Qu’est-ce que l’architecture de données ? Un cadre de gestion des données

Définition de l’architecture de données

L’architecture de données décrit la structure des actifs de données logiques et physiques et des ressources de gestion de données d’une organisation, selon

{{#url}} Le Cadre d’Architecture de Groupe Ouvert (TOGAF) {{/url}} {{^url}} Le Cadre d’Architecture de groupe ouvert (TOGAF) {{/url}}

. Il s’agit d’une émanation de l’architecture d’entreprise qui comprend les modèles, les politiques, les règles et les normes qui régissent la collecte, le stockage, la disposition, l’intégration et l’utilisation des données dans les organisations. L’architecture de données d’une organisation est la compétence de

{{#url}} architectes de données {{/url}} {{^url}} architectes de données {{/url}}

.

Objectifs de l’architecture de données

L’objectif de l’architecture de données est de traduire les besoins de l’entreprise en exigences de données et de systèmes et de gérer les données et leur flux dans l’entreprise.

Publicité

Principes d’architecture de données

{{#url}} Selon Joshua Klahr {{/url}} {{^url}} Selon Joshua Klahr {{/url}}

, vice-président de la gestion des produits, produits de base, chez Splunk, et anciennement vice-président de la gestion des produits chez AtScale, six principes forment la base des données modernes architecture :

  1. Les données sont un actif partagé. Une architecture de données moderne doit éliminer les silos de données des départements et donner à toutes les parties prenantes une vision complète de l’entreprise.
  2. Les utilisateurs ont besoin d’un accès adéquat aux données. Au-delà de la décomposition des silos, les architectures de données modernes doivent fournir des interfaces qui facilitent la consommation de données par les utilisateurs à l’aide d’outils adaptés à leurs tâches.
  3. La sécurité est essentielle. Les architectures de données modernes doivent être conçues pour la sécurité et elles doivent prendre en charge les politiques de données et les contrôles d’accès directement sur les données brutes.
  4. Les vocabulaires communs assurent une compréhension commune. Les ressources de données partagées, telles que les catalogues de produits, les dimensions du calendrier fiscal et les définitions des indicateurs clés de performance, nécessitent un vocabulaire commun pour éviter les litiges lors de l’analyse.
  5. Les données doivent être organisées. Investissez dans des fonctions de base qui effectuent la conservation des données (modélisation des relations importantes, nettoyage des données brutes et conservation des dimensions et mesures clés).
  6. Les flux de données doivent être optimisés pour l’agilité. Réduisez le nombre de fois où les données doivent être déplacées pour réduire les coûts, augmenter la fraîcheur des données et optimiser l’agilité de l’entreprise.

Composants d’architecture de données

{{#url}} Dataversity{{/url}} {{^url}} Dataversity{{/url}}

indique que l’architecture de données peut être synthétisée en trois composants globaux :

  • Résultats d’architecture de données. Ce sont les modèles, les définitions et les flux de données souvent appelés artefacts d’architecture de données.
  • Activités d’architecture de données. Ce sont les formes, les déploiements et les réalisations des intentions d’architecture de données.
  • Comportements d’architecture de données. Ce sont les collaborations, les mentalités et les compétences des différents rôles qui affectent l’architecture de données d’une entreprise.

Architecture de données vs. modélisation des données

Selon

{{#url}} Livre de connaissances sur la Gestion des données (DMBOK 2) {{/url}} {{^url}} Livre de connaissances sur la gestion des données (DMBOK 2) {{/url}}

, l’architecture des données définit le plan directeur de la gestion des actifs de données en s’alignant sur la stratégie organisationnelle pour établir des exigences stratégiques en matière de données et des conceptions pour répondre à ces exigences. D’autre part, DMBOK 2 définit la modélisation des données comme « le processus de découverte, d’analyse, de représentation et de communication des besoins en données sous une forme précise appelée modèle de données. »

Alors que l’architecture des données et la modélisation des données cherchent à combler le fossé entre les objectifs commerciaux et la technologie, l’architecture des données concerne la vue macro qui cherche à comprendre et à soutenir les relations entre les fonctions, la technologie et les types de données d’une organisation. La modélisation des données adopte une vision plus ciblée de systèmes ou d’analyses de rentabilisation spécifiques.

Frameworks d’architecture de données

Il existe plusieurs frameworks d’architecture d’entreprise qui servent généralement de base à la construction du framework d’architecture de données d’une organisation.

  • {{# url }} DAMA-DMBOK 2 {{/url}} {{^url}} DAMA-DMBOK 2 {{/url}}

    . Le corpus de connaissances de Gestion des données de DAMA International est un cadre spécifique à la gestion des données. Il fournit des définitions standard pour les fonctions de gestion des données, les livrables, les rôles et d’autres terminologies, et présente des principes directeurs pour la gestion des données.

  • {{# url}} Cadre Zachman pour l’Architecture d’entreprise {{/url}} {{^url}} Cadre Zachman pour l’Architecture d’entreprise {{/url}}

    . Le

    {{#url}}Zachman Framework{{/url}} {{^url}} Zachman Framework{{/url}}

    est une ontologie d’entreprise créée par John Zachman chez IBM dans les années 1980. La colonne « données » du framework Zachman comprend plusieurs couches, y compris des normes architecturales importantes pour l’entreprise, un modèle sémantique ou conceptuel/modèle de données d’entreprise, un modèle de données d’entreprise/logique, un modèle de données physiques et des bases de données réelles.

  • {{# url}} Le Cadre d’Architecture de Groupe Ouvert (TOGAF) {{/url}} {{^url}} Le Cadre d’Architecture de Groupe Ouvert (TOGAF) {{/url}}

    . TOGAF est une méthodologie d’architecture d’entreprise qui offre un cadre de haut niveau

    {{#url}}{{/url}} {{^url}} cadre de haut niveau {{/url}}

    pour le développement de logiciels d’entreprise. La phase C du TOGAF couvre le développement d’une architecture de données et la construction d’une feuille de route d’architecture de données.

Caractéristiques de l’architecture de données moderne

Les architectures de données modernes doivent être conçues pour tirer parti des technologies émergentes telles que l’intelligence artificielle (IA), l’automatisation, l’Internet des objets (IoT) et la blockchain. Dan Sutherland, ingénieur distingué et directeur technique, plates-formes de données, chez IBM, déclare que

{{#url}} les architectures de données modernes devraient posséder les caractéristiques suivantes dans {{/url}}{{^url}} les architectures de données modernes devraient posséder les caractéristiques suivantes dans {{/url}}

commun :

Publicité

  • Natif du cloud. Les architectures de données modernes sont conçues pour prendre en charge la mise à l’échelle élastique, la haute disponibilité, la sécurité de bout en bout pour les données en mouvement et les données au repos, ainsi que l’évolutivité des coûts et des performances.
  • Pipelines de données évolutifs. Pour tirer parti des technologies émergentes, les architectures de données prennent en charge le streaming de données en temps réel et les rafales de données par micro-lots.
  • Intégration transparente des données. Les architectures de données s’intègrent aux applications héritées à l’aide d’interfaces API standard. Ils sont optimisés pour le partage de données entre les systèmes, les zones géographiques et les organisations.
  • Activation des données en temps réel. Les architectures de données modernes permettent de déployer la validation, la classification, la gestion et la gouvernance des données automatisées et actives.
  • Découplé et extensible. Les architectures de données modernes sont conçues pour être couplées de manière lâche, ce qui permet aux services d’effectuer des tâches minimales indépendamment des autres services.

Rôles d’architecture de données

Voici quelques-uns des titres d’emploi les plus populaires liés à l’architecture de données et au salaire moyen pour chaque poste, selon les données de

{{#url}} Échelle de salaire {{/url}} {{^url}} Échelle de salaire {{/url}}

:

  • {{# url}} Architecte de données {{/url}} {{^url}} Architecte de données {{/url}}

    :776K -1155K

  • Chef de projet :556K -$128K
  • Architecte de solutions: $74K-$159K
  • {{#url}}Data engineer{{/url}}{{^url}}Data engineer{{/url}}

    : $65K-$132K

  • {{#url}}Data analyst{{/url}}{{^url}}Data analyst{{/url}}

    : $43K-$85K

  • {{#url}}Data scientist{{/url}}{{^url}}Data scientist{{/url}}

    : $67K-$134K

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.