Was ist Datenarchitektur? Ein Framework zum Verwalten von Daten

Definition der Datenarchitektur

Die Datenarchitektur beschreibt die Struktur der logischen und physischen Datenressourcen und Datenverwaltungsressourcen einer Organisation gemäß

{{#url}}Das Open Group Architecture Framework (TOGAF){{/url}}{{^url}}Das Open Group Architecture Framework (TOGAF){{/url}}

. Es ist ein Ableger der Unternehmensarchitektur, der die Modelle, Richtlinien, Regeln und Standards umfasst, die die Erfassung, Speicherung, Anordnung, Integration und Verwendung von Daten in Organisationen regeln. Die Datenarchitektur einer Organisation ist der Zuständigkeitsbereich von

{{#url}}data architects{{/url}}{{^url}}data architects{{/url}}

.

Ziele der Datenarchitektur

Das Ziel der Datenarchitektur ist es, Geschäftsanforderungen in Daten- und Systemanforderungen zu übersetzen und Daten und ihren Fluss durch das Unternehmen zu verwalten.

Advertisement

Prinzipien der Datenarchitektur

{{#url}}Laut Joshua Klahr{{/url}}{{^url}}Laut Joshua Klahr{{/url}}

, Vice President of Product Management, core products, bei Splunk und ehemals Vice President of Product Management bei AtScale, bilden sechs Prinzipien die Grundlage für moderne architektur:

  1. Daten sind ein gemeinsames Asset. Eine moderne Datenarchitektur muss Abteilungs-Datensilos beseitigen und allen Stakeholdern einen vollständigen Überblick über das Unternehmen geben.
  2. Benutzer benötigen einen angemessenen Zugriff auf Daten. Moderne Datenarchitekturen müssen nicht nur Silos auflösen, sondern auch Schnittstellen bereitstellen, die es Benutzern erleichtern, Daten mit Tools zu konsumieren, die für ihre Arbeit geeignet sind.
  3. Sicherheit ist wichtig. Moderne Datenarchitekturen müssen auf Sicherheit ausgelegt sein und Datenrichtlinien und Zugriffskontrollen direkt auf die Rohdaten unterstützen.
  4. Gemeinsame Vokabeln sorgen für ein gemeinsames Verständnis. Gemeinsam genutzte Datenbestände wie Produktkataloge, Dimensionen des Finanzkalenders und KPI-Definitionen erfordern ein gemeinsames Vokabular, um Streitigkeiten während der Analyse zu vermeiden.
  5. Daten sollten kuratiert werden. Investieren Sie in Kernfunktionen, die die Datenkuration durchführen (Modellierung wichtiger Beziehungen, Bereinigung von Rohdaten und Kuratieren von Schlüsseldimensionen und -kennzahlen).
  6. Datenflüsse sollten auf Agilität optimiert werden. Reduzieren Sie die Häufigkeit, mit der Daten verschoben werden müssen, um Kosten zu senken, die Aktualität der Daten zu erhöhen und die Agilität des Unternehmens zu optimieren.

Datenarchitekturkomponenten

{{#url}}Dataversity{{/url}}{{^url}}Dataversity{{/url}}

Die Datenarchitektur kann in drei Gesamtkomponenten zusammengefasst werden:

  • Ergebnisse der Datenarchitektur. Dies sind die Modelle, Definitionen und Datenflüsse, die oft als Datenarchitekturartefakte bezeichnet werden.
  • Datenarchitektur-Aktivitäten. Dies sind die Formen, Bereitstellungen und Funktionen von Datenarchitekturabsichten.
  • Verhalten der Datenarchitektur. Dies sind die Kollaborationen, Denkweisen und Fähigkeiten der verschiedenen Rollen, die sich auf die Datenarchitektur eines Unternehmens auswirken.

Datenarchitektur vs. datenmodellierung

Gemäß

{{#url}}Data Management Book of Knowledge (DMBOK 2){{/url}}{{^url}}Data Management Book of Knowledge (DMBOK 2){{/url}}

definiert die Datenarchitektur die Blaupause für die Verwaltung von Datenbeständen, indem sie sich an der Organisationsstrategie ausrichtet, um strategische Datenanforderungen festzulegen, und diese Anforderungen erfüllt. Auf der anderen Seite definiert DMBOK 2 die Datenmodellierung als „den Prozess des Entdeckens, Analysierens, Darstellens und Kommunizierens von Datenanforderungen in einer präzisen Form, die als Datenmodell bezeichnet wird.“

Während sowohl die Datenarchitektur als auch die Datenmodellierung versuchen, die Lücke zwischen Geschäftszielen und Technologie zu schließen, geht es bei der Datenarchitektur um die Makroansicht, die versucht, die Beziehungen zwischen den Funktionen, der Technologie und den Datentypen eines Unternehmens zu verstehen und zu unterstützen. Bei der Datenmodellierung werden bestimmte Systeme oder Geschäftsfälle fokussierter betrachtet.

Datenarchitektur-Frameworks

Es gibt mehrere Unternehmensarchitektur-Frameworks, die üblicherweise als Grundlage für den Aufbau des Datenarchitektur-Frameworks einer Organisation dienen.

  • {{# url}}DAMA-DMBOK 2{{/url}}{{^url}}DAMA-DMBOK 2{{/url}}

    . Das Data Management Body of Knowledge von DAMA International ist ein Framework speziell für das Datenmanagement. Es enthält Standarddefinitionen für Datenverwaltungsfunktionen, Ergebnisse, Rollen und andere Terminologie und enthält Leitprinzipien für das Datenmanagement.

  • {{# url}}Zachman Framework für Unternehmensarchitektur{{/url}}{{^url}}Zachman Framework für Unternehmensarchitektur{{/url}}

    . Das

    {{#url}}Zachman Framework{{/url}}{{^url}}Zachman Framework{{/url}}

    ist eine Unternehmensontologie, die von John Zachman bei IBM in den 1980er Jahren erstellt wurde. Die Spalte „Daten“ des Zachman-Frameworks umfasst mehrere Ebenen, darunter Architekturstandards, die für das Unternehmen wichtig sind, ein semantisches Modell oder ein konzeptionelles / Unternehmensdatenmodell, ein unternehmens- / logisches Datenmodell, ein physisches Datenmodell und tatsächliche Datenbanken.

  • {{# url}}Das Open Group Architecture Framework (TOGAF){{/url}}{{^url}}Das Open Group Architecture Framework (TOGAF){{/url}}

    . TOGAF ist eine Enterprise-Architektur-Methodik, die ein

    {{#url}}High-Level-Framework{{/url}}{{^url}}High-Level-Framework{{/url}}

    für die Entwicklung von Unternehmenssoftware bietet. Phase C von TOGAF umfasst die Entwicklung einer Datenarchitektur und die Erstellung einer Datenarchitektur-Roadmap.

Merkmale der modernen Datenarchitektur

Moderne Datenarchitekturen müssen so konzipiert sein, dass sie neue Technologien wie künstliche Intelligenz (KI), Automatisierung, Internet der Dinge (IoT) und Blockchain nutzen. Dan Sutherland, Distinguished Engineer und CTO, data Platforms, bei IBM, sagt

{{#url}}Moderne Datenarchitekturen sollten die folgenden Eigenschaften in{{/url}}{{^url}}Moderne Datenarchitekturen sollten die folgenden Eigenschaften in{{/url}}

common:

Advertisement

  • Cloud-nativ. Moderne Datenarchitekturen sind so konzipiert, dass sie elastische Skalierung, hohe Verfügbarkeit, End-to-End-Sicherheit für bewegte und ruhende Daten sowie Kosten- und Leistungsskalierbarkeit unterstützen.
  • Skalierbare Datenpipelines. Um die Vorteile neuer Technologien zu nutzen, unterstützen Datenarchitekturen Echtzeit-Datenstreaming und Micro-Batch-Datenbursts.
  • Nahtlose Datenintegration. Datenarchitekturen lassen sich über Standard-API-Schnittstellen in Legacy-Anwendungen integrieren. Sie sind für die gemeinsame Nutzung von Daten über Systeme, Regionen und Organisationen hinweg optimiert.
  • Echtzeit-Datenaktivierung. Moderne Datenarchitekturen unterstützen die Bereitstellung automatisierter und aktiver Datenvalidierung, -klassifizierung, -verwaltung und -governance.
  • Entkoppelt und erweiterbar. Moderne Datenarchitekturen sind lose gekoppelt, sodass Dienste minimale Aufgaben unabhängig von anderen Diensten ausführen können.

Data architecture roles

Hier sind einige der beliebtesten Berufsbezeichnungen im Zusammenhang mit Data architecture und das durchschnittliche Gehalt für jede Position, nach Daten von

{{#url}}PayScale{{/url}}{{^url}}PayScale{{/url}}

:

  • {{# url}}Datenarchitekt{{/url}}{{^url}}Datenarchitekt{{/url}}

    : $76K-$155K

  • Projektmanager: $ 56K-$128K
  • Lösungsarchitekt: $74K-$159K
  • {{#url}}Data engineer{{/url}}{{^url}}Data engineer{{/url}}

    : $65K-$132K

  • {{#url}}Data analyst{{/url}}{{^url}}Data analyst{{/url}}

    : $43K-$85K

  • {{#url}}Data scientist{{/url}}{{^url}}Data scientist{{/url}}

    : $67K-$134K

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.