Vad är data architecture? Ett ramverk för hantering av data

dataarkitektur definition

dataarkitektur beskriver strukturen för en organisations logiska och fysiska datatillgångar och datahanteringsresurser, enligt

{{#url}}Open Group Architecture Framework (TOGAF){{/url}}{{^url}}Open Group Architecture Framework (TOGAF){{/url}}

. Det är en utlöpare av företagsarkitektur som omfattar modeller, politik, regler och standarder som styr insamling, lagring, arrangemang, integration och användning av data i organisationer. En organisations dataarkitektur är

{{#url}}data architects {{/url}}{{^url}}data architects {{/url}}

.

data architecture goals

målet med data architecture är att översätta affärsbehov till data-och systemkrav och att hantera data och dess flöde genom företaget.

annons

dataarkitekturprinciper

{{#url}}enligt Joshua Klahr{{/url}}{{^url}}enligt Joshua Klahr{{/url}}

, vice president för produkthantering, kärnprodukter, på Splunk, och tidigare vice president för produkthantering på AtScale, utgör sex principer grunden för moderna data arkitektur:

  1. data är en delad tillgång. En modern dataarkitektur måste eliminera avdelnings datasilos och ge alla intressenter en fullständig bild av företaget.
  2. användare behöver tillräcklig tillgång till data. Utöver att bryta ner silor måste moderna dataarkitekturer tillhandahålla gränssnitt som gör det enkelt för användare att konsumera data med hjälp av verktyg som passar deras jobb.
  3. säkerhet är viktigt. Moderna dataarkitekturer måste utformas för säkerhet och de måste stödja datapolicyer och åtkomstkontroller direkt på rådata.
  4. vanliga vokabulärer säkerställer gemensam förståelse. Delade datatillgångar, till exempel produktkataloger, finanspolitiska kalenderdimensioner och KPI-definitioner, kräver ett gemensamt ordförråd för att undvika tvister under analysen.
  5. Data bör sammanställas. Investera i kärnfunktioner som utför datakurering (modellering av viktiga relationer, rengöring av rådata och kurering av nyckeldimensioner och mått).
  6. dataflöden bör optimeras för smidighet. Minska antalet gånger data måste flyttas för att minska kostnaderna, öka datans färskhet och optimera företagets smidighet.

dataarkitekturkomponenter

{{#url}}Dataversity{{/url}}{{^url}}Dataversity{{/url}}

säger att dataarkitektur kan syntetiseras i tre övergripande komponenter:

  • dataarkitekturresultat. Dessa är modeller, definitioner och dataflöden som ofta kallas dataarkitekturartefakter.
  • aktiviteter för dataarkitektur. Dessa är de former, distribuerar och uppfyller dataarkitektur avsikter.
  • dataarkitekturbeteenden. Det här är samarbeten, tankesätt och färdigheter i de olika roller som påverkar ett företags dataarkitektur.

dataarkitektur vs. datamodellering

enligt

{{#url}}Data Management Book of Knowledge (DMBOK 2){{/url}}{{^url}}Data Management Book of Knowledge (DMBOK 2){{/url}}

definierar data architecture planen för hantering av datatillgångar genom att anpassa sig till organisationsstrategi för att fastställa strategiska datakrav och mönster för att uppfylla dessa krav. Å andra sidan definierar DMBOK 2 datamodellering som ”processen att upptäcka, analysera, representera och kommunicera datakrav i en exakt form som kallas datamodellen.”

medan både dataarkitektur och datamodellering försöker överbrygga klyftan mellan affärsmål och teknik, handlar dataarkitektur om makrovyn som försöker förstå och stödja relationerna mellan en organisations funktioner, teknik och datatyper. Datamodellering tar en mer fokuserad bild av specifika system eller affärsfall.

data architecture frameworks

det finns flera enterprise architecture frameworks som vanligtvis fungerar som grunden för att bygga en organisations data architecture framework.

  • {{#url}}DAMA-DMBOK 2 {{/url}}{{^url}}DAMA-DMBOK 2{{/url}}

    . DAMA Internationals Data Management Body of Knowledge är ett ramverk specifikt för datahantering. Det ger standarddefinitioner för datahanteringsfunktioner, leveranser, roller och annan terminologi och presenterar vägledande principer för datahantering.

  • {{#url}}Zachman Framework för Enterprise Architecture {{/url}}{{^url}}Zachman Framework för Enterprise Architecture {{/url}}

    .

    {{#url}}Zachman Framework {{/url}} {{^url}} Zachman Framework{{/url}}

    är en företags ontologi skapad av John Zachman på IBM på 1980-talet. kolumnen ”data” i Zachman Framework består av flera lager, inklusive arkitektoniska standarder som är viktiga för verksamheten, en semantisk modell eller konceptuell/företagsdatamodell, en företags/logisk datamodell, en fysisk datamodell och faktiska databaser.

  • {{#url}}Open Group Architecture Framework (TOGAF){{/url}}{{^url}}Open Group Architecture Framework (TOGAF){{/url}}

    . TOGAF är en företagsarkitekturmetodik som erbjuder en

    {{#url}}högnivåramverk {{/url}}{{^url}}högnivåramverk {{/url}}

    för utveckling av företagsprogramvara. Fas C i TOGAF omfattar att utveckla en dataarkitektur och bygga en färdplan för dataarkitektur.

egenskaper hos modern dataarkitektur

moderna dataarkitekturer måste utformas för att dra nytta av ny teknik som artificiell intelligens (AI), automatisering, sakernas internet (IoT) och blockchain. Dan Sutherland, distinguished engineer och CTO, data platforms, på IBM, säger

{{#url}}moderna dataarkitekturer bör innehålla följande egenskaper i {{/url}}{{^url}}moderna dataarkitekturer bör innehålla följande egenskaper i {{/url}}

common:

annons

  • Cloud-native. Moderna dataarkitekturer är utformade för att stödja elastisk skalning, hög tillgänglighet, end-to-end-säkerhet för data i rörelse och data i vila, och kostnad och prestanda skalbarhet.
  • skalbara datapipelines. För att dra nytta av ny teknik Stöder dataarkitekturer realtidsdataströmning och mikrobatchdatabrott.
  • sömlös dataintegration. Dataarkitekturer integreras med äldre applikationer med hjälp av standard API-gränssnitt. De är optimerade för att dela data mellan system, geografiska områden och organisationer.
  • realtidsdata aktivering. Moderna dataarkitekturer stöder möjligheten att distribuera automatiserad och aktiv datavalidering, klassificering, hantering och styrning.
  • frikopplad och utdragbar. Moderna dataarkitekturer är utformade för att vara löst kopplade, vilket gör det möjligt för tjänster att utföra minimala uppgifter oberoende av andra tjänster.

dataarkitekturroller

här är några av de mest populära jobbtitlarna relaterade till dataarkitektur och genomsnittslönen för varje position, enligt data från

{{#url}}PayScale{{/url}}{{^url}}PayScale {{/url}}

:

  • {{#url}}data arkitekt {{/url}}{{^url}}data arkitekt {{/url}}

    : $76K – $155K

  • Projektledare: $56K – $128K
  • lösningar arkitekt: $74K-$159K
  • {{#url}}Data engineer{{/url}}{{^url}}Data engineer{{/url}}

    : $65K-$132K

  • {{#url}}Data analyst{{/url}}{{^url}}Data analyst{{/url}}

    : $43K-$85K

  • {{#url}}Data scientist{{/url}}{{^url}}Data scientist{{/url}}

    : $67K-$134K

Lämna ett svar

Din e-postadress kommer inte publiceras.