Dataarkitekturdefinition
dataarkitektur beskriver strukturen i en organisations logiske og fysiske dataaktiver og datastyringsressourcer i henhold til
. Det er en udløber af virksomhedsarkitektur, der omfatter modeller, politikker, regler og standarder, der styrer indsamling, opbevaring, arrangement, integration og brug af data i organisationer. En organisations dataarkitektur hører under
.
dataarkitekturmål
målet med dataarkitektur er at oversætte forretningsbehov til data-og systemkrav og at styre data og dets strøm gennem virksomheden.
data architecture principles
, vicepræsident for produktstyring, kerneprodukter, hos Splunk og tidligere vicepræsident for produktstyring i AtScale udgør seks principper grundlaget for moderne data arkitektur:
- data er et delt Aktiv. En moderne dataarkitektur skal eliminere afdelingsdatasiloer og give alle interessenter et komplet overblik over virksomheden.
- brugere kræver tilstrækkelig adgang til data. Ud over at nedbryde siloer skal Moderne dataarkitekturer give grænseflader, der gør det nemt for brugerne at forbruge data ved hjælp af værktøjer, der passer til deres job.
- sikkerhed er afgørende. Moderne dataarkitekturer skal være designet til sikkerhed, og de skal understøtte datapolitikker og adgangskontrol direkte på rådataene.
- fælles ordforråd sikrer fælles forståelse. Delte dataaktiver, såsom produktkataloger, regnskabskalenderdimensioner og KPI-definitioner, kræver et fælles ordforråd for at undgå tvister under analysen.
- Data skal kurateres. Invester i kernefunktioner, der udfører datakurationering (modellering af vigtige relationer, rensning af rådata og kuratering af nøgledimensioner og-foranstaltninger).
- datastrømme skal optimeres til smidighed. Reducer antallet af gange, data skal flyttes for at reducere omkostningerne, øge datafriheden og optimere virksomhedens smidighed.
dataarkitekturkomponenter
siger, at dataarkitektur kan syntetiseres i tre overordnede komponenter:
- dataarkitekturresultater. Disse er de modeller, definitioner og datastrømme ofte omtalt som data arkitektur artefakter.
- data arkitektur aktiviteter. Disse er de former, deploys, og opfylder af data arkitektur intentioner.
- data arkitektur adfærd. Dette er samarbejdet, tankesæt og færdigheder i de forskellige roller, der påvirker en virksomheds dataarkitektur.
dataarkitektur vs. datamodellering
i henhold til
definerer dataarkitektur planen for styring af dataaktiver ved at tilpasse sig organisatorisk strategi for at etablere strategiske datakrav og design for at opfylde disse krav. På den anden side definerer DMBOK 2 datamodellering som “processen med at opdage, analysere, repræsentere og kommunikere datakrav i en præcis form kaldet datamodellen.”
mens både dataarkitektur og datamodellering søger at bygge bro over kløften mellem forretningsmål og teknologi, handler dataarkitektur om makrovisningen, der søger at forstå og understøtte forholdet mellem en organisations funktioner, teknologi og datatyper. Datamodellering tager et mere fokuseret syn på specifikke systemer eller forretningssager.
Dataarkitekturrammer
der er flere virksomhedsarkitekturrammer, der almindeligvis tjener som grundlag for opbygning af en organisations dataarkitekturramme.
-
{{#url}} DAMA-DMBOK 2 {{/url}} {{^url}}DAMA-DMBOK 2{{/url}}
. DAMA Internationals Datastyringsorgan af viden er en ramme specifikt til datastyring. Det giver standarddefinitioner for datastyringsfunktioner, leverancer, roller og anden terminologi og præsenterer vejledende principper for datastyring.
-
{{#url}}ramme for virksomhedsarkitektur{{/url}}{{^url}}ramme for virksomhedsarkitektur{{/url}}
.
{{#url}}Sachman-rammen{{/url}}{{^url}}Sachman-rammen{{/url}}er en virksomheds ontologi oprettet af John Sachman hos IBM i 1980 ‘ erne. kolonnen “data” i Sachman-rammen omfatter flere lag, herunder arkitektoniske standarder, der er vigtige for virksomheden, en semantisk model eller konceptuel/virksomhedsdatamodel, en virksomhed/logisk datamodel, en fysisk datamodel og faktiske databaser.
-
{{#url}}rammen for åben Gruppearkitektur (TOGAF){{/url}}{{^url}}rammen for åben Gruppearkitektur (TOGAF){{/url}}
. TOGAF er en virksomhedsarkitekturmetode, der tilbyder en
{{#url}}ramme på højt niveau{{/url}}{{^url}}ramme på højt niveau{{/url}}til udvikling af virksomhedsprogrammer. Fase C i TOGAF dækker udvikling af en dataarkitektur og opbygning af en dataarkitektur køreplan.
karakteristika for moderne dataarkitektur
moderne dataarkitekturer skal være designet til at drage fordel af nye teknologier som kunstig intelligens (AI), automatisering, tingenes internet (IoT) og blockchain. Dan Sutherland, distinguished engineer and CTO, data platforms, hos IBM, siger
almindelig:
- Cloud-indfødt. Moderne dataarkitekturer er designet til at understøtte elastisk skalering, høj tilgængelighed, end-to-end sikkerhed for data i bevægelse og data i hvile og omkostninger og ydeevne skalerbarhed.
- skalerbare data rørledninger. For at drage fordel af nye teknologier understøtter dataarkitekturer datastreaming i realtid og mikrobatch-dataudbrud.
- problemfri dataintegration. Dataarkitekturer integreres med ældre applikationer ved hjælp af Standard API-grænseflader. De er optimeret til deling af data på tværs af systemer, geografiske områder og organisationer.
- real-time data aktivering. Moderne dataarkitekturer understøtter muligheden for at implementere automatiseret og aktiv datavalidering, klassificering, styring og styring.
- afkoblet og udvideligt. Moderne dataarkitekturer er designet til at blive løst koblet, så Tjenester kan udføre minimale opgaver uafhængigt af andre tjenester.
dataarkitekturroller
her er nogle af de mest populære jobtitler relateret til dataarkitektur og gennemsnitslønnen for hver position ifølge data fra
:
-
{{# url}}dataarkitekt {{/url}}{{^url}}dataarkitekt {{/url}}
: $76K – $155K
- projektleder: $56K – $128k
- Solutions architect: $74K-$159K
-
{{#url}}Data engineer{{/url}}{{^url}}Data engineer{{/url}}
: $65K-$132K
-
{{#url}}Data analyst{{/url}}{{^url}}Data analyst{{/url}}
: $43K-$85K
-
{{#url}}Data scientist{{/url}}{{^url}}Data scientist{{/url}}
: $67K-$134K