Data architecture definition
Data architecture beschrijft de structuur van de logische en fysieke data assets en data management resources van een organisatie, volgens
. Het is een uitloper van enterprise architectuur die de modellen, beleid, regels en normen die de verzameling, opslag, rangschikking, integratie, en het gebruik van gegevens in organisaties. De gegevensarchitectuur van een organisatie is het bereik van
.
doelen voor Gegevensarchitectuur
doel van gegevensarchitectuur is het vertalen van bedrijfsbehoeften naar gegevens en systeemvereisten en het beheren van gegevens en de doorstroming ervan door de onderneming.
Data architecture principles
, vice president of product management, core products, at Splunk, en voorheen vice president of product management at AtScale, vormen zes principes de basis van de moderne data-architectuur:
- Data is een gedeeld bezit. Een moderne dataarchitectuur moet departementale datasilo ‘ s elimineren en alle stakeholders een volledig beeld van het bedrijf geven.
- gebruikers hebben adequate toegang tot gegevens nodig. Naast het afbreken van silo ‘ s, moeten moderne dataarchitecturen interfaces bieden die het gebruikers gemakkelijk maken om gegevens te gebruiken met behulp van tools die geschikt zijn voor hun werk.
- veiligheid is essentieel. Moderne dataarchitecturen moeten worden ontworpen voor beveiliging en ze moeten Gegevensbeleid en toegangscontroles rechtstreeks op de ruwe gegevens ondersteunen.
- gemeenschappelijke woordenlijsten zorgen voor gemeenschappelijk begrip. Gedeelde gegevens, zoals productcatalogi, fiscale kalenderafmetingen en KPI-definities, vereisen een gemeenschappelijke woordenschat om geschillen tijdens de analyse te voorkomen.
- gegevens moeten worden samengesteld. Investeer in kernfuncties die datacuratie uitvoeren (het modelleren van belangrijke relaties, het reinigen van ruwe data, en het cureren van belangrijke dimensies en maatregelen).
- gegevensstromen moeten worden geoptimaliseerd voor flexibiliteit. Verminder het aantal keren dat gegevens moeten worden verplaatst om de kosten te verlagen, de versheid van gegevens te verhogen en de flexibiliteit van bedrijven te optimaliseren.
Data architecture components
zegt dat gegevensarchitectuur kan worden gesynthetiseerd in drie algemene componenten:
- data architecture outcomes. Dit zijn de modellen, definities, en gegevensstromen vaak aangeduid als data-architectuur artefacten.
- activiteiten op het gebied van Gegevensarchitectuur. Dit zijn de vormen, implementeert en vervult van data architectuur intenties.
- gedrag in Gegevensarchitectuur. Dit zijn de samenwerkingen, mindsets en vaardigheden van de verschillende rollen die de gegevensarchitectuur van een onderneming beïnvloeden.
gegevensarchitectuur vs. data modeling
volgens
definieert data architecture de blauwdruk voor het beheren van data assets door het afstemmen op de organisatiestrategie om strategische gegevensvereisten en ontwerpen op te stellen om aan die vereisten te voldoen. Aan de andere kant definieert DMBOK 2 datamodellering als: “het proces van het ontdekken, analyseren, vertegenwoordigen en communiceren van gegevensvereisten in een precieze vorm genaamd Het datamodel.”
terwijl zowel data-architectuur als data-modellering de kloof tussen bedrijfsdoelstellingen en technologie proberen te overbruggen, gaat data-architectuur over de macro-visie die de relaties tussen functies, technologie en datatypes van een organisatie probeert te begrijpen en te ondersteunen. Data modeling neemt een meer gerichte blik op specifieke systemen of business cases.
data architecture frameworks
er zijn verschillende enterprise architecture frameworks die vaak dienen als de basis voor het bouwen van een organisatie data architecture framework.
-
{{#url}}DAMA-DMBOK 2 {{/url}} {{^url}}DAMA-DMBOK 2 {{/url}}
. Dama International ‘ s datamanagement Body of Knowledge is een kader specifiek voor datamanagement. Het biedt standaarddefinities voor data management functies, deliverables, rollen en andere terminologie, en presenteert leidende principes voor data management.
-
{{#url}}Zachman Framework for Enterprise Architecture {{/url}} {{^url}}Zachman Framework for Enterprise Architecture{{/url}}
. Het
{{#url}}Zachman Framework {{/url}} {{^url}}Zachman Framework {{/url}}is een ontologie voor ondernemingen die in de jaren tachtig door John Zachman bij IBM is
kolom “data” van het Zachman Framework bestaat uit meerdere lagen, waaronder architectonische normen die belangrijk zijn voor het bedrijf, een semantisch model of conceptueel/ondernemingsgegevensmodel, een ondernemingsgegevensmodel, een fysiek gegevensmodel en feitelijke databases. -
{{#url}}het Open Group Architecture Framework (TOGAF){{/url}}{{^url}}het Open Group Architecture Framework (TOGAF){{/url}}
. TOGAF is een enterprise architecture methodologie die een
{{#url}}high-level framework{{/url}}{{^url}}high-level framework{{/url}}biedt voor de ontwikkeling van enterprise software. Fase C van TOGAF omvat het ontwikkelen van een dataarchitectuur en het bouwen van een dataarchitectuur roadmap.
kenmerken van moderne dataarchitectuur
moderne dataarchitecturen moeten worden ontworpen om gebruik te maken van opkomende technologieën zoals kunstmatige intelligentie (AI), Automatisering, internet of things (IoT) en blockchain. Dan Sutherland, distinguished engineer en CTO, data platforms, bij IBM, zegt
common:
- cloud-native. Moderne dataarchitecturen zijn ontworpen om elastische schaling, hoge beschikbaarheid, end-to-end beveiliging voor gegevens in beweging en gegevens in rust, en kosten en prestaties schaalbaarheid te ondersteunen.
- schaalbare datapijpleidingen. Om te profiteren van opkomende technologieën, ondersteunen dataarchitecturen real-time datastreaming en micro-batch data uitbarstingen.
- naadloze gegevensintegratie. Dataarchitecturen integreren met oudere toepassingen met behulp van standaard API-interfaces. Ze zijn geoptimaliseerd voor het delen van gegevens tussen systemen, regio ‘ s en organisaties.
- real-time data enablement. Moderne dataarchitecturen ondersteunen de mogelijkheid om geautomatiseerde en actieve gegevensvalidatie, classificatie, beheer en governance te implementeren.
- ontkoppeld en uitbreidbaar. Moderne dataarchitecturen zijn ontworpen om losjes te worden gekoppeld, waardoor diensten minimale taken kunnen uitvoeren onafhankelijk van andere diensten.
Data-architectuur rollen
Hier zijn enkele van de meest populaire functiebenamingen in verband met data-architectuur en het gemiddelde salaris voor elke positie, volgens de gegevens van
:
-
{{#url}}Data architect{{/url}}{{^url}}Data architect{{/url}}
: $76K-$155K
- Project manager: $56K-$128K
- Solutions architect: $74K-$159K
-
{{#url}}Data engineer{{/url}}{{^url}}Data engineer{{/url}}
: $65K-$132K
-
{{#url}}Data analyst{{/url}}{{^url}}Data analyst{{/url}}
: $43K-$85K
-
{{#url}}Data scientist{{/url}}{{^url}}Data scientist{{/url}}
: $67K-$134K