definirea arhitecturii datelor
arhitectura datelor descrie structura activelor de date logice și fizice ale unei organizații și a resurselor de gestionare a datelor, în conformitate cu
. Este o ramură a arhitecturii întreprinderii care cuprinde modelele, politicile, regulile și standardele care guvernează colectarea, stocarea, aranjarea, integrarea și utilizarea datelor în organizații. Arhitectura de date a unei organizații este domeniul de aplicare al
.
obiective de arhitectură de date
scopul arhitecturii de date este de a traduce nevoile afacerii în date și cerințe de sistem și de a gestiona datele și fluxul acestora prin întreprindere.
principiile arhitecturii datelor
, vicepreședinte al managementului produselor, produse de bază, la Splunk și fost vicepreședinte al managementului produselor la AtScale, șase principii formează fundamentul arhitecturii moderne a datelor:
- datele sunt un activ partajat. O arhitectură modernă de date trebuie să elimine silozurile de date departamentale și să ofere tuturor părților interesate o imagine completă a companiei.
- utilizatorii au nevoie de acces adecvat la date. Dincolo de descompunerea silozurilor, arhitecturile moderne de date trebuie să ofere interfețe care să faciliteze utilizatorilor să consume date folosind instrumente potrivite pentru locurile lor de muncă.
- Securitatea este esențială. Arhitecturile moderne de date trebuie să fie proiectate pentru securitate și trebuie să sprijine politicile de date și controalele de acces direct pe datele brute.
- vocabularul comun asigură înțelegerea comună. Activele de date partajate, cum ar fi cataloagele de produse, dimensiunile calendarului fiscal și definițiile KPI, necesită un vocabular comun pentru a ajuta la evitarea disputelor în timpul analizei.
- datele ar trebui să fie curate. Investiți în funcții de bază care efectuează Curarea datelor (modelarea relațiilor importante, curățarea datelor brute și curatarea dimensiunilor și măsurilor cheie).
- fluxurile de date ar trebui optimizate pentru agilitate. Reduceți de câte ori datele trebuie mutate pentru a reduce costurile, a crește prospețimea datelor și a optimiza agilitatea întreprinderii.
componente de arhitectură de date
spune că arhitectura de date poate fi sintetizată în trei componente generale:
- rezultate ale arhitecturii de date. Acestea sunt modelele, definițiile și fluxurile de date adesea denumite artefacte ale arhitecturii datelor.
- activități de arhitectură de date. Acestea sunt formele, implementările și îndeplinirea intențiilor arhitecturii datelor.
- comportamente de arhitectură de date. Acestea sunt colaborările, mentalitățile și abilitățile diferitelor roluri care afectează arhitectura de date a unei întreprinderi.
arhitectura datelor vs. modelarea datelor
conform
, arhitectura de date definește planul pentru gestionarea activelor de date prin alinierea cu strategia organizațională pentru a stabili cerințele strategice de date și modele pentru a îndeplini aceste cerințe. Pe de altă parte, DMBOK 2 definește modelarea datelor ca „procesul de descoperire, analiză, reprezentare și comunicare a cerințelor de date într-o formă precisă numită model de date.”
în timp ce atât arhitectura de date, cât și modelarea datelor încearcă să reducă decalajul dintre obiectivele de afaceri și tehnologie, arhitectura de date se referă la vizualizarea macro care încearcă să înțeleagă și să susțină relațiile dintre funcțiile, tehnologia și tipurile de date ale unei organizații. Modelarea datelor are o viziune mai concentrată asupra sistemelor specifice sau a cazurilor de afaceri.
cadre de arhitectură de date
există mai multe cadre de arhitectură de întreprindere care servesc în mod obișnuit ca bază pentru construirea cadrului de arhitectură de date al unei organizații.
-
{{#url}}dama-DMBOK 2 {{/url}} {{^url}}dama-DMBOK 2 {{/url}}
. Dama International Data Management Body Of Knowledge este un cadru special pentru gestionarea datelor. Oferă definiții standard pentru funcțiile de gestionare a datelor, livrabile, roluri și alte terminologii și prezintă principii directoare pentru gestionarea datelor.
-
{{#url}}Zachman Framework for Enterprise Architecture {{/url}} {{^url}}Zachman Framework for Enterprise Architecture {{/url}}
.
{{#url}}Zachman Framework {{/url}} {{^url}}Zachman Framework {{/url}}este o ontologie de întreprindere creată de John Zachman la IBM în anii 1980. coloana „date” a Zachman Framework cuprinde mai multe straturi, inclusiv standarde arhitecturale importante pentru afaceri, un model semantic sau model de date conceptual/enterprise, un model de date enterprise/logic, un model de date fizice și baze de date reale.
-
{{#url}}Open Group Architecture Framework (TOGAF){{/url}}{{^url}}Open Group Architecture Framework (TOGAF){{/url}}
. TOGAF este o metodologie de arhitectură de întreprindere care oferă un
{{#url}}cadru la nivel înalt {{/url}} {{^url}}cadru la nivel înalt {{/url}}pentru dezvoltarea de software pentru întreprinderi. Faza C A TOGAF acoperă dezvoltarea unei arhitecturi de date și construirea unei foi de parcurs pentru arhitectura datelor.
caracteristicile arhitecturii moderne de date
arhitecturile moderne de date trebuie să fie proiectate pentru a profita de tehnologiile emergente, cum ar fi inteligența artificială (AI), automatizarea, internetul obiectelor (IoT) și blockchain. Dan Sutherland, inginer distins și CTO, platforme de date, la IBM, spune
comun:
- nor-nativ. Arhitecturile moderne de date sunt concepute pentru a sprijini scalarea elastică, disponibilitatea ridicată, securitatea end-to-end pentru datele în mișcare și datele în repaus și scalabilitatea costurilor și performanței.
- conducte de date scalabile. Pentru a profita de tehnologiile emergente, arhitecturile de date acceptă streaming de date în timp real și explozii de date micro-lot.
- integrare perfectă a datelor. Arhitecturile de date se integrează cu aplicațiile vechi folosind interfețe API standard. Acestea sunt optimizate pentru schimbul de date între sisteme, geografii și organizații.
- activarea datelor în timp real. Arhitecturile moderne de date susțin capacitatea de a implementa validarea, clasificarea, gestionarea și guvernanța automată și activă a datelor.
- decuplat și extensibil. Arhitecturile moderne de date sunt concepute pentru a fi cuplate slab, permițând serviciilor să îndeplinească sarcini minime independente de alte servicii.
roluri de arhitectură de date
iată câteva dintre cele mai populare titluri de locuri de muncă legate de arhitectura de date și salariul mediu pentru fiecare poziție, conform datelor de la
:
-
{{#url}}arhitect de date {{/url}} {{^url}}arhitect de date {{/url}}
: $76K – $155K
- Manager de proiect: $56K – $128K
- arhitect de soluții: $74K-$159K
-
{{#url}}Data engineer{{/url}}{{^url}}Data engineer{{/url}}
: $65K-$132K
-
{{#url}}Data analyst{{/url}}{{^url}}Data analyst{{/url}}
: $43K-$85K
-
{{#url}}Data scientist{{/url}}{{^url}}Data scientist{{/url}}
: $67K-$134K