Enterprise Data Management si occupa di tutto lo spettro di attività dirette verso l’organizzazione e il corretto utilizzo dei dati. Questo articolo copre lo sfondo della relativa popolarità della gestione dei dati in molte organizzazioni negli ultimi anni. Qual è lo scopo della gestione dei dati? Perché la gestione dei dati è così importante? E se le organizzazioni desiderano coinvolgere questo argomento, come farlo? Questo articolo si sforza di rispondere a queste domande.
Introduzione
Il nostro mondo digitale è costruito sulle informazioni. I dati sono ovunque e tutti li usano per il loro business quotidiano. La gestione dei dati ha recentemente visto un aumento di popolarità tra aziende, organizzazioni, analisti e consulenti. Cosa guida questo sviluppo, considerando che questo argomento non è generalmente considerato molto sexy?
I dati sono una rappresentazione dei fatti. Inserendo i dati nel contesto, vengono create informazioni. L’assenza di una buona gestione dei dati spesso significa automaticamente che la gestione e le informazioni operative non sono efficaci. A lungo termine, questo paralizzerà un’organizzazione nella misura in cui non può più funzionare correttamente. La ragione di ciò è che le decisioni importanti vengono prese troppo tardi, perché le persone non possono più fare affidamento sulle informazioni di gestione. Inoltre, la gestione dei processi aziendali richiede tempo e sforzi crescenti perché le attività e le responsabilità dei reparti non sono ben allineate tra loro. In questa situazione, ognuno crea e gestisce solo i dati necessari per l’esecuzione dei propri compiti, e di conseguenza fa uso di un proprio set di definizioni di dati. Poiché i dipartimenti si accusano a vicenda di inesattezza, le misure di controllo vengono imposte in massa e le operazioni diventano ancora più viscose, portando a una spirale discendente per l’intera impresa. Pertanto, esiste un motivo commerciale urgente per assegnare alla gestione dei dati una posizione indipendente e professionale all’interno delle organizzazioni.
Inoltre, norme e regolamenti impongono un’organizzazione strutturata di gestione dei dati. Le normative nel settore finanziario, come Basilea e Solvency, impongono un quadro di governance da implementare per la qualità dei dati e la tracciabilità delle informazioni utilizzate nei report organizzativi. In tale contesto, Basilea II afferma: “La banca deve disporre di un processo di valutazione dei dati immessi in un modello statistico di previsione di inadempienze o perdite che comprenda una valutazione dell’accuratezza, della completezza e dell’adeguatezza dei dati specifici per l’assegnazione di un rating approvato.”La gestione qualitativa dei dati è importante per essere in grado di soddisfare questi criteri, ma può anche richiedere molto tempo per essere implementata. In questo contesto, è difficile rispettare norme e regolamenti o in atto accordi con fornitori e clienti.
Enterprise Data Management comprende tutte le attività all’interno delle organizzazioni volte all’identificazione strutturata, classificazione, registrazione, modellazione, sblocco, protezione, archiviazione e cancellazione dei dati. In questo quadro, il termine “impresa” rappresenta il carattere a livello di organizzazione della gestione dei dati.
Il fatto che la gestione dei dati svolga un ruolo così cruciale nelle operazioni aziendali è sottolineato dalle dichiarazioni dei funzionari di livello C. Aloys Kregting, CIO di DSM, scelto come CIO dell’anno nel 2011, afferma: “Il CIO dovrebbe soprattutto occuparsi del valore delle informazioni. Devi sapere esattamente quali persone hanno bisogno di quali informazioni quando e facilitare anche questo processo. Ciò sottolinea ancora una volta l’importanza della rendicontazione e della gestione dei dati anagrafici.’
Come secondo esempio si può scegliere il CEO di un olio impresa di esplorazione e produzione, che si rende conto che una buona gestione dei dati è il passo successivo della sua società di progredire verso l’eccellenza del business, e permetterà di distinguersi dalla concorrenza: ‘gli sforzi di miglioramento Continuo si concentrerà ora sull’approfittare di questi cambiamenti e scoprire il valore nascosto che essi offrono. Ciò significa guidare processi semplificati e una gestione dei dati rafforzata per fornire un processo decisionale più rapido e meglio informato, una maggiore reattività alle esigenze dei clienti e meno sprechi, il tutto con un conseguente aumento delle prestazioni competitive.’
I dati come risorsa
Come menzionato sopra, i dati sono una rappresentazione dei fatti. In un ambiente aziendale ciò significa “fatti riguardanti le operazioni commerciali”. Senza contesto o struttura, questi dati non hanno alcun valore aggiunto per un’azienda. Manca il contenuto e il significato per avere un valore reale. Qui, facciamo una distinzione tra dati strutturati (memorizzati e disposti in un database) e dati non strutturati (sotto forma di documenti, file, immagini, messaggi di testo, moduli, video o registrazioni sonore, che non possono essere incorporati in righe, colonne o record).
Senza informazioni supplementari, è difficile, se non impossibile, classificare, registrare e sbloccare questi dati per l’uso. Nel momento in cui portiamo il contesto a questi dati-è quando acquista significato. Aggiungiamo quindi un riferimento, una data e un’ora, il significato del messaggio, un formato. Con questo, i dati sono strutturati e diventano informazioni. Se colleghiamo tutte le varie fonti di informazione, stabilendo relazioni e identificando modelli, questa informazione diventa conoscenza. Questo è quindi il valore aggiunto della business intelligence( BI): collegare varie fonti di informazione in un’organizzazione per migliorare il processo decisionale da parte della direzione dell’azienda. Vedi anche Figura 1.
Figura 1. Valore dei dati, inseriti nel contesto.
Le organizzazioni che sono meglio in grado di strutturare i propri dati e di aprire queste informazioni ai lavoratori della conoscenza all’interno dell’azienda avranno un vantaggio competitivo. L’utilizzo del potere commerciale intrinseco di questi dati darà alle aziende e alle organizzazioni un vantaggio strategico rispetto ai loro concorrenti. Eric Schmidt, ex CEO di Google, ha dichiarato nel 2010: “Non credo che la società capisca cosa succede quando tutto è disponibile, conoscibile e registrato da tutti tutto il tempo.”E Gartner dichiara: “Nel settore privato stimiamo, ad esempio, che un rivenditore che utilizza pienamente i big data abbia il potenziale per aumentare il proprio margine operativo di oltre il 60%.'()
Ma non si tratta solo di una buona strutturazione e sblocco dei dati. Per diversi anni, l’idea prevalente era che la BI avrebbe risolto il problema delle informazioni di gestione. La maggior parte delle aziende e delle organizzazioni globali ha implementato software complessi ed eseguito costosi programmi di BI. Tuttavia, la direzione non è soddisfatta. Poiché la BI è orientata principalmente verso i dati strutturati, viene investito uno sforzo insufficiente per sbloccare il valore dei dati non strutturati. Inoltre, le informazioni di gestione non possono essere facilmente modificate per soddisfare le mutevoli esigenze aziendali. KPMG ha dichiarato: “Gli enormi investimenti in IT non garantiscono necessariamente una migliore informazione. Ciò che è più importante è cambiare radicalmente il modo in cui i dati vengono raccolti, elaborati e presentati.”()
Le informazioni esposte mediante un data warehouse sono prive di valore se la qualità del set di dati sottostante è scarsa. Dati non strutturati (ca. 85% di tutti i dati aziendali) non è possibile accedere tramite un data warehouse. Le domande sono quindi: come possiamo aggiornare questi dati e cosa costituisce una buona gestione dei dati per i dati non strutturati? In questo contesto, “buono” significa in conformità con i criteri di qualità che l’organizzazione ha imposto ai dati. È evidente che i “buoni dati” non sono qualcosa che appare semplicemente dal nulla. È necessario un framework. Questo framework consiste in attività che un’azienda deve organizzare e incorporare nell’organizzazione in modo logico e preciso. Questa si chiama data management e copre tutte le attività organizzative dirette verso le operazioni aziendali, al fine di identificare, classificare, registrare, modellare, sbloccare, proteggere, archiviare ed eliminare i dati in modo strutturato. Per tali attività facciamo uso del termine ‘Enterprise Data Management’ (EDM), perché si tratta di attività che vengono eseguite a livello di organizzazione.
La consapevolezza che una buona gestione dei dati può aggiungere valore alle attività aziendali e aumentare i profitti ha portato analisti e consulenti a mettere i dati allo stesso livello di altre risorse aziendali come terreni, edifici e macchinari. In questo contesto, i dati sono definiti come un asset aziendale. Le risorse devono essere ben gestite: correttamente mantenute e protette, con la proprietà assegnata e lo smaltimento o la sostituzione tempestiva dei dati se diventano obsoleti. Proprio come altre attività, i dati organizzativi possono anche essere venduti per estrarne il valore. Ad esempio, i concorrenti valuteranno le informazioni sui clienti perché possono essere utilizzate per migliorare le vendite.
I direttori di aziende leader in tutto il mondo lo hanno pienamente riconosciuto. I programmi relativi ai dati sono prominenti nei loro elenchi di azioni. Il Gruppo Hackett afferma: “Ciò che le aziende stanno riconoscendo è che hanno gettato un sacco di soldi alle applicazioni ma, senza standardizzare e ripulire i loro dati, stanno ancora ottenendo informazioni che non hanno senso. Hanno aziende che utilizzano definizioni diverse, che calcolano le metriche in modo diverso, che utilizzano gerarchie diverse. L’intero concetto di gestione dei dati master è assolutamente fondamentale per le aziende per essere in grado di arrivare al punto in cui dispongono di analisi predittive.”Il business case per l’avvio di programmi di master data management (MDM) sembra evidente:” Entro il 2013, MDM ridurrà la ridondanza dei dati delle organizzazioni, il che può far risparmiare l ‘80% dei costi associati alla gestione dei dati ridondanti.'()
Modelli per la gestione dei dati aziendali
La gestione dei dati è stata oggetto di molta attenzione per un bel po ‘ di tempo, e c’è un’abbondanza di modelli e metodi che pretendono tutti di fornire la migliore risposta alla struttura della gestione dei dati aziendali. L’Organizzazione internazionale per la standardizzazione, meglio conosciuta come ISO, ha innumerevoli standard, ognuno dei quali copre un sotto-aspetto dello spettro dei dati. Ad esempio, ISO 27001 si occupa della sicurezza delle informazioni. ISO 15489 è la norma che viene applicata alla gestione delle informazioni dal punto di vista archivistico. ISO 23081 è lo standard per i metadati. Inoltre, è possibile utilizzare ISO 19005 come linea guida per l’aspetto dei dati. Quindi abbiamo un eccesso di standard. Altri framework come COSO e framework come Cobit e ISF parlano dell’importanza dei dati in senso più ampio, ma solo da una prospettiva di rischio.
Data Management Body of Knowledge
Un modello più completo sembrerebbe essere quello di DAMA-DMBOK. Contiene una raccolta di best practice nel campo della gestione dei dati che sono state integrate da nuove intuizioni dalla pratica della vita reale nel corso degli anni. La Guida DAMA-DMBOK (in full: Data Management Body of Knowledge) è una pubblicazione della Data Management Association, un’organizzazione internazionale rivolta ai data manager e ai professionisti dei dati per la distribuzione delle conoscenze sulla gestione dei dati.
Il DMBOK identifica dieci diverse funzioni di dati. Queste funzioni sono mostrate in Figura 2. Data governance è la funzione che collega gli altri domini tra loro. In ciascuno dei settori, si dovrebbe prestare attenzione ai fattori ambientali, come i metodi e le procedure di lavoro attuali, le tecniche utilizzate e la cultura organizzativa.
Figura 2. Domini di dati secondo DAMA ().
DAMA ha i suoi punti deboli. Ad esempio, il fatto che le funzioni menzionate si riferiscano solo l’una all’altra in termini generali, il che significa che un utente non sempre riconosce o comprende la relazione tra le funzioni e successivamente il significato generale della combinazione. Inoltre, DAMA sembra essere orientato verso dati tradizionali e strutturati, almeno in questo momento. Stando così le cose, poca attenzione è dedicata all’importanza dei contenuti dai social media. La sicurezza dei dati all’interno di DAMA è rivolta principalmente alla protezione tecnologica dei dati. A parte questo, la differenza nel modo in cui le generazioni trattano i dati non è stata esplicitamente riconosciuta come un fattore rilevante (fattore ambientale). Infine-e questa è forse la più grande obiezione – si tratta soprattutto di un quadro concettuale. Mancano esempi pratici per rendere sufficientemente chiari concetti e termini al lettore, con il rischio di un’interpretazione incoerente. Anche il modo in cui il quadro dovrebbe essere attuato non è chiaro. Questo è contrario all’obiettivo primario di un corpo di conoscenza. Dopo tutto, l’applicazione di questo insieme di conoscenze dovrebbe mirare a stimolare la coerenza nell’applicazione della gestione dei dati. È per queste ragioni che usiamo DAMA solo per la sua identificazione di funzioni, perché queste sono davvero solide.
KPMG Enterprise Data Management model
I modelli sopra citati contengono elementi importanti che devono essere seguiti nella realizzazione di un’organizzazione professionale di gestione dei dati. Per l’operazionalizzazione della gestione dei dati, tuttavia, è importante anche un altro insieme di aspetti, aspetti che non sono coperti da questi modelli.
In primo luogo, questi riguardano il fatto che i dati vengono scambiati tra sistemi sia all’interno dell’organizzazione che tra l’organizzazione e terze parti. Pertanto, la gestione dei dati dovrebbe garantire che siano presi buoni accordi sul formato in cui i dati vengono forniti, sulla convalida della qualità dei dati forniti, sui possibili cicli di arricchimento prima che i dati vengano ulteriormente elaborati e su eventuali procedure in caso di difetti nel processo. Raggruppiamo queste attività sotto i termini “acquisizione e authoring” e “distribuzione”.
Inoltre, EDM dovrebbe anche garantire che il quadro EDM possa essere mantenuto nel suo complesso. L’organizzazione deve disporre di processi per registrare documenti e difetti identificati durante l’esecuzione operativa delle attività EDM. Questi dovrebbero essere discussi negli organi di consultazione sulla governance dell’EDM e dovrebbero portare ad un adeguamento delle procedure e delle tecniche esistenti. In questo contesto, si può considerare una situazione in cui un dashboard di qualità dei dati utilizzato all’interno di un’organizzazione deve essere adattato perché l’organizzazione desidera monitorare un nuovo oggetto dati. In questi casi, dovrebbe esserci un “processo di cambiamento” che imposta il processo decisionale su questo cambiamento e implementa l’alterazione del cruscotto dopo che la decisione è stata presa.
Infine, tutte le attività di EDM svolte da un’organizzazione dovrebbero essere valutate in base alla loro efficacia ed efficienza. Proprio come nel caso dei processi primari all’interno di un’organizzazione, dovrebbe esserci un meccanismo di “piano, fare, controllare, agire” per l’EDM in modo da poter controllare se l’esecuzione delle attività di EDM è conforme agli accordi presi in materia. Il “monitoraggio del processo” consente questo e consente all’organizzazione EDM di identificare in modo indipendente eventuali difetti e di adottare misure correttive.
Questi passaggi sono rappresentati nel modello KPMG EDM in Figura 3.
Figura 3. Modello di gestione dei dati aziendali KPMG.
Di seguito viene presentata una breve descrizione degli elementi più importanti del modello.
- La governance dei dati è diretta allo sterzo delle attività di gestione dei dati. Questioni come strategia, politica, ruoli, compiti e responsabilità rientrano in questa categoria.
- L’architettura dei dati riguarda la definizione e la documentazione di oggetti dati e strutture dati in un modello di dati. Questi costituiscono la base per l’analisi delle informazioni e la costruzione di processi e sistemi in un’organizzazione.
- La gestione dei dati master riguarda la qualità dei dati master e di riferimento. L’obiettivo finale è quello di creare record unici (‘d’oro’).
- Il Data Warehousing è l’attività che garantisce la definizione dell’architettura utilizzata per memorizzare i dati nei database relazionali.
- La business Intelligence comporta l’apertura dei dati memorizzati nei data warehouse. I dati devono essere forniti in modo tale da fornire informazioni utili alla direzione, consentendo loro di prendere decisioni ben informate.
- La gestione della qualità dei dati riguarda una documentazione strutturale dei criteri di qualità, l’analisi della qualità effettiva dei dati e la rendicontazione della qualità dei dati.
- La gestione dei contenuti è diretta alla classificazione dei dati, alla strutturazione dei flussi documentali e all’accesso a questi.
- L’archiviazione è orientata al trasferimento dei dati inattivi in altri ambienti.
- In Operazioni di governance, per “metadati” si intendono le informazioni sugli elementi di gestione dei dati, come le descrizioni tecniche e funzionali degli oggetti di dati e dei modelli di dati.
- La gestione dei database è diretta alla gestione tecnica operativa dei database.
- La sicurezza dei dati è diretta alla protezione dei dati contro l’accesso e l’uso non autorizzati di questi dati.
- Identity Management, in conclusione, specifica l’accesso ai dati.
Per una descrizione più dettagliata di un certo numero di questi elementi EDM, vi rimandiamo ai contributi separati sugli elementi EDM che sono stati inclusi in questo Compatto.
EDM dal punto di vista organizzativo
Nell’ambito di questo articolo, non resta che rispondere alla questione del modo migliore per implementare il modello EDM nella pratica reale.
Se si osservano da vicino i vari componenti di EDM, come mostrato in Figura 3, si ha l’impressione che ci sia poco ordine logico in questi componenti. La figura 3 dimostra che non vi è alcuna priorità o graduale proposta per la costruzione e l’implementazione degli elementi. Tuttavia, è evidente che la governance dei dati collega tutti gli altri elementi. Con questo, vogliamo indicare che non esiste una classifica tra i domini e che l’ordine di sequenza in cui sono disposti i componenti di EDM è puramente casuale. La governance dei dati costituisce un’eccezione qui. Il collegamento che forma la governance dei dati tra tutte le altre parti di EDM mostra chiaramente che nessuna attività di gestione dei dati può essere sviluppata e implementata con successo se non esiste una governance dei dati all’interno dell’organizzazione.
Data governance pone le basi per tutte le attività di gestione dei dati. Senza questo fondamento, le attività sarebbero semplicemente un mucchio di mattoni sciolti senza struttura e cemento. Ciò potrebbe significare che le soluzioni di BI vengono acquistate e implementate mentre non ci sono standard di dati o definizioni di dati insufficienti. Oppure può essere il caso che la qualità dei dati necessaria per generare informazioni di gestione affidabili sia inadeguata. Ciò può portare alla progettazione e all’acquisto di sistemi che non sono compatibili con altri sistemi perché non esiste un modello di dati aziendali globale che funga da base per tutti gli sviluppi del sistema. In ultima analisi, può comportare un’organizzazione che fa un uso attivo delle tracce che gli utenti di Internet lasciano sui siti Web, senza prendere in considerazione le regole sulla privacy, il che potrebbe portare a danni all’immagine e forse a rivendicazioni.
Data governance garantisce una visione e una strategia a livello di organizzazione per la gestione dei dati, supportate dal management. La visione ci informa di ciò che vogliamo raggiungere. Indica l’ambizione dell’organizzazione per così dire. Tutte le attività relative ai dati dovrebbero essere conformi a questa visione e la strategia dovrebbe portare coerenza in queste attività. La strategia determina anche l’ambito della gestione dei dati all’interno di un’organizzazione. Ignorando il modello DAMA generale, le organizzazioni potrebbero preferire di omettere determinati aspetti dalla considerazione perché probabilmente sono già stati compilati da qualche altra parte, in un’unità decentrata. Un fenomeno costantemente ricorrente, ad esempio, è il fatto che HR crea una propria organizzazione di gestione dei dati e fa solo un uso limitato delle linee guida e degli standard sviluppati dall’organizzazione centrale di gestione dei dati.
Data governance garantisce inoltre che l’attenzione sia dedicata alla formulazione di regole politiche. In questo contesto, ci riferiamo alla politica di sicurezza delle informazioni, alle regole politiche relative all’architettura dei dati, all’archiviazione e alla qualità dei dati. Inoltre, data governance garantisce l’incorporamento organizzativo della gestione dei dati. È necessario determinare: chi è in ultima analisi responsabile, dove e come vengono prese le decisioni su strategia, politica, standard, ruoli, proprietà? Ad esempio, come e quando vengono formulati i report sulle attività di gestione dei dati all’interno dell’organizzazione? In che modo organizziamo l’esecuzione delle attività di master data maintenance?
Questa panoramica avrà chiarito che la governance dei dati è la base di una buona gestione dei dati. Indipendentemente dalla fase di maturità in cui un’organizzazione può trovarsi, è sempre utile esaminare seriamente la qualità della governance dei dati e verificare se la sua portata sia adeguata o meno.
Immagina che un’organizzazione abbia la sua governance dei dati completamente in ordine. Ci sono quindi appigli disponibili o best practice che possono chiarire quali degli altri componenti di gestione dei dati sono direttamente idonei per l’ottimizzazione, in termini di priorità? Sfortunatamente, questo non è il caso. In altre parole, l’esperienza ci ha insegnato che questo dipende dalle priorità che emettono dall’agenda dell’organizzazione stessa.
Immagina che un’organizzazione decida di sostituire un sistema informativo legacy con un nuovo sistema ERP. Ci si potrebbe quindi chiedere l’impatto che questo potrebbe avere sulla gestione dei dati. Cosa dovrebbe avere la massima priorità? Ciò può comportare l’assegnazione della massima priorità alla “Gestione della qualità dei dati” a seguito della migrazione necessaria. I dati inquinati vengono ripuliti, la meta-documentazione viene affrontata e la gestione dei dati principali viene migliorata. L’implementazione di un’applicazione di integrazione dei dati può portare, ad esempio, all’aggiornamento del modello di architettura dei dati e alla selezione e implementazione di un’applicazione di qualità dei dati al fine di pulire e arricchire i dati prima che vengano condivisi con altre piattaforme.
Figura 4. Relazione tra modello di business ed EDM.
Concludendo, riteniamo che, sulla base della governance dei dati e a seconda dell’agenda aziendale dell’organizzazione, debbano essere perseguite quelle attività di gestione dei dati che apportano il maggior valore aggiunto nella realizzazione dell’agenda in un determinato momento. I dettagli sono mostrati in Figura 4. Centrato sulla visione e sulla strategia, viene costruito il modello di business necessario per realizzare gli obiettivi dichiarati nella visione e nella strategia. Questo modello di business richiede i processi primari e di supporto. Le risorse sono necessarie per consentire a questi processi di funzionare e possono essere successivamente suddivise in risorse umane, dati e IT. Esattamente cosa e quanto è necessario sul lato dei dati in un caso specifico è determinato dall’agenda aziendale. EDM offre un punto d’appoggio per il modo in cui questo dovrebbe essere organizzato. Questo comporta un approccio su misura e non può essere incapsulato in un modello fisso di attività di gestione dei dati.
Conclusione
In questo contributo abbiamo dato un’introduzione all’EDM come approccio alla gestione di tutti i dati che un’organizzazione genera o acquisisce. Una corretta implementazione di questo approccio garantisce che questi dati siano conformi ai requisiti di qualità dei dati dell’organizzazione e che i dati necessari per eseguire i processi e consentire alla gestione di prendere decisioni fondate siano corretti, completi e disponibili tempestivamente. In questo caso, i dati sono una risorsa che deve essere gestita come tutte le altre risorse aziendali. Successivamente, abbiamo ulteriormente definito le parti costitutive di EDM. Pertanto, è sorto un quadro di attività di gestione che costituiscono la base per la qualità dei dati. Infine, abbiamo sostenuto che l’attuazione delle parti costitutive non può avvenire secondo uno schema fisso. Nell’operazionalizzazione, è la strategia aziendale e la priorità che determinano quali dei componenti di EDM sono selezionati e ottimizzati. Un ruolo cruciale è assegnato alla governance dei dati, che garantisce la visione e la strategia a livello di organizzazione e di gestione.
The DAMA Guide to The Data management Body of Knowledge (DAMA-DMBOK Guide), p. 7. Prima edizione, 2009. Via http://franklybi.blogspot.com/.
Gartner, Hype Cycle for Master Data Management, 2010.
KPMG International, la tua Business Intelligence ti racconta tutta la storia?, 2009.
McKinsey Global Institute, Big Data: the Next Frontier for Innovation, Competition and Productivity, McKinsey & Company, 2011.