Enterprise Data Management: brug og behov

Enterprise Data Management beskæftiger sig med hele spektret af aktiviteter rettet mod organisation og korrekt brug af data. Denne artikel dækker baggrunden for den relative popularitet af datastyring i mange organisationer i løbet af de sidste par år. Hvad er formålet med data management? Hvorfor er datastyring så vigtig? Og hvis organisationer ønsker at engagere sig i dette emne, Hvordan gør man det? Denne artikel bestræber sig på at besvare disse spørgsmål.

introduktion

vores digitale verden er bygget på information. Data er overalt, og alle bruger det til deres daglige forretning. Data management har for nylig oplevet en stigning i popularitet på tværs af virksomheder, organisationer, analytikere og rådgivere. Hvad driver denne udvikling, i betragtning af at dette emne generelt ikke anses for at være meget seksuelt?

Data er en repræsentation af fakta. Ved at placere data i kontekst oprettes information. Fraværet af god datastyring betyder ofte automatisk, at ledelse og operationel information ikke er effektiv. I det lange løb vil dette lamme en organisation i det omfang, den ikke længere kan fungere korrekt. Årsagen til dette er, at vigtige beslutninger træffes for sent, fordi folk ikke længere kan stole på ledelsesinformation. Derudover kræver forretningsprocesstyring øget tid og kræfter, fordi afdelingernes opgaver og ansvar ikke er godt tilpasset hinanden. I denne situation opretter og administrerer alle kun de data, der er nødvendige for udførelsen af hans eller hendes egne opgaver, og bruger derfor et eget sæt datadefinitioner. Fordi afdelinger beskylder hinanden for unøjagtighed, indføres kontrolforanstaltninger i massevis, og operationerne bliver endnu mere vicious, hvilket fører til en nedadgående spiral for hele virksomheden. Derfor er der en presserende forretningsmæssig grund til at tildele datastyring en uafhængig og professionel position inden for organisationer.

desuden håndhæver regler og forskrifter en struktureret organisation af datastyring. Forordninger i den finansielle sektor, såsom Basel og solvens, kræver en styringsramme, der skal implementeres for datakvalitet og sporbarhed af oplysninger, der bruges i organisatoriske rapporter. I denne forbindelse fastslår Basel II: ‘banken skal have indført en proces til kontrol af datainput i en statistisk standard-eller tabsprognosemodel, som omfatter en vurdering af nøjagtigheden, fuldstændigheden og hensigtsmæssigheden af de data, der er specifikke for tildelingen af en godkendt rating.’Kvalitativ datastyring er vigtig for at kunne opfylde disse kriterier, men kan også være meget tidskrævende at implementere. I denne sammenhæng er det vanskeligt at overholde regler og forskrifter eller indgå aftaler med leverandører og kunder.

Enterprise Data Management består af alle aktiviteter inden for organisationer rettet mod struktureret identifikation, klassificering, registrering, modellering, oplåsning, sikring, arkivering og sletning af data. I denne ramme repræsenterer udtrykket ‘virksomhed’ den organisationsdækkende karakter af datastyring.

det faktum, at datastyring spiller en så afgørende rolle i forretningsdriften, understreges af udsagn fra embedsmænd på C-niveau. Aloys Kregting, CIO for DSM, valgt som Årets CIO i 2011, siger: ‘CIO skal frem for alt være bekymret for værdien af information. Du skal vide præcis, hvilke mennesker har brug for hvilke oplysninger, når, og lette denne proces samt. Dette understreger endnu en gang vigtigheden af rapportering og styring af stamdata.’

som et andet eksempel kan vi pege på Administrerende Direktør for et olieefterforsknings-og produktionsselskab, der indser, at god datastyring er det næste skridt i hans virksomheds fremskridt mod forretningsekspertise og vil gøre det muligt for den at skille sig ud fra sine rivaler: ‘løbende forbedringsindsats vil nu fokusere på at drage fordel af disse ændringer og afdække den skjulte værdi, de tilbyder. Det betyder, at vi skal køre forenklede processer og styrket datastyring for at give hurtigere og bedre informeret beslutningstagning, større lydhørhed over for kundernes behov og mindre spild-alt sammen med større konkurrenceevne.’

Data som et aktiv

som nævnt ovenfor er data en repræsentation af fakta. I et forretningsmiljø betyder det ‘fakta om forretningsdrift’. Uden kontekst eller struktur har disse data ingen merværdi for en virksomhed. Det mangler indhold og betydning for at have nogen reel værdi. Her skelner vi mellem strukturerede data (gemt og arrangeret i en database) og ustrukturerede data (i form af dokumenter, filer, billeder, tekstbeskeder, formularer, videoer eller lydoptagelser, som ikke kan indarbejdes i rækker, kolonner eller poster).

uden supplerende oplysninger er det vanskeligt, hvis ikke umuligt, at klassificere, registrere og låse disse data op til brug. I det øjeblik vi bringer kontekst til disse data – det er når det får betydning. Vi tilføjer derefter en reference, en dato og et tidspunkt, betydningen af meddelelsen, et format. Med dette er dataene struktureret og bliver til information. Hvis vi forbinder alle de forskellige informationskilder ved at etablere relationer og identificere mønstre, bliver disse oplysninger viden. Dette er således merværdien af business intelligence (BI): tilslutning af forskellige informationskilder i en organisation for at forbedre beslutningsprocessen fra virksomhedens ledelse. Se også Figur 1.

C-2012-2-Jonker-01

Figur 1. Værdi af data, placeret i sammenhæng.

organisationer, der er bedst i stand til at strukturere deres data og åbne disse oplysninger for vidensarbejderne i virksomheden, vil have en konkurrencemæssig fordel. Brug af den iboende kommercielle magt af disse data vil give virksomheder og organisationer en strategisk føring over deres konkurrenter. Eric Schmidt, tidligere administrerende direktør for Google, sagde i 2010: ‘Jeg tror ikke, at samfundet forstår, hvad der sker, når alt er tilgængeligt, kendt og registreret af alle hele tiden.’Og Gartner erklærer: I den private sektor vurderer vi for eksempel, at en detailhandler, der bruger big data fuldt ud, har potentialet til at øge sin driftsmargin med mere end 60%.'()

men det handler ikke kun om god strukturering og oplåsning af data. I flere år var den fremherskende ide, at BI ville løse problemet med ledelsesinformation. De fleste globale virksomheder og organisationer har implementeret komplekse programmer og udført dyre BI-programmer. Ikke desto mindre er ledelsen ikke tilfreds. Da BI primært er orienteret mod strukturerede data, investeres utilstrækkelig indsats i at frigøre værdien af ustrukturerede data. Desuden kan ledelsesinformation ikke let ændres for at imødekomme skiftende virksomhedsbehov. KPMG har udtalt: ‘store investeringer i IT garanterer ikke nødvendigvis bedre information. Hvad der er vigtigere er grundlæggende at ændre den måde, hvorpå data indsamles, behandles og præsenteres.'()

oplysninger, der eksponeres ved hjælp af et datalager, er værdiløse, hvis kvaliteten af det underliggende datasæt er dårlig. Ustrukturerede data (CA. 85% af alle virksomhedsdata) kan ikke tilgås via et datalager. Spørgsmålene er derfor: hvordan kan vi opgradere disse data, og hvad der udgør god datastyring for ustrukturerede data? I denne sammenhæng betyder ‘god’ i overensstemmelse med de kvalitetskriterier, som organisationen har pålagt dataene. Det er tydeligt, at ‘gode data’ ikke er noget, der simpelthen vises ud af tynd luft. Der kræves en ramme. Denne ramme består af aktiviteter, som en virksomhed skal arrangere og integrere i organisationen på en logisk og præcis måde. Dette kaldes datastyring og dækker alle organisatoriske aktiviteter rettet mod forretningsdrift for at identificere, klassificere, registrere, modellere, låse op, sikre, arkivere og slette data på en struktureret måde. Til sådanne aktiviteter bruger vi udtrykket ‘Enterprise Data Management’ (EDM), fordi det involverer aktiviteter, der udføres hele organisationen.

bevidstheden om, at god styring af data kan tilføre værdi til virksomhedens aktiviteter og øge overskuddet, har bragt analytikere og rådgivere til at sætte data på samme niveau som andre virksomhedsressourcer som jord, bygninger og maskiner. I denne sammenhæng defineres data som et virksomhedsaktiv. Aktiver skal styres godt: korrekt vedligeholdt og beskyttet med tildelt ejerskab og rettidig bortskaffelse eller udskiftning af data, hvis de bliver forældede. Ligesom andre aktiver kan organisatoriske data også sælges for at udtrække dens værdi. For eksempel vil konkurrenter værdsætte kundeoplysninger, fordi de kan bruges til at forbedre salget.

direktører for førende virksomheder over hele verden har fuldt ud anerkendt dette. Datarelaterede programmer er fremtrædende på deres aktionslister. Hackett-gruppen siger: ‘hvad virksomheder anerkender er, at de har kastet masser af penge på applikationerne, men uden at standardisere og rense deres data får de stadig information, der ikke giver mening. De har virksomheder, der bruger forskellige definitioner, der beregner metrics forskelligt, der bruger forskellige hierarkier. Hele dette koncept med masterdatastyring er helt afgørende for, at virksomheder i sidste ende kan komme til det punkt, hvor de har forudsigelig analyse.’Business case for initiering af master data management (MDM) programmer synes indlysende: ‘i 2013 vil MDM reducere organisationernes dataredundans, hvilket kan spare 80% af omkostningerne forbundet med styring af overflødige data.'()

modeller til Virksomhedsdatastyring

styring af data har været genstand for meget opmærksomhed i nogen tid, og der er en overflod af modeller og metoder, der alle hævder at give det bedste svar på strukturen i Virksomhedsdatastyring. Den Internationale Standardiseringsorganisation, bedre kendt som ISO, har utallige standarder, der hver især dækker et underaspekt af dataspektret. For eksempel beskæftiger ISO 27001 sig med informationssikkerhed. ISO 15489 er den norm, der anvendes til styring af information fra et arkivperspektiv. ISO 23081 er standarden for metadata. Derudover kan man bruge ISO 19005 som en retningslinje for udseendet af data. Så vi har en overflod af standarder. Andre rammer som COSO og rammer som Cobit og ISF taler om vigtigheden af data i bredere forstand, men kun ud fra et risikoperspektiv.

Data Management krop af viden

en mere komplet model synes at være, at DAMA-DMBOK. Den indeholder en samling af bedste praksis inden for datastyring, der er blevet suppleret med ny indsigt fra praksis i det virkelige liv gennem årene. DAMA-DMBOK Guide (i sin helhed: Data Management krop af viden) er en publikation af Data Management Association, en international organisation rettet mod data ledere og data fagfolk til distribution af viden om data management.

dmbok identificerer ti forskellige datafunktioner. Disse funktioner er vist i figur 2. Data governance er den funktion, der forbinder de andre domæner til hinanden. På hvert af domænerne skal der lægges vægt på miljøfaktorer, såsom nuværende arbejdsmetoder og procedurer, anvendte teknikker og organisationskulturen.

C-2013-0-Jonker-02-klein

figur 2. Data domæner ifølge DAMA ().

DAMA har sine svage punkter. For eksempel det faktum, at de nævnte funktioner kun henviser til hinanden i brede vendinger, hvilket betyder, at en bruger ikke altid genkender eller forstår forholdet mellem funktioner og efterfølgende den overordnede betydning af kombinationen. Desuden synes DAMA at være orienteret mod traditionelle, strukturerede data, i det mindste på dette tidspunkt. Dette er tilfældet, lidt opmærksomhed er afsat til vigtigheden af indhold fra de sociale medier. Datasikkerhed i DAMA er primært rettet mod den teknologiske beskyttelse af data. Bortset fra dette er forskellen i den måde, generationer håndterer data på, ikke udtrykkeligt anerkendt som en relevant faktor (miljøfaktor). Endelig – og det er måske den største indvending-er det frem for alt en begrebsmæssig ramme. Det mangler praktiske eksempler for at gøre begreber og udtryk tilstrækkeligt klare for læseren, hvilket medfører en risiko for inkonsekvent fortolkning. Den måde, hvorpå rammerne skal gennemføres, er også temmelig uklar. Dette er i strid med det primære mål for en krop af viden. Når alt kommer til alt, bør anvendelsen af denne viden sigte mod at stimulere konsistens i anvendelsen af datastyring. Det er af disse grunde, at vi kun bruger DAMA til identifikation af funktioner, fordi de faktisk er solide.

KPMG Enterprise Data Management model

ovennævnte modeller indeholder vigtige elementer, der skal overholdes i realiseringen af en professionel datastyringsorganisation. Til operationalisering af datastyring er et andet sæt aspekter imidlertid også vigtigt, aspekter, der ikke er dækket af disse modeller.

først og fremmest involverer disse det faktum, at data udveksles mellem systemer både inden for organisationen og mellem organisationen og tredjepart. Derfor bør datastyring sikre, at der indgås gode aftaler om det format, som data leveres i, om validering af kvaliteten af de leverede data, om mulige berigelsesrunder, før dataene behandles yderligere, og om eventuelle procedurer, hvis der opstår mangler i processen. Vi grupperer disse aktiviteter under udtrykkene ‘erhvervelse og authoring’ og ‘distribution’.

derudover bør EDM også sikre, at EDM-rammen kan opretholdes som en helhed. Organisationen skal have processer til rådighed for at registrere dokumenter og mangler, der er identificeret under den operationelle udførelse af EDM-aktiviteter. Disse bør drøftes i EDM governance høring organer, og bør føre til en tilpasning af eksisterende procedurer og teknikker. I denne sammenhæng kan man overveje en situation, hvor et datakvalitetsdashboard, der bruges i en organisation, skal tilpasses, fordi organisationen ønsker at overvåge et nyt dataobjekt. I sådanne tilfælde bør der være en ‘ændringsproces’, der fastlægger beslutningstagningen om denne ændring og implementerer ændringen af instrumentbrættet, efter at beslutningen er truffet.

endelig skal alle EDM-aktiviteter, der udføres af en organisation, vurderes i henhold til deres effektivitet og effektivitet. Ligesom det er tilfældet med de primære processer i en organisation, bør der være en ‘plan, Do, check, act’ mekanisme for EDM, så man kan kontrollere, om udførelsen af EDM-aktiviteter overholder de aftaler, der er indgået i denne sag. ‘Procesovervågning’ muliggør dette og giver EDM-organisationen mulighed for uafhængigt at identificere eventuelle mangler og træffe korrigerende foranstaltninger.

disse trin er afbildet i KPMG EDM-modellen i figur 3.

C-2012-2-Jonker-03

figur 3. KPMG Enterprise Data Management model.

en kort beskrivelse af de vigtigste elementer i modellen er præsenteret nedenfor.

  • datastyring er rettet mod styring af datastyringsaktiviteter. Spørgsmål som strategi, politik, roller, opgaver og ansvar kommer ind i denne kategori.
  • Dataarkitektur beskæftiger sig med definition og dokumentation af dataobjekter og datastrukturer i en datamodel. Disse danner grundlag for informationsanalyse og proces-og systemopbygning i en organisation.
  • Master Data Management vedrører kvaliteten af master-og referencedata. Det ultimative mål er at skabe unikke (‘gyldne’) poster.
  • datalagring er den aktivitet, der sikrer definitionen af den arkitektur, der bruges til at gemme data i relationsdatabaser.
  • Business Intelligence indebærer åbning af data, der er gemt i datalagre. Dataene skal leveres på en sådan måde, at de giver nyttige oplysninger til ledelsen, så de kan træffe velinformerede beslutninger.
  • Datakvalitetsstyring vedrører en strukturel dokumentation af kvalitetskriterier, analyse af faktisk datakvalitet og rapportering af datakvalitet.
  • indholdsstyring er rettet mod klassificering af data, strukturering af dokumentstrømme og adgang til disse.
  • arkivering er orienteret mod flytning af inaktive data til andre miljøer.
  • under Governance Operations, ‘meta-data’ refererer til oplysninger om data management elementer såsom tekniske og funktionelle beskrivelser af data objekter og datamodeller.
  • databasestyring er rettet mod den operationelle tekniske styring af databaser.
  • datasikkerhed er rettet mod at sikre data mod uautoriseret adgang og brug af disse data.
  • identitetsstyring angiver afslutningsvis adgangen til data.

For en mere detaljeret beskrivelse af et antal af disse EDM-elementer henviser vi til de separate Bidrag til EDM-elementer, der er inkluderet i denne kompakt.

EDM fra et organisatorisk perspektiv

inden for rammerne af denne artikel er det kun for os at reagere på spørgsmålet om den bedste måde at implementere EDM-modellen i praksis i det virkelige liv.

hvis du ser nøje på de forskellige komponenter i EDM, som vist i figur 3, får du indtryk af, at der er lidt logisk rækkefølge i disse komponenter. Figur 3 viser, at der ikke er nogen foreslået prioritering eller indfasning af konstruktionen og implementeringen af elementerne. Det er imidlertid tydeligt, at datastyring forbinder alle de andre elementer. Med dette ønsker vi at indikere, at der ikke er nogen placering mellem domænerne, og at rækkefølgen af sekvens, hvori komponenterne i EDM er arrangeret, er rent tilfældig. Datastyring udgør en undtagelse her. Forbindelsen, som datastyring danner mellem alle de andre dele af EDM, viser tydeligt, at ingen datastyringsaktivitet overhovedet kan udvikles og implementeres med succes, hvis der ikke er nogen datastyring i organisationen.

Data governance lægger grundlaget for alle data management aktiviteter. Uden dette fundament ville aktiviteterne kun være en bunke løse mursten uden struktur og cement. Dette kan betyde, at BI-løsninger købes og implementeres, mens der ikke er tilstrækkelige datastandarder eller datadefinitioner. Eller det kan være tilfældet, at den datakvalitet, der kræves for at generere pålidelige ledelsesoplysninger, er utilstrækkelig. Dette kan føre til design og køb af systemer, der ikke er kompatible med andre systemer, fordi der ikke er nogen overordnet virksomhedsdatamodel, der tjener som grundlag for al systemudvikling. Det kan i sidste ende resultere i, at en organisation aktivt bruger de spor, som internetbrugere efterlader på hjemmesider, uden at tage hensyn til privatlivets regler, hvilket kan føre til billedskader og måske krav.

Data governance sikrer, at der er en organisationsdækkende vision og strategi for datastyring, understøttet af ledelsen. Visionen informerer os om, hvad vi ønsker at opnå. Det angiver organisationens ambition som den var. Alle datarelaterede aktiviteter skal overholde denne vision, og strategien bør skabe sammenhæng i disse aktiviteter. Strategi dikterer også omfanget af datastyring i en organisation. Ignorerer den overordnede DAMA-model, kan organisationer foretrække at udelade visse aspekter fra overvejelse, fordi de sandsynligvis allerede udfyldes et andet sted i en decentral enhed. Et konsekvent tilbagevendende fænomen er for eksempel det faktum, at HR opretter sin egen datastyringsorganisation og kun bruger begrænset brug af de retningslinjer og standarder, som den centrale datastyringsorganisation har udviklet.

Data governance sikrer også, at opmærksomheden er afsat til formuleringen af politiske regler. I denne sammenhæng henviser vi til informationssikkerhedspolitik, politiske regler vedrørende dataarkitektur, arkivering og datakvalitet. Derudover sikrer datastyring den organisatoriske indlejring af datastyring. Det er nødvendigt at bestemme: hvem er i sidste ende ansvarlig, hvor og hvordan træffes beslutninger om strategi, politik, standarder, roller, ejerskab? For eksempel, hvordan og hvornår formuleres rapporter om datastyringsaktiviteter i organisationen? På hvilken måde organiserer vi udførelsen af masterdatavedligeholdelsesaktiviteter?

denne oversigt vil have gjort det klart, at datastyring er grundlaget for god datastyring. Uanset hvilket modenhedsstadium en organisation befinder sig i, er det altid fordelagtigt at undersøge kvaliteten af datastyring seriøst og kontrollere, om dens rækkevidde er tilstrækkelig eller ej.

Forestil dig, at en organisation har sin datastyring helt i orden. Er der så fodfæste tilgængelige eller bedste praksis, der kan afklare, hvilke af de andre datastyringskomponenter der er direkte berettigede til optimering med hensyn til prioritering? Desværre er dette ikke tilfældet. Med andre ord har erfaringen lært os, at dette afhænger af de prioriteter, der udsteder fra selve organisationens dagsorden.

Forestil dig, at en organisation beslutter at erstatte et ældre informationssystem med et nyt ERP-system. Man kan så undre sig over den indvirkning, dette kan have på datastyring. Hvad skal have højeste prioritet? Dette kan føre til, at Datakvalitetsstyring får højeste prioritet som følge af den nødvendige migration. Forurenede data renses, metadokumentation tackles, og masterdatastyringen forbedres. Implementeringen af en dataintegrationsapplikation kan for eksempel føre til, at dataarkitekturmodellen opdateres, og at en datakvalitetsapplikation vælges og implementeres for at rense og berige data, før den deles med andre platforme.

C-2013-0-Jonker-04-klein

figur 4. Forholdet mellem forretningsmodel og EDM.

afslutningsvis mener vi, at på grundlag af datastyring og afhængigt af organisationens forretningsdagsorden skal de datastyringsaktiviteter, der bringer mest merværdi i realiseringen af dagsordenen på et bestemt tidspunkt, forfølges. Detaljerne er vist i figur 4. Centreret om vision og strategi er den forretningsmodel, der er nødvendig for at realisere de mål, der er erklæret i visionen og strategien, konstrueret. Denne forretningsmodel stiller krav til de primære og understøttende processer. Ressourcer er nødvendige for at gøre det muligt for disse processer at fungere og kan senere opdeles i arbejdskraft, data og IT-ressourcer. Præcis hvad og hvor meget der er behov for på datasiden i en bestemt sag bestemmes af forretningsdagsordenen. EDM tilbyder fodfæste for den måde, hvorpå dette skal organiseres. Dette omfatter en skræddersyet tilgang og kan ikke indkapsles i et fast mønster af datastyringsaktiviteter.

konklusion

i dette bidrag har vi givet en introduktion til EDM som en tilgang til styring af alle de data, en organisation genererer eller erhverver. En korrekt implementering af denne tilgang sikrer, at disse data overholder organisationens datakvalitetskrav, og at de data, der er nødvendige for at udføre processer og for at gøre det muligt for ledelsen at tage velbegrundede beslutninger, er korrekte, komplette og tilgængelige rettidigt. Når dette er tilfældet, er data et aktiv, der skal styres ligesom alle andre virksomhedsaktiver. Derefter har vi yderligere defineret de bestanddele af EDM. Således er der opstået en ramme for ledelsesaktiviteter, der danner grundlaget for datakvalitet. Endelig har vi hævdet, at implementeringen af de bestanddele ikke kan finde sted i henhold til et fast mønster. I operationaliseringen er det virksomhedens strategi og prioritering, der bestemmer, hvilke af komponenterne i EDM der vælges og optimeres. En afgørende rolle er tildelt data governance, som sikrer den organisationsdækkende og ledelsessponsorerede vision og strategi.

DAMA-guiden til Datastyringsorganet for viden (DAMA-DMBOK Guide), s. 7. Første udgave, 2009. Via http://franklybi.blogspot.com/.

Gartner, Hype Cycle for Master Data Management, 2010.

KPMG International, fortæller din Business Intelligence dig hele historien?, 2009.

McKinsey Global Institute, Big Data: Den næste grænse for Innovation, konkurrence og produktivitet, McKinsey & virksomhed, 2011.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.