Enterprise Data Management se zabývá celým spektrem činností zaměřených na organizaci a správné využití dat. Tento článek se zabývá pozadím relativní popularity správy dat v mnoha organizacích za posledních několik let. Jaký je cíl správy dat? Proč je správa dat tak důležitá? A pokud se organizace chtějí zapojit do tohoto tématu, jak to udělat? Tento článek se snaží odpovědět na tyto otázky.
Úvod
náš digitální svět je postaven na informacích. Data jsou všude a každý je používá pro své každodenní podnikání. Správa dat v poslední době zaznamenala nárůst popularity napříč společnostmi, organizacemi, analytiky a poradci. Co řídí tento vývoj, vzhledem k tomu, že toto téma se obecně nepovažuje za velmi sexy?
Data jsou reprezentací faktů. Umístěním dat do kontextu se vytvářejí informace. Absence dobré správy dat často automaticky znamená, že manažerské a provozní informace nejsou účinné. Z dlouhodobého hlediska to ochromí organizaci do té míry, že již nemůže správně fungovat. Důvodem je to, že důležitá rozhodnutí jsou přijímána příliš pozdě, protože lidé se již nemohou spoléhat na informace o řízení. Řízení obchodních procesů navíc vyžaduje zvýšení času a úsilí, protože úkoly a odpovědnosti oddělení nejsou navzájem dobře sladěny. V této situaci každý vytváří a spravuje pouze data, která jsou nezbytná pro výkon svých vlastních povinností, a proto využívá vlastní soubor definic dat. Protože se oddělení navzájem obviňují z nepřesnosti, jsou hromadně zavedena kontrolní opatření a operace jsou ještě viskóznější, což vede k sestupné spirále pro celý podnik. Proto existuje naléhavý obchodní důvod přidělit správě dat nezávislé a profesionální postavení v rámci organizací.
navíc pravidla a předpisy vynucují strukturovanou organizaci správy dat. Předpisy ve finančním sektoru, jako je Basilej a solventnost, nařizují zavést rámec správy údajů pro kvalitu údajů a sledovatelnost informací používaných v organizačních zprávách. V této souvislosti Basel II uvádí: „banka musí mít zaveden postup prověřování vstupů údajů do statistického modelu predikce selhání nebo ztráty, který zahrnuje posouzení přesnosti, úplnosti a vhodnosti údajů specifických pro přidělení schváleného ratingu.“Kvalitativní správa údajů je důležitá pro splnění těchto kritérií,ale může být také velmi časově náročná. V této souvislosti je obtížné dodržovat pravidla a předpisy nebo zavádět dohody s dodavateli a zákazníky.
Správa podnikových dat se skládá ze všech činností v rámci organizací zaměřených na strukturovanou identifikaci, klasifikaci, registraci, modelování, odemykání, zabezpečení, archivaci a mazání dat. V tomto rámci pojem „podnik“ představuje celoorganizační charakter správy dat.
skutečnost, že správa dat hraje v obchodních operacích tak zásadní roli, je zdůrazněna prohlášeními úředníků na úrovni C. Aloys Kregting, CIO společnosti DSM, zvolený jako CIO roku v roce 2011, říká: „CIO by se měl především zabývat hodnotou informací. Musíte přesně vědět, kteří lidé potřebují, jaké informace kdy, a usnadnit tento proces také. To opět zdůrazňuje význam podávání zpráv a správy kmenových dat.“
jako druhý příklad můžeme poukázat na generálního ředitele společnosti zabývající se průzkumem a těžbou ropy, který si uvědomuje, že dobrá správa dat je dalším krokem v pokroku jeho společnosti směrem k obchodní dokonalosti a umožní jí vyniknout od svých konkurentů: „úsilí o neustálé zlepšování se nyní zaměří na využití těchto změn a odhalení skryté hodnoty, kterou nabízejí. To znamená řídit zjednodušené procesy a posílit správu dat, aby bylo zajištěno rychlejší a lépe informované rozhodování, větší schopnost reagovat na potřeby zákazníků a méně odpadu-to vše vede k vyšší konkurenceschopnosti.‘
Data jako aktivum
jak bylo uvedeno výše, data jsou reprezentací faktů. V podnikatelském prostředí to znamená „fakta týkající se obchodních operací“. Bez kontextu nebo struktury nemají tato data pro společnost žádnou přidanou hodnotu. Postrádá obsah a význam, aby měl jakoukoli skutečnou hodnotu. Zde rozlišujeme mezi strukturovanými daty (uloženými a uspořádanými v databázi) a nestrukturovanými daty (ve formě dokumentů ,souborů, obrázků, textových zpráv, formulářů, videí nebo zvukových záznamů, které nelze začlenit do řádků, sloupců nebo záznamů).
bez doplňujících informací je obtížné, ne-li nemožné, klasifikovat, registrovat a odemknout tato data pro použití. Ve chvíli, kdy k těmto datům přinášíme kontext – to je, když nabývá na významu. Poté přidáme odkaz, datum a čas, význam zprávy, formát. Díky tomu jsou data strukturována a stávají se informacemi. Pokud spojíme všechny různé zdroje informací, navázáním vztahů a identifikací vzorců se tyto informace stanou znalostmi. To je tedy přidaná hodnota business intelligence (BI): propojení různých informačních zdrojů v organizaci za účelem zlepšení rozhodování vedením společnosti. Viz také Obrázek 1.
Obrázek 1. Hodnota dat, umístěné v kontextu.
organizace, které jsou nejlépe schopné strukturovat svá data a otevírat tyto informace znalostním pracovníkům v rámci společnosti, budou mít konkurenční výhodu. Využití vlastní obchodní síly těchto údajů poskytne společnostem a organizacím strategický náskok před jejich konkurenty. Eric Schmidt, bývalý generální ředitel společnosti Google, uvedl v roce 2010: „nevěřím, že společnost chápe, co se stane, když je vše k dispozici, známo a zaznamenáno každým po celou dobu.“A Gartner prohlašuje: „Například v soukromém sektoru odhadujeme, že maloobchodník využívající big data v plném rozsahu má potenciál zvýšit svou provozní marži o více než 60%.'()
ale nejde jen o dobré strukturování a odemykání dat. Několik let převládala myšlenka, že BI vyřeší problém informací o řízení. Většina globálních společností a organizací implementovala komplexní software a prováděla drahé BI programy. Vedení však není spokojeno. Vzhledem k tomu, že BI je primárně orientován na strukturovaná data, není investováno dostatečné úsilí do odblokování hodnoty nestrukturovaných dat. Navíc informace o řízení nelze snadno upravit tak, aby vyhovovaly měnícím se potřebám společnosti. KPMG uvedla: „obrovské investice do IT nemusí nutně zaručit lepší informace. Co je důležitější, je zásadně změnit způsob, jakým jsou data shromažďována, zpracovávána a prezentována.'()
informace vystavené prostřednictvím datového skladu jsou bezcenné, pokud je kvalita podkladového datového souboru špatná. Nestrukturovaná data (cca. 85% všech firemních dat) nelze získat přístup přes datový sklad. Otázky proto zní: Jak můžeme tato data upgradovat a co představuje dobrou správu dat pro nestrukturovaná data? V této souvislosti se „dobrým“ rozumí v souladu s kritérii kvality, která organizace uložila na údaje. Je zřejmé, že „dobrá data“ nejsou něco, co se jednoduše objevuje ze vzduchu. Je vyžadován rámec. Tento rámec se skládá z činností, které musí společnost uspořádat a vložit do organizace logickým a přesným způsobem. Tomu se říká správa dat a pokrývá všechny organizační činnosti zaměřené na obchodní operace, aby bylo možné strukturovaným způsobem identifikovat, klasifikovat, registrovat, modelovat, odemykat, zabezpečit, archivovat a mazat data. Pro tyto činnosti používáme termín „Enterprise Data Management“ (EDM), protože zahrnuje činnosti, které jsou prováděny v celé organizaci.
povědomí o tom, že dobrá správa dat může zvýšit hodnotu činnosti společnosti a zvýšit zisky, přineslo analytikům a poradcům, aby uvedli data na stejnou úroveň jako jiné zdroje společnosti, jako jsou pozemky, budovy a stroje. V této souvislosti jsou data definována jako aktivum společnosti. Aktiva musí být dobře spravována: řádně udržována a chráněna, s přiřazeným vlastnictvím a včasnou likvidací nebo výměnou dat, pokud se stanou zastaralými. Stejně jako ostatní aktiva mohou být i organizační data prodána za účelem získání její hodnoty. Konkurenti například ocení informace o zákaznících, protože je lze použít ke zlepšení prodeje.
ředitelé předních společností po celém světě to plně uznali. Programy související s údaji jsou na jejich akčních seznamech prominentní. Hackett Group uvádí: „společnosti uznávají, že na aplikace hodily spoustu peněz, ale bez standardizace a čištění svých dat stále získávají informace, které nedávají smysl. Mají podniky, které používají různé definice, které počítají metriky odlišně, které používají různé hierarchie. Celý tento koncept správy kmenových dat je naprosto zásadní pro to, aby se společnosti mohly nakonec dostat do bodu, kdy mají prediktivní analytiku.“Obchodní případ pro zahájení programů pro správu kmenových dat (MDM)se zdá být zřejmý:“ do roku 2013 MDM sníží redundanci dat organizací, což může ušetřit 80% nákladů spojených se správou redundantních dat.'()
modely pro správu podnikových dat
správa dat je již nějakou dobu předmětem velké pozornosti a existuje množství modelů a metod, které tvrdí, že poskytují nejlepší odpověď na strukturu správy podnikových dat. Mezinárodní organizace pro normalizaci, lépe známá jako ISO, má nespočet standardů, z nichž každá pokrývá dílčí aspekt datového spektra. Například ISO 27001 se zabývá bezpečností informací. ISO 15489 je norma, která se používá pro správu informací z archivního hlediska. ISO 23081 je standardem pro metadata. Kromě toho lze použít ISO 19005 jako vodítko pro vzhled dat. Takže máme nadbytek standardů. Jiné rámce jako COSO a rámce jako Cobit a ISF hovoří o důležitosti dat v širším smyslu, ale pouze z hlediska rizika.
Data Management Body Of Knowledge
zdá se, že úplnějším modelem je model DAMA-DMBOK. Obsahuje sbírku osvědčených postupů v oblasti správy dat, které byly v průběhu let doplněny novými poznatky z praxe v reálném životě. Dama-DMBOK Guide (v plném rozsahu: Data Management Body Of Knowledge) je publikace Asociace pro správu dat, mezinárodní organizace zaměřené na správce dat a datové profesionály pro distribuci znalostí o správě dat.
DMBOK identifikuje deset různých datových funkcí. Tyto funkce jsou znázorněny na obrázku 2. Správa dat je funkce, která propojuje ostatní domény navzájem. V každé z domén by měla být věnována pozornost faktorům prostředí, jako jsou současné pracovní metody a postupy, použité techniky a organizační kultura.
Obrázek 2. Datové domény dle DAMA ().
DAMA má svá slabá místa. Například skutečnost, že uvedené funkce se na sebe vztahují pouze v širokém smyslu, což znamená, že uživatel ne vždy rozpozná nebo nerozumí vztahu mezi funkcemi a následně zastřešujícímu významu kombinace. Navíc se zdá, že se DAMA orientuje na tradiční, strukturovaná data, alespoň v tomto okamžiku. V tomto případě je věnována malá pozornost důležitosti obsahu ze sociálních médií. Zabezpečení dat v rámci DAMA je primárně zaměřeno na technologickou ochranu dat. Kromě toho rozdíl ve způsobu, jakým generace nakládají s daty, nebyl výslovně uznán jako relevantní faktor (environmentální faktor). Konečně – a to je možná největší námitka – je to především koncepční rámec. Chybí praktické příklady, aby byly pojmy a pojmy dostatečně jasné pro čtenáře, což znamená riziko nekonzistentní interpretace. Způsob, jakým by měl být rámec implementován, je také poněkud nejasný. To je v rozporu s primárním cílem souboru znalostí. Koneckonců, použití tohoto souboru znalostí by mělo být zaměřeno na stimulaci konzistence při aplikaci správy dat. Právě z těchto důvodů používáme DAMA pouze pro její identifikaci funkcí, protože ty jsou skutečně pevné.
KPMG Enterprise Data Management model
výše uvedené modely obsahují důležité prvky, kterým je třeba věnovat pozornost při realizaci profesionální organizace pro správu dat. Pro operacionalizaci správy dat je však důležitá i další sada aspektů, aspekty, na které se tyto modely nevztahují.
nejprve se jedná o skutečnost, že data jsou vyměňována mezi systémy jak v rámci organizace, tak mezi organizací a třetími stranami. Proto by správa údajů měla zajistit, aby byly uzavřeny dobré dohody o formátu, ve kterém jsou údaje doručovány, o ověření kvality dodaných údajů, o možných kolech obohacování před dalším zpracováním údajů a o jakýchkoli postupech, pokud se v procesu vyskytnou závady. Tyto činnosti seskupujeme pod pojmy „akvizice a tvorba“ a „distribuce“.
kromě toho by EDM měl také zajistit, aby rámec EDM mohl být zachován jako celek. Organizace musí mít k dispozici procesy pro zaznamenávání dokumentů a nedostatků zjištěných během provozního provádění činností EDM. Ty by měly být projednány v konzultačních orgánech pro správu EDM a měly by vést k úpravě stávajících postupů a technik. V této souvislosti lze uvažovat o situaci, kdy musí být přizpůsoben řídicí panel kvality dat používaný v organizaci, protože organizace si přeje sledovat nový datový objekt. V takových případech by měl existovat „proces změny“, který stanoví rozhodování o této změně a provede změnu řídicího panelu po přijetí rozhodnutí.
nakonec by měly být všechny činnosti EDM prováděné organizací hodnoceny podle jejich účinnosti a efektivity. Stejně jako je tomu v případě primárních procesů v Organizaci, měl by existovat mechanismus „plánovat, dělat, kontrolovat, jednat“ pro EDM, aby bylo možné kontrolovat, zda provádění činností EDM je v souladu s dohodami uzavřenými v této věci. „Monitorování procesů“ to umožňuje a umožňuje organizaci EDM nezávisle identifikovat jakékoli vady a přijmout nápravná opatření.
tyto kroky jsou znázorněny v modelu KPMG EDM na obrázku 3.
obrázek 3. KPMG Enterprise Data Management model.
Stručný popis nejdůležitějších prvků v modelu je uveden níže.
- Správa dat je zaměřena na řízení činností správy dat. Do této kategorie spadají záležitosti jako strategie, politika, role, úkoly a odpovědnosti.
- datová Architektura se zabývá definicí a dokumentací datových objektů a datových struktur v datovém modelu. Ty tvoří základ pro analýzu informací a budování procesů a systémů v Organizaci.
- Správa kmenových dat se týká kvality kmenových a referenčních dat. Konečným cílem je vytvořit jedinečné („zlaté“) záznamy.
- datové sklady je činnost, která zajišťuje definici architektury používané k ukládání dat do relačních databází.
- Business Intelligence zahrnuje otevření dat, která jsou uložena v datových skladech. Údaje musí být poskytnuty tak, aby poskytovaly vedení užitečné informace a umožnily jim přijímat dobře informovaná rozhodnutí.
- řízení kvality dat se týká strukturální dokumentace kritérií kvality, analýzy skutečné kvality dat a vykazování kvality dat.
- Správa obsahu je zaměřena na klasifikaci dat, strukturování toků dokumentů a přístup k nim.
- archivace je orientována na přemístění neaktivních dat do jiných prostředí.
- v rámci operací správy se „meta-daty“ rozumí informace o prvcích správy dat, jako jsou technické a funkční popisy datových objektů a datových modelů.
- správa databází je zaměřena na Provozně technickou správu databází.
- zabezpečení dat je zaměřeno na zabezpečení dat proti neoprávněnému přístupu a použití těchto dat.
- Správa identit na závěr specifikuje přístup k datům.
pro podrobnější popis řady těchto prvků EDM Vás odkazujeme na samostatné příspěvky k prvkům EDM, které byly zahrnuty do tohoto kompaktu.
EDM z organizačního hlediska
v rámci tohoto článku zbývá pouze odpovědět na otázku nejlepšího způsobu implementace modelu EDM v praxi v reálném životě.
pokud se podíváte pozorně na různé komponenty EDM, jak je znázorněno na obrázku 3, získáte dojem, že v těchto komponentách je málo logického pořadí. Obrázek 3 ukazuje, že neexistuje žádné navrhované stanovení priorit nebo fázování konstrukce a implementace prvků. Je však zřejmé, že správa dat spojuje všechny ostatní prvky. Tímto chceme naznačit, že mezi doménami neexistuje žádné pořadí a že pořadí sekvence, ve kterém jsou komponenty EDM uspořádány, je čistě náhodné. Správa dat zde tvoří výjimku. Spojení, které tvoří správa dat mezi všemi ostatními částmi EDM, jasně ukazuje, že žádná činnost správy dat nemůže být úspěšně vyvinuta a implementována, pokud v organizaci neexistuje žádná správa dat.
Správa dat je základem všech činností správy dat. Bez tohoto základu by činnosti byly pouze hromadou volných cihel bez struktury a cementu. To by mohlo znamenat, že řešení BI jsou zakoupena a implementována, zatímco neexistují dostatečné datové standardy nebo definice dat. Nebo se může stát, že kvalita dat potřebná k vytvoření spolehlivých informací o správě je nedostatečná. To může vést k návrhu a nákupu systémů, které nejsou kompatibilní s jinými systémy, protože neexistuje žádný zastřešující podnikový datový model, který by sloužil jako základ pro veškerý vývoj systému. To může nakonec vést k tomu, že organizace aktivně využívá stopy, které uživatelé internetu zanechávají na webových stránkách, aniž by brala v úvahu pravidla ochrany osobních údajů,což by mohlo vést k poškození obrazu a možná i nárokům.
Správa dat zajišťuje, že existuje celofiremní vize a strategie pro správu dat podporovaná správou. Vize nás informuje o tom, čeho chceme dosáhnout. Naznačuje to ambice organizace tak, jak byla. Všechny činnosti související s údaji by měly být v souladu s touto vizí a strategie by měla přinést soudržnost v těchto činnostech. Strategie také určuje rozsah správy dat v rámci organizace. Ignorování zastřešujícího modelu DAMA, organizace mohou raději vynechat určité aspekty z úvahy, protože jsou pravděpodobně již vyplněny někde jinde, v decentralizované jednotce. Trvale se opakujícím jevem je například skutečnost, že HR vytváří vlastní organizaci pro správu dat a pouze omezeně využívá pokyny a standardy, které vyvinula centrální organizace pro správu dat.
Správa dat také zajišťuje, že pozornost je věnována formulaci politických pravidel. V této souvislosti máme na mysli politiku bezpečnosti informací, pravidla politiky týkající se architektury dat, archivace a kvality dat. Správa dat navíc zajišťuje organizační začlenění správy dat. Je třeba určit: kdo je nakonec zodpovědný, kde a jak se rozhoduje o strategii, politice, standardech, rolích, vlastnictví? Například, jak a kdy jsou formulovány zprávy o činnostech správy dat v rámci organizace? Jakým způsobem organizujeme provádění činností údržby kmenových dat?
tento přehled objasní, že správa dat je základem dobré správy dat. Bez ohledu na stupeň zralosti, ve kterém se organizace může ocitnout, je vždy prospěšné seriózně prozkoumat kvalitu správy dat a zkontrolovat, zda je její dosah přiměřený.
Představte si, že organizace má svou správu dat zcela v pořádku. Jsou pak k dispozici opěrné body nebo osvědčené postupy, které mohou objasnit, které z dalších komponent správy dat jsou přímo způsobilé pro optimalizaci, pokud jde o stanovení priorit? Bohužel tomu tak není. Jinými slovy, zkušenost nás naučila, že to závisí na prioritách, které vydávají z agendy samotné organizace.
Představte si, že se organizace rozhodne nahradit starší informační systém novým ERP systémem. Člověk by se pak mohl divit, jaký dopad by to mohlo mít na správu dat. Co by mělo mít nejvyšší prioritu? To může vést k tomu, že „řízení kvality údajů“ bude v důsledku nezbytné migrace přiděleno nejvyšší priorita. Znečištěná data jsou vyčištěna, meta-dokumentace je řešena a správa kmenových dat je vylepšena. Implementace aplikace pro integraci dat může vést například k aktualizaci modelu datové architektury a výběru a implementaci aplikace pro kvalitu dat za účelem očištění a obohacení dat před sdílením s jinými platformami.
obrázek 4. Vztah mezi obchodním modelem a EDM.
závěrem se domníváme, že na základě správy dat a v závislosti na obchodní agendě organizace by měly být prováděny činnosti správy dat, které přinášejí největší přidanou hodnotu při realizaci agendy v určitém okamžiku. Podrobnosti jsou uvedeny na obrázku 4. Soustředěný na vizi a strategii, je vytvořen obchodní model potřebný k realizaci cílů deklarovaných ve vizi a strategii. Tento obchodní model klade nároky na primární a podpůrné procesy. Zdroje jsou potřebné k tomu, aby tyto procesy fungovaly, a později je lze rozdělit na pracovní sílu, data a IT zdroje. Přesně to, co a kolik je potřeba na datové straně v konkrétním případě, je určeno obchodní agendou. EDM nabízí oporu pro způsob, jakým by to mělo být organizováno. To zahrnuje přístup šitý na míru a nelze jej zapouzdřit do pevného vzoru činností správy dat.
závěr
v tomto příspěvku jsme uvedli úvod do EDM jako přístupu ke správě všech dat, která organizace generuje nebo získává. Správná implementace tohoto přístupu zajišťuje, že tato data jsou v souladu s požadavky organizace na kvalitu dat a že údaje potřebné k provádění procesů a umožnění managementu přijímat opodstatněná rozhodnutí jsou správné, úplné a dostupné včas. V takovém případě jsou data aktivem, které musí být spravováno stejně jako všechna ostatní aktiva společnosti. Následně jsme dále definovali součásti EDM. Vznikl tak rámec řídících činností, které tvoří základ pro kvalitu dat. Nakonec jsme tvrdili, že provádění jednotlivých částí nemůže probíhat podle pevného vzoru. Při operacionalizaci je to strategie společnosti a stanovení priorit, které určují, které komponenty EDM jsou vybrány a optimalizovány. Klíčovou roli hraje správa dat, která zajišťuje vizi a strategii sponzorovanou organizací a řízením.
DAMA Guide to the Data management Body Of Knowledge (Dama-DMBOK Guide), s. 7. První vydání, 2009. Přes http://franklybi.blogspot.com/.
Gartner, Hype Cycle for Master Data Management, 2010.
KPMG International, říká vám vaše Business Intelligence celý příběh?, 2009.
McKinsey Global Institute, Big Data: the Next Frontier for Innovation, Competition and Productivity, McKinsey & Company, 2011.