La gestion des données d’entreprise concerne l’ensemble des activités orientées vers l’organisation et la bonne utilisation des données. Cet article couvre le contexte de la popularité relative de la gestion des données dans de nombreuses organisations au cours des dernières années. Quel est l’objectif de la gestion des données ? Pourquoi la gestion des données est-elle si importante ? Et si les organisations souhaitent s’engager sur ce sujet, comment le faire? Cet article s’efforce de répondre à ces questions.
Introduction
Notre monde numérique est construit sur l’information. Les données sont partout et tout le monde les utilise pour ses affaires quotidiennes. La gestion des données a récemment connu un regain de popularité parmi les entreprises, les organisations, les analystes et les conseillers. Qu’est-ce qui motive ce développement, considérant que ce sujet n’est généralement pas considéré comme très sexy?
Les données sont une représentation des faits. En plaçant les données dans leur contexte, des informations sont créées. L’absence d’une bonne gestion des données signifie souvent automatiquement que les informations de gestion et opérationnelles ne sont pas efficaces. À long terme, cela paralysera une organisation dans la mesure où elle ne pourra plus fonctionner correctement. La raison en est que les décisions importantes sont prises trop tard, car les gens ne peuvent plus compter sur les informations de gestion. De plus, la gestion des processus opérationnels exige de plus en plus de temps et d’efforts parce que les tâches et les responsabilités des ministères ne sont pas bien alignées les unes sur les autres. Dans cette situation, chacun crée et gère uniquement les données nécessaires à l’exécution de ses propres tâches, et utilise en conséquence un propre ensemble de définitions de données. Parce que les départements s’accusent mutuellement d’inexactitude, des mesures de contrôle sont imposées en masse et les opérations deviennent encore plus visqueuses, entraînant une spirale descendante pour l’ensemble de l’entreprise. Par conséquent, il y a une raison commerciale urgente d’attribuer à la gestion des données une position indépendante et professionnelle au sein des organisations.
De plus, les règles et règlements imposent une organisation structurée de la gestion des données. Les réglementations du secteur financier, telles que Bâle et Solvabilité, imposent la mise en œuvre d’un cadre de gouvernance pour la qualité des données et la traçabilité des informations utilisées dans les rapports organisationnels. Dans ce contexte, Bâle II stipule : « La banque doit mettre en place un processus de vérification des données saisies dans un modèle statistique de prévision des défaillances ou des pertes, qui comprend une évaluation de l’exactitude, de l’exhaustivité et de la pertinence des données spécifiques à l’attribution d’une notation approuvée. » La gestion qualitative des données est importante pour pouvoir répondre à ces critères, mais peut également prendre beaucoup de temps à mettre en œuvre. Dans ce contexte, il est difficile de se conformer aux règles et réglementations ou d’établir des accords avec les fournisseurs et les clients.
La gestion des données d’entreprise comprend toutes les activités au sein des organisations visant l’identification structurée, la classification, l’enregistrement, la modélisation, le déverrouillage, la sécurisation, l’archivage et la suppression des données. Dans ce cadre, le terme » entreprise » représente le caractère de la gestion des données à l’échelle de l’organisation.
Le fait que la gestion des données joue un rôle si crucial dans les opérations commerciales est souligné par les déclarations des responsables de niveau C. Aloys Kregting, CIO de DSM, élu CIO de l’année en 2011, déclare : « Le CIO doit avant tout se préoccuper de la valeur de l’information. Vous devez savoir exactement quelles personnes ont besoin de quelles informations quand, et faciliter ce processus également. Cela souligne une fois de plus l’importance du reporting et de la gestion des données de base. »
Comme deuxième exemple, nous pouvons citer le PDG d’une société d’exploration et de production pétrolière, qui réalise qu’une bonne gestion des données est la prochaine étape de la progression de son entreprise vers l’excellence commerciale et lui permettra de se démarquer de ses concurrents: « Les efforts d’amélioration continue vont désormais se concentrer sur la mise à profit de ces changements et la découverte de la valeur cachée qu’ils offrent. Cela implique de simplifier les processus et de renforcer la gestion des données pour permettre une prise de décision plus rapide et mieux informée, une plus grande réactivité aux besoins des clients et moins de gaspillage, le tout pour une meilleure performance concurrentielle.’
Les données en tant qu’actif
Comme mentionné ci-dessus, les données sont une représentation des faits. Dans un environnement d’affaires, cela signifie « faits concernant les opérations commerciales ». Sans contexte ni structure, ces données n’ont aucune valeur ajoutée pour une entreprise. Il manque le contenu et la signification pour avoir une valeur réelle. Ici, nous distinguons les données structurées (stockées et disposées dans une base de données) et les données non structurées (sous forme de documents, fichiers, images, messages texte, formulaires, vidéos ou enregistrements sonores, qui ne peuvent pas être incorporés dans des lignes, des colonnes ou des enregistrements).
Sans informations supplémentaires, il est difficile, voire impossible, de classer, d’enregistrer et de déverrouiller ces données pour utilisation. Le moment où nous mettons en contexte ces données – c’est à ce moment qu’elles acquièrent une signification. On ajoute ensuite une référence, une date et une heure, la signification du message, un format. Avec cela, les données sont structurées et deviennent des informations. Si nous connectons toutes les différentes sources d’information, en établissant des relations et en identifiant des modèles, cette information devient connaissance. C’est donc la valeur ajoutée de la business intelligence (BI) : connecter différentes sources d’information dans une organisation pour améliorer la prise de décision par la direction de l’entreprise. Voir aussi la figure 1.
Figure 1. Valeur des données, mise en contexte.
Les organisations les mieux à même de structurer leurs données et d’ouvrir ces informations aux travailleurs du savoir au sein de l’entreprise disposeront d’un avantage concurrentiel. L’utilisation de la puissance commerciale inhérente à ces données donnera aux entreprises et aux organisations une avance stratégique sur leurs concurrents. Eric Schmidt, ancien PDG de Google, a déclaré en 2010: « Je ne crois pas que la société comprenne ce qui se passe lorsque tout est disponible, connaissable et enregistré par tout le monde tout le temps. » Et Gartner déclare: « Dans le secteur privé, nous estimons, par exemple, qu’un détaillant utilisant pleinement le big data a le potentiel d’augmenter sa marge opérationnelle de plus de 60%.’ ()
Mais ce n’est pas seulement une bonne structuration et un bon déverrouillage des données. Pendant plusieurs années, l’idée dominante était que la BI résoudrait le problème de l’information de gestion. La plupart des entreprises et organisations mondiales ont mis en œuvre des logiciels complexes et exécuté des programmes de BI coûteux. Néanmoins, la direction n’est pas satisfaite. Comme la BI est principalement orientée vers les données structurées, les efforts déployés pour libérer la valeur des données non structurées sont insuffisants. De plus, les informations de gestion ne peuvent pas facilement être modifiées pour répondre aux besoins changeants de l’entreprise. KPMG a déclaré : « Des investissements énormes dans l’informatique ne garantissent pas nécessairement une meilleure information. Ce qui est plus important, c’est de changer fondamentalement la façon dont les données sont collectées, traitées et présentées.'()
Les informations exposées au moyen d’un entrepôt de données ne valent rien si la qualité de l’ensemble de données sous-jacent est médiocre. Données non structurées (env. 85% de toutes les données de l’entreprise) ne sont pas accessibles via un entrepôt de données. Les questions sont donc les suivantes : comment mettre à niveau ces données et qu’est-ce qui constitue une bonne gestion des données pour les données non structurées ? Dans ce contexte, « bon » signifie conformément aux critères de qualité que l’organisation a imposés aux données. Il est évident que les « bonnes données » ne sont pas quelque chose qui apparaît simplement hors de l’air. Un cadre est nécessaire. Ce cadre est constitué d’activités qu’une entreprise doit organiser et intégrer dans l’organisation de manière logique et précise. C’est ce qu’on appelle la gestion des données et couvre toutes les activités organisationnelles orientées vers les opérations commerciales, afin d’identifier, classer, enregistrer, modéliser, déverrouiller, sécuriser, archiver et supprimer les données de manière structurée. Pour de telles activités, nous utilisons le terme « Gestion des données d’entreprise » (GED), car il s’agit d’activités exécutées à l’échelle de l’organisation.
La prise de conscience qu’une bonne gestion des données peut ajouter de la valeur aux activités de l’entreprise et augmenter les bénéfices a amené les analystes et les conseillers à mettre les données au même niveau que les autres ressources de l’entreprise telles que les terrains, les bâtiments et les machines. Dans ce contexte, les données sont définies comme un actif de l’entreprise. Les actifs doivent être bien gérés: correctement entretenus et protégés, avec la propriété assignée et l’élimination ou le remplacement en temps opportun des données si elles deviennent obsolètes. Tout comme d’autres actifs, les données organisationnelles peuvent également être vendues pour en extraire la valeur. Par exemple, les concurrents apprécieront les informations sur les clients car elles peuvent être utilisées pour améliorer les ventes.
Les directeurs de grandes entreprises du monde entier l’ont pleinement reconnu. Les programmes liés aux données figurent en bonne place sur leurs listes d’actions. Le groupe Hackett déclare: « Ce que les entreprises reconnaissent, c’est qu’elles ont jeté beaucoup d’argent sur les applications mais, sans standardiser et nettoyer leurs données, elles obtiennent toujours des informations qui n’ont pas de sens. Ils ont des entreprises qui utilisent des définitions différentes, qui calculent les métriques différemment, qui utilisent des hiérarchies différentes. Tout ce concept de gestion des données de base est absolument essentiel pour que les entreprises puissent éventuellement en arriver au point où elles disposent d’analyses prédictives. » L’analyse de rentabilisation pour lancer des programmes de gestion des données de base (MDM) semble évidente : » D’ici 2013, MDM réduira la redondance des données des organisations, ce qui permettra d’économiser 80 % des coûts associés à la gestion des données redondantes.'()
Modèles de gestion des données d’entreprise
La gestion des données fait l’objet de beaucoup d’attention depuis un certain temps, et il existe une abondance de modèles et de méthodes prétendant tous fournir la meilleure réponse à la structure de la gestion des données d’entreprise. L’Organisation internationale de normalisation, mieux connue sous le nom d’ISO, a d’innombrables normes, chacune couvrant un sous-aspect du spectre des données. Par exemple, ISO 27001 traite de la sécurité de l’information. L’ISO 15489 est la norme appliquée à la gestion de l’information dans une perspective archivistique. ISO 23081 est la norme pour les métadonnées. De plus, on peut utiliser la norme ISO 19005 comme ligne directrice pour l’apparition des données. Nous avons donc une surabondance de normes. D’autres cadres tels que COSO et des cadres tels que Cobit et ISF parlent de l’importance des données dans un sens plus large, mais uniquement du point de vue des risques.
Corpus de connaissances sur la gestion des données
Un modèle plus complet semble être celui du DAMA-DMBOK. Il contient une collection de bonnes pratiques dans le domaine de la gestion des données qui ont été complétées par de nouvelles connaissances issues de la pratique réelle au fil des ans. Le Guide DAMA-DMBOK (in full: Data Management Body of Knowledge) est une publication de la Data Management Association, une organisation internationale destinée aux gestionnaires de données et aux professionnels des données pour la diffusion des connaissances sur la gestion des données.
Le DMBOK identifie dix fonctions de données différentes. Ces fonctions sont représentées à la figure 2. La gouvernance des données est la fonction qui relie les autres domaines les uns aux autres. Dans chacun des domaines, il convient de prêter attention aux facteurs environnementaux, tels que les méthodes et procédures de travail actuelles, les techniques utilisées et la culture organisationnelle.
Figure 2. Domaines de données selon DAMA().
DAMA a ses points faibles. Par exemple, le fait que les fonctions mentionnées ne se réfèrent qu’entre elles en termes généraux, ce qui signifie qu’un utilisateur ne reconnaît pas ou ne comprend pas toujours la relation entre les fonctions et, par la suite, la signification globale de la combinaison. De plus, DAMA semble être orienté vers des données traditionnelles et structurées, du moins en ce moment. Cela étant, peu d’attention est consacrée à l’importance du contenu des médias sociaux. La sécurité des données au sein de DAMA vise principalement la protection technologique des données. En dehors de cela, la différence dans la façon dont les générations traitent les données n’a pas été explicitement reconnue comme un facteur pertinent (facteur environnemental). Enfin – et c’est peut–être la plus grande objection – c’est avant tout un cadre conceptuel. Il manque d’exemples pratiques pour rendre les concepts et les termes suffisamment clairs pour le lecteur, ce qui entraîne un risque d’interprétation incohérente. La manière dont le cadre devrait être mis en œuvre est également assez floue. Ceci est contraire au but premier d’un ensemble de connaissances. Après tout, l’application de ce corpus de connaissances devrait viser à stimuler la cohérence dans l’application de la gestion des données. C’est pour ces raisons que nous n’utilisons DAMA que pour son identification des fonctions, car celles-ci sont en effet solides.
Modèle de gestion des données d’entreprise de KPMG
Les modèles susmentionnés contiennent des éléments importants qui doivent être pris en compte dans la réalisation d’une organisation professionnelle de gestion des données. Pour l’opérationnalisation de la gestion des données, cependant, un autre ensemble d’aspects est également important, des aspects qui ne sont pas couverts par ces modèles.
Tout d’abord, celles-ci impliquent le fait que les données sont échangées entre les systèmes à la fois au sein de l’organisation et entre l’organisation et des tiers. Par conséquent, la gestion des données devrait veiller à ce que de bons accords soient conclus sur le format dans lequel les données sont livrées, sur la validation de la qualité des données livrées, sur les cycles d’enrichissement possibles avant le traitement ultérieur des données et sur les procédures éventuelles en cas de défauts dans le processus. Nous regroupons ces activités sous les termes » acquisition et création » et » distribution « .
En outre, la GED devrait également veiller à ce que le cadre de GED puisse être maintenu dans son ensemble. L’organisation doit disposer de processus pour enregistrer les documents et les défauts identifiés lors de l’exécution opérationnelle des activités de GED. Celles-ci devraient être discutées dans les organes de consultation sur la gouvernance de la GED et devraient conduire à un ajustement des procédures et techniques existantes. Dans ce contexte, on peut considérer une situation dans laquelle un tableau de bord de la qualité des données utilisé au sein d’une organisation doit être adapté car l’organisation souhaite surveiller un nouvel objet de données. Dans de tels cas, il devrait y avoir un « processus de changement » qui définit la prise de décision sur ce changement et met en œuvre la modification du tableau de bord une fois la décision prise.
Enfin, toutes les activités de GED réalisées par une organisation doivent être évaluées en fonction de leur efficacité et de leur efficience. Tout comme c’est le cas pour les processus primaires au sein d’une organisation, il devrait y avoir un mécanisme « planifier, faire, vérifier, agir » pour la GED afin que l’on puisse contrôler si l’exécution des activités de GED est conforme ou non aux accords conclus à ce sujet. La « surveillance des processus » permet cela et permet à l’organisation de GED d’identifier de manière indépendante les défauts éventuels et de prendre des mesures correctives.
Ces étapes sont représentées dans le modèle de GED de KPMG à la figure 3.
Figure 3. Modèle de gestion des données d’entreprise de KPMG.
Une brève description des éléments les plus importants du modèle est présentée ci-dessous.
- La gouvernance des données vise le pilotage des activités de gestion des données. Des questions telles que la stratégie, la politique, les rôles, les tâches et les responsabilités entrent dans cette catégorie.
- L’architecture de données concerne la définition et la documentation d’objets de données et de structures de données dans un modèle de données. Ceux-ci constituent la base de l’analyse de l’information et de la construction de processus et de systèmes dans une organisation.
- La gestion des données de référence concerne la qualité des données de référence et des données de référence. Le but ultime est de créer des disques uniques (« dorés »).
- L’entreposage de données est l’activité qui assure la définition de l’architecture utilisée pour stocker des données dans des bases de données relationnelles.
- La Business Intelligence consiste à ouvrir des données stockées dans des entrepôts de données. Les données doivent être fournies de manière à fournir des informations utiles à la direction, leur permettant de prendre des décisions éclairées.
- La gestion de la qualité des données concerne une documentation structurelle des critères de qualité, l’analyse de la qualité réelle des données et les rapports sur la qualité des données.
- La gestion de contenu est orientée vers la classification des données, la structuration des flux de documents et l’accès à ceux-ci.
- L’archivage est orienté vers la relocalisation des données inactives vers d’autres environnements.
- Sous Opérations de gouvernance, les » méta-données » désignent les informations sur les éléments de gestion des données tels que les descriptions techniques et fonctionnelles des objets de données et des modèles de données.
- La gestion des bases de données est orientée vers la gestion technique opérationnelle des bases de données.
- La sécurité des données vise à protéger les données contre l’accès et l’utilisation non autorisés de ces données.
- La gestion des identités, en conclusion, spécifie l’accès aux données.
Pour une description plus détaillée d’un certain nombre de ces éléments EDM, nous vous renvoyons aux contributions distinctes sur les éléments EDM qui ont été incluses dans ce Compact.
La GED d’un point de vue organisationnel
Dans le cadre de cet article, il ne nous reste plus qu’à répondre à la question de la meilleure façon de mettre en œuvre le modèle de GED dans la pratique réelle.
Si vous regardez de près les différents composants de l’EDM, comme le montre la figure 3, vous avez l’impression qu’il y a peu d’ordre logique dans ces composants. La figure 3 montre qu’il n’y a pas de priorisation proposée ou de mise en œuvre progressive de la construction et de la mise en œuvre des éléments. Cependant, il est évident que la gouvernance des données relie tous les autres éléments. Avec cela, nous souhaitons indiquer qu’il n’y a pas de classement entre les domaines, et que l’ordre de séquence dans lequel les composantes de l’EDM sont disposées est purement aléatoire. La gouvernance des données constitue ici une exception. Le lien que forme la gouvernance des données entre toutes les autres parties de la GED montre clairement qu’aucune activité de gestion des données ne peut être développée et mise en œuvre avec succès s’il n’y a pas de gouvernance des données au sein de l’organisation.
La gouvernance des données jette les bases de toutes les activités de gestion des données. Sans cette fondation, les activités ne seraient qu’un tas de briques en vrac sans structure ni ciment. Cela pourrait signifier que des solutions de BI sont achetées et mises en œuvre alors qu’il n’y a pas suffisamment de normes de données ou de définitions de données. Ou il peut arriver que la qualité des données requises pour générer des informations de gestion fiables soit inadéquate. Cela peut conduire à la conception et à l’achat de systèmes qui ne sont pas compatibles avec d’autres systèmes car il n’existe pas de modèle global de données d’entreprise servant de base à tous les développements de systèmes. Cela peut en fin de compte conduire une organisation à utiliser activement les traces laissées par les internautes sur les sites Web, sans prendre en compte les règles de confidentialité, ce qui pourrait entraîner des dommages à l’image et peut-être des réclamations.
La gouvernance des données garantit qu’il existe une vision et une stratégie de gestion des données à l’échelle de l’organisation, soutenues par la direction. La vision nous informe de ce que nous souhaitons réaliser. Cela indique pour ainsi dire l’ambition de l’organisation. Toutes les activités liées aux données doivent être conformes à cette vision, et la stratégie doit assurer la cohérence de ces activités. La stratégie dicte également la portée de la gestion des données au sein d’une organisation. Ignorant le modèle global de DAMA, les organisations peuvent préférer omettre certains aspects de la considération car ils sont probablement déjà remplis ailleurs, dans une unité décentralisée. Un phénomène récurrent, par exemple, est le fait que les RH créent leur propre organisation de gestion des données et n’utilisent que peu les directives et les normes élaborées par l’organisation centrale de gestion des données.
La gouvernance des données garantit également que l’attention est consacrée à la formulation des règles de politique. Dans ce contexte, nous nous référons à la politique de sécurité de l’information, aux règles de politique concernant l’architecture des données, l’archivage et la qualité des données. De plus, la gouvernance des données assure l’intégration organisationnelle de la gestion des données. Il est nécessaire de déterminer: qui est en fin de compte responsable, où et comment les décisions sur la stratégie, la politique, les normes, les rôles, la propriété sont-elles prises? Par exemple, comment et quand les rapports sur les activités de gestion des données au sein de l’organisation sont-ils formulés? De quelle manière organisons-nous l’exécution des activités de maintenance des données de base ?
Cet aperçu aura clairement montré que la gouvernance des données est la base d’une bonne gestion des données. Quel que soit le stade de maturité dans lequel une organisation peut se trouver, il est toujours avantageux d’examiner sérieusement la qualité de la gouvernance des données et de vérifier si sa portée est adéquate ou non.
Imaginez qu’une organisation a sa gouvernance des données complètement en ordre. Existe-t-il alors des bases de données disponibles ou des pratiques exemplaires permettant de préciser quelles autres composantes de la gestion des données sont directement éligibles à l’optimisation, en termes de priorisation ? Malheureusement, ce n’est pas le cas. En d’autres termes, l’expérience nous a appris que cela dépend des priorités qui découlent de l’ordre du jour de l’organisation elle-même.
Imaginez qu’une organisation décide de remplacer un ancien système d’information par un nouveau système ERP. On peut alors s’interroger sur l’impact que cela pourrait avoir sur la gestion des données. Qu’est-ce qui devrait avoir la plus haute priorité? Cela peut conduire à attribuer la priorité la plus élevée à la « gestion de la qualité des données » à la suite de la migration nécessaire. Les données polluées sont nettoyées, la méta-documentation est traitée et la gestion des données de base est améliorée. La mise en œuvre d’une application d’intégration de données peut conduire, par example, à la mise à jour du modèle d’architecture de données et à la sélection et à la mise en œuvre d’une application de qualité de données afin de nettoyer et d’enrichir des données avant qu’elles ne soient partagées avec d’autres plates-formes.
Figure 4. Relation entre le modèle d’affaires et la GED.
En conclusion, nous pensons que, sur la base de la gouvernance des données et en fonction de l’agenda commercial de l’organisation, les activités de gestion des données qui apportent la plus grande valeur ajoutée dans la réalisation de l’agenda à un moment donné doivent être poursuivies. Les détails sont présentés à la figure 4. Centré sur la vision et la stratégie, le modèle d’affaires nécessaire à la réalisation des objectifs déclarés dans la vision et la stratégie est construit. Ce modèle d’affaires impose des exigences aux processus primaires et de support. Des ressources sont nécessaires pour permettre à ces processus de fonctionner et peuvent ensuite être subdivisées en ressources humaines, en données et en ressources informatiques. Exactement quoi et combien est nécessaire du côté des données dans un cas spécifique est déterminé par l’agenda commercial. L’EDM offre un pied pour la façon dont cela devrait être organisé. Cela comprend une approche sur mesure et ne peut pas être encapsulé dans un modèle fixe d’activités de gestion des données.
Conclusion
Dans cette contribution, nous avons présenté l’EDM comme approche de la gestion de toutes les données qu’une organisation génère ou acquiert. Une bonne mise en œuvre de cette approche garantit que ces données sont conformes aux exigences de qualité des données de l’organisation et que les données nécessaires à l’exécution des processus et à la prise de décisions fondées par la direction sont correctes, complètes et disponibles en temps opportun. Lorsque c’est le cas, les données sont un actif qui doit être géré comme tous les autres actifs de l’entreprise. Par la suite, nous avons défini plus en détail les parties constitutives de l’EDM. Ainsi, un cadre d’activités de gestion est apparu qui constitue la base de la qualité des données. Enfin, nous avons fait valoir que la mise en œuvre des éléments constitutifs ne peut se faire selon un schéma fixe. Dans l’opérationnalisation, c’est la stratégie et la priorisation de l’entreprise qui déterminent lesquels des composants de l’EDM sont sélectionnés et optimisés. Un rôle crucial est attribué à la gouvernance des données, qui garantit la vision et la stratégie à l’échelle de l’organisation et parrainées par la direction.
Le Guide DAMA du Corpus de connaissances sur la gestion des données (Guide DAMA-DMBOK), p. 7. Première édition, 2009. Via http://franklybi.blogspot.com/.
Gartner, Cycle Hype pour la gestion des données de base, 2010.
KPMG International, Votre Business Intelligence Vous Raconte-T-Elle Toute L’Histoire ?, 2009.
McKinsey Global Institute, Big Data: the Next Frontier for Innovation, Competition and Productivity, McKinsey & Company, 2011.