Validation vs Vérification : Quelle est la différence ?

Validation des données Vérification des données
Objet Vérifier si les données se situent dans la plage de valeurs acceptable Vérifier les données pour s’assurer qu’elles sont exactes et cohérentes
Généralement effectué Lorsque les données sont créées ou mises à jour Lorsque les données sont migrées ou fusionnées
Exemple Vérifier si le code POSTAL saisi par l’utilisateur peut être trouvé Vérifier que tous les codes postaux de l’ensemble de données sont au format ZIP + 4

En termes simples, la vérification et la validation des données peuvent sembler être la même chose. Cependant, lorsque vous plongez dans les subtilités de la qualité des données, ces deux pièces importantes du puzzle sont nettement différentes. Connaître la distinction peut vous aider à mieux comprendre l’ensemble de la qualité des données.

Qu’est-ce que la validation des données ?

En un mot, la validation des données consiste à déterminer si une information particulière se situe dans la plage de valeurs acceptable pour un champ donné.

Aux États-Unis, par exemple, chaque adresse municipale devrait inclure un champ distinct pour l’État. Certaines valeurs telles que NH, ND, AK et TX sont conformes à la liste des abréviations d’État telles que définies par le Service postal américain. Comme vous le savez, ces abréviations désignent des états spécifiques.

Il existe également des abréviations à deux caractères pour les territoires américains, tels que Guam (« GU ») et les îles Mariannes du Nord (« MP »). Si vous deviez entrer « ZP » ou « A7 » dans le champ État, vous invalideriez essentiellement l’adresse entière, car aucun État ou territoire de ce type n’existe. La validation des données effectuerait une vérification par rapport aux valeurs existantes dans une base de données pour s’assurer qu’elles relèvent de paramètres valides.

Pour une liste d’adresses qui comprend des pays en dehors des États-Unis, le champ état /province / territoire devrait être validé par rapport à une liste beaucoup plus longue de valeurs possibles, mais la prémisse de base est la même; les valeurs saisies doivent correspondre à une liste ou à une plage de valeurs acceptables. (Pour info, offre précisément des solutions de validation d’adresse)

Par exemple, dans certains cas, vous devrez peut-être définir des limites autour des valeurs numériques possibles pour un champ donné, mais avec un peu moins de précision que dans l’exemple précédent. Si vous enregistrez la taille d’une personne, vous voudrez peut-être interdire les valeurs qui se situent en dehors de la plage prévue. Si une personne est répertoriée dans votre base de données comme mesurant 12 pieds de haut (environ 3 mètres), vous pouvez probablement supposer que les données sont incorrectes. De même, vous ne voudriez pas autoriser des nombres négatifs pour ce champ.

Heureusement, ces types de contrôles de validation sont généralement effectués au niveau de l’application ou de la base de données. Par exemple, si vous entrez une adresse de livraison basée aux États-Unis dans un site Web de commerce électronique, il est peu probable que vous puissiez entrer un code d’état invalide pour les États-Unis.

Lisez notre eBook

Comment une qualité  » Suffisamment bonne  » Érode la confiance dans vos informations sur les données

Explorez les informations clés sur la qualité des données fournies par les professionnels des données dans le cadre de l’enquête sur la qualité des données

Lire

Qu’est-ce que la vérification des données et en quoi est-elle différente ?

La vérification des données, en revanche, est en fait très différente de la validation des données. La vérification effectue une vérification des données actuelles pour s’assurer qu’elles sont exactes, cohérentes et reflètent l’objectif visé.

La vérification peut également avoir lieu à tout moment. En d’autres termes, la vérification peut avoir lieu dans le cadre d’un processus récurrent de qualité des données, alors que la validation se produit généralement lorsqu’un enregistrement est initialement créé ou mis à jour.

La vérification joue un rôle particulièrement critique lorsque des données sont migrées ou fusionnées à partir de sources de données extérieures. Prenons le cas d’une entreprise qui vient d’acquérir un petit concurrent. Ils ont décidé de fusionner les données clients du concurrent acquis dans leur propre système de facturation. Dans le cadre du processus de migration, il est important de vérifier que les enregistrements proviennent correctement du système source.

De petites erreurs dans la préparation des données pour la migration peuvent parfois entraîner de gros problèmes. Si un champ clé de l’enregistrement principal du client est attribué de manière incorrecte (par exemple, si une plage de cellules d’une feuille de calcul a été déplacée par inadvertance vers le haut ou vers le bas lors de la préparation des données), les adresses de livraison ou les factures impayées pourraient être attribuées au mauvais client.

Par conséquent, il est important de vérifier que les informations du système de destination correspondent aux informations du système source. Cela peut être fait en échantillonnant les données des systèmes source et de destination pour vérifier manuellement l’exactitude, ou cela peut impliquer des processus automatisés qui effectuent une vérification complète des données importées, correspondent à tous les enregistrements et signalent les exceptions.

Vérification en tant que processus continu

La vérification ne se limite pas à la migration des données. Il joue également un rôle important pour assurer l’exactitude et la cohérence des données de l’entreprise au fil du temps.

Imaginez que vous disposez d’une base de données existante de consommateurs qui ont acheté votre produit et que vous souhaitez leur envoyer une promotion d’un nouvel accessoire pour ce produit. Certaines de ces informations client peuvent être obsolètes, il est donc utile de vérifier les données avant votre envoi.

En vérifiant les adresses des clients par rapport à une base de données de changement d’adresse du service postal, vous pouvez identifier les enregistrements de clients avec des adresses obsolètes. Dans de nombreux cas, vous pouvez même mettre à jour les informations client dans le cadre de ce processus.

L’identification des enregistrements en double est une autre activité importante de vérification des données. Si votre base de données clients répertorie le même client trois ou quatre fois, vous êtes susceptible de lui envoyer des envois en double. Cela vous coûte non seulement plus d’argent, mais se traduit également par une expérience client négative.

Pour rendre le processus de déduplication plus difficile, plusieurs enregistrements pour le même client peuvent avoir été créés en utilisant des variations légèrement différentes sur le nom d’une personne. Les outils qui utilisent une logique floue pour identifier les correspondances possibles et probables peuvent améliorer le fonctionnement du processus.

Le mandat qualité des données

De plus en plus de chefs d’entreprise comprennent la valeur stratégique des données dans les informations qui peuvent en être extraites à l’aide d’intelligence artificielle / apprentissage automatique et d’outils modernes de business intelligence.

Malheureusement, cependant, le vieil adage « ordures dedans, ordures dehors » s’applique maintenant plus que jamais. À mesure que le volume de données augmente, il est essentiel que les entreprises axées sur les données mettent en place des mesures proactives pour surveiller et gérer la qualité des données de manière routinière. Sinon, ils risquent d’agir sur des informations basées sur des informations erronées.

Pour en savoir plus, lisez notre eBook : Comment une Qualité  » Suffisante  » Érode la confiance dans vos Informations sur les données

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.