validatie vs. verificatie: Wat is het verschil?

de validatie van Gegevens verificatie van de Gegevens
Doel Controleer of de gegevens valt binnen het aanvaardbare bereik van waarden gegevens Controleren om ervoor te zorgen het is nauwkeurig en consistent
Gewoonlijk verricht Wanneer de gegevens wordt gemaakt of bijgewerkt Wanneer gegevens worden gemigreerd of samengevoegd
Voorbeeld Controleren of de gebruiker ingevoerde postcode kan gevonden worden het Controleren van alle postcodes in de dataset zijn in ZIP+4 formaat

In termen van de leek, dataverificatie en datavalidatie klinkt misschien alsof ze hetzelfde zijn. Wanneer u zich verdiepen in de fijne kneepjes van de kwaliteit van de gegevens, echter, deze twee belangrijke stukken van de puzzel zijn duidelijk verschillend. Het kennen van het onderscheid kan u helpen om het grotere beeld van de gegevenskwaliteit beter te begrijpen.

Wat is gegevensvalidatie?

in een notendop is gegevensvalidatie het proces om te bepalen of een bepaald stuk informatie binnen het aanvaardbare bereik van waarden voor een bepaald veld valt.

in de Verenigde Staten moet bijvoorbeeld elk straatadres een apart veld voor de staat bevatten. Bepaalde waarden zoals NH, ND, AK en TX voldoen aan de lijst van staat afkortingen zoals gedefinieerd door de U. S. Postal Service. Zoals u weet, verwijzen deze afkortingen naar specifieke staten.

er zijn ook afkortingen van twee tekens voor Amerikaanse gebieden, zoals Guam (“GU”) en de Noordelijke Marianen (“MP”). Als u “ZP” of “A7” in het veld Status zou invoeren, zou u in wezen het volledige adres ongeldig maken, omdat een dergelijke staat of gebied niet bestaat. Gegevensvalidatie zou een controle uitvoeren op bestaande waarden in een database om ervoor te zorgen dat deze binnen geldige parameters vallen.

voor een lijst met adressen die landen buiten de VS omvat, moet het veld Staat/provincie/gebied worden gevalideerd aan de hand van een aanzienlijk langere lijst van mogelijke waarden, maar het uitgangspunt is hetzelfde; de ingevoerde waarden moeten binnen een lijst of Bereik van aanvaardbare waarden passen. (Ter info, Precisely offers address validation solutions)

bijvoorbeeld, in sommige gevallen moet u mogelijk limieten instellen rond mogelijke numerieke waarden voor een bepaald veld, zij het met iets minder precisie dan in het vorige voorbeeld. Als u de lengte van een persoon registreert, wilt u mogelijk waarden verbieden die buiten het verwachte bereik vallen. Als een persoon in uw database wordt vermeld als 12 voet hoog (ongeveer 3 meter), dan kunt u waarschijnlijk aannemen dat de gegevens onjuist zijn. Ook zou u geen negatieve getallen voor dat veld willen toestaan.

Gelukkig worden dit soort validatiecontroles meestal uitgevoerd op applicatieniveau of op databankniveau. Als u bijvoorbeeld een in de VS gevestigd verzendadres invoert op een e-commercewebsite, is het onwaarschijnlijk dat u een staatscode kunt invoeren die ongeldig is voor de Verenigde Staten.

lees ons eBook

hoe” goed genoeg ” kwaliteit het vertrouwen in uw data Insights ondermijnt

ontdek belangrijke data quality insights van data professionals in de data quality survey

lezen

Wat is data verificatie, en hoe is het anders?

de verificatie van de gegevens is daarentegen heel anders dan de validatie van de gegevens. Verificatie voert een controle uit van de huidige gegevens om ervoor te zorgen dat deze accuraat en consistent zijn en het beoogde doel weerspiegelen.

controle kan ook op elk moment plaatsvinden. Met andere woorden, verificatie kan plaatsvinden als onderdeel van een terugkerend proces van gegevenskwaliteit, terwijl validatie meestal plaatsvindt wanneer een record in eerste instantie wordt gemaakt of bijgewerkt.

verificatie speelt een bijzonder cruciale rol wanneer gegevens worden gemigreerd of samengevoegd van externe gegevensbronnen. Denk aan het geval van een bedrijf dat net een kleine concurrent heeft verworven. Ze hebben besloten om de klantgegevens van de overgenomen concurrent samen te voegen in hun eigen factureringssysteem. Als onderdeel van het migratieproces, is het belangrijk om te controleren of de records goed uit het bronsysteem kwamen.

kleine fouten bij het voorbereiden van gegevens voor migratie kunnen soms tot grote problemen leiden. Als een sleutelveld in het Customer master record onjuist is toegewezen (bijvoorbeeld als een cellenbereik in een spreadsheet per ongeluk omhoog of omlaag werd verschoven toen de gegevens werden voorbereid), kan dit leiden tot verzendadressen of openstaande facturen worden toegewezen aan de verkeerde klant.

daarom is het belangrijk om te controleren of de informatie in het doelsysteem overeenkomt met de informatie van het bronsysteem. Dit kan worden gedaan door het bemonsteren van gegevens van zowel de bron en bestemming systemen om de nauwkeurigheid handmatig te controleren, of het kan geautomatiseerde processen die volledige verificatie van de geïmporteerde gegevens uit te voeren, overeenkomen met alle records en markeren uitzonderingen.

verificatie als lopend proces

verificatie is niet beperkt tot gegevensmigratie. Het speelt ook een belangrijke rol bij het waarborgen van de nauwkeurigheid en consistentie van bedrijfsgegevens in de tijd.

stel je voor dat je een bestaande database hebt van consumenten die je product hebben gekocht, en je wilt ze een promotie sturen voor een nieuw accessoire bij dat product. Sommige van die klantinformatie kan verouderd zijn, dus het is de moeite waard om de gegevens voorafgaand aan uw mailing te controleren.

door klantadressen te vergelijken met een adreswijziging van de postdienst, kunt u klantgegevens met verouderde adressen identificeren. In veel gevallen, u kunt zelfs de klant informatie bij te werken als onderdeel van dat proces.

het identificeren van dubbele records is een andere belangrijke gegevensverificatieactiviteit. Als uw klantendatabase drie of vier keer dezelfde klant weergeeft, dan bent u waarschijnlijk om ze Dubbele mailings te sturen. Dit kost je niet alleen meer geld, het resulteert ook in een negatieve klantervaring.

om het deduplicatieproces uitdagender te maken, kunnen meerdere records voor dezelfde klant zijn aangemaakt met behulp van enigszins verschillende variaties op de naam van een persoon. Tools die fuzzy logic gebruiken om mogelijke en waarschijnlijke overeenkomsten te identificeren, kunnen het proces beter laten werken.

the data quality mandate

steeds meer bedrijfsleiders begrijpen de strategische waarde van data in de inzichten die daaruit kunnen worden gehaald met behulp van kunstmatige intelligentie/machine learning en moderne business intelligence tools.

helaas is het oude gezegde “garbage in, garbage out” nu meer dan ooit van toepassing. Naarmate de hoeveelheid gegevens toeneemt, is het essentieel dat data-gedreven bedrijven proactieve maatregelen nemen om de gegevenskwaliteit routinematig te bewaken en te beheren. Anders lopen ze het risico te handelen op inzichten die gebaseerd zijn op gebrekkige informatie.

voor meer informatie, lees ons eBook: hoe” goed genoeg ” kwaliteit het vertrouwen in uw data Insights ondermijnt

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.