validering vs. verifiering: Vad är skillnaden?

datavalidering dataverifiering
syfte kontrollera om data faller inom det acceptabla intervallet av värden kontrollera data för att säkerställa att den är korrekt och konsekvent
vanligtvis utförs när data skapas eller uppdateras när data migreras eller slås samman
exempel kontrollera om ANVÄNDARINMATAT Postnummer kan hittas kontrollera att alla Postnummer i dataset är i ZIP + 4-format

i lekmanens termer, dataverifiering och datavalidering kan låta som om de är samma sak. När du gräver in i invecklingen av datakvalitet är dessa två viktiga pusselbitar tydligt olika. Att känna till skillnaden kan hjälpa dig att bättre förstå den större bilden av datakvalitet.

vad är datavalidering?

i ett nötskal är datavalidering processen för att bestämma om en viss information faller inom det acceptabla intervallet för värden för ett visst fält.

i USA bör till exempel varje gatuadress innehålla ett distinkt fält för staten. Vissa värden som NH, ND, AK och TX överensstämmer med listan över statliga förkortningar som definieras av US Postal Service. Som du vet anger dessa förkortningar specifika tillstånd.

det finns också förkortningar med två tecken för amerikanska territorier, såsom Guam (”GU”) och Nordmarianerna (”MP”). Om du skulle ange ”ZP” eller ” A7 ” i statsfältet skulle du i huvudsak ogiltigförklara hela adressen, eftersom ingen sådan stat eller territorium existerar. Datavalidering skulle utföra en kontroll mot befintliga värden i en databas för att säkerställa att de faller inom giltiga parametrar.

för en lista över adresser som inkluderar länder utanför USA, måste fältet stat/provins/territorium valideras mot en betydligt längre lista över möjliga värden, men den grundläggande förutsättningen är densamma; de angivna värdena måste passa inom en lista eller ett intervall av acceptabla värden. (FYI, erbjuder exakt adressvalideringslösningar)

till exempel kan du i vissa fall behöva ställa in gränser kring möjliga numeriska värden för ett visst fält, om än med lite mindre precision än i föregående exempel. Om du registrerar en persons höjd kanske du vill förbjuda värden som faller utanför det förväntade intervallet. Om en person är listad i din databas som 12 meter lång (ca 3 meter), kan du förmodligen anta att uppgifterna är felaktiga. På samma sätt vill du inte tillåta negativa tal för det fältet.

lyckligtvis utförs dessa typer av valideringskontroller vanligtvis på applikationsnivå eller databasnivå. Om du till exempel anger en USA-baserad leveransadress på en e-handelswebbplats är det osannolikt att du skulle kunna ange en Statskod som är ogiltig för USA.

läs vår e-bok

hur” tillräckligt bra ” kvalitet urholkar förtroendet för dina Datainsikter

utforska viktiga datakvalitetsinsikter från dataproffs i datakvalitetsundersökningen

Läs

vad är dataverifiering, och hur är det annorlunda?

dataverifiering, å andra sidan, är faktiskt ganska annorlunda än datavalidering. Verifiering utför en kontroll av aktuella data för att säkerställa att de är korrekta, konsekventa och återspeglar det avsedda syftet.

verifiering kan också ske när som helst. Med andra ord kan verifiering ske som en del av en återkommande datakvalitetsprocess, medan validering vanligtvis sker när en post ursprungligen skapas eller uppdateras.

verifiering spelar en särskilt viktig roll när data migreras eller slås samman från externa datakällor. Tänk på ett företag som just har förvärvat en liten konkurrent. De har beslutat att slå samman den förvärvade konkurrentens kunddata i sitt eget faktureringssystem. Som en del av migrationsprocessen är det viktigt att verifiera att poster kom över ordentligt från källsystemet.

små fel i att förbereda data för migrering kan ibland leda till stora problem. Om ett nyckelfält i kundhuvudposten tilldelas felaktigt (till exempel om ett cellområde i ett kalkylblad oavsiktligt flyttades uppåt eller nedåt när data förbereddes) kan det leda till att leveransadresser eller utestående fakturor tilldelas fel kund.

därför är det viktigt att kontrollera att informationen i destinationssystemet matchar informationen från källsystemet. Detta kan göras genom att sampla data från både käll-och destinationssystemen för att manuellt verifiera noggrannhet, eller det kan innebära automatiserade processer som utför fullständig verifiering av importerade data, matchar alla poster och flaggningsundantag.

verifiering som en pågående process

verifiering är inte begränsad till datamigrering. Det spelar också en viktig roll för att säkerställa noggrannheten och konsistensen av företagsdata över tiden.

Tänk dig att du har en befintlig databas över konsumenter som har köpt din produkt, och du vill skicka dem en marknadsföring av ett nytt tillbehör till den produkten. En del av den kundinformationen kan vara inaktuell, så det är värt att verifiera uppgifterna före din utskick.

genom att kontrollera kundadresser mot en ändring av adressdatabasen från posttjänsten kan du identifiera kundregister med föråldrade adresser. I många fall kan du även uppdatera kundinformationen som en del av den processen.

att identifiera dubbla poster är en annan viktig dataverifieringsaktivitet. Om din kunddatabas listar samma kund tre eller fyra gånger, då är det troligt att skicka dem dubbla utskick. Detta kostar inte bara mer pengar, det resulterar också i en negativ kundupplevelse.

för att göra dedupliceringsprocessen mer utmanande kan flera poster för samma kund ha skapats med lite olika variationer på en persons namn. Verktyg som använder fuzzy logic för att identifiera möjliga och troliga matchningar kan göra processen bättre.

data quality mandate

fler och fler företagsledare kommer att förstå det strategiska värdet av data i de insikter som kan extraheras från iT med hjälp av artificiell intelligens/maskininlärning och moderna Business intelligence-verktyg.

tyvärr gäller det gamla ordspråket ”skräp in, skräp ut” nu mer än någonsin. När datamängden ökar är det viktigt att datadrivna företag vidtar proaktiva åtgärder för att övervaka och hantera datakvalitet rutinmässigt. Annars riskerar de att agera på insikter som bygger på felaktig information.

för att lära dig mer, Läs vår e-bok: Hur” tillräckligt bra ” kvalitet urholkar förtroendet för dina Datainsikter

Lämna ett svar

Din e-postadress kommer inte publiceras.