Validation vs. Verification: What ’ s the Difference?

Tietojen validointi tietojen todentaminen
Käyttötarkoitus Tarkista, kuuluvatko tiedot hyväksyttävälle arvojen vaihteluvälille Tarkista, että tiedot ovat tarkkoja ja yhdenmukaisia
yleensä tehty kun tietoja luodaan tai päivitetään kun tietoja siirretään tai yhdistetään
esimerkki tarkistetaan, löytyykö käyttäjän antamaa postinumeroa tarkistetaan, että kaikki datajoukon postinumerot ovat ZIP + 4-muodossa

maallikon termein, tietojen todentaminen ja validointi voivat kuulostaa samalta kuin ne olisivat sama asia. Kun kaivaa koukerot tietojen laatua, kuitenkin, nämä kaksi tärkeää kappaletta palapeli ovat selvästi erilaisia. Eron tunteminen voi auttaa ymmärtämään paremmin datan laatua koskevaa kokonaiskuvaa.

mitä tietojen validointi on?

pähkinänkuoressa tietojen validointi on prosessi, jossa määritetään, kuuluuko tietty tieto tietyn kentän hyväksyttävälle arvoalueelle.

esimerkiksi Yhdysvalloissa jokaisen katuosoitteen tulisi sisältää erillinen kenttä osavaltiolle. Tietyt arvot, kuten NH, ND, AK ja TX, ovat Yhdysvaltain postilaitoksen määrittelemän valtion lyhenteiden luettelon mukaisia. Kuten tiedätte, nämä lyhenteet tarkoittavat tiettyjä valtioita.

on olemassa myös kaksimerkkisiä lyhenteitä Yhdysvaltain territorioista, kuten Guamista (”GU”) ja Pohjois-Mariaaneista (”MP”). Jos syöttäisit ”ZP” tai ”A7” valtion kenttään, käytännössä mitätöisit koko osoitteen, koska sellaista valtiota tai aluetta ei ole olemassa. Tietojen validoinnilla tarkistettaisiin tietokannassa olevat olemassa olevat arvot sen varmistamiseksi, että ne ovat kelvollisten parametrien rajoissa.

jos osoiteluettelo Sisältää Yhdysvaltain ulkopuolisia maita, osavaltion/provinssin/territorion kenttä on validoitava huomattavasti pidemmällä mahdollisten arvojen listalla, mutta peruslähtökohta on sama; annettujen arvojen on sovittava hyväksyttävien arvojen luetteloon tai vaihteluväliin. (Tiedoksi, tarjoaa juuri osoitteen validointiratkaisuja)

esimerkiksi joissakin tapauksissa saatat joutua asettamaan rajat tietyn kentän mahdollisten numeeristen arvojen ympärille, vaikkakin hieman vähemmän tarkasti kuin edellisessä esimerkissä. Jos rekisteröit henkilön pituuden, kannattaa kieltää arvot, jotka jäävät odotetun vaihteluvälin ulkopuolelle. Jos henkilö on lueteltu tietokannassa olevan 12 jalkaa pitkä (noin 3 metriä), niin voit todennäköisesti olettaa, että tiedot ovat virheellisiä. Samoin, et halua sallia negatiivisia numeroita, että kenttä.

onneksi tällaiset oikeellisuustarkistukset tehdään yleensä sovellustasolla tai tietokannan tasolla. Esimerkiksi, jos olet syöttämässä US-pohjainen toimitusosoite osaksi sähköisen kaupankäynnin verkkosivuilla, on epätodennäköistä, että voisit syöttää valtion koodi, joka on virheellinen Yhdysvalloissa.

Lue eBook

miten ”tarpeeksi hyvä” laatu murentaa luottamusta datasi oivalluksiin

tutki keskeisiä tietojen laatua koskevia oivalluksia data-alan ammattilaisilta tietojen laatututkimuksessa

Lue

mikä on tietojen todentaminen,ja miten se eroaa?

tietojen todentaminen sen sijaan on itse asiassa aivan eri asia kuin tietojen validointi. Tarkastuksessa tarkistetaan nykyiset tiedot sen varmistamiseksi, että ne ovat tarkkoja, johdonmukaisia ja vastaavat niiden aiottua tarkoitusta.

verifiointi voi tapahtua myös milloin tahansa. Toisin sanoen todentaminen voi tapahtua osana toistuvaa tietojen laatuprosessia, kun taas validointi tapahtuu tyypillisesti silloin, kun tietuetta alun perin luodaan tai päivitetään.

todentaminen on erityisen ratkaisevassa asemassa, kun tietoja siirretään tai yhdistetään ulkopuolisista tietolähteistä. Ajatellaanpa yritystä, joka on juuri hankkinut pienen kilpailijan. He ovat päättäneet yhdistää hankitun kilpailijan asiakastiedot omaan laskutusjärjestelmäänsä. Osana siirtymäprosessia on tärkeää varmistaa, että tietueet tulivat oikein lähdejärjestelmästä.

pienet virheet tietojen valmistelussa migraatiota varten voivat joskus johtaa suuriin ongelmiin. Jos asiakkaan päätietueen avainkenttä on määritetty väärin (esimerkiksi jos laskentataulukon solualuetta on vahingossa siirretty ylös tai alas tietoja laadittaessa), se voi johtaa lähetysosoitteiden tai maksamattomien laskujen määrittämiseen väärälle asiakkaalle.

siksi on tärkeää varmistaa, että kohdejärjestelmän tiedot vastaavat lähdejärjestelmän tietoja. Tämä voidaan tehdä ottamalla näytteitä sekä lähde – että kohdejärjestelmistä tarkkuuden varmistamiseksi manuaalisesti, tai se voi sisältää automatisoituja prosesseja, jotka suorittavat tuotujen tietojen täydellisen todentamisen, sovittamalla kaikki tietueet ja merkitsemistä koskevat poikkeukset.

todentaminen jatkuvana prosessina

todentaminen ei rajoitu tietojen siirtoon. Sillä on myös tärkeä rooli varmistettaessa yritystietojen tarkkuus ja johdonmukaisuus ajan mittaan.

Kuvittele, että sinulla on olemassa tietokanta kuluttajista, jotka ovat ostaneet tuotteesi, ja haluat lähettää heille myynninedistämistarkoituksessa kyseisen tuotteen uuden lisälaitteen. Osa näistä asiakastiedoista saattaa olla vanhentuneita, joten tiedot kannattaa tarkistaa jo ennen postitusta.

tarkistamalla asiakkaan osoitteet postin osoitteenmuutostietokannasta, voit tunnistaa asiakasrekisterit vanhentuneilla osoitteilla. Monissa tapauksissa voit jopa päivittää asiakastietoja osana tätä prosessia.

päällekkäisten tietueiden tunnistaminen on toinen tärkeä tietojen todentamistoimi. Jos asiakastietokantasi listaa saman asiakkaan kolme tai neljä kertaa, niin todennäköisesti lähetät heille päällekkäisiä postituksia. Tämä ei vain maksa sinulle enemmän rahaa, se johtaa myös negatiiviseen asiakaskokemukseen.

deduplikaatioprosessin muuttamiseksi haastavammaksi samalle asiakkaalle on saatettu luoda useita tietueita käyttämällä henkilön nimestä hieman erilaisia variaatioita. Työkalut, jotka käyttävät sumeaa logiikkaa mahdollisten ja todennäköisten vastaavuuksien tunnistamiseen, voivat tehdä prosessista paremman.

tietojen laadun toimeksianto

yhä useammat yritysjohtajat alkavat ymmärtää datan strategista arvoa oivalluksissa, joita siitä voidaan poimia keinoälyn/koneoppimisen ja nykyaikaisten Business intelligence-työkalujen avulla.

valitettavasti vanha sanonta ”roskat sisään, roskat ulos” pätee kuitenkin nyt enemmän kuin koskaan. Datan määrän kasvaessa on tärkeää, että datalähtöiset yritykset ryhtyvät ennakoiviin toimenpiteisiin tietojen laadun seuraamiseksi ja hallitsemiseksi rutiininomaisesti. Muuten he ovat vaarassa toimia vääriin tietoihin perustuvien oivallusten varassa.

Lue eBook: How ”good Enough” Quality is raping Trust in Your Data Insights

Vastaa

Sähköpostiosoitettasi ei julkaista.