Adatellenőrzés | Adatellenőrzés | |
cél | ellenőrizze, hogy az adatok az elfogadható értéktartományba esnek-e | ellenőrizze az adatokat, hogy azok pontosak és következetesek legyenek |
általában | adatok létrehozásakor vagy frissítésekor | adatok áttelepítésekor vagy egyesítésekor |
példa | annak ellenőrzése, hogy a felhasználó által megadott irányítószám megtalálható-e | annak ellenőrzése, hogy az adatkészlet összes irányítószáma ZIP+4 formátumban van-e |
laikus értelemben, az adatellenőrzés és az adatellenőrzés úgy hangzik, mintha ugyanaz lenne. Amikor elmélyül az adatminőség bonyodalmaiban, azonban, a puzzle e két fontos darabja határozottan különbözik egymástól. A megkülönböztetés ismerete segíthet jobban megérteni az adatminőség nagyobb képét.
mi az adatellenőrzés?
dióhéjban az adatérvényesítés annak meghatározása, hogy egy adott információ egy adott mező elfogadható értéktartományába esik-e.
az Egyesült Államokban például minden utcacímnek külön mezőt kell tartalmaznia az állam számára. Bizonyos értékek, mint például az NH, az ND, az AK és a TX megfelelnek az amerikai postai szolgálat által meghatározott állami rövidítések listájának. Mint tudják, ezek a rövidítések meghatározott állapotokat jelölnek.
két karakteres rövidítések vannak az Egyesült Államok területeire is, mint például Guam (“GU”) és az Északi-Mariana-szigetek (“MP”). Ha “ZP” – t vagy “A7” – et írna be az állapot mezőbe, akkor lényegében érvénytelenítené a teljes címet, mert ilyen állam vagy terület nem létezik. Az adatok érvényesítése ellenőrzést végezne az adatbázis meglévő értékei ellen annak biztosítása érdekében, hogy azok érvényes paramétereken belül legyenek.
az Egyesült Államokon kívüli országokat tartalmazó címlista esetén az állam/tartomány/terület mezőt a lehetséges értékek lényegesen hosszabb listájával kell érvényesíteni, de az alapfeltevés ugyanaz; a megadott értékeknek el kell illeszkedniük egy listába vagy az elfogadható értékek tartományába. (FYI, pontosan címérvényesítési megoldásokat kínál)
például bizonyos esetekben szükség lehet korlátok beállítására egy adott mező lehetséges numerikus értékei körül, bár kissé kisebb pontossággal, mint az előző példában. Ha egy személy magasságát rögzíti, érdemes megtiltania a várt tartományon kívül eső értékeket. Ha egy személy szerepel az adatbázisban, hogy 12 láb magas (körülbelül 3 méter), akkor valószínűleg feltételezik, hogy az adatok helytelenek. Hasonlóképpen, nem szeretné engedélyezni a negatív számokat az adott mezőhöz.
szerencsére az ilyen típusú érvényesítési ellenőrzéseket általában az alkalmazás vagy az adatbázis szintjén hajtják végre. Például, ha egy amerikai székhelyű szállítási címet ad meg egy e-kereskedelmi webhelyen, nem valószínű, hogy olyan államkódot tudna megadni, amely érvénytelen az Egyesült Államokban.
olvassa el e-könyvünket
hogyan rontja az” elég jó ” minőség az adatokba vetett bizalmat?
fedezze fel az adatminőségi felmérésben részt vevő szakemberek legfontosabb adatminőségi betekintéseit
mi az adatellenőrzés,és miben különbözik?
az adatok ellenőrzése viszont valójában meglehetősen különbözik az adatok érvényesítésétől. A hitelesítés ellenőrzi az aktuális adatokat annak biztosítása érdekében, hogy azok pontosak, következetesek és tükrözik a tervezett célt.
ellenőrzés is megtörténhet bármikor. Más szavakkal, az ellenőrzésre ismétlődő adatminőségi folyamat részeként kerülhet sor, míg az érvényesítésre általában akkor kerül sor, amikor egy rekordot eredetileg létrehoznak vagy frissítenek.
A hitelesítés különösen kritikus szerepet játszik, amikor az adatokat külső adatforrásokból migrálják vagy egyesítik. Tekintsük egy olyan vállalat esetét,amely éppen egy kis versenytársat szerzett. Úgy döntöttek, hogy a megszerzett versenytárs ügyféladatait egyesítik saját számlázási rendszerükbe. Az áttelepítési folyamat részeként fontos ellenőrizni, hogy a rekordok megfelelően érkeztek-e át a forrásrendszerből.
az adatok migrációra való előkészítésének apró hibái néha nagy problémákat okozhatnak. Ha az ügyfél főbejegyzésében egy kulcsmező helytelenül van hozzárendelve (például ha egy táblázat cellatartománya véletlenül felfelé vagy lefelé tolódott az adatok elkészítésekor), az azt eredményezheti, hogy a szállítási címeket vagy a fennálló számlákat rossz ügyfélhez rendelik.
ezért fontos ellenőrizni, hogy a célrendszerben lévő információk megegyeznek-e a forrásrendszerből származó információkkal. Ez történhet mind a forrás -, mind a célrendszerből származó adatok mintavételével a pontosság manuális ellenőrzése érdekében, vagy automatizált folyamatokkal, amelyek teljes mértékben ellenőrzik az importált adatokat, megfeleltetve az összes rekordot és megjelölve a kivételeket.
ellenőrzés mint folyamatban lévő folyamat
az ellenőrzés nem korlátozódik az adatok migrációjára. Fontos szerepet játszik a vállalati adatok időbeli pontosságának és következetességének biztosításában is.
képzelje el, hogy van egy meglévő adatbázisa azokról a fogyasztókról, akik megvásárolták a terméket, és el szeretné küldeni nekik egy új kiegészítő promócióját a termékhez. Előfordulhat, hogy az ügyféladatok egy része elavult, ezért érdemes ellenőrizni az adatokat a levelezés előtt.
ha ellenőrzi az ügyfélcímeket a postai szolgáltatás címváltozási adatbázisával, azonosíthatja az elavult címekkel rendelkező ügyfélrekordokat. Sok esetben akár az ügyfél adatait is frissítheti a folyamat részeként.
a duplikált rekordok azonosítása egy másik fontos adatellenőrzési tevékenység. Ha az ügyféladatbázis háromszor vagy négyszer felsorolja ugyanazt az ügyfelet, akkor valószínűleg ismétlődő leveleket küld nekik. Ez nem csak több pénzt fizet, hanem negatív ügyfélélményt is eredményez.
annak érdekében, hogy a deduplikációs folyamat nagyobb kihívást jelentsen, ugyanazon ügyfél számára több rekordot is létrehozhattak egy személy nevének kissé eltérő variációival. Azok az eszközök, amelyek fuzzy logikát használnak a lehetséges és valószínű egyezések azonosítására, jobbá tehetik a folyamatot.
az adatminőségi megbízás
egyre több üzleti vezető érti meg az adatok stratégiai értékét a mesterséges intelligencia/gépi tanulás és a modern üzleti intelligencia eszközök segítségével kinyerhető betekintésekben.
sajnos azonban a régi mondás: “szemét be, szemét ki” most jobban érvényes, mint valaha. Az adatmennyiség növekedésével elengedhetetlen, hogy az adatközpontú vállalatok proaktív intézkedéseket vezessenek be az adatminőség rutinszerű figyelemmel kísérése és kezelése érdekében. Ellenkező esetben kockáztatják a hibás információkon alapuló betekintést.
további információkért olvassa el e-könyvünket: hogyan rontja az” elég jó ” minőség az adatokba vetett bizalmat