nå forstår de fleste bedrifter appellen ved å bruke store dataanalyser. Med big data kan bedrifter forbedre effektiviteten, øke produktiviteten og få verdifull innsikt som driver arbeidet fremover. Få vil benekte den viktige rollen big data nå spiller i organisasjoner over hele verden, men å få de unike fordelene krever å ha data av høy kvalitet, noe som har blitt stadig vanskeligere å gjøre. Alt for ofte er dataene som samles inn av bedrifter fylt med feil, feil og ufullstendige verdier. Dette kalles skitne data, og det kan utgjøre en formidabel hindring for selskaper som håper å bruke dataene til å forbedre seg. Skitne data er ikke bare et mindre problem i den store ordningen av ting heller. Ifølge Data Warehouse Institute (TDWI), ender skitne data opp med Å koste amerikanske selskaper rundt $600 milliarder hvert år. For å løse dette problemet fullt ut, må bedrifter forstå hva som forårsaker skitne data og hvordan man best kan fikse det.
Brukerfeil
En del av nøkkelen til å bruke big data analytics mest effektivt er å ha data som er nøyaktige og fullstendige. Upålitelige data oftere enn ikke fører til bedrifter kommer til feil konklusjoner. Problemet er når brukerfeil kryper inn i datasett. En måte organisasjoner samle inn data på sine kunder er ved å ha dem fylle ut elektroniske skjemaer. Når det er fylt ut fullt og riktig, gir dette selskapene mye informasjon å analysere og analysere. Når kunder forlater hull i disse dataene, eller når de fyller det ut unøyaktig ved en feil eller med vilje, vil bedrifter finne seg i en alvorlig ulempe. Dette er spesielt viktig med salgs – og markedsføringsteam som er avhengige av nøyaktig kundeinformasjon for å drive salg. Faktisk viser en nylig undersøkelse av markedsførere at mer enn halvparten (60 prosent) sier at helsen til dataene deres er upålitelig.
Datakobling/Kondensering
Andre problemer med skitne data oppstår Når organisasjoner forsøker å koble data på tvers av ulike sett. Når datasettene ikke har en unik identifikator, kan kobling av dem skape problemer, ofte dukker opp i form av gjentatte oppføringer som ikke ble kombinert på grunn av mindre feil. Eller noen ganger kombineres data når det ikke skal være (som når kunder med samme navn har informasjonen blandet sammen). Disse typer skitne dataproblemer dukker oftest opp når bedrifter ansetter flere databaser samtidig og prøver å kombinere dem, eller når de bruker eldre teknologi som ikke kan holde tritt med dagens datakrav. De samme problemene kan oppstå når du prøver å kondensere mer komplekse datasett til en mer håndterlig form.
Slik Rengjør Du Skitne Data
Når et selskap har identifisert hva som forårsaker skitne data, kan det gå om å prøve å rydde opp dataene. En slik oppgave er ikke alltid lett, men når den er fullført, kan den være vel verdt bedriftens tid, ressurser og innsats. Datarensing krever å gå gjennom dataene omhyggelig, og merke seg hvor feil eller fraværende verdier kan skade datanøyaktigheten. Selvfølgelig, hvis datasettene er enorme, blir dette manuelt nesten umulig, men heldigvis kan store dataalgoritmer faktisk hjelpe til med å rydde opp skitne data. Disse algoritmene er designet spesielt for å fikse de vanligste tilfellene av bruker-og samlingsfeil. Selv om de ikke kan fikse hver eneste feil eller unøyaktighet, begrenser de i stor grad antall feil, noe som gjør skitne data mye renere enn før.
Forhindre Skitne Data
Organisasjoner kan også ta de riktige forberedelsene for å forhindre at skitne data blir et stort problem i utgangspunktet. Ved å etablere et tillitsfullt forhold til kunder (som å ikke fylle e-postene sine med spam), vil folk være mindre villige til å gi unøyaktig eller falsk informasjon om eventuelle skjemaer de fyller ut. Bedrifter kan også rydde opp data ved å oppdatere sine systemer for å sikre at de kan håndtere store mengder datainnsamling og analyse. Bedrifter med riktig teknologi kan til og med komme inn i dataskrubbing, som er som datarensing, men grundigere, og involverer prosesser som filtrering, dekoding og oversettelse.
Skitne data kan utgjøre betydelige problemer for bedrifter som prøver å bruke store data. Mye av tiden innser selskapene ikke at de selv har et problem før skitne data har blitt voldsomme. Å ta trinnene nå for å rense data og forhindre problemet, vil gå langt i å hjelpe organisasjoner med å få mest mulig ut av dataene de samler inn. Først da vil de se de sanne fordelene som big data analytics har å tilby.