det er mange definisjoner av datakvalitet, generelt er datakvalitet vurderingen av hvor mye dataene er brukbare og passer til serveringskonteksten.
mange faktorer bidrar til å måle datakvalitet som:
- Datakonsistens: Brudd på semantiske regler definert over datasettet. .
- Datanøyaktighet: Data er nøyaktige når dataverdier som er lagret i databasen, samsvarer med virkelige verdier.
- Data Unikhet: et mål på uønsket duplisering eksisterende innenfor eller på tvers av systemer for et bestemt felt, post eller datasett.
- Datafullstendighet: i hvilken grad verdier er til stede i en datainnsamling.
- Data Aktualitet: i hvilken grad alder av dataene er bevilget for oppgaven ved hånden.
Andre faktorer kan tas i betraktning Som Tilgjengelighet, Enkel Manipulering, Troverdighet og Valuta.
Hvorfor Er Datakvalitet Viktig?
Å Forbedre datakvaliteten Er en kritisk bekymring da data regnes som kjernen i alle aktiviteter i organisasjoner, dårlig datakvalitet fører til unøyaktig rapportering som vil føre til unøyaktige beslutninger og sikkert økonomiske skader.
hvordan forbedre Datakvaliteten?
Forbedring Av datakvalitet oppnås ved:
- Opplæringspersonell
- Implementering av datakvalitetsløsninger
3.1. Opplæringspersonale
Før vi tenker på å implementere datakvalitetsløsninger, må vi først minimere datakvalitetsproblemene som følge av menneskelige aktiviteter i organisasjonen som dataregistrering. Også alle utviklere og databaseadministratorer må ha god kunnskap om forretningsprosessen og må referere til et enhetlig skjema når de utvikler og designer databaser og applikasjoner.
3.2. Implementering av datakvalitetsløsninger
den andre måten å forbedre datakvaliteten på er å implementere datakvalitetsløsninger. Datakvalitetsløsninger er et sett med verktøy eller program som utfører kvalitetsoppgaver som:
- Kunnskapsbase: en kunnskapsbase er en maskinlesbar ressurs for formidling av informasjon.
- data de-duplisering: Fjern duplisert informasjon basert på et sett med semantiske regler.
- datarensing: Fjerner uønskede tegn og symboler fra verdier.
- dataprofilering: er prosessen med å undersøke dataene som er tilgjengelige fra en eksisterende informasjonskilde (f. eks. en database eller en fil) og samle statistikk eller informative sammendrag om disse dataene.
- datamatching: datamatching beskriver forsøk på å sammenligne to sett med innsamlede data ved hjelp av teknologier som Postkobling og Enhetsløsning.
Populære datakvalitetsløsninger
I denne delen vil jeg vise noen av de mest populære datakvalitetsløsningene i markedet.
4.1. IBM Infosphere Information server
IBM InfoSphere® Information Server er en markedsledende dataintegrasjonsplattform, som inkluderer en familie av produkter som gjør at du kan forstå, rense, overvåke, transformere og levere data, og samarbeide for å bygge bro over gapet mellom virksomhet og IT. InfoSphere Information Server gir mpp-funksjoner (massively parallel processing) for å levere en svært skalerbar og fleksibel integrasjonsplattform som håndterer alle datamengder, store og små.
InfoSphere Information Server gir deg muligheten til fleksibelt å oppfylle dine unike informasjons integrasjonskrav — fra dataintegrasjon til datakvalitet og datastyring — for å levere pålitelig informasjon til dine virksomhetskritiske forretningsinitiativer (for eksempel big data og analyse, datalagermodernisering, master data management og point-of-impact analyse).
- Hjemmeside: https://www.ibm.com/analytics/information-server
4.2. Informatica Datakvalitet
Informatica Datakvalitet leverer pålitelige data til alle interessenter, prosjekter og datadomener for alle forretningsapplikasjoner på stedet eller i skyen.
- Hjemmeside: https://www.informatica.com/products/data-quality/informatica-data-quality.html
4.3. Oracle Data Quality
Oracle Enterprise Data Quality leverer en komplett, best-of-breed tilnærming til fest – og produktdata som resulterer i pålitelige masterdata som integreres med applikasjoner for å forbedre forretningsinnsikt.
- Hjemmeside: http://www.oracle.com/us/products/middleware/data-integration/enterprise-data-quality/overview/index.html
4.4. Microsoft Data Quality Services
SQL Server Data Quality Services (DQS) er et kunnskapsbasert datakvalitetsprodukt. MED DQS kan du bygge en kunnskapsbase og bruke den til å utføre en rekke kritiske datakvalitetsoppgaver, inkludert korrigering, berikelse, standardisering og de-duplisering av dataene dine. DQS gjør det mulig å utføre datarensing ved hjelp av skybaserte referansedatatjenester levert av referansedataleverandører. DQS gir deg også profilering som er integrert i datakvalitetens oppgaver, slik at du kan analysere integriteten til dataene dine.
- Hjemmeside: https://docs.microsoft.com/en-us/sql/data-quality-services/data-quality-services
4.5. Melissa Datakvalitet
Siden 1985 har Melissa levert verktøy for datakvalitet for bedrifter med brede muligheter, inkludert dataprofilering og standardisering, rensing, berikelse, kobling og deduping. Vår misjon er å gi organisasjoner med best-of-breed løsninger som leverer pålitelig, pålitelig, nøyaktig informasjon for større innsikt.
- Hjemmeside: https://www.melissa.com/uk/data/data-quality
4.6. Talend Data Quality
Talends verktøy for datakvalitet profilerer, renser og maskerer data, samtidig som datakvaliteten overvåkes over tid, i alle formater eller størrelser. Data de-duplisering, validering og standardisering skaper rene data for tilgang, rapportering, analyse og operasjoner. Berik data med eksterne kilder for postvalidering, forretningsidentifikasjon, kredittpoenginformasjon og mer.
- Hjemmeside: https://www.talend.com/products/data-quality/
4.7. Syncsort Trillium Software Lead
Syncsorts Trillium Cloud leverer en bransjeledende løsning for datakvalitet for bedrifter med enkel distribusjon og operativ fleksibilitet i et herdet, sikkert colud-Miljø som Administreres Av Syncsort.
- Hjemmeside: http://www.syncsort.com/en/About/Trillium-Software
4.8. SAS Datakvalitet
SAS Datakvalitetsprogramvaren gjør det mulig å forbedre konsistensen og integriteten til dataene dine. Når du øker kvaliteten på dataene dine, øker du verdien av analyseresultatene dine.
SAS Datakvalitetsprogramvare støtter en rekke datakvalitetsoperasjoner. Datakvalitetsoperasjonene benytter forhåndsdefinerte regler som gjelder for den spesifikke konteksten til dataene dine (for eksempel navn eller gateadresser). Eksempler på datakvalitet operasjoner inkluderer casing, parsing, fuzzy matching, og standardisering.
- Hjemmeside: https://www.sas.com/en_us/software/data-quality.html
- C. Batini, C. Cappiello, C. Francalanci, A. Maurino, «Metoder for vurdering og forbedring av datakvalitet,» ACM Computing Surveys (CSUR), vol. 41, s. 16, 2009.
- D. McGilvray, «Ti Trinn Til Kvalitetsdata og Pålitelig Informasjon,» MIT Information Quality Industry Symposium, 2008.
- R. Y. W. A. D. M. Strong, «Utover nøyaktighet: hva datakvalitet betyr å data forbrukere,» Journal of management information systems, vol. 12, s. 5-33, 1996.
- Sidi Fatimah,Shariat Panahy, Payam Hassany, Lilly Suriani Affendey, Marzanah A. Jabar, Hamidah Ibrahim, Aida Mustapha, «datakvalitet: en undersøkelse av datakvalitetsdimensjoner», I Proceedings – 2012 International Conference on Information Retrieval And Knowledge Management, CAMP’12, 2012.
- Herzog,Thomas N., scheuren, f.j, winkler, «Hva Er Datakvalitet Og Hvorfor Skal Vi Bry Oss,» Journal Of Industrial Engineering and Management, vol. 4 (2), nr. 2. utgave, s. 1-9, 2016.
- M. Rouse,» Kunnskapsbase», TechTarget, 3 2007. . Tilgjengelig: https://searchcrm.techtarget.com/definition/knowledge-base. .
- «Dataprofilering,» Wikipedia, . Tilgjengelig: https://en.wikipedia.org/wiki/Data_profiling. .
- » Hva Er Datamatching?, «Techopedia,. Tilgjengelig: https://www.techopedia.com/definition/28041/data-matching. .
- «IBM Informasjonsserver,» IBM,. Tilgjengelig: https://www.ibm.com/analytics/information-server. .
- » Beste Datakvalitetsprogramvare, » G2Crowd,. Tilgjengelig: https://www.g2crowd.com/categories/data-quality. .
- » Oracle Bedrifts Datakvalitet, » Oracle,. Tilgjengelig: http://www.oracle.com/us/products/middleware/data-integration/enterprise-data-quality/overview/index.html. .
- «Tjenester For Datakvalitet», Microsoft, 10 12 2013. . Tilgjengelig: https://docs.microsoft.com/en-us/sql/data-quality-services/data-quality-services?vis = sql-server-2017. .
- » Datakvalitet, » Talend,. Tilgjengelig: https://www.talend.com/products/data-quality/. .
- «Trillium-Programvare,» Syncsort,. Tilgjengelig: http://www.syncsort.com/en/About/Trillium-Software. .
- «SAS Datakvalitet Og Datakvalitetsserver,» SAS, . Tilgjengelig: http://support.sas.com/software/products/dataqual/index.html.