Validación vs. Verificación: ¿Cuál es la diferencia?

Validación de datos Verificación de datos
Propósito Compruebe si los datos están dentro del rango aceptable de valores Compruebe los datos para asegurarse de que sean precisos y coherentes
Normalmente se realiza Cuando se crean o actualizan datos Cuando se migran o fusionan datos
Ejemplo Comprobar si se puede encontrar el código POSTAL introducido por el usuario Comprobar que todos los códigos postales del conjunto de datos están en formato ZIP+4

En términos sencillos, la verificación de datos y la validación de datos pueden sonar como si fueran la misma cosa. Sin embargo, cuando profundiza en las complejidades de la calidad de los datos, estas dos piezas importantes del rompecabezas son claramente diferentes. Conocer la distinción puede ayudarlo a comprender mejor el panorama general de la calidad de los datos.

¿Qué es la validación de datos?

En pocas palabras, la validación de datos es el proceso de determinar si una información en particular está dentro del rango aceptable de valores para un campo dado.

En los Estados Unidos, por ejemplo, cada dirección debe incluir un campo distinto para el estado. Ciertos valores como NH, ND, AK y TX se ajustan a la lista de abreviaturas estatales definidas por el Servicio Postal de los Estados Unidos. Como saben, esas abreviaturas denotan estados específicos.

También hay abreviaturas de dos caracteres para los territorios de los Estados Unidos, como Guam («GU») y las Islas Marianas del Norte («MP»). Si ingresara «ZP» o » A7 » en el campo estado, en esencia estaría invalidando la dirección completa, porque no existe tal estado o territorio. La validación de datos realizaría una comprobación con los valores existentes en una base de datos para asegurarse de que se ajustan a parámetros válidos.

Para una lista de direcciones que incluya países fuera de los EE.UU., el campo estado/provincia/territorio tendría que validarse con una lista significativamente más larga de valores posibles, pero la premisa básica es la misma; los valores ingresados deben encajar dentro de una lista o rango de valores aceptables. (Para su información, Precisamente ofrece soluciones de validación de direcciones)

Por ejemplo, en algunos casos es posible que necesite establecer límites alrededor de los posibles valores numéricos para un campo dado, aunque con un poco menos de precisión que en el ejemplo anterior. Si está registrando la altura de una persona, es posible que desee prohibir los valores que estén fuera del rango esperado. Si una persona aparece en su base de datos como de 12 pies de altura (aproximadamente 3 metros), entonces probablemente pueda asumir que los datos son incorrectos. Del mismo modo, no querrá permitir números negativos para ese campo.

Afortunadamente, este tipo de comprobaciones de validación se realizan normalmente a nivel de aplicación o de base de datos. Por ejemplo, si está ingresando una dirección de envío basada en EE.UU. en un sitio web de comercio electrónico, es poco probable que pueda ingresar un código de estado que no sea válido para los Estados Unidos.

Lea nuestro libro electrónico

Cómo la Calidad «Lo suficientemente buena» está Erosionando la Confianza en Sus Conocimientos de datos

Explore los conocimientos clave de calidad de datos de profesionales de datos en la encuesta de calidad de datos

Leer

¿Qué es la verificación de datos y en qué se diferencia?

La verificación de datos, por otro lado, es en realidad bastante diferente de la validación de datos. Verificación realiza una verificación de los datos actuales para garantizar que sean precisos, coherentes y reflejen su propósito previsto.La verificación

también puede realizarse en cualquier momento. En otras palabras, la verificación puede tener lugar como parte de un proceso de calidad de datos recurrente, mientras que la validación generalmente ocurre cuando se crea o actualiza un registro inicialmente.

La verificación desempeña un papel especialmente crítico cuando los datos se migran o fusionan desde fuentes de datos externas. Consideremos el caso de una empresa que acaba de adquirir un pequeño competidor. Han decidido fusionar los datos de clientes de la competencia adquirida en su propio sistema de facturación. Como parte del proceso de migración, es importante verificar que los registros provienen correctamente del sistema de origen.

Los pequeños errores en la preparación de datos para la migración a veces pueden dar lugar a grandes problemas. Si un campo clave en el registro maestro del cliente se asigna incorrectamente (por ejemplo, si un rango de celdas en una hoja de cálculo se desplazó inadvertidamente hacia arriba o hacia abajo cuando se preparaban los datos), podría resultar en que las direcciones de envío o las facturas pendientes se asignaran al cliente incorrecto.

Por lo tanto, es importante verificar que la información en el sistema de destino coincida con la información del sistema de origen. Esto se puede hacer tomando muestras de los datos de los sistemas de origen y de destino para verificar manualmente la precisión, o puede implicar procesos automatizados que realizan una verificación completa de los datos importados, coincidiendo con todos los registros y marcando excepciones.

Verificación como proceso continuo

La verificación no se limita a la migración de datos. También desempeña un papel importante para garantizar la precisión y coherencia de los datos corporativos a lo largo del tiempo.

Imagine que tiene una base de datos existente de consumidores que han comprado su producto y desea enviarles por correo una promoción de un nuevo accesorio para ese producto. Parte de esa información del cliente puede estar desactualizada, por lo que vale la pena verificar los datos antes de su envío.

Al verificar las direcciones de los clientes con una base de datos de cambio de direcciones del servicio postal, puede identificar los registros de clientes con direcciones obsoletas. En muchos casos, incluso puede actualizar la información del cliente como parte de ese proceso.

Identificar registros duplicados es otra actividad importante de verificación de datos. Si su base de datos de clientes enumera al mismo cliente tres o cuatro veces, es probable que le envíe correos duplicados. Esto no solo le cuesta más dinero, sino que también resulta en una experiencia de cliente negativa.

Para que el proceso de deduplicación sea más difícil, es posible que se hayan creado varios registros para el mismo cliente utilizando variaciones ligeramente diferentes en el nombre de una persona. Las herramientas que usan lógica difusa para identificar coincidencias posibles y probables pueden hacer que el proceso funcione mejor.

El mandato de calidad de datos

Cada vez más líderes empresariales están llegando a comprender el valor estratégico de los datos en los conocimientos que se pueden extraer de ti utilizando inteligencia artificial/aprendizaje automático y herramientas modernas de inteligencia empresarial.

Desafortunadamente, sin embargo, el viejo dicho «basura entra, basura sale» se aplica ahora más que nunca. A medida que aumenta el volumen de datos, es esencial que las empresas basadas en datos implementen medidas proactivas para monitorear y administrar la calidad de los datos de forma rutinaria. De lo contrario, corren el riesgo de actuar sobre la base de ideas basadas en información defectuosa.

Para obtener más información, lea nuestro libro electrónico: Cómo la Calidad «Lo Suficientemente Buena» está Erosionando la Confianza en Sus Conocimientos de datos

Deja una respuesta

Tu dirección de correo electrónico no será publicada.