¿Qué es un archivo de esquema en DataStage?

SCHEMA-FILES-IN-DATASTAGE

Como desarrollador, siempre defines las columnas y sus tipos de datos en la pestaña «Columna» en cada etapa.

¿Sabe que tiene otra forma de definir columnas que no sea la pestaña columnas?

Los esquemas son una forma alternativa de especificar definiciones de columnas para los datos utilizados por los trabajos paralelos.

Como sabe, de forma predeterminada, la mayoría de las etapas de trabajo paralelas toman sus metadatos de la pestaña Columnas, que contiene definiciones de tabla, complementadas, cuando sea necesario, con información de formato de la pestaña Formato.

Para algunas etapas, puede especificar una propiedad que haga que la etapa tome sus metadatos del archivo de esquema especificado.

Lea también: Diferencia entre la ordenación de enlaces y la etapa de ordenación

Algunas etapas también nos permiten especificar un esquema parcial. Esto le permite definir solo aquellas columnas que una etapa en particular está procesando e ignorar el resto de columnas.

El archivo de esquema es un archivo de texto sin formato. Y es preferible guardarlo con ‘.extensión de esquema, para que pueda identificarlos fácilmente en el sistema de archivos.

Formato de archivo de esquema:

Un esquema contiene una definición de registro (o fila). Esto describe cada columna (o campo) que se encontrará dentro del registro, dando nombre de columna y tipo de datos. El siguiente es un ejemplo de esquema de registro:

registro (
nombre: cadena;
dirección:cadena anulable;
value1: int32;
value2: int32;
dateofbirth: date)

Los saltos de línea están ahí para facilitar la lectura, si lo desea puede omitirlos si estaba definiendo un esquema parcial, por ejemplo

record (nombre: string; value1: int32; dateofbirth: date)

es un esquema válido.

El formato de cada línea describe una columna es:

column_name:datatype;

column_name: Este es el nombre que identifica la columna. Los nombres deben comenzar con una letra o un guion bajo (_), y solo pueden contener caracteres alfanuméricos o guiones bajos. El nombre no distingue entre mayúsculas y minúsculas.

nullability: Puede especificar opcionalmente si se permite que una columna contenga un valor nulo o si esto se vería como no válido. Si la columna puede ser nula, inserte la palabra ‘nullable’. Por defecto, las columnas no se pueden anular.

También puede incluir ‘nullable’ a nivel de registro para especificar que todas las columnas son nullables, y luego anular la configuración para columnas individuales especificando ‘not nullable’. Por ejemplo:

registro nulo (
nombre: cadena no nula;
valor1: int32;
fecha de nacimiento: fecha)

tipo de datos: Este es el tipo de datos de la columna. Esto usa los tipos de datos internos, pero no los tipos de datos SQL como se usan en las pestañas de columnas en los editores de etapas.

Puede incluir comentarios en los archivos de definición de esquema. Un comentario se inicia con una barra doble / / y termina con una nueva línea.

Siempre debe asegurarse de que la propagación de columnas en tiempo de ejecución esté activada si desea utilizar archivos de esquema para definir metadatos de columnas.

Lea también: ¿Cómo funciona la función de CAMPO en DataStage?

Deja una respuesta

Tu dirección de correo electrónico no será publicada.