Qu’est-ce qu’un fichier de schéma dans DataStage ?

SCHEMA-FILES-IN-DATASTAGE

En tant que développeur, vous définissez toujours les colonnes et leurs types de données dans l’onglet « Colonne » à chaque étape.

Savez-vous que vous avez un autre moyen de définir des colonnes autres que l’onglet colonnes?Les schémas

sont une autre façon de spécifier des définitions de colonnes pour les données utilisées par les travaux parallèles.

Comme vous le savez, par défaut, la plupart des étapes de travail parallèles prennent leurs métadonnées de l’onglet Colonnes, qui contient des définitions de table, complétées, le cas échéant, par des informations de format de l’onglet Format.

Pour certaines étapes, vous pouvez spécifier une propriété qui amène l’étape à prendre ses métadonnées à partir du fichier de schéma spécifié à la place.

Lire aussi: Différence entre le tri de lien et l’étape de tri

Certaines étapes nous permettent également de spécifier un schéma partiel. Cela vous permet de définir uniquement les colonnes qu’une étape particulière traite et d’ignorer le reste des colonnes.

Le fichier de schéma est un fichier texte brut. Et il est préférable de le sauvegarder avec ‘.extension de schéma, afin que vous puissiez les identifier facilement dans le système de fichiers.

Format de fichier de schéma :

Un schéma contient une définition d’enregistrement (ou de ligne). Cela décrit chaque colonne (ou champ) qui sera rencontrée dans l’enregistrement, en indiquant le nom de la colonne et le type de données. Voici un exemple de schéma d’enregistrement :

record(
name:string;
address:chaîne nullable;
value1: int32;
value2:int32;
dateofbirth: date)

Les sauts de ligne sont là pour faciliter la lecture, si vous le souhaitez, vous pouvez les omettre si vous définissez un schéma partiel, par exemple

record(name: string; value1:int32; dateofbirth: date)

est un schéma valide.

Le format de chaque ligne décrivant une colonne est:

column_name:datatype;

nom_colonne : C’est le nom qui identifie la colonne. Les noms doivent commencer par une lettre ou un trait de soulignement (_) et ne peuvent contenir que des caractères alphanumériques ou de soulignement. Le nom n’est pas sensible à la casse.

nullité : Vous pouvez éventuellement spécifier si une colonne est autorisée à contenir une valeur nulle ou si elle serait considérée comme non valide. Si la colonne peut être nulle, insérez le mot ‘nullable’. Par défaut, les colonnes ne sont pas annulables.

Vous pouvez également inclure ‘nullable’ au niveau de l’enregistrement pour spécifier que toutes les colonnes sont annulables, puis remplacer le paramètre pour des colonnes individuelles en spécifiant ‘non annulable’. Par exemple:

enregistrement nullable(
nom: chaîne non nullable;
value1: int32;
dateofbirth: date)

type de données: Il s’agit du type de données de la colonne. Cela utilise les types de données internes, mais pas les types de données SQL utilisés dans les onglets Colonnes des éditeurs d’étapes.

Vous pouvez inclure des commentaires dans des fichiers de définition de schéma. Un commentaire commence par une double barre oblique // et se termine par une nouvelle ligne.

Vous devez toujours vous assurer que la propagation des colonnes à l’exécution est activée si vous souhaitez utiliser des fichiers de schéma pour définir des métadonnées de colonne.

Lire aussi: Comment Fonctionne la fonction de CHAMP dans DataStage?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.