Wat is een Schema-bestand in DataStage?

SCHEMA-FILES-IN-DATASTAGE

als ontwikkelaar definieer je altijd de kolommen en hun datatypes in ‘kolom’ tab in elke fase.

weet u dat u een andere manier hebt om kolommen anders dan Tab kolommen te definiëren?

schema ‘ s zijn een alternatieve manier om kolomdefinities te specificeren voor de gegevens die door parallelle taken worden gebruikt.

zoals u weet, nemen de meeste parallelle takenstadia standaard hun metagegevens op het tabblad Kolommen, dat tabeldefinities bevat, waar nodig aangevuld met opmaakinformatie op het tabblad Opmaak.

voor sommige fasen kunt u een eigenschap opgeven die ervoor zorgt dat de fase zijn metagegevens uit het opgegeven schemabestand neemt.

Lees ook: verschil tussen de sorteer-en sorteerfase

sommige fasen laten ons ook toe om een gedeeltelijk schema te specificeren. Hiermee kunt u alleen die kolommen definiëren die in een bepaald stadium worden verwerkt en de rest van de kolommen negeren.

het schemabestand is een platte tekstbestand. En het is beter om het op te slaan met ‘.schema ‘ extensie, zodat u ze gemakkelijk kunt identificeren in het bestandssysteem.

Schema bestandsformaat:

een schema bevat een record (of rij) definitie. Dit beschrijft elke kolom (of veld) die zal worden aangetroffen in de record, met vermelding kolomnaam en gegevenstype. Het volgende voorbeeld is een recordschema:

record (
naam: string;
adres:Nuller string;
value1: int32;
value2: int32;
dateofbirth: date)

de regeleinden zijn er voor het gemak van lezen, als u wilt kunt u deze weglaten als u een gedeeltelijk schema definieert, bijvoorbeeld

record (name: string; value1: int32; dateofbirth: date)

is een geldig schema.

het formaat van elke regel die een kolom beschrijft is:

column_name:datatype;

column_name: Dit is de naam die de kolom identificeert. Namen moeten beginnen met een letter of een underscore (_), en mogen alleen alfanumerieke of underscore tekens bevatten. De naam is niet hoofdlettergevoelig.

nullability: u kunt optioneel opgeven of een kolom een null-waarde mag bevatten, of dat deze als ongeldig wordt gezien. Als de kolom null kan zijn, vul dan het woord ‘Nuller’ in. Standaard zijn kolommen niet nullabelbaar.

u kunt ook ‘nullabelbaar’ op recordniveau opnemen om aan te geven dat alle kolommen nullabelbaar zijn, en vervolgens de instelling voor individuele kolommen overschrijven door ‘niet nullabelbaar’op te geven. Bijvoorbeeld:

record nullabelbaar (
naam:niet nullabel string;
waarde1: int32;
datumgeboorte: datum)

datatype: Dit is het datatype van de kolom. Dit maakt gebruik van de interne gegevenstypen, maar niet van SQL-gegevenstypen zoals die worden gebruikt op tabbladen van kolommen in toneelbewerkers.

u kunt opmerkingen toevoegen in schemadefinitiebestanden. Een commentaar wordt gestart door een dubbele slash //, en eindigt door een nieuwe regel.

u moet er altijd voor zorgen dat Kolomvoortplanting is ingeschakeld als u schema-bestanden wilt gebruiken om kolommetadata te definiëren.

Lees ook: Hoe werkt de VELDFUNCTIE in DataStage?

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.