ca dezvoltator, definiți întotdeauna coloanele și tipurile lor de date în fila ‘coloană’ în fiecare etapă.
știi, ai un alt mod de a defini coloane, altele decât coloanele tab?
schemele sunt o modalitate alternativă de a specifica definițiile coloanelor pentru datele utilizate de joburile paralele.
după cum știți, în mod implicit, majoritatea etapelor de lucru paralele își iau datele meta din fila coloane, care conține definiții de tabel, completate, dacă este necesar, de informații de format din fila Format.
pentru unele etape, puteți specifica o proprietate care determină etapa să ia datele meta din fișierul schemă specificat în schimb.
Citește și: diferența dintre sortarea legăturii și etapa de sortare
unele etape ne permit, de asemenea, să specificăm o schemă parțială. Acest lucru vă permite să definiți numai acele coloane pe care o anumită etapă le procesează și să ignorați restul coloanelor.
fișierul schemă este un fișier text simplu. Și este de preferat să-l salvați cu ‘.schema ‘ extensie, astfel încât să le puteți identifica cu ușurință în sistemul de fișiere.
Format fișier schemă:
o schemă conține o definiție de înregistrare (sau rând). Aceasta descrie fiecare coloană (sau câmp) care va fi întâlnită în înregistrare, dând numele coloanei și tipul de date. Următoarea este o schemă de înregistrare exemplu:
Nume: string;
adresa:string nullable;
value1: int32;
value2: int32;
dateofbirth:data)
pauzele de linie sunt acolo pentru ușurința de citire, dacă doriți, puteți omite aceste Dacă ați fost definirea unei scheme parțiale, de exemplu
înregistrare(nume:string;value1:int32; dateofbirth:data)
este o schemă validă.
formatul fiecărei linii care descrie o coloană este:
column_name:datatype;
column_name: acesta este Numele care identifică coloana. Numele trebuie să înceapă cu o literă sau o subliniere ( _ ) și pot conține numai caractere alfanumerice sau subliniere. Numele nu este sensibil la majuscule.
nulabilitate: puteți specifica opțional dacă unei coloane i se permite să conțină o valoare nulă sau dacă aceasta ar fi considerată nevalidă. Dacă coloana poate fi nulă, introduceți cuvântul ‘nullable’. În mod implicit, coloanele nu pot fi anulate.
puteți include, de asemenea, ‘nullable’ la nivel de înregistrare pentru a specifica că toate coloanele sunt nullable, apoi suprascrie setarea pentru coloane individuale prin specificarea ‘not nullable’. De exemplu:
nume:nu string nullable;
value1:int32;
dateofbirth:data)
datatype: Acesta este tipul de date al coloanei. Aceasta utilizează tipurile de date interne, dar nu și tipurile de date SQL, așa cum sunt utilizate în filele coloane din editorii de etape.
puteți include comentarii în fișierele de definiție a schemei. Un comentariu este pornit de un dublu slash//, și sa încheiat cu o linie nouă.
trebuie să vă asigurați întotdeauna că propagarea coloanei în timpul rulării este activată dacă doriți să utilizați fișiere schemă pentru a defini metadatele coloanei.
Citește și: cum funcționează funcția de câmp în DataStage?