コンポーネントの設定 - Cloud - 8.0

MS Delimited

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > MS区切りコンポーネント
データガバナンス > サードパーティーシステム > ファイルコンポーネント > MS区切りコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > MS区切りコンポーネント

手順

  1. tFileInputMSDelimitedをダブルクリックして、[Multi Schema Editor] (複数のスキーマエディター)を開きます。
  2. [File Name] (ファイル名)フィールドの横にある[Browse...] (参照...)をクリックして、処理が必要な複数のスキーマ区切りファイルを探します。
  3. [File Settings] (ファイル設定)エリアで次の操作を行います。
    - ソースファイルがエンコードされているエンコーディングタイプをリストから選択します。この設定は、すべての入力ファイルと出力ファイルの一貫性を保証するためのものです。
    - ソースファイルで使用されているフィールド区切りと行区切りを選択します。
    注:

    [Use Multiple Separator] (複数の区切り文字を使用)チェックボックスをオンにし、異なるフィールド区切りを使用してソースファイル内のスキーマを区切る場合は、それに応じてフィールドを定義します。

    [Preview] (プレビュー)パネルにソースファイルのデータのプレビューが自動的に表示されます。
    注:

    デフォルトでは、レコードタイプインディケーターを保持するカラム0が選択されます。ただし、他の列のチェックボックスをオンにしてプライマリキーとして定義することもできます。

  4. [Preview] (プレビュー)パネルの右側にある[Fetch Codes] (フェッチコード)をクリックして、ソースファイルにあるスキーマとレコードのタイプをリストします。このシナリオでは、ソースファイルには3つのスキーマタイプ(A、B、C)があります。
    [Fetch Codes] (フェッチコード)パネルで各スキーマタイプをクリックすると、そのデータ構造が[Preview] (プレビュー)パネルの下に表示されます。
  5. 名前のセルをクリックし、選択した各スキーマのカラム名を設定します。
    このシナリオでは、カラム名は次のようになります。
    -スキーマ A: タイプ、ディスク名、作成者、日付
    -スキーマ B: タイプ、SongName,
    -スキーマ C: タイプ、LibraryName.
    入力データからプライマリキーを設定して一意性を保証する必要があります(このシナリオではDiscName)。これを設定するには、以下のようにします:
  6. [Fetch Codes] (フェッチコード)パネルで、プライマリキー(このシナリオではスキーマA)として設定するカラムを保持するスキーマを選択して、そのデータ構造を表示します。
  7. DiscNameカラムに対応する[key] (キー)セルをクリックし、表示されるチェックボックスをオンにします。
  8. エディタの任意の場所をクリックすると、[key] (キー)セルのfalsetrueになります。
    他の "子"スキーマ(このシナリオではDiscName)をグルーピングする親スキーマを宣言する必要があります。これを設定するには、以下のようにします:
  9. [Fetch Codes] (フェッチコード)パネルでスキーマBを選択し、右矢印ボタンをクリックして右に移動します。次に、スキーマCで同じ操作を行います。
    注:

    [Cardinality] (カーディナリティ)フィールドは必須ではありません。親スキーマにアタッチされた "子"スキーマのフィールドの数(または範囲)を定義するのに役立ちます。ただし、番号または範囲を間違って設定してジョブを実行しようとすると、エラーメッセージが表示されます。

  10. [Multi Schema Editor] (複数のスキーマエディター)で、[OK]をクリックしてすべての変更を検証し、エディタを閉じます。
    定義された3つのスキーマと、対応するレコードタイプおよびフィールドセパレータは、tFileInputMSDelimited[Basic settings] (基本設定)ビューに自動的に表示されます。
    [Multi Schema Editor] (複数のスキーマエディター)で定義した3つのスキーマは、自動的に3つのtLogRowコンポーネントに渡されます。
  11. 必要に応じて、各tLogRowコンポーネントの[Basic settings] (基本設定)ビューの[Edit Schema] (スキーマを編集)ボタンをクリックして、[Multi Schema Editor] (複数のスキーマエディター)で定義した入出力データ構造を表示したり、変更したりします。