コンポーネントを設定 - 7.3

tFileList

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > ファイル制御 > tFileList
データガバナンス > サードパーティーシステム > ファイルコンポーネント > ファイル制御 > tFileList
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > ファイル制御 > tFileList

手順

  1. 最初のtFileListコンポーネントの[Basic settings] (基本設定)ビューで、[Directory] (ディレクトリー)フィールドに、ファイル名を読み取る最初のフォルダーへのパスを入力します(この例ではE:/DataFiles/DI/images)。他の設定はそのままにします。
  2. tFileCopyコンポーネントをダブルクリックして、[Basic settings] (基本設定)ビューを表示します。
  3. [Edit schema] (スキーマを編集)の横にある[...]ボタンをダブルクリックして[Schema] (スキーマ)ダイアログボックスを開き、次のコンポーネントがファイル名を書き込むテキストファイルのスキーマを定義します。終了したら[OK]をクリックしてダイアログボックスを閉じ、スキーマを次のコンポーネントにプロパゲートします。
    この例では、スキーマに含まれるカラムはFilenameの1つだけです。
  4. [Mapping] (マッピング)テーブルの[Value] (値)フィールドで[Ctrl]+[Space]を押して変数のオートコンプリートリストにアクセスし、グローバル変数((String)globalMap.get("tFileList_1_CURRENT_FILE"))を選択して、入力ディレクトリー内の各ファイルの名前を読み取ります。これはデータフローに入れられ、次のコンポーネントに渡されます。
  5. 最初のtFileOutputDelimitedコンポーネントの[Basic settings] (基本設定)ビューで、[File Name] (ファイル名)フィールドに、受信フローからのファイル名を保管するテキストファイルのパス(この例ではD:/temp/tempdata.csv)を入力します。これで最初のサブジョブの構成が完了しました。
  6. 上記の手順を繰り返して、2番目のサブジョブの設定を完了します。ただし、
    • 2番目のtFileListコンポーネントの[Basic settings] (基本設定)ビューの[Directory] (ディレクトリー)フィールドに、ファイル名を読み取る別のフォルダー(この例ではE:/DataFiles/DQ/images)を入力します。

    • 以前にテキストファイルに書き込まれたファイル名が上書きされないように、2番目のtFileOutputDelimitedコンポーネントの[Basic settings] (基本設定)ビューの[Append] (追加)チェックボックスをオンにします。

  7. tFileInputDelimitedコンポーネントの[Basic settings] (基本設定)ビューで、[File name/Stream] (ファイル名/ストリーム)フィールドに、ファイル名のリストを保管するテキストファイルのパス(この例では D:/temp/tempdata.csv)を入力します。続いて、ファイルスキーマを定義します。ファイルスキーマには、この例では1つのカラムFilenameのみが含まれています。
  8. tUniqRowコンポーネントの[Basic settings] (基本設定)ビューで、唯一のカラム(この例ではFilename)の[Key attribute] (キー属性)チェックボックスをオンにします。
  9. tLogRowコンポーネントの[Batic settings] (基本設定)ビューで、表示効果を高めるために[Table (print values in cells of a table)] (テーブル(テーブルのセルに値を印刷))オプションを選択します。