繰り返し処理の設定 - 7.3

HDFS

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > HDFS
データガバナンス > サードパーティーシステム > ファイルコンポーネント > HDFS
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > HDFS

手順

  1. tHDFSListをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
  2. [Version] (バージョン)エリアで、接続しているHadoopディストリビューションとそのバージョンを選択します。
  3. [Connection] (接続)エリアに、HDFSへの接続に必要なパラメーターの値を入力します。
    本番環境では、tHDFSConnectionを使って接続を作成し、現在のコンポーネントからその接続を再使用することがあります。詳細は、tHDFSConnectionを参照してください。
  4. [HDFS Directory] (HDFSディレクトリー)フィールドに、繰り返し処理を実行するファイルが格納されたフォルダーへのパスを入力します。この例では、前述のようにディレクトリーは/user/ychen/data/hdfs/out/です。
  5. [FileList Type] (FileListタイプ)フィールドで[File] (ファイル)を選択します。
  6. [Files] (ファイル)テーブルでをクリックして行を1つ追加し、引用符で囲んだ*を入力して、既存のファイルに対して反復します。