ファイルの選択 - 7.3

HDFS

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > HDFS
データガバナンス > サードパーティーシステム > ファイルコンポーネント > HDFS
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > HDFS

手順

  1. tHDFSGetをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
  2. [Version] (バージョン)エリアで、接続しているHadoopディストリビューションとそのバージョンを選択します。
  3. [Connection] (接続)エリアに、HDFSへの接続に必要なパラメーターの値を入力します。
    本番環境では、tHDFSConnectionを使って接続を作成していることがあります。その場合、現在のコンポーネントからその接続を再使用できます。詳細は、tHDFSConnectionを参照してください。
  4. [HDFS directory] (HDFSディレクトリー)フィールドに、取得するファイルが格納されたフォルダーへのパスを入力します。
    オートコンプリートリストでこの操作を実行するには、このフィールドにマウスを重ねてから[Ctrl] + [Space]を押してリストを表示し、tHDFSList_1_CURRENT_FILEDIRECTORY変数を選択して、tHDFSListで定義したディレクトリーを再使用します。この変数のtHDFSList_1は、コンポーネントのラベルです。違うラベルを使用する場合は、変更に応じて変数を選択します。
    この変数を選択すると、このフィールドの変数は((String)globalMap.get("tHDFSList_1_CURRENT_FILEDIRECTORY"))になります。
    コンポーネントにラベル付けする方法は、『 Talend Studio ユーザーガイド』を参照してください。
  5. [Local directory] (ローカルディレクトリー)フィールドに、選択したファイルを格納するフォルダーのパスを入力するか参照します。このフォルダーは、存在しない場合は作成されます。この例ではC:/hdfsFilesです。
  6. [Overwrite file] (ファイルの上書き)フィールドで[always] (常時)を選択します。
  7. [Files] (ファイル)でーブルでをクリックして行を1つ追加し、[Filemask] (ファイルマスク)カラムに、引用符で囲んだ*を入力して、既存のファイルを取得します。