手順
-
tHDFSGetをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
- [Version] (バージョン)エリアで、接続しているHadoopディストリビューションとそのバージョンを選択します。
-
[Connection] (接続)エリアに、HDFSへの接続に必要なパラメーターの値を入力します。
本番環境では、tHDFSConnectionを使って接続を作成していることがあります。その場合、現在のコンポーネントからその接続を再使用できます。詳細は、tHDFSConnectionをご覧ください。
-
[HDFS directory] (HDFSディレクトリー)フィールドに、取得するファイルが格納されたフォルダーへのパスを入力します。
オートコンプリートリストでこの操作を実行するには、このフィールドにマウスを重ねてから[Ctrl] + [Space]を押してリストを表示し、tHDFSList_1_CURRENT_FILEDIRECTORY変数を選択して、tHDFSListで定義したディレクトリーを再使用します。この変数のtHDFSList_1は、コンポーネントのラベルです。違うラベルを使用する場合は、変更に応じて変数を選択します。この変数を選択すると、このフィールドの変数は((String)globalMap.get("tHDFSList_1_CURRENT_FILEDIRECTORY"))になります。コンポーネントにラベル付けする方法は、『 Talend Studio ユーザーガイド』をご覧ください。
- [Local directory] (ローカルディレクトリー)フィールドに、選択したファイルを格納するフォルダーのパスを入力するか参照します。このフォルダーは、存在しない場合は作成されます。この例ではC:/hdfsFilesです。
- [Overwrite file] (ファイルの上書き)フィールドで[always] (常時)を選択します。
-
[Files] (ファイル)でーブルで
をクリックして行を1つ追加し、[Filemask] (ファイルマスク)カラムに、引用符で囲んだ*を入力して、既存のファイルを取得します。