コンポーネントの設定 - 7.2

Delimited

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
データガバナンス > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き
データクオリティとプレパレーション > サードパーティーシステム > ファイルコンポーネント > 列区切り文字付き

手順

  1. tFileFetchをダブルクリックして、[Basic settings] (基本設定)タブを[Component] (コンポーネント)ビューに表示し、プロパティを設定します。
  2. [Protocol] (プロトコル)リストから、データが保存されているサーバーにアクセスするための適切なプロトコルを選択します。
  3. [URI]フィールドに、ファイルが保存されているサーバーにアクセスするために必要なURIを入力します。
  4. [Use cache to save the resource] (キャッシュを使用してリソースを保存)チェックボックスをオンにして、ファイルデータをキャッシュメモリに追加します。このオプションを使用すると、ストリーミングモードを使用してデータを転送できます。
  5. ワークスペースで、tSleepをダブルクリックして、[Basic settings] (基本設定)タブを[Component] (コンポーネント)ビューに表示し、プロパティを設定します。
    デフォルトでは、tSleep[Pause] (一時停止)フィールドは1秒に設定されています。この設定を変更しないでください。最初のジョブを提供するために2番目のジョブを一時停止して、ファイルデータを読み込む時間tFileFetchを含めます。
  6. ワークスペースで、tFileInputDelimitedをダブルクリックして、[Basic settings] (基本設定)タブを[Component] (コンポーネント)ビューに表示し、プロパティを設定します。
  7. [File name/Stream] (ファイル名/ストリーム)フィールドで次の操作を実行します。
    - デフォルトコンテンツを削除します。
    - Ctrl+スペースを押して、このコンポーネントで利用可能な変数を表示します。
    - オートコンプリートリストからtFileFetch_1_INPUT_STREAMを選択して、[Filename] (ファイル名)フィールドに次の変数を追加します: ((java.io.InputStream)globalMap.get("tFileFetch_1_INPUT_STREAM"))
  8. [Schema] (スキーマ)リストから[Built-in] (組み込み)を選択し、[Edit schema] (スキーマの編集)フィールドの横にある[...]をクリックして、取得するファイルの構造を示します。US_Employeesファイルは、IDEmployeeAgeAddressStateEntryDateの6つのカラムで構成されています。
    [+]をクリックして、6つのカラムを追加し、上記のスクリーンショットに示されているように設定します。[OK]をクリックします。
  9. ワークスペースで、tLogRowをダブルクリックして、[Basic settings] (基本設定)タブを[Component] (コンポーネント)ビューに表示し、[Sync Columns] (カラムの同期)をクリックしてスキーマ構造が前のコンポーネントから正しく取得されていることを確認します。