入力データをロードして複製を削除 - 7.2

Pig

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント > Pig
データガバナンス > サードパーティーシステム > 変換処理コンポーネント > Pig
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント > Pig

手順

  1. tPigLoadをダブルクリックし、[Basic settings] (基本設定)ビューを開きます。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、[Schema] (スキーマ)ダイアログボックスを開きます。
  3. [+]ボタンをクリックし、入力ファイルのデータストラクチャーに従ってName (文字列)、Country (文字列)、Age (整数)という3つのカラムを追加した後に、[OK]をクリックして、設定を保存してダイアログボックスを閉じます。
  4. [Mode] (モード)エリアで[Local] (ローカル)をクリックします。
  5. [Input file URI] (入力ファイルURI)フィールドに入力ファイルへの完全パスを入力します。
  6. [Load function] (関数のロード)リストから[PigStorage]を選択して、残りの設定を変更しないでおきます。
  7. tPigDistinctをダブルクリックし、[Basic settings] (基本設定)ビューを開き、[Sync columns] (カラムの同期)をクリックして、入力スキーマストラクチャーが前のコンポーネントから正しくプロパゲートされていることを確認します。
    このコンポーネントはデータフローからどの複製も削除します。