コンポーネントの設定 - 7.3

Standardization

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化

手順

  1. 最初のtFileInputDelimitedコンポーネントをダブルクリックして[Basic settings] (基本設定)ビューを開き、読み取るファイルのパスと名前、スキップするヘッダー行の数など、メイン入力フローのパラメーターを設定します。
    このサンプルでは、メイン入力ファイルには人名と米国の州名のリストが含まれています。以下はファイルコンテンツを抽出したものです。
    name;state
    Andrew Kennedy;Mississippi
    Benjamin Carter;Louisiana
    Benjamin Monroe;West Virginia
    Bill Harrison;Tennessee
    Calvin Grant;Virginia
    Chester Harrison;Rhode Island
    Chester Hoover;Kansas
    Chester Kennedy;Maryland
    Chester Polk;Indiana
    Dwight Nixon;Nevada
    Dwight Roosevelt;Mississippi
    Franklin Grant;Nebraska
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックし、[Schema] (スキーマ)ダイアログボックスを開いて入力スキーマを設定します。
    メイン入力ファイルの構造に従い、入力スキーマにはnameおよびstateという2つのカラムが含まれている必要があります。
    完了したら、[OK]をクリックしてダイアログボックスを閉じ、変更を次のコンポーネントにプロパゲートします。
  3. 2番目のtFileInputDelimitedコンポーネントのプロパティも同様に定義します。
    このサンプルには、参照入力ファイルには州とその2文字のコードのリストが含まれています。したがって、参照入力スキーマにはstateおよびcodeという2つのカラムが必要です。
  4. tReplaceListコンポーネントをダブルクリックして[Basic settings] (基本設定)ビューを開き、実行するオペレーションを設定します。
  5. 検索するカラムを[Lookup search column] (検索カラムを参照)リストから選択します。このユースケースでは、stateカラムを検索しようとしています。
  6. 置換する値が含まれているカラムを[Lookup replacement column] (置換カラムを参照)リストから選択します。このサンプルでは、2文字の州コードが含まれているcodeです。
  7. [Column options] (カラムオプション)テーブルでstatesカラムの[Replace] (置換)チェックボックスをオンにして、州名を対応するコードに置換します。
  8. 出力を読みやすくするために、tLogRowコンポーネントで[Table] (テーブル)チェックボックスをオンにします。