複数カラムでの正規化 - 7.3

処理(インテグレーション)

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > 変換処理コンポーネント
データガバナンス > サードパーティーシステム > 変換処理コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > 変換処理コンポーネント

手順

  1. [Palette] (パレット)からtFileInputDelimitedtDenormalizetLogRowコンポーネントをデザインワークスペースにドロップします。
  2. [Row main] (行メイン)接続を使用してすべてのコンポーネントを接続します。
  3. tFileInputDelimited[Basic settings] (基本設定)パネルで、非正規化するファイルのファイルパスを設定します。
  4. [Row] (行)および [Field] (フィールド) [separators] (区切り文字)[Header] (ヘッダー)を定義し、必要に応じてその他の情報を定義します。
  5. ファイルスキーマは、[Name] (名前)[FirstName] (姓)[HomeTown] (ホームタウン)[WorkTown] (ワークタウン)という4つのカラムで構成されています。
  6. tDenormalizeコンポーネントの[Basic settings] (基本設定)で繰り返しを含むカラムを選択します。カラムをこのように設定することで、値がドキュメント内で複数回出現できるようにします。このユースケースでは、[FirstName] (姓)[HomeCity]、および[WorkCity]が非正規化が実行されるカラムになります。
  7. プラスボタンを使用して、必要な数の行をテーブルに追加します。次に関連カラムをドロップダウンリストから選択します。
  8. [Delimiter] (区切り文字)カラムで、二重引用符の間の区切り文字を定義して、連結された値を分割します。[FirstName] (姓)カラムの場合は、#を入力し、[HomeCity]の場合は§、[WorkCity]の場合は¤と入力します。
  9. ジョブを保存し、[F6]を押して実行します。
    結果は、コンマを使用して連結された非正規化値を示します。
  10. tDenormalizeコンポーネントの[Basic settings] (基本設定)に戻るには、[denormalize]テーブルで[Merge same value] (同じ値をマージ)チェックボックスをオンにして、重複するオカレンスを削除します。
  11. ジョブを再度保存し、[F6]キーを押して実行します。

タスクの結果

今回はインスタンスが重複していない結果がコンソールに表示されます。