データのブレディング - 7.3

Talend Data Preparation入門ガイド

EnrichVersion
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Data Preparation
task
データクオリティとプレパレーション > データクレンジング

参照機能を使用すると、既存のデータセットからデータを取得してプレパレーションに追加できます。

この例では次のことを前提としています。

  • このページの左側パネルにある[Downloads] (ダウンロード)タブからstates.csvファイルをすでに取得している。
  • states.csvTalend Data Preparationのデータセットのリストに追加している。データセットのインポート方法の詳細については、ローカルファイルからデータセットを開くを参照してください。

この例では、所有している参照ファイル(Statesデータセット)を使ってさらに多くの顧客のリージョン情報を追加します。このデータセットには、米国の州コードおよび対応するリージョンが含まれています。このデータセットのデータを動的に使ってプレパレーションを補完することで、各顧客がサブスクライブしたリージョンに関する情報を州コードに基づいて追加できます。

データをプレパレーションの別のデータセットとブレンディングするには、次の手順を実行します。

手順

  1. [State] (州)カラムのヘッダーをクリックしてその内容を選択します。
  2. 画面上部の[Lookup] (参照)アイコンをクリックします。

    [Add data from lookup] (参照からデータを追加)パネルが画面下部に開きます。

  3. [ + ]アイコンをクリックして、追加するデータセットを選択します。
    これまでにインポートされたデータセットのリストが開きます。この場合、Statesのみを使用できます。
  4. [States] (州)の横のチェックボックスを選択して、[Add] (追加)をクリックします。
    Statesデータセットが画面下部に開きます。データセットは、[State] (州)を含む2つのカラムのみで構成されています。[State] (州)は現在のプレパレーションにもあります。
  5. プレパレーションとデータセットの両方で[State] (州)カラムを選択します。選択後、カラムは青で表示されます。
    共通の情報のカラム、この場合は米国の州コードのカラムがプレパレーションとデータセットにあれば、プレパレーションとデータセットをリンクすることができます。
  6. Statesデータセットで、[Region] (リージョン)カラムヘッダー下の[Add to Dataset] (データセットへの追加)チェックボックスをオンにして、現在のプレパレーションに追加します。
  7. [Confirm] (確認)ボタンの上にマウスを置き、変更をプレビューします。
  8. [Confirm] (確認)ボタンをクリックして変更を適用し、[Region] (リージョン)カラムをプレパレーションに追加します。

タスクの結果

参照ファイルから抽出した、顧客のサブスクリプションリージョンに関する新しい情報がデータに含まれます。