データのブレンディング - 7.3

Talend Data Preparation入門ガイド

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング
Last publication date
2023-01-09

参照機能を使用すると、既存のデータセットからデータを取得してプレパレーションに追加できます。

この例では次のことを前提としています。

  • ドキュメンテーションページの[Downloads] (ダウンロード)タブからstates.csvファイルを取得済みであること。
  • states.csvTalend Data Preparationのデータセットのリストに追加済みである。データセットのインポート方法の詳細は、ローカルファイルからデータセットを開くを参照してください。

この例では、所有している参照ファイル(Statesデータセット)を使ってさらに多くの顧客のリージョン情報を追加します。このデータセットには、米国の州コードおよび対応するリージョンが含まれています。このデータセットのデータを動的に使ってプレパレーションを補完することで、各顧客がサブスクライブしたリージョンに関する情報を州コードに基づいて追加できます。

データをプレパレーションの別のデータセットとブレンディングするには、次の手順を実行します。

手順

  1. [State] (州)カラムのヘッダーをクリックしてその内容を選択します。
  2. 画面上部の[Lookup] (参照)アイコンをクリックします。

    [Add data from lookup] (参照からデータを追加)パネルが画面下部に開きます。

  3. [ + ]アイコンをクリックして、追加するデータセットを選択します。
    これまでにインポートされたデータセットのリストが開きます。この場合、Statesのみを使用できます。
  4. [States] (州)の横のチェックボックスをオンにして、[Add] (追加)をクリックします。
    Statesデータセットが画面下部に開きます。データセットは、[State] (州)を含む2つのカラムのみで構成されています。[State] (州)は現在のプレパレーションにもあります。
  5. プレパレーションとデータセットの両方で[State] (州)カラムを選択します。選択後、カラムは青で表示されます。
    共通の情報のカラム、この場合は米国の州コードのカラムがプレパレーションとデータセットにあれば、プレパレーションとデータセットをリンクできます。
  6. Statesデータセットで、[Region] (リージョン)カラムヘッダー下の[Add to Dataset] (データセットに追加)チェックボックスをオンにして、現在のプレパレーションに追加します。
  7. [Confirm] (確認)ボタンの上にマウスを置き、変更をプレビューします。
  8. [Confirm] (確認)ボタンをクリックして変更を適用し、[Region] (リージョン)カラムをプレパレーションに追加します。

タスクの結果

参照ファイルから抽出した、顧客のサブスクリプションリージョンに関する新しい情報がデータに含まれます。