データのブレンディング - Cloud

Talend Cloud Data Preparation入門ガイド

Version
Cloud
Language
日本語 (日本)
Product
Talend Cloud
Module
Talend Data Preparation
Content
データクオリティとプレパレーション > データクレンジング

参照機能を使用すると、既存のデータセットからデータを取得してプレパレーションに追加できます。

この例では次のことを前提としています。

  • ドキュメンテーションページの[Downloads] (ダウンロード)タブからstates.csvファイルを取得済みであること。
  • states.csvTalend Data Preparationのデータセットのリストに追加済みである。データセットのインポート方法の詳細は、ローカルファイルからデータセットを開くを参照してください。

この例では、所有している参照ファイル(Statesデータセット)を使ってさらに多くの顧客のリージョン情報を追加します。このデータセットには、米国の州コードおよび対応するリージョンが含まれています。このデータセットのデータを動的に使ってプレパレーションを補完することで、各顧客がサブスクライブしたリージョンに関する情報を州コードに基づいて追加できます。

データをプレパレーションの別のデータセットとブレンディングするには、次の手順を実行します。

手順

  1. [State] (州)カラムのヘッダーをクリックしてその内容を選択します。
  2. 画面上部の[Lookup] (参照)アイコンをクリックします。

    [Add data from lookup] (参照からデータを追加)パネルが画面下部に開きます。

  3. [ + ]アイコンをクリックして、追加するデータセットを選択します。
    これまでにインポートされたデータセットのリストが開きます。この場合、Statesのみを使用できます。
  4. [States] (州)の横のチェックボックスをオンにして、[Add] (追加)をクリックします。
    Statesデータセットが画面下部に開きます。データセットは、[State] (州)を含む2つのカラムのみで構成されています。[State] (州)は現在のプレパレーションにもあります。
  5. プレパレーションとデータセットの両方で[State] (州)カラムを選択します。選択後、カラムは青で表示されます。
    共通の情報のカラム、この場合は米国の州コードのカラムがプレパレーションとデータセットにあれば、プレパレーションとデータセットをリンクできます。
  6. Statesデータセットで、[Region] (リージョン)カラムヘッダー下の[Add to Dataset] (データセットに追加)チェックボックスをオンにして、現在のプレパレーションに追加します。
  7. [Confirm] (確認)ボタンの上にマウスを置き、変更をプレビューします。
  8. [Confirm] (確認)ボタンをクリックして変更を適用し、[Region] (リージョン)カラムをプレパレーションに追加します。

タスクの結果

参照ファイルから抽出した、顧客のサブスクリプションリージョンに関する新しい情報がデータに含まれます。