tDataShufflingコンポーネントの設定 - Cloud - 8.0

Data privacy

Version
Cloud
8.0
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > データプライバシーコンポーネント

手順

  1. tDataShufflingコンポーネントをダブルクリックし、[Basic settings] (基本設定)ビューを表示してコンポーネントのプロパティを定義します。
  2. [Sync columns] (カラムを同期)をクリックし、入力コンポーネントで定義されているスキーマを取得します。
  3. [Shuffling columns] (シャッフルカラム)テーブルで、[+]ボタンをクリックして4行を追加し、以下のようにします:
    • [Column] (カラム)で、データがシャッフルされるカラムを選択し、

    • [Group ID] (グループID)で、各カラムのグループ識別コードを選択します。同じグループ識別コードを持つカラムが一緒にシャッフルされます。

    上記の例では、カラムの2つのグループでシャッフルされます:
    • グループID 1: [credit_card] (クレジットカード)

    • グループID 2:[lname] (姓)[fname] (名)、および[mi] (ミドルネーム)

    ジョブにより[credit_card]カラムのクレジットカード番号は異なる行の値に置き換えられます。また、[lname] (姓)[fname] (名)および[mi] (ミドルネーム)カラムから姓、名、ミドルネームの初期値も保持され、異なる行の値に置き換えられます。
  4. [Advanced settings] (詳細設定)タブをクリックします。
    [Partitioning columns] (パーティション分割カラム)テーブルで、[+]ボタンをクリックして1行追加します。
    ジョブにより、パーティション分割カラムの同じ値を共有する元のデータ行がシャッフルされます。
    上の例では[country] (国)カラムで同じ値が共有されている行にのみシャッフル処理が適用されるようにコンポーネントが設定されています。