手順
-
tDataShufflingコンポーネントをダブルクリックし、[Basic settings] (基本設定)ビューを表示してコンポーネントのプロパティを定義します。
- [Sync columns] (カラムを同期)をクリックし、入力コンポーネントで定義されているスキーマを取得します。
-
[Shuffling columns] (シャッフルカラム)テーブルで、[+]ボタンをクリックして4行を追加し、以下のようにします:
-
[Column] (カラム)で、データがシャッフルされるカラムを選択し、
-
[Group ID] (グループID)で、各カラムのグループ識別コードを選択します。同じグループ識別コードを持つカラムが一緒にシャッフルされます。
上記の例では、カラムの2つのグループでシャッフルされます:-
グループID 1: [credit_card] (クレジットカード)
-
グループID 2:[lname] (姓)、 [fname] (名)、および[mi] (ミドルネーム)
-
-
[Advanced settings] (詳細設定)タブをクリックします。
[Partitioning columns] (パーティショニングカラム)テーブルで、[+]ボタンをクリックして1行追加します。ジョブにより、パーティショニングカラムの同じ値を共有する元のデータ行がシャッフルされます。上の例では[country] (国)カラムで同じ値が共有されている行にのみシャッフル処理が適用されるようにコンポーネントが設定されています。