tDataShuffling
シャッフルでは、入力テーブルのデータについて、データセットのファンクションを保ったまま実際のデータを保護します。これはテストやトレーニングなどの目的で使用できます。
tDataShufflingは、元の値を同じカラムの別の行の他の値に置き換えます。
1つまたは複数のカラムをパーティショングループとして定義すると、テーブル全体が特定の数のパーティションに分割されます。これらのパーティションは、パーティショニングされたカラムの同じ値を共有します。次に、シャッフルプロセスが各パーティションに個別に適用されます。すべてのパーティションが1つの出力テーブルにマージされます。
カラムをパーティショングループとして設定しない場合、シャッフルプロセスは入力テーブル全体に適用されます。
ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。
デフォルトで、このコンポーネントはStudio Talendと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。
Talendがサポートしているテクノロジーの詳細は、Talendコンポーネントをご覧ください。
このページは役に立ちましたか?
このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。