単純なテーブル分析の作成(カラムセット分析) - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発

カラムのセットのコンテンツを分析できます。このセットは、定義されたテーブルやテーブル全体の一部のカラムしか表現していない場合があります。

カラム分析とは異なり、カラムセット分析は、個々のカラムではなくカラムセット(完全レコード)に焦点を当てます。分析結果に示される統計(行数、重複を除いたカウント、一意カウント、重複カウント)は全データを通じた値を基に測定されるため、各カラム内の値を個別に分析することはありません。

Javaエンジンでは、各カラムにパターンを適用することもできます。それによって、選択されたすべてのパターンに一致するレコードの総数が分析の結果に出力されます。詳細は、分析対象カラムにパターンを追加するを参照してください。

注: Javaエンジンを使って、大規模なデータセットや多くの問題を含むデータでカラムセット分析を実行する場合、最大メモリサイズのしきい値を定義することをお勧めします。定義しない場合、Javaヒープエラーが発生することがあります。詳細は、最大メモリサイズスレッショルドの定義を参照してください。