単純なテーブル分析の作成(カラムセット分析) - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

カラムのセットのコンテンツを分析できます。このセットは、定義されたテーブルやテーブル全体の一部のカラムしか表現していない場合があります。

カラム分析とは異なり、カラムセット分析は、個々のカラムではなくカラムセット(完全レコード)に焦点を当てます。分析結果に示される統計(行カウント、重複を除いたカウント、一意カウント、重複カウント)は全データを通じた値を基に測定されるため、各カラム内の値を個別に分析することはありません。

Javaエンジンでは、各カラムにパターンを適用することもできます。それによって、選択されたすべてのパターンに一致するレコードの総数が分析の結果に出力されます。詳細は、分析対象カラムにパターンを追加するを参照して下さい。

注: Javaエンジンを使って、大規模なデータセットや多くの問題を含むデータでカラムセット分析を実行する場合、最大メモリサイズのスレッショルドを定義することをお勧めします。定義しない場合、Javaヒープエラーが発生することがあります。詳細は、最大メモリサイズスレッショルドの定義を参照して下さい。