データベースカラムでの基本分析の作成 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

このタスクについて

JavaエンジンまたはSQLエンジンを使って、分析を最初からビルドし、1つ以上のカラムの内容を分析し、作成した分析を実行できます。このタイプの分析では、各カラムの値に関する統計が得られます。

Javaエンジンを使ってカラム分析を行う場合、自分で設定したパラメーターに従って分析されたデータを確認できます。

詳細は、JavaエンジンまたはSQLエンジンの使用を参照してください。

注: Javaエンジンを使って大規模なデータセットや多くの問題を含むデータに対してカラム分析を実行する場合、Talend Studio [Preferences] (環境設定)で最大メモリサイズのしきい値を設定し、分析を実行することを推奨します。実行しない場合、Javaヒープエラーが発生することがあります。

カラムのセットも分析できます。このタイプの分析では、すべてのデータセット(フルレコード)に関する統計が得られます。

詳細は、データベース内のテーブルの分析を参照して下さい。

また、分析された特定のカラムから重複値を削除するジョブを生成できます。

カラム分析の作成は、次の手順で行います。

手順

  1. 分析するカラムを定義する。
  2. カラムに対して定義済みのシステムインジケーターまたはユーザー定義インジケーターを設定する。
  3. データの内容、ストラクチャー、クオリティを定義する基となるパターンを追加する。