データベースカラムでの基本分析の作成 - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発

このタスクについて

JavaエンジンまたはSQLエンジンを使って、分析を最初からビルドし、1つ以上のカラムの内容を分析し、作成した分析を実行できます。このタイプの分析では、各カラムの値に関する統計が得られます。

Javaエンジンを使ってカラム分析を行う場合、自分で設定したパラメーターに従って分析されたデータを確認できます。

詳細は、JavaエンジンまたはSQLエンジンの使用を参照してください。

注: Javaエンジンを使って大規模なデータセットや多くの問題を含むデータに対してカラム分析を実行する場合、Talend Studio [Preferences] (環境設定)で最大メモリサイズのしきい値を設定し、分析を実行することを推奨します。実行しない場合、Javaヒープエラーが発生することがあります。

カラムのセットも分析できます。このタイプの分析では、すべてのデータセット(フルレコード)に関する統計が得られます。

詳細は、データベース内のテーブルの分析を参照してください。

また、分析された特定のカラムから重複値を削除するジョブを生成できます。

カラム分析の作成は、次の手順で行います。

手順

  1. 分析するカラムを定義する。
  2. カラムで事前定義済みシステムインジケーターまたはユーザー定義インジケーターを設定する。
  3. データの内容、構造、クオリティを定義する基となるパターンを追加する。