JavaエンジンまたはSQLエンジンの使用 - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発

このタスクについて

分析エディターで分析パラメーターを設定したら、JavaエンジンまたはSQLエンジンを使用して、分析を実行できます。

選択するエンジンによって、分析結果に多少の違いが出る場合があります。たとえば、DB2データベースでプロファイリングを行うために、集計統計インジケーターを選択した場合、その可能性があります。これはデータベースの種類によってインジケーターの計算方法が異なるためです。また、 Talend ではJavaの使用に際して特別な関数を使用します。

SQLエンジン:

SQLエンジンを使ってカラム分析を実行する場合

  • カラム分析で使用されるインジケーターごとにSQLクエリーが生成され、分析では複数のインジケーターが並列して実行され、分析が進行中でもチャート内の結果は更新されます。

  • DBMSでデータの監視と処理が行われます。

  • 統計結果のみがローカルで取得されます。

このエンジンを使用すると、システムのパフォーマンスは確実に向上します。データエクスプローラーでは有効なデータにも無効なデータにもアクセスできます。

Javaエンジン:

Javaエンジンを使ってカラム分析を実行する場合

  • カラム分析で使用するすべてのインジケーターに対して1つのクエリーのみが生成されます。

  • 監視されたすべてのデータがローカルで取得され分析されます。

  • パラメーターを設定して、分析されたデータにアクセスするかどうか、1つのインジケーターあたりいくつのデータ行を表示するかを決められます。分析されたデータをすべて保管することはできないため、これによりメモリ制限の問題を回避できます。

Javaエンジンを使用してカラム分析を実行する場合は、各データベースに固有の異なるクエリーテンプレートは必要ありません。ただし、SQLエンジンに比べて、システムパフォーマンスが大幅に低下します。Javaエンジンを使用して分析を実行すると、すべてのデータが取得され、ローカルに保存された時にディスク容量が使用されます。一部の容量を開放するために、Talend-Studio>workspace>project_name>Work_MapDBのメインのStudioディレクトリー内に保存されたデータを削除できます。

Javaエンジンを使って、パラメーターを設定し、分析されたデータにアクセスするには、以下のようにします:

手順

  1. カラム分析エディターの[Analysis Parameters] (分析パラメーター)ビューで、[Execution engine] (実行エンジン)[Java]を選択します。
  2. [Allow drill down] (ドリルダウンを許可)チェックボックスをオンにし、現在の分析によって分析されるデータをローカルに格納します。
    このチェックボックスは通常デフォルトで選択されています。
  3. [Max number kept per indicator] (インジケーターごとに維持する最大行数)フィールドに、アクセス可能にするデータ行数を入力します。
    このフィールドの数はデフォルトで50に設定されています。

タスクの結果

これで、設定したパラメーターに従って分析を実行し、分析されたデータにアクセスできるようになりました。