JavaエンジンまたはSQLエンジンの使用 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このタスクについて

分析エディターで分析パラメーターを設定したら、JavaエンジンまたはSQLエンジンを使用して、分析を実行できます。

選択するエンジンによって、分析結果に多少の違いが出る場合があります。たとえば、DB2データベースでプロファイリングを行うために、概要統計インジケーターを選択した場合、その可能性があります。これは、データベースのタイプによって、インジケーターの計算が異なることと、TalendではJavaでの処理に特別な関数を使用することが原因です。

SQLエンジン:

SQLエンジンを使ってカラム分析を実行する場合

  • カラム分析で使用されるインジケーターごとにSQLクエリが生成され、分析では複数のインジケーターが並列して実行され、分析が進行中でもチャート内の結果は更新されます。

  • DBMSでデータの監視と処理が行われます。

  • 統計結果のみがローカルで取得されます。

このエンジンを使用すると、システムのパフォーマンスは確実に向上します。データエクスプローラーで有効または無効なデータにもアクセスできます。詳細は、分析されたデータの表示とエクスポートを参照して下さい。

Javaエンジン:

Javaエンジンを使ってカラム分析を実行する場合

  • カラム分析で使用するすべてのインジケーターに対して1つのクエリのみが生成されます。

  • 監視されたすべてのデータがローカルで取得され分析されます。

  • パラメーターを設定して、分析されたデータにアクセスするかどうか、1つのインジケーターあたりいくつのデータ行を表示するかを決められます。分析されたデータをすべて格納することはできないため、これによりメモリ制限の問題を回避できます。

Javaエンジンを使用してカラム分析を実行する場合は、各データベースに固有の異なるクエリテンプレートは必要ありません。ただし、SQLエンジンに比べて、システムパフォーマンスが大幅に低下します。Javaエンジンを使用して分析を実行すると、すべてのデータが取得され、ローカルに保存されたときにディスク容量が使用されます。一部の容量を開放するために、Talend-Studio>workspace>project_name>Work_MapDBのメインのStudioディレクトリ内に保存されたデータを削除できます。

Javaエンジンを使って、パラメーターを設定し、分析されたデータにアクセスするには、次の手順に従います。

手順

  1. カラム分析エディターの[Analysis Parameters] (分析パラメーター)ビューで、[Execution engine] (実行エンジン)に[Java]を選択します。
  2. [Allow drill down] (ドリルダウンを許可)チェックボックスを選択し、現在の分析によって分析されるデータをローカルに格納します。
    このチェックボックスは通常デフォルトで選択されています。
  3. [Max number kept per indicator] (インジケーターごとに維持する最大行数)フィールドに、アクセス可能にするデータ行数を入力します。
    このフィールドの数はデフォルトで50に設定されています。

タスクの結果

これで、設定したパラメーターに従って分析を実行し、分析されたデータにアクセスできるようになりました。詳細は、分析されたデータの表示とエクスポートを参照して下さい。