JavaエンジンまたはSQLエンジンの使用 - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

このタスクについて

分析エディターで分析パラメーターを設定したら、JavaエンジンまたはSQLエンジンを使用して、分析を実行できます。

選択するエンジンによって、分析結果に多少の違いが出る場合があります。たとえば、DB2データベースでプロファイリングを行うために、集計統計インジケーターを選択した場合、その可能性があります。これはデータベースの種類によってインジケーターの計算方法が異なるためです。また、 Talend ではJavaの使用に際して特別なファンクションを使用します。

SQLエンジン:

SQLエンジンを使ってカラム分析を実行する場合

  • カラム分析で使用されるインジケーターごとにSQLクエリが生成され、分析では複数のインジケーターが並列して実行され、分析が進行中でもチャート内の結果は更新されます。

  • DBMSでデータの監視と処理が行われます。

  • 統計結果のみがローカルで取得されます。

このエンジンを使用すると、システムのパフォーマンスは確実に向上します。データエクスプローラーで有効または無効なデータにもアクセスできます。詳細は、分析されたデータの表示とエクスポートを参照して下さい。

Javaエンジン:

Javaエンジンを使ってカラム分析を実行する場合

  • カラム分析で使用する全てのインジケーターに対して1つのクエリのみが生成されます。

  • 監視された全てのデータがローカルで取得され分析されます。

  • パラメーターを設定して、分析されたデータにアクセスするかどうか、1つのインジケーターあたりいくつのデータ行を表示するかを決められます。分析されたデータを全て保管することはできないため、これによりメモリ制限の問題を回避できます。

Javaエンジンを使用してカラム分析を実行する場合は、各データベースに固有の異なるクエリテンプレートは必要ありません。ただし、SQLエンジンに比べて、システムパフォーマンスが大幅に低下します。Javaエンジンを使用して分析を実行すると、全てのデータが取得され、ローカルに保存されたときにディスク容量が使用されます。一部の容量を開放するために、Talend-Studio>workspace>project_name>Work_MapDBのメインのStudioディレクトリー内に保存されたデータを削除できます。

Javaエンジンを使って、パラメーターを設定し、分析されたデータにアクセスするには、以下のようにします:

手順

  1. カラム分析エディターの[Analysis Parameters] (分析パラメーター)ビューで、[Execution engine] (実行エンジン)に[Java]を選択します。
  2. [Allow drill down] (ドリルダウンを許可)チェックボックスを選択し、現在の分析によって分析されるデータをローカルに格納します。
    このチェックボックスは通常デフォルトで選択されています。
  3. [Max number kept per indicator] (インジケーターごとに維持する最大行数)フィールドに、アクセス可能にするデータ行数を入力します。
    このフィールドの数はデフォルトで50に設定されています。

タスクの結果

これで、設定したパラメーターに従って分析を実行し、分析されたデータにアクセスできるようになりました。詳細は、分析されたデータの表示とエクスポートを参照して下さい。