JavaエンジンまたはSQLエンジンの使用 - Cloud - 8.0

Talend Studioユーザーガイド

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-03-20
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

このタスクについて

分析エディターで分析パラメーターを設定したら、JavaエンジンまたはSQLエンジンを使用して、分析を実行できます。

選択するエンジンによって、分析結果に多少の違いが出る場合があります。たとえば、DB2データベースでプロファイリングを行うために、集計統計インジケーターを選択した場合、その可能性があります。これはデータベースの種類によってインジケーターの計算方法が異なるためです。また、 Talend ではJavaの使用に際して特別なファンクションを使用します。

SQLエンジン:

SQLエンジンを使ってカラム分析を実行する場合

  • カラム分析で使われるインジケーターごとにSQLクエリーが生成され、分析では複数のインジケーターが並列して実行され、分析が進行中でもチャート内の結果は更新されます。

  • DBMSでデータの監視と処理が行われます。

  • 統計結果のみがローカルで取得されます。

このエンジンを使用すると、システムのパフォーマンスは確実に向上します。データエクスプローラーでは有効なデータにも無効なデータにもアクセスできます。

Javaエンジン:

Javaエンジンを使ってカラム分析を実行する場合

  • カラム分析で使用されるすべてのインジケーターに対し、クエリーが1つだけ生成されます。

  • 監視されたすべてのデータがローカルで取得され分析されます。

  • パラメーターを設定して、分析されたデータにアクセスするかどうか、1つのインジケーターあたりいくつのデータ行を表示するかを決定できます。分析されたデータをすべて保管することはできないため、これによりメモリ制限の問題を回避できます。

Javaエンジンを使用してカラム分析を実行する場合は、各データベースに固有の異なるクエリーテンプレートは必要ありません。ただし、SQLエンジンに比べて、システムパフォーマンスが大幅に低下します。Javaエンジンを使用して分析を実行すると、すべてのデータが取得され、ローカルに保存された時にディスク容量が使用されます。空き容量を作成する場合は、Talend-Studio>workspace>project_name>Work_MapDBのメインのTalend Studioディレクトリー内に保存されているデータを削除できます。

Javaエンジンを使って、パラメーターを設定し、分析されたデータにアクセスするには、以下のようにします:

手順

  1. カラム分析エディターの[Analysis Parameters] (分析パラメーター)セクションで、[Execution engine] (実行エンジン)としてJavaを選択します。
  2. [Allow drill down] (ドリルダウンを許可)チェックボックスをオンにし、現在の分析によって分析されるデータをローカルに格納します。
    このチェックボックスは通常デフォルトで選択されています。
  3. [Max number kept per indicator] (インジケーターごとに維持する最大行数)フィールドに、アクセス可能にするデータ行数を入力します。
    このフィールドの数はデフォルトで50に設定されています。

タスクの結果

これで、設定したパラメーターに従って分析を実行し、分析されたデータにアクセスできるようになりました。