カラムセット分析を確定および実行 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-03-20
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

このカラムセット分析を実行する前に、インジケーターの設定、データフィルター、分析パラメーターを定義する作業が残っています。

始める前に

Talend StudioProfilingパースペクティブで、カラムセット分析が既に定義されていること。

手順

  1. [Analysis Parameters] (分析パラメーター)ビューで、次を実行します。
    • [Number of connections per analysis] (分析ごとの接続数)フィールドで、分析ごとに、選択したデータベースへの接続に対して許可する同時接続数を設定します。

      この数値はデータベースの利用可能リソース、つまりデータベースがサポートできる同時接続数に基づいて設定します。

    • [Execution engine] (実行エンジン)リストから、分析の実行に使用したいエンジン(JavaまたはSQL)を選択します。
      • Javaエンジンを選択した場合、[Store data] (データを保存)チェックボックスはデフォルトでオンになっており、オフにすることはできません。分析が実行されると、いつでもプロファイリング結果をローカルで使用できるため、[Analysis Results] (分析結果) > [Data] (データ)ビューを通じて結果をドリルダウンできます。

        Javaエンジンを使用して分析を実行すると、すべてのデータが取得され、ローカルに保存された時にディスク容量が使用されます。空き容量を作成する場合は、Talend-Studio/workspace/project_name/Work_MapDBのメインのTalend Studioディレクトリー内に保存されているデータを削除できます。

      • SQLエンジンを選択した場合は、[Store data] (データを保存)チェックボックスを使い、分析されたデータをローカルに保存して[Analysis Results] (分析結果) > [Data] (データ)ビューでアクセスするかどうか決定できます。
        注: 分析しているデータが非常に大きい場合は、分析計算の最後に結果を保管しないように、[Store data] (データの保管)チェックボックスをオフにしておくことをお勧めします。
  2. 分析を保存し、F6を押して実行します。

    分析エディターが[Analysis Results] (分析結果)ビューに切り替わり、分析結果がテーブルとグラフィックで表示されます。グラフ結果では、各カラム個別の値ではなく、分析済みカラムの完全レコードに関するシンプル統計が得られます。

    分析するカラムのセットのコンテンツに一致させるためにパターンを使う場合は、使用するパターンの総計に対して一致結果と非一致結果を表すグラフが表示されます。

  3. [Simple Statistics] (シンプル統計)テーブルで、インジケーター結果を右クリックして[View rows] (行を表示)または[View Values] (値を表示)を選択します。
    • Javaエンジンを使って分析を実行する場合は、分析済みデータのリストがProfilingパースペクティブで開きます。
    • SQLエンジンを使って分析を実行する場合は、分析済みデータのリストがData Explorerパースペクティブで開きます。
  4. [Data] (データ)ビューで[Filter Data] (データをフィルタリング)をクリックし、使用されるパターンに基づいて有効な値および無効な値をフィルタリングします。
    Javaエンジンを使用して分析を実行する場合のみデータをフィルター処理できます。

次のタスク

有効行と無効行をグルーピングして別々のファイルに書き込む既製ジョブを生成できます。[All Match] (すべて一致)テーブルで、結果行を右クリックして[Generate an ETL job to handle rows] (行を処理するETLジョブを生成)を選択します。Integrationパースペクティブでジョブが作成されます。
制約事項: [All Match] (すべて一致)テーブルは、Javaエンジンを使用して分析を実行する場合のみ使用できます。