分析するカラムの選択 - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

手順

  1. 分析エディタ内の[Connection] (接続)リストから、分析を実行するデータベース接続を選択します。
    現在のところ、名義コリレーション分析はデータベースのカラムに対してのみ可能です。[Connection] (接続)リストから他の接続を選択すると、データベース接続を変更できます。新しく設定するデータベース接続に分析されたカラムが存在しない場合は警告メッセージが表示され、オペレーションを続行またはキャンセルできます。
  2. [Select Columns] (カラムの選択)をクリックして[Column Selection] (カラム選択)ダイアログボックスを開き、分析するカラムを選択するか、[DQ Repository] (DQリポジトリ)ツリービューから直接ドラッグします。
    あまり多くのカラムを選択すると、分析結果の表が非常に読みづらくなります。
    [Analyzed Columns] (分析対象カラム)ビューにリスト表示されたいずれかのカラムを右クリックし、[Show in DQ Repository view] (DQリポジトリビューで表示)を選択すると、ツリービューの対応する接続の下にある、選択カラムを見つけることができます。
  3. 必要に応じて、[Indicators] (インジケーター)ビューの をクリックしてダイアログボックスを開き、各インジケータのスレッショルドを設定します。
    シンプル統計を表すインジケーターは、デフォルトでこの分析タイプに関連付けられています。
  4. [Data Filter] (データフィルター)ビューで、必要に応じて、SQL WHERE句を入力し、分析を実行するデータをフィルター処理します。
  5. [Analysis Parameter] (分析パラメーター)ビューの[Number of connections per analysis] (分析ごとの接続数)フィールドで、必要に応じて、選択されたデータベース接続に対して許可する分析ごとの同時接続数を設定します。
    この数値はデータベースの利用可能リソース、つまりデータベースがサポートできる同時接続数に基づいて設定します。
  6. 分析エディターでコンテキスト変数を定義した場合は、次の手順に従います。
    1. [Data Filter] (データフィルター)ビューおよび[Analysis Parameter] (分析パラメーター)ビューを使用して、データをフィルター処理するためのコンテキスト変数を設定/選択し、それぞれの分析ごとの同時接続数を決定します。
    2. [Context Group Settings] (コンテキストグループ設定)ビューで、リストから、分析を実行するために使用するコンテキスト環境を選択します。
    コンテキストと変数の詳細は、分析でのコンテキスト変数の使用方法を参照して下さい。
  7. F6を押して分析を実行します。
    エディターが[Analysis Results] (分析結果)ビューに切り替わり、結果が表示されます。
    分析結果の詳細な説明については、名義コリレーション分析結果の検討を参照して下さい。