推奨されるテーブル分析の定義 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

手順

  1. ウィザードの分析メタデータページで分析メタデータ(名前、目的、説明)を設定し、[Finish] (終了)をクリックします。

    推奨するインジケーターがカラムに割り当てられた状態で、分析エディターが開きます。

  2. 必要に応じて、[Select Indicators] (インジケーターの選択)をクリックしてダイアログボックスを開き、カラムに割り当てられたインジケーターを変更します。
    このダイアログボックスからカラムにパターンを追加することもできます。
  3. 分析を実行します。

タスクの結果

分析結果がStudioに表示され、また、ログサーバー上のオントロジーリポジトリーに登録されます。

オントロジーリポジトリーは、各カラムタイプにどのインジケーターが使用されたかについての情報でエンリッチされます。また、インジケーターに使用された最小値および最大値、およびパターンに使用されたスレッショルドなどの結果でエンリッチされます。

最小値と最大値のような結果は、数値カラムに範囲を定義するのに重要です。この範囲は、以下のルールに従って、オントロジーリポジトリー内で更新されます。

  • Studioで最小/最大インジケーターにスレッショルドを定義せず、最小/最大インジケーター値がオントロジーリポジトリー内の属性の最小/最大値よりも小さいか大きいかのどちらかである場合、属性の最小/最大値はインジケーターの新規の値で更新されます。
  • Studioでインジケーターにスレッショルドを設定すると、最小または最大スレッショルドは、分析が実行されるたびにオントロジーリポジトリー内の属性の最小または最大値を更新します。

類似するカラムでテーブル分析を作成しようとすると、登録済みの全てのインジケーターとパターンがカラム上でデフォルトで使用されます。