カスタムインジケーターの定義とカテゴリの設定 - 7.0

Talend Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

手順

  1. [Indicator Category] (インジケーターカテゴリ)をクリックし、リストからJavaインジケーターのカテゴリを選択します。
    カテゴリによって、このインジケーターを使用する分析の結果セットから予想されるカラムの数が決まります。
    次のテーブルで、各カテゴリを説明します。

    インジケーターカテゴリ

    説明

    予想されるクエリ結果

    ユーザー定義一致

    条件に一致するデータの数を評価します。

    結果セットは1行と2カラムになります。1つ目のカラムには一致する値の数が、2番目のカラムには合計数が含まれます。

    [User Defined Frequency] (ユーザー定義頻度)

    個々のレコードに対してユーザー定義インジケーターを使用してレコードの頻度を評価します。

    結果セットは0以上の行と2カラムになります。1つ目のカラムには値が、2番目のカラムにはこの値の頻度(カウント)が含まれます。

    [User Defined Real Value] (ユーザー定義実数)

    データの実関数を評価します。

    結果セットは実数を含む1行と1カラムになります。

    [User Defined Count] (ユーザー定義数)

    レコードの数を分析し、行カウントを返します。

    結果セットは行カウントを含む1行と1カラムになります。
  2. [Indicator Definition] (インジケーター定義)をクリックし、[+]ボタンをクリックします。
  3. [Database] (データベース)リストから[Java]を選択します。
  4. [Java Class] (Javaクラス)フィールドにJavaクラスを入力します。
    注: クラス名にパッケージパスが含まれていることを確認して下さい。この文字列パラメーターが正しく指定されていないと、Javaユーザー定義インジケーターを保存しようとするときにエラーメッセージが表示されます。
  5. Javaクラスを含むJavaアーカイブを選択します。
    • [Edit...] (編集...)ボタンをクリックします。

      [UDI Selector] (UDI選択)ダイアログボックスが開きます。

    • [Select libraries] (ライブラリの選択)ビューで、Javaクラスが含まれているアーカイブのチェックボックスを選択し、ウィザードの下部のパネルでクラスを選択します。

    • [OK]をクリックします。

      ダイアログボックスが閉じ、インジケーターエディターにJavaアーカイブが表示されます。

      このダイアログボックスの[Manage Libraries] (ライブラリ管理)ビューからJavaアーカイブを追加または削除することができます。

      Javaアーカイブの作成について詳しくは、ユーザー定義インジケーターのJavaアーカイブを作成するを参照して下さい。

  6. [Indicator Parameters] (インジケーターパラメーター)をクリックしてビューを開き、パラメーター値を取得するためのパラメーターを定義しながらJavaインジケーターをコーディングできます。
    次のようなコードでパラメーター値を取得することができます。この例ではパラメーターを取得しています。 EMAIL_PARAM:
    // Check prerequisite
            IndicatorParameters param = this.getParameters();
            if (param == null) {
                log.error("No parameter set in the user defined indicator " + this.getName()); //$NON-NLS-1$
                return false;
            }
            Domain indicatorValidDomain = param.getIndicatorValidDomain();
            if (indicatorValidDomain == null) {
                log.error("No parameter set in the user defined indicator " + this.getName()); //$NON-NLS-1$
                return false;
            }
    
            // else retrieve email from parameter
            EList<JavaUDIIndicatorParameter> javaUDIIndicatorParameter = indicatorValidDomain.getJavaUDIIndicatorParameter();
            for (JavaUDIIndicatorParameter p : javaUDIIndicatorParameter) {
                if (EMAIL_PARAM.equalsIgnoreCase(p.getKey())) {
    Javaユーザー定義インジケーターにおけるパラメーターの詳細な使用サンプルは、https://github.com/Talend/tdq-studio-se/tree/master/sample/test.myudi/src/main/java/org/talend/dataquality/indicator/userdefine/emailを確認して下さい。
  7. テーブルの下部にある[+]ボタンをクリックしてパラメーターキーと値の新しい行を定義します。
    カラム分析でインジケーターを使用する際は、いつでもデフォルトのパラメーターを編集したり、新しいパラメーターを追加したりすることができます。そのためには、分析エディターでインジケーターオプションアイコンをクリックしてダイアログボックスを開き、必要に応じてデフォルトパラメーターを編集するか、新しいパラメーターを追加します。
  8. エディターの上部にある保存アイコンをクリックします。
    インジケーターが、[DQ Repository] (DQリポジトリ)ツリービューの[User Defined Indicators] (ユーザー定義インジケーター)フォルダーの下にリストされます。このインジケーターは、[DQ Repository] (DQリポジトリ)ツリービューからエディターにリストされたカラムにドラッグアンドドロップするだけで、分析対象カラムに対して使用することができます。