メイン コンテンツをスキップする 補完的コンテンツへスキップ

カラムでインジケーターを設定

分析するカラムを定義した後は、定義したカラムのシステムインジケーターまたはユーザー定義インジケーターを設定します。

システムまたはユーザー定義インジケーターの設定

Before you begin

Talend StudioProfilingパースペクティブの分析エディターでカラム分析が開いていること。

Procedure

  1. 分析エディターの[Data Preview] (データプレビュー)セクションで[Select Indicators] (インジケーターを選択)をクリックし、[Indicator Selection] (インジケーターの選択)ダイアログボックスを開きます。
  2. [Indicator Selection] (インジケーターの選択)ダイアログボックスから、次の手順に従います。
    情報メモNote:

    SQLエンジンで分析を実行する場合、データベースの日付型のカラムに対してパターン頻度統計を使うことは有用ではありません。すべての日付が1種類の形式で表示されるため、このインジケーターによってデータクオリティ問題が検出されることはありません。

    分析の日付カラムに[Date Pattern Frequency] (日付パターン頻度)を付けると、分析結果から日付の正規表現を生成できます。

  3. OKをクリックします。
    [Analyzed Columns] (分析済みカラム)セクションの分析済みカラムに、選択したインジケーターが付加されます。
    この例の分析により、以下が提供され、計算されます。
    • 全カラムのシンプル統計。
    • テキスト統計インジケーターを用いたテキストフィールドの特性、およびインジケーターにおける各個別レコードの最頻値の数。
    • 頻度の高いパターンと低いパターンを示すemailカラム内のパターン。これは、パターン頻度統計インジケーターを使ってクオリティ問題をさらに容易に特定するためのものです。
    • 要約統計インジケーターを使った、total_salesカラム内の数値データの範囲、四分位範囲、平均、中央値。
    • 売上額における1から9までの数字の頻度。これは、不正検出インジケーターを使って不正を検出するためのものです。

システムまたはユーザー定義インジケーターのオプション設定

Before you begin

分析エディターでカラム分析が開いていること。詳細は、分析するカラムを定義をご覧ください。

About this task

インジケーターの値に関する想定しきい値を定義できます。定義するしきい値は、データのクオリティ測定のために使用されます。インジケーターの値が定義したしきい値外にある場合、データのクオリティがよくありません。しきい値は定義しなくても構いませんが、複数定義することはできません。これらのしきい値は、行数に対する割合または値で設定できます。

インジケーターの設定の詳細は、システムまたはユーザー定義インジケーターの設定をご覧ください。

Procedure

  1. 分析エディターの[Analyzed Columns] (分析済みカラム)ビューで、インジケーターの横にある[Options ] (オプション)をクリックします。
  2. 開いたダイアログボックスで、インジケーターにパラメーターを設定します。
    たとえば、分析するカラムにnull値がある場合に警告を出すようにするには、[Null Count] (null値数)[Upper threshold] (上限しきい値)を「0」に設定できます。
    [インジケーター設定]ダイアログボックスの概要。

    インジケーター設定のダイアログボックスは、各インジケーター特有のパラメーターによって異なります。さまざまなインジケーターのパラメーターの詳細は、インジケーターパラメーターをご覧ください。

  3. [Finish] (終了)をクリックしてダイアログボックスを閉じます。
  4. 分析を保存します。

分析エディターからユーザー定義インジケーターを設定する

Before you begin

分析するカラムに分析エディターからユーザー定義インジケーターを設定するには、次の手順に従います。

Procedure

  1. 以下のいずれかを行います:
    1. 分析エディターの[Analyzed Columns] (分析済みカラム)ビューから、インジケーターを定義したいカラム名の横にある[Add UDI] (UDIを追加)をクリックします。
      [UDI selector] (UDIセレクター)ダイアログボックスが開きます。
      [UDIを追加]アイコンの場所と[UDIセレクター]ダイアログボックスの概要。
    2. ユーザー定義インジケーターを選択し、OKをクリックします。
  2. または:
    1. [DQ Repository] (DQリポジトリー)ツリービューで、[Libraries] (ライブラリー) > [Indicators] (インジケーター)と展開します。
    2. [User Defined Indicator] (ユーザー定義インジケーター)フォルダーから、カラム内容の分析に使うユーザー定義インジケーターを[Analyzed Columns] (分析済みカラム)ビューのカラム名にドロップします。
      ユーザー定義インジケーターがカラム名の下に表示されます。
    3. Optional: ユーザー定義インジケーターにしきい値を設定します。
    4. 分析を保存します。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。