基本モードでデータクオリティルールを作成 - 8.0

Talend Data Stewardshipユーザーガイド

Version
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend Data Stewardship
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Stewardship
Content
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > セマンティックタイプの管理
データクオリティとプレパレーション > タスク管理
管理と監視 > ユーザーの管理

このタスクについて

この例では、大学に勤めています。一部のデータセットが混在していることに気が付いて、大学生に正しい奨学金を与えていることを確認したがっています。

データクオリティルールは、大学生がアメリカ市民権を持っており、ステータスコードが2632である場合に、2021年9月1日から有効で、コードが10ABまたは10ACで終わる奨学金を受けていることを検証します。

データセットのサンプルは次のとおりです。

手順

  1. ルールマネージャーとしてログインします。
  2. 左パネルで[Data quality rules] (データクオリティルール) > [Add rule] (ルールを追加)をクリックします。
  3. ScholarshipProgramという名前を入力します。
    サポートされている文字は[a-z]、[A-Z]、 [0-9]です。 特殊文字は_ $ # @です。
  4. Checking the status code 2632という説明を入力します。
    説明はオプションです。ルール名が似ている場合は、ルールの発見に役立ちます。
  5. [IF]部分で、[Add a row] (行を追加)をクリックします:
    1. [Variable] (変数)を選択して、StatusCodeという名前を入力します。
      サポートされている文字は[a-z]、[A-Z]、 [0-9]です。 特殊文字は_ $ # @です。
    注: データクオリティルールはテンプレートです。データモデルにルールを適用する時に、変数と属性を関連付けます。
    1. [Is equal to] (等しい)という演算子を選択します。
      演算子に関する詳細は、リストと例を参照してください。
    2. [Value] (値)を選択して、2632と入力します。
    3. 行を追加して、Citizenship is USというサブ条件を追加します。
    4. [AND]という論理演算子を選択します。
  6. [THEN]部分に3行を追加します:
    1. 最初の2行をグルーピングするには、行にマウスを重ねて、右側にあるチェックボックスを選択します。
    2. アクションバーで[Group] (グルーピング)をクリックします。
      アクションに関する詳細は、行を管理を参照してください。
    3. [AND]という論理演算子を選択します。
    4. 2021年9月1日から有効で、コードが10ABまたは10ACで終わる奨学金を大学生が受けていることを検証するよう、フィールドをすべて定義します。
    [ELSE]部分では、条件([IF])が満たされていない場合の代替手段を定義できます。

    この例では、[ELSE]部分を空のままにしておきます。条件を満たさない値は該当しない値として分類されます。

    データクオリティルールは以下のように定義されます:
  7. [Save] (保存)をクリックします。

次のタスク

データモデルにデータクオリティルールを適用できるようになりました。