キャンペーンでデータモデルを設定 - Cloud

Talend Cloud Data Stewardship入門ガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Stewardship
Content
データガバナンス > キャンペーンの管理
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理
データクオリティとプレパレーション > 重複データの削除
Last publication date
2024-03-06

データモデルにより管理対象データの構造が決定されます。データモデルはデータの構文とセマンティックの検証に使用されます。

データモデルにリスト表示される各属性にロールごとのアクセス許可を定義できます。

手順

  1. [Add Campaign] (キャンペーンを追加)ページで、[Data model] (データモデル)をクリックし、キャンペーンで使用するデータ構造をモデルリストから選択します。
    モデルリストでは、定義されているすべてのデータモデルにアクセス権が付与されます。
    [Data model] (データモデル)ビュー。
  2. データ構造内の属性の横にあるボタンをそれぞれ選択して、属性ごとおよびロール/データスチュワードごとにアクセス権限を設定し、誰がどの属性を表示/編集できるかを定義します。
    アイコン 説明
    [Read/write access] (読み取り/書き込みアクセス)アイコン データモデルの属性に対して読み取り/書き込みアクセスが提供されます。
    [Read access] (読み取りアクセス)アイコン データモデルの属性に対して読み取りアクセスのみ提供されます。

    この種のアクセスは、データスチュワードが情報を調べて判断を下す必要があるものの、値を変更してはならない場合、たとえば、スチュワードが表示する一意の識別子が、他のエンティティにリンクしている場合、または信頼できることが判明しており、変更するべきでないデータを表示する場合に便利です。

    [No access] (アクセスなし)アイコン 属性へのアクセスを提供しません。

    属性の非表示の機能は、情報の機密性が高い場合や、財務情報などの情報をデータスチュワードに見せたくない場合に便利です。非表示にする属性の別の例としては技術識別子など、スチュワードにとっては単にノイズであっても、タスクの一部としてプロパゲートする必要のある項目があります。

    このキャンペーンではAccount analystロールを持つキャンペーン参加者には識別子属性への読み取り専用アクセスを付与し、他の参加者には読み書きアクセスを付与します。

  3. 各属性の横にあるSurvivorship Rule (サバイバーシップルール)リストからルールを選択します。
    これらのルールはキャンペーンにデータを読み込む際、マスターレコードを定義する属性値を決定するために使用されます。データスチュワードは、これらの選択を手動で変更できます。
    • [First valid] (最初の有効なもの): 関連付けられているデータモデルで定義されている制約に関して、有効な値が含まれている最初のソースを選択します。定義されているすべての制約と規則に適合している値であれば有効です。「先頭」はタスク作成時のレコードの順番によって定義されます。
    • [First not null] (NULLでない最初のもの): 値が含まれている最初のソースを選択します。この場合の「最初」とはタスク作成時のレコードの順番によって定義されます。
    • [Most common] (最も共通するもの): 1つまたは複数のデータソースからの重複のうち最も共通する属性値を選択します。
    • [Most recent] (最も直近のもの): 1つまたは複数のデータソースからの重複のうち最も直近の属性値を選択します。これはメタデータの最後のアップデート日に基づきます。
    • [Most trusted] (最も信頼できるもの): キャンペーンの作成時またはキャンペーンでタスクを読み込む時に設定したトラストスコアにしたがって重複のうち最も信頼制の高い属性値を選択します。トラストスコアが定義されていない場合、このオプションは動作しません。
    フォーム右上のリストからルールをクリックすると、すべての属性に対して1つのルールを選択できます。指定されたアルゴリズムを適用できない場合、ルールは[First not null] (NULLでない最初のもの)に戻ります。たとえば、トラストスコアを設定していないのに、キャンペーン定義に[Most trusted] (最も信頼できるもの)を選択した場合、[First not null] (NULLでない最初のもの)が使用されます。同様に、[Most common] (最も共通するもの)または[First valid] (最初の有効)を選択しているのに、重複データに共通するものがないか、有効なデータがない場合にも[First not null] (NULLでない最初のもの)が使用されます。

    マスターレコードをビルドするためにどんな価値を選択するのかは、サバイバーシップルールによって決まります。以下は、そのことを示すサンプルです。
    [First valid] (最初の有効なもの): メールアドレス:
    • 最初の値が有効でなく、2番目の値が有効な場合は、2番目のメールが勝ちます。
    • すべてのメールアドレスが無効な場合は、最初の空でない値が勝ちます。
    [First not null] (NULLでない最初のもの): ファーストネーム:
    • 最初の値が空で、2番目の値が空でない場合は、2番目のファーストネームが勝ちます。
    • すべてのファーストネームが空の場合、マスターレコード内でファーストネームは空になります。
    [Most common] (最も共通するもの): ラストネーム:
    • 2つのソースレコード内でラストネームが同一である場合は、この値が勝ちます。
    • すべてのソースレコード内でラストネームが異なる場合は、最初の空でない値が勝ちます。
    [Most recent] (最近のもの)の電話番号とタイムスタンプ:
    • 1つの電話番号に最新のタイムスタンプがある場合は、この値が勝ちます。
    • すべての電話番号に同じタイムスタンプがある場合は、最初の空でない値が勝ちます。
    [Most trusted] (最も信頼できるもの): 住所:
    • ソースレコード内のすべての住所にトラストスコアがある場合は、スコアが最高の値が勝ちます。
    • ソースレコード内のすべての住所にトラストスコアがあり、2つが同一である場合は、同一住所の最初のものが勝ちます。
    • どの住所もトラストスコアを持たない場合は、最初の空でない値が勝ちます。
  4. 必要に応じて、[Add campaign] (キャンペーンを追加)をクリックしてサーバーに保存し、都合の良い時に作成したフォームを完成させます。