グループ化キャンペーンのデータモデルの定義 - 7.2

Talend Data Stewardshipの例

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Data Stewardship
task
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理

この例では、Site deduplication (サイト重複除去)キャンペーンで管理するデータの構造を決定するためのデータモデルを作成する必要があります。このキャンペーンでは、データスチュワードがTalendジョブで抽出されたデータサンプルの重複に近いものにラベルを付けることができます。

Talend Data Stewardshipではデータモデルが認識されるため、データのセマンティックの導入およびセマンティックの検証が可能になっています。データモデルで属性を定義し、定義済みの標準タイプまたはセマンティックタイプから種類をを選択できます。

手順

  1. [DATA MODELS] (データモデル) > [ADD DATA MODEL] (データモデルの追加)をクリックします。
  2. 新しいモデルの名前と説明を入力します。
  3. Attributes (属性)セクションで、データモデルに含めるカラムを次のように定義します:
    1. Identifier (識別子)フィールドで、最初のカラムの技術識別子を入力します。
    2. 必要に応じて、対応するフィールドにカラム名と説明を入力します。
      Name (名前)フィールドに設定した名前がタスクリストに表示されます。名前が設定されていない場合は、技術識別コードが表示されます。
    3. 属性タイプのリストでカラムのタイプを選択します。

      標準タイプとセマンティックタイプは、デフォルトでアプリケーション内で統合されています

      • 標準タイプでは、選択したタイプに従って追加フィールドが表示されます。これらのフィールドは省略可能で、最小値や最大長の定義、属性を検証するパターンの定義など、属性に制約を定義できます。

        この値全体が検証パターンと必ず一致するようにするためのベストプラクティスは、検証パターンを^$で囲むことです。

        例:
        • [A-Z]AおよびABCと一致します。
        • ^[A-Z]$Aと一致しますが、ABCとは一致しません。

        DateカラムとTimestampカラムについては、日時のピッカーにアクセスできるため、日時が正しい形式で自動的に設定されます。

      • セマンティックタイプはTalend Dictionary Serviceを使用して管理できます。ただし、このサービスをご利用になれるかどうかは、お持ちのライセンスによって異なります。
  4. 必要に応じて、[ALLOW EMPTY VALUES] (空の値を許可)オプションを切り替えて、空のフィールドのアップロードを無効にします。このオプションはデフォルトで有効になっています。
  5. 左側のパネルの[Add attribute] (属性の追加)をクリックし、上記の手順を繰り返して、データモデルに必要なすべてのカラムを作成します。
    この例のSite deduplication (サイト重複除去)キャンペーンについて定義されるカラムには、シカゴ幼児教育センターの情報が保管されています。