この例では、Site deduplicationキャンペーンで管理するデータの構造を決定するためのデータモデルを作成する必要があります。このキャンペーンでは、データスチュワードがTalendジョブで抽出されたデータサンプルの重複に近いものにラベルを付けることができます。
Talend Data Stewardshipではデータモデルが認識されるため、データのセマンティックの導入およびセマンティックの検証が可能になっています。データモデルで属性を定義し、定義済みの標準タイプまたはセマンティックタイプから種類をを選択できます。
手順
-
の順に選択します。
-
新しいモデルの名前と説明をName (名前)およびDescription (説明)フィールドにそれぞれ入力します。オプションフィールドは、名前の横に[*]としてマークされます。
-
Attributes (属性)セクションで、データモデルに含めるカラムを次のように定義します:
-
Identifier (識別子)フィールドで、最初のカラムの技術識別子を入力します。
-
必要に応じて、対応するフィールドにカラム名と説明を入力します。
Name (名前)フィールドに設定した名前がタスクリストに表示されます。名前が設定されていない場合は、技術識別コードが表示されます。
-
属性タイプのリストでカラムのタイプを選択します。
標準タイプとセマンティックタイプは、デフォルトでアプリケーション内で統合されています
-
必要に応じて、[ALLOW EMPTY VALUES] (空の値を許可)オプションを切り替えて、空のフィールドのアップロードを無効にします。このオプションはデフォルトで有効になっています。
-
[Add attribute] (属性の追加)をクリックし、上記の手順を繰り返して、データモデルに必要なすべてのカラムを作成します。
この例のSite deduplicationキャンペーンについて定義されるカラムには、シカゴ幼児教育センターの情報が保管されています。