Talend Dictionary Serviceに公開されている他のセマンティックタイプを参照する複合セマンティックタイプを作成し、Talend Data Stewardshipで認識されたデータ型のリストに追加できます。
複合型を作成する際にはすべてのセマンティックタイプを混在させることが可能です。複合セマンティックタイプは、すべての子タイプが既に公開されているという条件で他の複合型を参照できます。
仮に、米国、イギリス、ドイツ、フランスの顧客に関する情報を保持する1つのファイルが存在するとします。作成した複合セマンティックタイプに対して、異なる郵便番号を登録して検証する必要があります。データが子タイプの1つと一致すると、そのデータは有効と見なされ、他の参照タイプに対して評価されません。
Talend Data Stewardshipでデータモデルを定義する場合、郵便番号を含むカラムのセマンティックタイプを、この新しい複合型(この場合はZip_codes
)に設定できます。
始める前に
複合型で使用するすべての子セマンティックタイプが作成され、公開されます。
手順
-
の順に選択します。
-
新しいセマンティックタイプの名前と説明を入力します。
-
[Type] (タイプ)リストからセマンティックタイプを選択します。
-
[Use for validation] (検証で使用)スイッチを有効なままにしておきます。
この複合型は、特定のカラムに適用する時に正しい値や誤った値を定義するために使われます。この検証プロセスの結果は、データセットの各カラムのクオリティバーで確認できます。
この例では、スイッチを無効にすると、複合型はデータの検索のみに使用され、値はいずれも無効と見なされません。
-
[Children types](子タイプ)リストから、この複合型でグルーピングするセマンティックタイプを選択します。
-
[Save and publish] (保存して公開)をクリックして、セマンティックタイプを Talend Dictionary Serviceサーバーに送信し、Data Stewardshipで使用できるようにします。
[Save as draft] (下書きとして保存)をクリックすると、システム全体に反映することなく新しいタイプがサーバーに保管されます。新しいタイプ名は、公開されていない場合には使用できません。このオプションの使用例を示すために、仮に、新しいプロジェクトの一部としてデプロイする新しいセマンティックタイプが存在するとしましょう。セマンティックタイプを作成して作業を準備し、プロジェクトの稼動前にそれらをドラフトとして保存し、セマンティックタイプを稼動日にのみデプロイできます。
-
[Data models] (データモデル)ページで、顧客データのデータモデルを作成します。
新しいセマンティックカテゴリーPhone_numbers
は、セマンティックタイプのリストで使用可能になり、電話番号を含むカラムに設定できます。
タスクの結果
Talend Data Stewardshipに顧客データをロードすると、データは、作成されたPhone_numbers
復号タイプと照合され、検証されます。データは最初の子タイプに対して評価され、データが一致した場合、そのデータは他の参照タイプに対して評価されません。