新しい複合セマンティックタイプの追加 - 7.2

Talend Data Stewardshipユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > セマンティックタイプの管理
データクオリティとプレパレーション > タスク管理
管理と監視 > ユーザーの管理
EnrichPlatform
Talend Data Stewardship

Talend Dictionaryサービスにパブリッシュされている他のセマンティックタイプを参照する複合セマンティックタイプを作成し、Talend Data Stewardshipで認識されたデータタイプのリストに追加できます。

複合タイプを作成する際にはすべてのセマンティックタイプを混在させることが可能です。複合セマンティックタイプは、すべての子タイプがすでにパブリッシュされているという条件で他の複合タイプを参照できます。

仮に、米国、イギリス、ドイツ、フランスの顧客に関する情報を保持する1つのファイルが存在するとします。作成した複合セマンティックタイプに対して、異なる郵便番号を登録して検証する必要があります。データが子タイプの1つと一致すると、そのデータは有効と見なされ、他の参照タイプに対して評価されません。

Talend Data Stewardshipでデータモデルを定義する場合、郵便番号を含むカラムのセマンティックタイプを、この新しい複合タイプ(この場合はZip_codes)に設定できます。

始める前に

複合タイプで使用するすべての子セマンティックタイプが作成され、パブリッシュされます。

手順

  1. [SEMANTIC TYPES] (セマンティックタイプ) > [ADD SEMANTIC TYPE] (セマンティックタイプの追加)の順に選択します。
  2. 新しいセマンティックタイプの名前と説明を入力します。
  3. [Type] (タイプ)リストからセマンティックタイプを選択します。
  4. [Use for validation] (検証で使用)スイッチを有効なままにしておきます。

    この複合タイプは、特定のカラムに適用する時に正しい値や誤った値を定義するために使われます。この検証プロセスの結果は、データセットの各カラムのクオリティバーで確認できます。

    この例では、スイッチを無効にすると、複合タイプはデータの検索のみに使用され、値はいずれも無効と見なされません。

  5. [Children types](子タイプ)リストから、この複合タイプでグループ化するセマンティックタイプを選択します。
  6. [SAVE AND PUBLISH] (保存してパブリッシュ)をクリックして、セマンティックタイプを Talend Dictionaryサービスサーバーに送信し、Data Stewardshipで使用できるようにします。
    [SAVE AS DRAFT] (下書きとして保存)をクリックすると、システム全体に反映することなく新しいタイプがサーバーに保管されます。新しいタイプ名は、パブリッシュされていない場合には使用できません。このオプションの使用例を示すために、仮に、新しいプロジェクトの一部としてデプロイする新しいセマンティックタイプが存在するとしましょう。セマンティックタイプを作成して作業を準備し、プロジェクトの稼動前にそれらをドラフトとして保存し、セマンティックタイプを稼動日にのみデプロイできます。
  7. [DATA MODELS] (データモデル)ページで、顧客データのデータモデルを作成します。
    新しいセマンティックカテゴリPhone_numbersは、セマンティックタイプのリストで使用可能になり、電話番号を含むカラムに設定できます。

タスクの結果

Talend Data Stewardshipに顧客データをロードすると、データは、作成されたPhone_numbers復号タイプと照合され、検証されます。データは最初の子タイプに対して評価され、データが一致した場合、そのデータは他の参照タイプに対して評価されません。