新しい複合セマンティックタイプの追加 - 7.0

Talend Data Stewardshipユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
インストールとアップグレード
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理
管理と監視 > ユーザーの管理
EnrichPlatform
Talend Data Stewardship

Talend Dictionaryサービスにパブリッシュされている他のセマンティックタイプを参照する複合セマンティックタイプを作成し、Talend Data Stewardshipで認識されたデータタイプのリストに追加できます。

複合タイプを作成する際にはすべてのセマンティックタイプを混在させることが可能です。複合セマンティックタイプは、すべての子タイプがすでにパブリッシュされているという条件で他の複合タイプを参照できます。

仮に、米国、イギリス、ドイツ、フランスの顧客に関する情報を保持する1つのファイルが存在するとします。作成した複合セマンティックタイプに対して、異なる郵便番号を登録して検証する必要があります。データが子タイプの1つと一致すると、そのデータは有効とみなされ、他の参照タイプに対して評価されません。

Talend Data Stewardshipでデータモデルを定義する場合、郵便番号を含むカラムのセマンティックタイプを、この新しい複合タイプ(この場合はZip_codes)に設定できます。

始める前に

  • 複合タイプで使用するすべての子セマンティックタイプが作成され、パブリッシュされます。

手順

  1. ホームページで、 [SEMANTIC TYPES] (セマンティックタイプ) > [ADD SEMANTIC TYPES] (セマンティックタイプの追加)をクリックします。
  2. 新しいセマンティックタイプの名前と説明を入力します。
  3. [Type] (タイプ)リストからセマンティックタイプを選択します。
  4. [Use for validation] (検証で使用)スイッチを有効なままにしておきます。

    この複合タイプは、特定のカラムに適用するときに、正しい値または誤った値を定義するために使用されます。この検証プロセスの結果は、データセットの各カラムのクオリティバーで確認できます。

    この例では、スイッチを無効にすると、複合タイプはデータの検索のみに使用され、値はいずれも無効と見なされません。

  5. [Children types](子タイプ)リストから、この複合タイプでグループ化するセマンティックタイプを選択します。
  6. [SAVE AND PUBLISH] (保存してパブリッシュ)をクリックして、セマンティックタイプを Talend Dictionaryサービスサーバーに送信し、システムで使用できるようにします。
    [SAVE AS DRAFT] (下書きとして保存)をクリックすると、システム全体に反映することなく新しいタイプがサーバーに保管されます。新しいタイプ名は、パブリッシュされていない場合には使用できません。このオプションの使用例を示すために、仮に、新しいプロジェクトの一部としてデプロイする新しいセマンティックタイプが存在するとしましょう。セマンティックタイプを作成して作業を準備し、プロジェクトの稼動前にそれらをドラフトとして保存し、セマンティックタイプを稼動日にのみデプロイできます。
  7. Talend Data Stewardshipに戻り、顧客データ用のデータモデルを作成します。
    新しいセマンティックカテゴリPhone_numbersは、セマンティックタイプのリストで使用可能になり、電話番号を含むカラムに設定できます。

タスクの結果

Talend Data Stewardshipに顧客データをロードすると、データは、作成されたPhone_numbers復号タイプと照合され、検証されます。データは最初の子タイプに対して評価され、データが一致した場合、そのデータは他の参照タイプに対して評価されません。