Data Stewardship用にセマンティックタイプをエンリッチ化 - Cloud

Talend Cloud Data Stewardshipユーザーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Stewardship
Content
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理
管理と監視 > ユーザーの管理
Last publication date
2024-01-30
Talend Dictionary Serviceは、各種Talend製品(Talend Cloud Data Stewardshipを含む)で使用されるセマンティックカテゴリーを保存します。個人のカテゴリーでこれらのセマンティックタイプをエンリッチでき、行ったすべての変更は即座に反映されます。ただし、Talend Dictionary Serviceが利用可能かどうかは所有するライセンスによって決まります。
注: テナントごとに10MBまでのコンテンツをTalend Dictionary Serviceにアップロードできます。
Talend Dictionary ServiceTalend Cloud Data Stewardshipとの間のやり取りを可能にするには、次の前提条件を満たす必要があります。
  • プラットフォームライセンスがあること。
  • Talend Cloudユーザーには、Talend Cloud Data Stewardshipロールのいずれかに加え、Talend Cloud Data Stewardshipに割り当てられている[Dictionary service] (ディクショナリーサービス)アプリケーションの[Semantic types manager] (セマンティックタイプマネージャー)ロールが設定されている必要があります。
注: Talend Cloud Data Stewardshipの試用版を使用している場合、セマンティックタイプの管理は使用できません。

キャンペーン所有者がキャンペーンで管理するデータの構造を定義する場合、事前定義済みのリストから各属性のセマンティックタイプを選択できます。データをTalend Cloud Data Stewardshipにロードすると、スキーマタイプの内部検証が実行され、それに応じてデータが有効または無効として表示されます。

キャンペーン内の有効なデータと無効なデータ。

たとえば、デフォルトで国の下のアプリケーションに含まれているエントリーのリストにはRepublic of AngolaUKが含まれていません。結果として、そのようなエントリーはTalend Cloud Data Stewardshipにロードされると無効な国名と見なされます。

しかし、さらに踏み込んで、独自のセマンティックタイプを作成したり、既存のセマンティックタイプのアップデートや削除を行ったりすると、Talend Cloud Data Stewardshipで自社に合ったビジネス用語が使用されるようになります。これらの管理オプションはすべて統合ユーザーインターフェイスを介して実行できます。

セマンティックタイプの作成時、セマンティックタイプをデータ検証に使用するか、データ検出に使用するかを決定できます。
  • データ検証では、データをセマンティックタイプと照合し、データを有効または無効としてマークします。
  • データ検出では、セマンティックカテゴリーを探索し、分析されたデータ内の複雑な意味関係を照会し、照合の結果を出力して、最も関連性の高い概念を表示します。

Talend Cloud Data Stewardshipでは、データ検出が行われないため、検証用にのみセマンティックタイプを使用します。

サーバー上では、セマンティックタイプは複数のカテゴリーに分けられます。
  • ディクショナリータイプ: 閉じた値のリストに基づく。
  • 正規表現タイプ: 事前に選択した正規表現とデータを比較する。
  • 複合型タイプ: 複合型で参照される複数のセマンティックタイプとデータを比較する。