Talend Dictionaryサービスのセマンティックタイプをエンリッチする(ユーザーインターフェイス) - 7.0

Talend Data Stewardshipユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
インストールとアップグレード
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理
管理と監視 > ユーザーの管理
EnrichPlatform
Talend Data Stewardship

Talend Dictionaryサービスは、各種Talend製品(Talend Data Stewardshipを含む)で使用されるセマンティックカテゴリを保存します。個人のカテゴリーでこれらのセマンティックタイプをエンリッチすることができ、行った全ての変更は即座にTalend Data Stewardshipに反映されます。ただし、Talend Dictionaryサービスが利用可能かどうかは、使用しているライセンスによって決まります。

Talend Data Stewardshipではデータモデルが認識されるため、データのセマンティックの導入およびセマンティックの検証が可能になっています。データモデル内で属性を定義し、Talend Dictionaryサービスに保存されている事前定義済みの標準またはセマンティックタイプからタイプを選択できます。

キャンペーンオーナーがキャンペーンで管理するデータの構造を定義する場合、事前定義済みのリストから各属性のセマンティックタイプを選択できます。データをTalend Data Stewardshipにロードすると、スキーマタイプの内部検証が実行され、それに応じてデータが有効または無効として表示されます。

たとえば、デフォルトで国の下のTalend Data Stewardshipに含まれているエントリのリストには、Republic of AngolaUnited States of America、およびUKは含まれていません。結果として、そのようなエントリはTalend Data Stewardshipにロードされると無効な国名とみなされます。

しかし、さらに踏み込んで、独自のセマンティックタイプを作成したり、既存のセマンティックタイプの更新や削除を行ったりすると、Talend Data Stewardshipで自社に合ったビジネス用語が使用されるようになります。これらの管理オプションは、Talend Data Stewardshipに統合されたユーザーインターフェースか、またはコマンドラインインターフェースのいずれかを使用して実行できます。

セマンティックタイプの作成時、セマンティックタイプをデータ検証に使用するか、データ検出に使用するかを決定できます。
  • データ検証では、データをセマンティックタイプと照合し、データを有効または無効としてマークします。
  • データ検出では、セマンティックカテゴリを探索し、分析されたデータ内の複雑な意味関係を照会し、照合の結果を出力して、最も関連性の高い概念を表示します。

Talend Data Stewardshipでは、データ検出が行われないため、検証用にのみセマンティックタイプを使用します。

サーバー上では、セマンティックタイプは複数のカテゴリに分けられます。
  • 辞書タイプ: 閉じた値のリストに基づく。
  • 正規表現タイプ: 事前に選択した正規表現とデータを比較する。
  • 複合タイプタイプ: 複合タイプで参照される複数のセマンティックタイプとデータを比較する。
Talend DictionaryサービスTalend Data Stewardshipとの間のやり取りを可能にするには、次の前提条件を満たす必要があります。
  • Talend Dictionaryサービスがインストールされ、実行されている。
  • Talend Administration Centerがインストールされ、実行されている。
  • Platformのライセンスがあることが前提となります。
  • Talend Administration Centerであなたに割り当てられたロールは、デザイナーまたはオペレーションマネージャーである。
  • 管理センターのユーザーアカウントで[Dictionary Service User] (辞書サービスユーザー)および[Data Stewardship User] (Data Stewardshipユーザー)チェックボックスがオンになっていること、また[Data Stewardship Role] (Data Stewardshipロール)フィールドで設定できる2つのロールが設定されていること。
  • <install_folder>\tds\apache-tomcat\conf\data-stewardship.propertiesファイルで、dataquality.dictionaryservice.enableプロパティがtrueに設定されていること。