Talend Dictionary Serviceで既存のセマンティックタイプを編集し、Talend Data Stewardshipでのデータ検証方法に影響を与えることができます。
Talend Data Stewardshipの事前定義済みセマンティックタイプは標準値に基づいていますが、独自のデータに合わせてセマンティックタイプを調整する必要があります。事前定義済みカテゴリーに入ると思われる一部のデータは、無効と見なされる可能性があります。
ここで、メールアドレス、生年月日、居住国を示す顧客リストを含むデータセットの例を見てみましょう。
ここで問題となるのは、Republic of Angolaは、Talend Data Stewardshipのcountry
セマンティックタイプで期待されている値の1つではないということです。
今後この問題の発生を回避するために、Talend Dictionary ServiceのCountry
セマンティックタイプをアップデートし、Republic of Angola
を有効なエントリーのリストに追加する必要があります。この変更は、Talend Data Stewardshipで自動的に使用可能になります。
手順
-
[Semantic Types] (セマンティックタイプ)を選択します。
-
ページの右上にある検索アイコンをクリックし、countryを入力してセマンティックタイプのリストをフィルターします。
-
リストから[Country] (国)を選択します。
-
[Values](値)の横にある
アイコンをクリックし、表示されているフィールドにRepublic of Angolaと入力します。
-
をクリックすると、Country
セマンティックタイプの有効なエントリーのリストの先頭にこの新しい値が追加されます。
-
[Save and publish] (保存して公開)をクリックして、セマンティックタイプを Talend Dictionary Serviceサーバーに送信し、Data Stewardshipで使用できるようにします。
[Save as draft] (下書きとして保存)をクリックすると、システム全体に反映することなく新しいタイプがサーバーに保管されます。新しいタイプ名は、公開されていない場合には使用できません。このオプションの使用例を示すために、仮に、新しいプロジェクトの一部としてデプロイする新しいセマンティックタイプが存在するとしましょう。セマンティックタイプを作成して作業を準備し、プロジェクトの稼動前にそれらをドラフトとして保存し、セマンティックタイプを稼動日にのみデプロイできます。
-
[Tasks] (タスク)ページに戻り、顧客の国が含まれているタスクリストを更新するか、再度開きます。
セマンティックタイプの変更が
Talend Data Stewardshipで使用できるようになっており、
Republic of Angola
が有効な値となっています。
また、各タスクの履歴にエントリーが追加され、セマンティックタイプに対して行われた変更が表示されます。
タスクの結果
Country
セマンティックタイプは、その新しい値をサポートするように手動でアップデートされています。
以降、Country
セマンティックタイプと一致するデータを利用する際は、Republic of Angola(アンゴラ共和国)は有効な値と見なされます。