既存のセマンティックタイプをアップデート - Cloud

Talend Cloud Data Inventoryユーザーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Inventory
Content
データガバナンス
データクオリティとプレパレーション > データの充実化
データクオリティとプレパレーション > データの識別
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理
Last publication date
2024-02-28

Talend Dictionary Serviceで既存のセマンティックタイプを編集すると、アプリケーションのサンプルビューでのデータ検証方法に反映されます。

事前定義済みセマンティックタイプは標準値に基づいていますが、自分のデータに合わせた調整が必要な場合があります。事前定義済みカテゴリーに入ると思われるデータによっては、無効と見なされるものもあります。

ここで、メールアドレス、生年月日、居住国を示す顧客リストが含まれているデータセットの例に注目してみましょう。Americaのエントリーがすべて無効と見なされていることがわかります。これは有効な国名ではありませんが、自分の会社で使われているので有効な値としたいと考えています。

ここで問題となるのは、Americaは、Talend Dictionary Servicecountryセマンティックタイプで期待されている値の1つではないという点です。この場合に有効なエントリーは、United StatesUnited States of Americaのいずれかです。

今後この問題を回避できるよう、Talend Dictionary Servicecountryセマンティックタイプをアップデートし、有効なエントリーのリストにAmericaを追加します。この変更は、Talend Cloud Data Inventoryやその他のクラスアプリケーションで自動的に使用可能になります。

手順

  1. ホームページの左パネルで[Semantic type] (セマンティックタイプ)ビューを開きます。
  2. 既存のセマンティックタイプのリストでCountryセマンティックタイプをクリックして開きます。
    このウィンドウでは、データの検索や検証に使用するエントリーのリストなど、あらゆるセマンティックタイプのパラメーターを編集できます。
  3. [values] (値)リストで、United Statesエントリーの上にカーソルを置き、右側に表示されたペンアイコンをクリックします。
  4. United Statesの直後に、新しい値としてAmericaをコンマで区切って入力します。
  5. チェックアイコンをクリックして変更を検証します。
    同じ行にあるコンマ区切りの値はすべてシノニムとして設定されます。これにより、Americacountryセマンティックタイプの有効な値と見なされるようになります。
  6. [Save and publish] (保存して公開)をクリックしてTalend Dictionary Serviceで変更をプロパゲートし、ユーザーが使用できるようにします。
    セマンティックタイプの変更は、新しいデータセットを作成するたびにTalend Cloud Data Inventoryへ即座に反映されます。既存のデータセットの場合は、新しい値でクオリティを再計算できるようサンプルを更新する必要があります。
  7. 顧客の国を含んだカラムのデータセットに戻ります。
  8. [Refresh sample] (サンプルを更新)ボタンをクリックします。
    データセットの概要からの[更新]ボタンの場所。

タスクの結果

countryセマンティックタイプが手動でアップデートされ、新しい値をサポートするようになりました。カラムヘッダーの下にあるクオリティバーを見ると、無効な値がもうないことがわかります。

今後、countryセマンティックタイプに一致するデータを処理する場合は、Americaも有効な値と見なされます。