セマンティックタイプの削除 - Cloud

Talend Cloud Data Inventoryユーザーガイド

Version
Cloud
Language
日本語 (日本)
Product
Talend Cloud
Module
Talend Data Inventory
Content
データガバナンス
データクオリティとプレパレーション > データの充実化
データクオリティとプレパレーション > データの識別
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理

Talend Dictionary Serviceでセマンティックタイプを削除すれば、Talend Cloudアプリケーションで認識されたデータタイプのリストからも同じタイプを削除できます。

デフォルトで存在するセマンティックタイプによっては、ユーザーのコンテキストには適用されないものがあります。たとえば5桁の数字であればアメリカの郵便番号であると解釈されますが、フォーマットが同じであるフランスやドイツの郵便番号として解釈することもできます。

ここで、あなたは米国の会社に勤務しており、国内の顧客からのデータ(郵便番号など)のみを扱う作業に従事しているとしましょう。認識されたセマンティックタイプのリストにアメリカの郵便番号だけを残したいと考えています。

このサンプルでは、データセットのZIPカラムは、少なくとも4つのタイプに一致する可能性があります。

Talend Dictionary Serviceを使用して、5桁の形式に一致する他のセマンティックタイプを削除し、US Postal Codeのみを残します。変更は即座ににプロパゲートされ、郵便番号は今後、US Postal Codeセマンティックタイプに対してのみの検証となります。

手順

  1. ホームページの左パネルで[Semantic Types] (セマンティックタイプ)ビューを開きます。
  2. 既存のセマンティックタイプのリストでFR Postal Codeを探します。
  3. このセマンティックタイプを削除するには、そのセマンティックタイプの上にマウスを置き、右側に表示されたゴミ箱アイコンをクリックします。
  4. 最後の2つのステップを繰り返して、FR Insee CodeDE Postal Codeを削除します。

タスクの結果

5桁の数値と互換性のある他のセマンティックタイプを削除しました。今後、新しいデータセットを追加する時は、郵便番号を含んだカラムのセマンティックタイプとしてUS Postal Codeのみが処理されます。
注: 1つ以上のデータセットで使用されているセマンティックタイプを削除する場合、関連するカラムがtextカテゴリーに切り替わります。