セマンティックタイプの削除 - 7.2

Talend Data Stewardshipユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > セマンティックタイプの管理
データクオリティとプレパレーション > タスク管理
管理と監視 > ユーザーの管理
EnrichPlatform
Talend Data Stewardship

Talend Dictionaryサービスでセマンティックタイプを削除し、Talend Data Stewardshipで認識されたデータタイプのリストから削除できます。

事前定義済みのセマンティックタイプと事前定義済みの標準タイプの両方を削除できます。

Talend Data Stewardshipにデフォルトで存在する各種セマンティックタイプは、特定の状況では厄介なものになる可能性があります。たとえば、5桁の数字はアメリカの郵便番号としても解釈されますが、フランス語またはドイツ語としても解釈される可能性があります。これらは同じフォーマットを共有するためです。

仮に、あなたはアメリカの会社に勤務しており、アメリカのクライアントからのデータ(郵便番号など)のみを扱う作業に従事しているとしましょう。ここであなたは認識されたセマンティックタイプのリストにアメリカの郵便番号だけを残したいと考えます。

Talend Dictionaryサービスを使用して、5桁の形式に一致する他のセマンティックタイプを削除し、US_POSTAL_CODEのみを残します。変更は即座にTalend Data Stewardshipに移植され、以降、セマンティックタイプUS_POSTAL_CODEに対してZIPコードカラムの検証が常に行われます。

手順

  1. コマンドプロンプトウィンドウを開きます。
  2. cdコマンドを使用して、<Dictionary_Service_Path>/command-lineフォルダに移動します。
  3. 既存のセマンティックの種類の名前を表示し、削除するものを確認するには、次のコマンドを実行します: お使いのオペレーティングシステムに応じて:
    • Windowsの場合、category_manager.bat -l -type REGEX
    • Linuxの場合、./category_manager.sh -l -type REGEX
    Talend Administration Centerの認証情報の入力を求められます。このコマンドは、有効なログインとパスワードを入力した後に実行されます。

    正規表現に基づくセマンティックタイプのリストが表示されます。その中から削除するセマンティックタイプの名前、FR_POSTAL_CODEまたはDE_POSTAL_CODEを特定できます。

  4. フランスの郵便番号のセマンティックタイプを削除するには、オペレーティングシステムに応じて次のコマンドを実行します。
    • Windowsの場合、category_manager.bat -d -name FR_POSTAL_CODE
    • Linuxの場合、./category_manager.sh -d -name FR_POSTAL_CODE
    FR_POSTAL_CODEは、認識されたセマンティックタイプのリストから削除されました。Talend Data Stewardshipでデータモデルを作成する際に、5桁の数字をフランスの郵便番号に関連付けることはできません。
  5. この操作を繰り返して、5桁の数字と一致する他のセマンティックタイプを削除します。
    • DE_POSTAL_CODE
    • FR_INSEE_CODE
    キャンペーンに関連付けられたデータモデルのカラムですでに使用されているセマンティックタイプを削除すると、そのセマンティックタイプがtextに自動的に設定されます。つまり、最初のセマンティックタイプで無効として表示される可能性のあるデータが、textセマンティックタイプで有効と見なされる可能性があります。

タスクの結果

1つのセマンティックタイプを除き、5桁の数値と互換性のあるすべてのセマンティックタイプを削除しました。以降、新しいデータモデルを追加する際、郵便番号データを持つカラムのセマンティックタイプとしてUS_POSTAL_CODEのみを設定できます。

使用可能なコマンドをTalend Dictionaryサービスですべて表示するには、<Dictionary_Service_Path>/command-lineに移動し、オペレーティングシステムに応じて次のコマンドを入力します。
  • Windowsの場合はcategory_manager.bat -h
  • Linuxの場合は./category_manager.sh -h