既存のセマンティックタイプの更新 - 7.0

Talend Data Stewardshipユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
インストールとアップグレード
データガバナンス > キャンペーンの管理
データガバナンス > タスクの割り当て
データガバナンス > データモデルの管理
データクオリティとプレパレーション > タスク管理
管理と監視 > ユーザーの管理
EnrichPlatform
Talend Data Stewardship

Talend Dictionaryサービスで既存のセマンティックタイプを編集し、Talend Data Stewardshipでのデータ検証方法に影響を与えることができます。

Talend Data Stewardshipの事前定義済みセマンティックタイプは標準値に基づいていますが、独自のデータに合わせてセマンティックタイプを調整する必要があります。事前定義済みカテゴリに入ると思われる一部のデータは、無効とみなされる可能性があります。

ここで、メールアドレス、生年月日、居住国を示す顧客リストを含むデータセットの例を見てみましょう。[United States of America] (アメリカ合衆国)のすべてのエントリーは無効であるとみなされます。その名前は正式名称であるため本来は無効であってはなりません。

ここで問題となるのは、[United States of America] (アメリカ合衆国)は、Talend Data Stewardshipcountryセマンティックタイプで予想される値の1つではないということです。このケースでの有効なエントリーはUnited States(米国)です。

今後この問題の発生を回避するために、Talend Dictionaryサービスcountryセマンティックタイプを更新し、有効なエントリーのリストに[United States of America] (アメリカ合衆国)を追加します。この変更は、Talend Data Stewardshipで自動的に使用可能になります。

手順

  1. コマンドプロンプトウィンドウを開き、cdコマンドを使用して<Dictionary_Service_Path>/command-lineフォルダーに移動します。
  2. 有効な国のリストに値[United States of America] (アメリカ合衆国)を追加するには、オペレーティングシステムに応じて次のコマンドを実行します。:
    • category_manager.bat -a -name COUNTRY -value "United States of America"Windowsの場合。
    • ./category_manager.sh -a -name COUNTRY -value "United States of America"Linuxの場合。

    このコマンドを使用できるようにするには、1つの行にコマンドを記述する必要があります。

    Talend Administration Centerの認証情報の入力を求められます。このコマンドは、有効なログインとパスワードを入力した後に実行されます。

  3. countryセマンティックタイプのエントリーのリストを表示するには、オペレーティングシステムに応じて以下のコマンドを実行します:
    • Windowsの場合、category_manager.bat -e -name COUNTRY
    • Linuxの場合、./category_manager.sh -e -name COUNTRY

    countryセマンティックタイプの有効なエントリーのリストの最後に[United States of America] (アメリカ合衆国)が適切に追加されています。

  4. Talend Data Stewardshipに戻り、顧客の国が含まれているタスクリストを更新するか、または再度開きます。
    これで、セマンティックタイプの変更がTalend Data Stewardshipで有効になりました。カラムヘッダーの下のクオリティバーを確認すると、無効な値はもはや存在しません。

タスクの結果

countryセマンティックタイプは、新しい値をサポートするように手動で更新されています。

以降、countryセマンティックタイプと照合されるデータを扱う際には、[United States of America] (アメリカ合衆国)は有効な値とみなされます。

使用可能な全てのコマンドをTalend Dictionaryサービスで表示するには、<Dictionary_Service_Path>/command-lineに移動して、オペレーティングシステムに応じて次のコマンドを入力します。
  • category_manager.bat -hコマンド(Windowsの場合)。
  • ./category_manager.sh -hコマンド(Linuxの場合)。