新しい複合セマンティックタイプの追加 - Cloud

Talend Cloud Data Inventoryユーザーガイド

Version
Cloud
Language
日本語 (日本)
Product
Talend Cloud
Module
Talend Data Inventory
Content
データガバナンス
データクオリティとプレパレーション > データの充実化
データクオリティとプレパレーション > データの識別
データクオリティとプレパレーション > データセットの管理
管理と監視 > 接続の管理

複合セマンティックを作成して、Talend Dictionary Serviceサーバーに公開された他のセマンティックタイプをグループ化し、認識されたデータタイプのリストに追加できます。

複合タイプを作成する際は、セマンティックタイプをすべて混在させることが可能です。複合セマンティックタイプは、すべての子タイプが既に公開されていれば他の複合タイプを参照できます。

この例では、米国、英国、ドイツ、フランスの顧客に関する情報を含んだファイルを準備する必要があります。このデータセットのいずれかのカラムにこれらの国の郵便番号が含まれていますが、当然ながらその形式はさまざまです。アプリケーションはこの場合、そのカラムで値に最も一致するセマンティックタイプ(たとえばUS Postal code)を採用します。そのため、ドイツ、フランス、英国の郵便番号といった他のデータは無効と見なされます。

この状況にアプリケーションをさらに適応させるため、複合タイプを作成し、郵便番号の検証に使う複数のセマンティックタイプを再グループ化します。

始める前に

複合タイプとしてグループ化するセマンティックタイプがすべて公開されます。

手順

  1. ホームページの左パネルで[Semantic type] (セマンティックタイプ)ビューを開きます。
  2. [Add semantic type] (セマンティックタイプの追加)ボタンをクリックします。
  3. [Name] (名前)フィールドにPostal codeと入力します。
  4. [Description] (説明)フィールドにAmerican, British, German and French postal codesと入力します。
  5. [Type] (タイプ)ドロップダウンリストで[Compound type] (複合タイプ)を選択します。
  6. [Use for validation] (検証で使用)スイッチを有効なままにしておきます。

    この複合タイプは、特定のカラムに適用する時に正しい値や誤った値を定義するために使われます。この検証プロセスの結果は、データセットの各カラムのクオリティバーで確認できます。

    この例では、スイッチを無効にすると複合タイプはデータの検索のみに使われ、どの値も無効とは見なされません。

  7. [Children types] (子タイプ)ドロップダウンリストで、このPostal code複合タイプにグループ化するセマンティックタイプを選択します。
  8. [Save and publish] (保存して公開)をクリックして新しい複合タイプをTalend Dictionary Serviceサーバーに送信し、Talend Cloud Data Inventoryユーザーが使用できるようにします。

    [Save as draft] (下書きの保存)をクリックすると、セマンティックタイプはTalend Dictionary Serviceに保存されますが、Talend Cloudアプリケーションにはブロードキャストされません。そのため、セマンティックタイプの公開時期を選ぶことができます。

    Postal codeタイプは、ステータスが[Published] (公開済み)になっているセマンティックタイプのリストで使用可能になります。

    セマンティックタイプの変更は、新しいデータセットを作成するたびにTalend Cloud Data Inventoryへ即座に反映されます。既存のデータセットの場合は、最も適切な新しいカテゴリーでクオリティを再計算できるようサンプルを更新する必要があります。

  9. 複数の国の郵便番号が含まれているデータセットに戻ります。
  10. [Refresh sample] (サンプルを更新)ボタンをクリックします。

タスクの結果

これでデータは、Talend Dictionary Serviceで手動で作成したPostal code複合タイプと一致するようになります。今後、郵便番号を含んだ新しいデータセットをインポートすると、適切なタイプと自動的に一致するようになります。