データクラスでカラムに自動タグ付け - 8.0

Talend Data Catalog入門ガイド

Version
8.0
Language
日本語
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Catalog
Content
データガバナンス
Last publication date
2024-01-12

データクラス、データプロファイリング、サンプリングを使って、anonymized_ordersデータベーステーブルでメタデータを分類します。

始める前に

  • tdc_gsg_sources_files\use-case-2-using_and_contributing\repo_backup.zipプロジェクトのバックアップを復元し、設定を切り替え済みであること。 詳細は、リポジトリーでのプロジェクトバックアップの復元をご覧ください。
  • メタデータのインポート中にデータのサンプリングとデータプロファイリングが有効になっており、設定済みであること。データサンプリングとデータプロファイリングは、データ分類の自動タグ付けを実行するために必要です。
  • [Metadata Viewing] (メタデータの表示)機能と[Data Viewing] (データの表示)機能を持つオブジェクトロールが割り当てられていること。
  • [Data Classification Editing] (データ分類の編集)機能を持つオブジェクトロールが割り当てられていること。

手順

  1. 検索バーにanonymized_orders tableと入力します。
  2. anonymized_ordersをクリックしてそのオブジェクトページにアクセスし、[Columns] (カラム)タブを開きます。
  3. ツールバーで[Columns] (カラム)をクリックし、表示モードに[Grid] (グリッド)を選択します。
  4. [Available columns] (利用可能なカラム)から[Selected columns] (選択したカラム)Data Classificationsカラムをドラッグ&ドロップし、[Grid] (グリッド)ビューに表示させます。
    Talend Data Catalogはタグを既に提案しています。青い点線のタグは非承認で、青い基本線のタグは承認となります。
  5. email_addressの提案されたデータクラスを承認する前に、email_addressというカラム名をクリックしてオブジェクトページを開き、このデータに関する統計とその他の情報を参照します。
    [Overview] (概要)タブにデータプロファイル情報が表示されます。
  6. anonymized_ordersテーブルページに戻り、[Data Sample] (データサンプル)タブをクリックして、サンプルデータをプレビューします。このタブには、データセットから抽出されたサンプル行が表示されます。
  7. [Columns] (カラム)タブに戻り、チェックアイコンをクリックして、email_addressEmailというデータクラスを承認します。

タスクの結果

エンタープライズボキャブラリーをドキュメント化するための用語集を実装する準備が整いました。