データクラス、データプロファイリング、サンプリングを使って、anonymized_ordersデータベーステーブルでメタデータを分類します。
始める前に
- tdc_gsg_sources_files\use-case-2-using_and_contributing\repo_backup.zipプロジェクトのバックアップを復元し、設定を切り替え済みであること。 詳細は、リポジトリーでのプロジェクトバックアップの復元をご覧ください。
- メタデータのインポート中にデータのサンプリングとデータプロファイリングが有効になっており、設定済みであること。データサンプリングとデータプロファイリングは、データ分類の自動タグ付けを実行するために必要です。
-
[Metadata Viewing] (メタデータの表示)機能と[Data Viewing] (データの表示)機能を持つオブジェクトロールが割り当てられていること。
-
[Data Classification Editing] (データ分類の編集)機能を持つオブジェクトロールが割り当てられていること。
手順
-
検索バーにanonymized_orders tableと入力します。
-
anonymized_ordersをクリックしてそのオブジェクトページにアクセスし、[Columns] (カラム)タブを開きます。
-
ツールバーで[Columns] (カラム)をクリックし、表示モードに[Grid] (グリッド)を選択します。
-
[Available columns] (利用可能なカラム)から[Selected columns] (選択したカラム)にData Classificationsカラムをドラッグ&ドロップし、[Grid] (グリッド)ビューに表示させます。
Talend Cloud Data Catalogはタグを既に提案しています。青い点線のタグは非承認で、青い基本線のタグは承認となります。
-
email_addressの提案されたデータクラスを承認する前に、email_addressというカラム名をクリックしてオブジェクトページを開き、このデータに関する統計とその他の情報を参照します。
[Overview] (概要)タブにデータプロファイル情報が表示されます。
-
anonymized_ordersテーブルページに戻り、[Data Sample] (データサンプル)タブをクリックして、サンプルデータをプレビューします。このタブには、データセットから抽出されたサンプル行が表示されます。
-
[Columns] (カラム)タブに戻り、チェックアイコンをクリックして、email_addressのEmailというデータクラスを承認します。
タスクの結果
エンタープライズボキャブラリーをドキュメント化するための用語集を実装する準備が整いました。