データクラスを割り当て - Cloud

Talend Cloud Data Catalogユーザーガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Catalog
Content
データガバナンス
Last publication date
2023-11-13

データ分類は、カタログにインポートされたデータソースに含まれているエレメントの性質と目的を検出、理解、分類するのに役立ちます。

データクラスを割り当てることで、同じデータクラスを持つオブジェクトを分類して操作できるようになります。

Talend Cloud Data Catalogでは、データクラスの種類がいくつか提供されています。
  • データ検出クラスは、事前定義済みの列挙、パターン、正規表現に基づいてデータの性質を自動的に検出します。データ検出分類では、データサンプリングとデータプロファイリングの機能を使います。
  • メタデータ検出クラスはメタデータ属性でクラスを検出します。データ検出分類では特定できないデータ(一意なデータパターンを持たない生年月日など)を検出するのに役立ちます。メタデータ検出分類では、MQL機能が活用されています。
  • 複合クラスは、複数のメタデータ検出クラスおよびデータ検出クラスに基づいています。
データベース内のカラムやファイル内のフィールドなどのオブジェクトには、データクラスを使って手動でタグ付けできます。Talend Cloud Data Catalogはデータクラスの割り当てを提案することもできます。

始める前に

  • [Data Classification Editing] (データ分類の編集)機能を持つオブジェクトロールが割り当てられていること。
  • オプションとして、メタデータのインポート中にデータのサンプリングとプロファイリングが有効になっており、設定済みであること。

手順

  1. オブジェクトのホームページに移動します。
  2. [Fields] (フィールド)タブでフィールドを選択するか、[Columns] (カラム)タブでカラムを選択し、ホームページを開きます。
  3. [Data Classifications] (データ分類)エリアで、ドロップダウンリストからデータクラスを選択します。
    Talend Cloud Data Catalogは、データクラスを自動的に提案します。提案を受け入れる場合はチェックマークを、拒否する場合はX印をそれぞれクリックします。
  4. [Commit changes] (変更をコミット)ボタンをクリックして変更を保存します。