Talend Cloud Data Catalogの概念 - Cloud

Talend Cloud Data Catalog入門ガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
データガバナンス
EnrichPlatform
Talend Data Catalog
これらの定義について学習すると、Talend Cloud Data Catalogの主な概念が理解しやすくなります。
  • カタログ

    カタログとは、データ資産(データベーステーブル、Data Integrationジョブ、BIレポートなど)のインベントリーのことです。

  • メタデータ

    メタデータとは、名前、タイプ、ロケーション、作成者、作成日、サイズ、他のデータオブジェクトとの関係など、データリソースを説明する構造化情報のことです。

  • メタデータリポジトリー

    メタデータリポジトリーには、データソース、プロジェクト設定、レポートから作成またはインポートされたメタデータが保管されます。

  • メタデータの収集

    メタデータの収集とは、Talend Cloud Data Catalogのブリッジを使ってデータソースからメタデータを収集することです。メタデータはモデル内にインポートされ、メタデータリポジトリーに保管されます。

  • ブリッジ

    ブリッジとはプラットフォーム専用のコネクターのことです。特定のドライバーを使ってソースツールに接続し、メタデータを収集します。

    メタデータは、データストア、Data Integrationツール、ビジネスインテリジェンスツール、ビジネスアプリケーションからインポートできます。

  • ステッチ化

    モデルが作成されると、設定内で互いにリンクされ、情報システム内でデータフローが定義されます。

  • 設定

    設定とは、エンタープライズ情報システムのグローバルスキーマをビルドするためにモデルを相互に接続する環境またはワークスペースのことです。

  • 用語集

    用語集は、誰もが把握できる共通言語を構築するために、エンタープライズボキャブラリをキャプチャーして定義します。

  • データプロファイリング

    データプロファイリングとは、使用するカタログにインポートされたデータソースのデータを検証し、このデータに関する統計と情報を収集するプロセスのことです。

  • データサンプリング

    データサンプリングによって、使用するカタログにインポートされたデータベーステーブルやデータファイルのコンテンツをプレビューできるようになります。

  • セマンティックタイプ

    セマンティックタイプは、エレメントの構造または可能な値を定義します。

    データプロファイリングとメタデータの収集プロセス中に、Talend Cloud Data Catalogはデータ値をその辞書内で利用できるセマンティックタイプと比較します。マッチングがある場合は、セマンティックタイプが自動的に割り当てられます。