Talend Trust Scoreを確認 - Cloud

Talend Cloud Data Inventory入門ガイド

Version
Cloud
Language
日本語
Product
Talend Cloud
Module
Talend Data Inventory
Content
データガバナンス
データクオリティとプレパレーション > データの充実化
データクオリティとプレパレーション > データの識別
管理と監視 > 接続の管理
Last publication date
2024-03-21

Talend Trust Scoreによって、「自分のデータセットの信頼度は?」といった質問に回答しやすくなります。

注: Talend Trust Scoreをチェックするためには、Remote Engineをバージョン2022-02以降にアップグレードしてください。

データセットの概要Talend Trust Scoreタイルは、データセットのTalend Trust Scoreを増減させうるさまざまな要因を視覚的に表現したものです。これらは5つのメイン軸に分類できます:

  • [Validity] (妥当性): データセット全体における有効な値と無効な値の数、セマンティックタイプの使用などと共にデータセット自体のクオリティを考慮します。
  • [Completeness] (完全性): サンプル内にある空のレコードの数に依存します。
  • [Popularity] (人気度): ユーザーの評価や認証レベルによってデータセットの信頼度を把握できます。
  • [Discoverability] (検索性): 適切なメタデータ(説明、タグ、カスタム属性など)の使用によってデータセットがどの程度ドキュメント化されているかが反映されます。ドキュメント化されたデータセットほど見つけやすくなります。
  • [Usage] (使用状況): データセットがパイプラインやプレパレーションのソースとしてどの程度使われているかがわかります。
Talend Trust Scoreタイル(データセットの概要から)。

自分のデータセットに何が欠けているのかが一目でわかるため、さらに高いスコアが得られます。軸名をクリックするか、矢印を使って移動し、軸に焦点を当てて、対応するメトリクスの説明とスコアの改善方法を表示させます。

Talend Trust Scoreは、これらのパラメーターに影響を与えるアクションが実行されるたびにアップデートされます。Talend Cloud Data PreparationまたはTalend Cloud Pipeline Designerを使ってデータ自体のクオリティに取り組んだり、Talend Cloud Data Inventoryのソーシャル機能を使ってデータセットのTalend Trust Scoreを改善したりできます。

この専用タイルに加えて、Talend Trust Scoreはデータセットリストやデータセット詳細ビューのサブヘッダーにも見つかります。

Talend Trust Score (データセットリストから)。