Talend Trust Score - Cloud

Snowflake版Talend Cloud Data Inventory入門ガイド

EnrichVersion
Cloud
EnrichPlatform
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
task
データガバナンス

Talend Trust Scoreによって、「自分のデータセットの信頼度は?」といった質問に回答しやすくなります。

データセットの概要のTalend Trust Scoreタイルは、データセットのTrust Scoreを増減させうるさまざまな要因を視覚的に表現したものです。その要因は次の主要な5つの軸にグループ化されます。

  • [Validity] (妥当性): データセットサンプル全体における有効値と無効値の数、セマンティックタイプの使用などと共にデータセット自体のクオリティを考慮します。
  • [Completeness] (完全性): サンプル内にある空のレコードの数に依存します。
  • [Popularity] (人気度): ユーザーの評価や認証レベルによってデータセットの信頼度を把握できます。
  • [Discoverability] (検索性): 記述、タグ、カスタム属性といった適切なメタデータを使うことで、データセットがドキュメント化されているかが反映されます。ドキュメント化されたデータセットほど見つけやすくなります。
  • [Usage] (使用): データセットがパイプラインやプレパレーションのソースとしてどの程度使われているかがわかります。

自分のデータセットに何が欠けているのかが一目でわかるため、より良いスコアが得られます。軸名をクリックするか矢印を使ってナビゲートすると、その軸に対応するメトリクスの説明とスコアの改善方法が表示されます。

Talend Trust Scoreは、これらのパラメーターに影響を与えるアクションが実行されるたびに更新されます。データセットのTalend Trust Scoreは、Talend Cloud Data PreparationやTalend Cloud Pipeline Designerを使ってデータ自体のクオリティに取り組んだり、Talend Cloud Data Inventoryのソーシャル機能を介して向上させることができます。

この専用タイルだけでなく、Talend Trust Scoreはデータセットリストやデータセット詳細ビューのサブヘッダーにも表示されます。