カラム内の異常の検出(機能的な依存性の分析) - 7.1

Talend Real-time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Real-Time Big Data Platform
task
ジョブデザインと開発
EnrichPlatform
Talend Studio

この分析タイプでは、カラムを"決定要素"または"依存"として定義し、依存カラムにある値を決定要素カラムと対比して分析することで、カラムの依存性に存在する異常を検出できます。この分析はデータベーステーブルにのみ対応しています。

この分析タイプでは、決定要素カラムの値が依存カラムにある他の値を関数で決定する程度を検出します。

それによって、データ内の問題(有効でない値など)を特定できるようになります。たとえば、米国のZIPコードを含んでいるカラムと、米国の州を含んでいるカラムの間にある依存性を分析する場合、同じZIPコードは常に州が同じであることが必要です。この2つのカラムに関数従属性分析を実行すると、この関数依存性で違反が存在するかどうかが表示されます。