重複除去コンポーネントの使用 - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発

データクオリティコンポーネントの中には、データベースのカラムを分析し、マッチングルールや比較アルゴリズムを使用して、重複をグループ化するか、値を照合できるコンポーネントがあります。コンポーネントの例としては、tMatchGrouptMatchGroupHadooptRecordMatchingtGenKeytSurviveFieldtRuleSurvivorshipがあります。

存続ルールパッケージの管理の詳細は、サバイバーシップルールパッケージの管理を参照してください。

重複除去コンポーネントの詳細とサンプルジョブについては、『Talendコンポーネントリファレンスガイド』および区切り記号付きファイル(csvファイル)のクレンジングを参照してください。

データクオリティのデモプロジェクトにも、重複除去コンポーネントを使用できる既製ジョブがあります。詳細は、データクオリティデモプロジェクトのインポートを参照してください。