データクオリティコンポーネントの中には、データベースのカラムを分析し、マッチングルールや比較アルゴリズムを使用して、重複をグルーピングするか、値を照合できるコンポーネントがあります。コンポーネントの例としては、tMatchGroup、tMatchGroupHadoop、tRecordMatching、tGenKey、tSurviveField、tRuleSurvivorshipがあります。
存続ルールパッケージの管理の詳細は、サバイバーシップルールパッケージを管理をご覧ください。
重複除去コンポーネントの詳細とサンプルジョブについては、Talendコンポーネントリファレンスガイドおよび区切り付きファイル(csvファイル)のクレンジングをご覧ください。
データクオリティのデモプロジェクトにも、重複除去コンポーネントを使用できる既製ジョブがあります。詳細は、データクオリティデモプロジェクトをインポートをご覧ください。