重複除去コンポーネントの使用 - 7.3

Talend Data Fabric Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
EnrichDitaval
Data Fabric
Product
Talend Data Fabric
Module
Talend Studio
Content
ジョブデザインと開発

データクオリティコンポーネントの中には、データベースのカラムを分析し、マッチングルールや比較アルゴリズムを使用して、重複をグルーピングするか、値を照合できるコンポーネントがあります。コンポーネントの例としては、tMatchGrouptMatchGroupHadooptRecordMatchingtGenKeytSurviveFieldtRuleSurvivorshipがあります。

存続ルールパッケージの管理の詳細は、サバイバーシップルールパッケージを管理をご覧ください。

重複除去コンポーネントの詳細とサンプルジョブについては、Talendコンポーネントリファレンスガイドおよび区切り付きファイル(csvファイル)のクレンジングをご覧ください。

データクオリティのデモプロジェクトにも、重複除去コンポーネントを使用できる既製ジョブがあります。詳細は、データクオリティデモプロジェクトをインポートをご覧ください。