重複除去コンポーネントの使用 - Cloud

Talend Cloud API Services Platform Studio ユーザーガイド

Version
Cloud
Language
日本語 (日本)
EnrichDitaval
API Services Platform
Product
Talend Cloud
Module
Talend Studio
Content
ジョブデザインと開発

データクオリティコンポーネントの中には、データベースのカラムを分析し、マッチングルールや比較アルゴリズムを使用して、重複をグルーピングするか、値を照合できるコンポーネントがあります。コンポーネントの例としては、tMatchGrouptMatchGroupHadooptRecordMatchingtGenKeytSurviveFieldtRuleSurvivorshipがあります。

存続ルールパッケージの管理の詳細は、サバイバーシップルールパッケージを管理をご覧ください。

重複除去コンポーネントの詳細とサンプルジョブについては、Talendコンポーネントリファレンスガイドおよび区切り付きファイル(csvファイル)のクレンジングをご覧ください。

データクオリティのデモプロジェクトにも、重複除去コンポーネントを使用できる既製ジョブがあります。詳細は、データクオリティデモプロジェクトをインポートをご覧ください。