重複コンポーネントの使用 - 7.0

データクレンジング

EnrichVersion
7.0
EnrichProdName
Talend Data Fabric
EnrichPlatform
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Talend Studio
task
インストールとアップグレード
ジョブデザインと開発
データクオリティとプレパレーション > データクレンジング
データクオリティとプレパレーション > データプロファイリング

データクオリティコンポーネントの中には、データベースのカラムを分析し、マッチングルールや比較アルゴリズムを使用して、重複をグループ化するか、値を照合することができるコンポーネントがあります。たとえば、tMatchGrouptMatchGroupHadooptRecordMatchingtGenKeytSurviveFieldtRuleSurvivorshipコンポーネントなどです。

存続ルールパッケージの管理の詳細は、サバイバーシップルールパッケージの管理を参照して下さい。

重複コンポーネントの詳細とサンプルジョブについては、『Talend Components Reference Guide』および区切り記号付きファイル(csvファイル)のクレンジングを参照して下さい。

注: データクオリティのデモプロジェクトにも、重複コンポーネントを使用できる既製ジョブがあります。詳細は、データクオリティデモプロジェクトのインポートを参照して下さい。