重複値の分析 - Cloud

Talend Cloud Real-Time Big Data Platform Studioユーザーガイド

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
ジョブデザインと開発
EnrichPlatform
Talend Management Console
Talend Studio

Talend StudioProfilingパースペクティブでマッチング分析を使用して、データベースまたは区切り記号付きファイルのカラムを比較し、VSRまたはT-Swooshアルゴリズムを使って類似レコードのグループを作成することができます。

この分析を使うと、シンプルな方法で一致ルールを作成してカラムのセットでテストでき、結果をエディターに直接表示できます。データで一致ルールをテストした後は、エディターからエクスポートしてStudioリポジトリーに保存し、tMatchGrouptRecordMatchingtGenkey、Hadoopなどの一致コンポーネントにインポートして後から使用できます

また、Profilingパースペクティブを使い、一致ルールエディターで一致ルールを定義してTalend Studioリポジトリーに保存することもできます。詳細は、一致ルールの作成を参照して下さい。