重複値の分析 - Cloud

Talend Cloud API Services Platform Studio ユーザーガイド

Version
Cloud
Language
日本語 (日本)
EnrichDitaval
API Services Platform
Product
Talend Cloud
Module
Talend Studio
Content
ジョブデザインと開発

Talend Studio Profiling パースペクティブで一致分析を使用して、データベースまたは区切り付きファイルのカラムを比較し、VSRまたはT-Swooshアルゴリズムを使って類似レコードのグループを作成できます。

この分析を使うと、シンプルな方法でマッチングルールを作成してカラムのセットでテストでき、結果をエディターに直接表示できます。データでマッチングルールをテストした後は、エディターからエクスポートしてStudioリポジトリーに保存し、tMatchGrouptRecordMatchingtGenkey、Hadoopなどの一致コンポーネントにインポートして後から使用できます。

また、 Profiling パースペクティブを使い、マッチングルールエディターでマッチングルールを定義してTalend Studioリポジトリーに保存することもできます。