重複値の分析 - 7.3

Talend Big Data Platform Studio ユーザーガイド

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発

Talend Studio Profiling パースペクティブで一致分析を使用して、データベースまたは区切り記号付きファイルのカラムを比較し、VSRまたはT-Swooshアルゴリズムを使って類似レコードのグループを作成できます。

この分析を使うと、シンプルな方法でマッチングルールを作成してカラムのセットでテストでき、結果をエディターに直接表示できます。データでマッチングルールをテストした後は、エディターからエクスポートしてStudioリポジトリーに保存し、tMatchGrouptRecordMatchingtGenkey、Hadoopなどの一致コンポーネントにインポートして後から使用できます。

また、 Profiling パースペクティブを使い、マッチングルールエディターでマッチングルールを定義してTalend Studioリポジトリーに保存することもできます。