メイン コンテンツをスキップする

重複値の分析

Talend Studio剖析パースペクティブで一致分析を使用して、データベースまたは区切り付きファイルのカラムを比較し、VSRまたはT-Swooshアルゴリズムを使って類似レコードのグループを作成できます。

この分析を使うと、シンプルな方法でマッチングルールを作成してカラムのセットでテストでき、結果をエディターに直接表示できます。データでマッチングルールのテストが終わったら、エディターからエクスポートしてTalend Studioリポジトリーに保存し、tMatchGrouptRecordMatchingtGenKey、Hadoopなどの一致コンポーネントにインポートすれば、後で使用できるようになります。

また、剖析パースペクティブを使い、マッチングルールエディターでマッチングルールを定義してTalend Studioリポジトリーに保存することもできます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。