重複値の分析
Talend Studioの剖析パースペクティブで一致分析を使用して、データベースまたは区切り付きファイルのカラムを比較し、VSRまたはT-Swooshアルゴリズムを使って類似レコードのグループを作成できます。
この分析を使うと、シンプルな方法でマッチングルールを作成してカラムのセットでテストでき、結果をエディターに直接表示できます。データでマッチングルールのテストが終わったら、エディターからエクスポートしてTalend Studioリポジトリーに保存し、tMatchGroup、tRecordMatching、tGenKey、Hadoopなどの一致コンポーネントにインポートすれば、後で使用できるようになります。
また、剖析パースペクティブを使い、マッチングルールエディターでマッチングルールを定義してTalend Studioリポジトリーに保存することもできます。
このページは役に立ちましたか?
このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。