重複値の分析 - Cloud - 7.3

Talend Studioユーザーガイド

Version
Cloud
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発
Last publication date
2024-02-13
対象製品...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Talend StudioProfilingパースペクティブで一致分析を使用して、データベースまたは区切り付きファイルのカラムを比較し、VSRまたはT-Swooshアルゴリズムを使って類似レコードのグループを作成できます。

この分析を使うと、シンプルな方法でマッチングルールを作成してカラムのセットでテストでき、結果をエディターに直接表示できます。データでマッチングルールのテストが終わったら、エディターからエクスポートしてStudioリポジトリーに保存し、tMatchGrouptRecordMatchingtGenkey、Hadoopなどの一致コンポーネントにインポートすれば、後で使用できるようになります。

また、Profilingパースペクティブを使い、マッチングルールエディターでマッチングルールを定義してTalend Studioリポジトリーに保存することもできます。