Analyse de doublons - 6.1

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend Real-Time Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Vous pouvez utiliser un éditeur d'analyse de correspondance dans la perspective Profiling du studio afin de comparer des colonnes dans des bases de données ou des fichiers délimités et de créer des groupes d'enregistrements similaires à l'aide de l'algorithme VSR ou T-Swoosh.

Cet éditeur vous fournit un moyen simple de créer des règles de mise en correspondance, de les tester sur un ensemble de colonnes et de voir les résultats directement dans l'éditeur. Après avoir testé vos règles de correspondance sur les données, vous pouvez les exporter à partir de l'éditeur et les sauvegarder dans le référentiel du studio, afin de les importer et les utiliser ultérieurement dans les composants de mise en correspondance, comme les composants de mise en correspondance, notamment le tMatchGroup, le tRecordMatching, le tGenKey et les composants Hadoop de mise en correspondance, par exemple.

Vous pouvez également utiliser la perspective Profiling afin de définir des règles de mise en correspondance dans l'éditeur de règles et les sauvegarder dans le référentiel du studio. Pour plus d'informations, consultez Créer une règle de mise en correspondance.