Définir une clé de rapprochement avec l'algorithme VSR - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-04-16
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Procédure

  1. Dans la section Record linkage algorithm (Algorithme de rapprochement d'enregistrements), sélectionnez Simple VSR Matcher s'il n'est pas sélectionné par défaut.
  2. Dans la section Data (Données), cliquez sur l'onglet Select Matching Key (Sélectionner la clé de rapprochement) et cliquez sur le nom des colonnes sur lesquelles appliquer l'algorithme de rapprochement.
    Les clés de rapprochement ayant le nom exact des colonnes d'entrée sélectionnées sont listées dans la table Matching Key.
    Exemples de clés de rapprochement et de leurs paramètres dans la section Matching Key (Clé de rapprochement).
    Pour supprimer une colonne de la table, cliquez-droit dessus et sélectionnez Delete ou cliquez sur son nom dans la table Data.
  3. Sélectionnez les algorithmes de rapprochement à utiliser dans la colonne Matching Function et l'opérateur null dans la colonne Handle Null.
    Utilisez les méthodes de rapprochement Levenshtein et Jaro-Winkler sur les prénoms et noms de famille, respectivement et récupérez les enregistrements en doublon.
    Si vous souhaitez utiliser un algorithme de rapprochement externe personnalisé, sélectionnez Custom (Personnalisé) et utilisez la colonne Custom Matcher pour charger le fichier JAR de l'algorithme personnalisé.