Définir une clé de rapprochement avec l'algorithme VSR - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Procédure

  1. Dans la zone Record linkage algorithm, sélectionnez Simple VSR Matcher s'il n'est pas sélectionné par défaut.
  2. Dans la zone Data, cliquez sur l'onglet Select Matching Key puis sur le nom de la colonnes/des colonnes sur lesquelles appliquer les algorithmes de rapprochement.
    Les clés de rapprochement ayant le nom exact des colonnes d'entrée sélectionnées sont listées dans la table Matching Key.
    Pour supprimer une colonne de la table, cliquez-droit dessus et sélectionnez Delete ou cliquez sur son nom dans la table Data.
  3. Sélectionnez les algorithmes de rapprochement à utiliser dans la colonne Matching Function et l'opérateur null dans la colonne Handle Null.
    Utilisez les méthodes de rapprochement Levenshtein et Jaro-Winkler sur les prénoms et noms de famille, respectivement et récupérez les enregistrements en doublon.
    Si vous souhaitez utiliser un algorithme de rapprochement externe personnalisé, sélectionnez Custom (Personnalisé) et utilisez la colonne Custom Matcher pour charger le fichier JAR de l'algorithme personnalisé.