Scénario 2 : Utiliser un algorithme de mise en correspondance personnalisé pour faire correspondre des entrées - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Dans ce scénario, réutilisez le Job précédent afin de charger et d'appliquer un algorithme de correspondance personnalisé.

Comme prérequis, suivez les étapes décrites dans Créer un algorithme de correspondance personnalisé afin d'écrire une algorithme personnalisé et le stocker dans un fichier .jar (archive Java). Le fichier mydistance.jar est utilisé ici pour fournir l'algorithme personnalisé de mise en correspondance, MyDistance.class.

Vous devez également utiliser le composant tLibraryLoad pour importer la bibliothèque Java dans le Job.

Construire le Job

  1. Dans le Job précédent, déposez un composant tLibraryLoad de la Palette dans l'espace de modélisation graphique.

  2. Supprimez les composants tLogRow nommés possible et none.

  3. Cliquez-droit sur le tLibraryLoad afin d'ouvrir son menu contextuel. Dans ce menu, sélectionnez Trigger > On Subjob Ok afin de le relier au composant tMysqlInput (person).

Configurer les composants

  1. Double-cliquez sur le tLibraryLoad pour ouvrir sa vue Component.

  2. A côté du champ Library, cliquez sur le bouton [...] et parcourez votre système jusqu'au fichier mydistance.jar.

  3. Cliquez sur Windows > Show view... pour ouvrir la vue Modules.

  4. Dans la vue Modules, cliquez sur le bouton . Dans la boîte de dialogue qui s'ouvre, parcourez votre système jusqu'au fichier personnalisé mydistance.jar, créé pour ce Job.

  5. Cliquez sur Open.

    Le fichier .jar personnalisé est importé et listé dans la vue Modules.

    Un message d'erreur s'affiche si vous essayez d'exécuter le Job sans avoir installé le fichier .jar externe personnalisé.

  6. Double-cliquez sur le tRecordMatching pour ouvrir sa vue Component.

  7. Dans le tableau Key Definition, cliquez sur la ligne name de la colonne Matching Type et sélectionnez custom... dans la liste déroulante.

  8. Dans la colonne Custom matcher class de la ligne name, saisissez le chemin d'accès pointant vers MyDistance.class dans le fichier mydistance.jar. Dans cet exemple, ce chemin d'accès est org.talend.mydistance.MyDistance.

    Note

    Lorsque vous sélectionnez une colonne de dates sur laquelle appliquer un algorithme ou un algorithme de mise en correspondance, vous pouvez choisir ce que vous souhaitez comparer dans le format de date.

    Par exemple, si vous souhaitez comparer uniquement l'année, attribuez le type Date à la colonne concernée dans le schéma du composant puis saisissez "yyyy" dans le champ Date Pattern. Le composant convertit le format de date en une chaîne de caractères, selon le modèle défini dans le schéma, avant de comparer les chaînes de caractères.

Exécuter le Job

  • Appuyez sur F6 pour exécuter le Job.

    Dans la vue Run, les entrées en correspondance sont identifiées et affichées comme suit :