tUniservRTMailSearch - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tUniservRTMailSearch

Famille de composant

Data Quality

 

Fonction

Le composant tUniservRTMailSearch recherche des données similaires dans l'enregistrement d'entrée donné.

Objectif

Le tUniservRTMailSearch cherche les valeurs dupliquées et ajoute de nouvelles données à chaque enregistrement.

Basic settings

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

Host name

Nom de l'hôte du serveur, entre guillemets doubles.

 

Port

Numéro du port d'écoute du serveur, entre guillemets doubles.

 

Service

Le nom du service est "mail" par défaut. Saisissez une nouveau nom si nécessaire (si le suffixe du service change, par exemple), entre guillemets doubles.

 

Maximum of displayed duplicates (0 = All)

Saisissez le nombre maximum de doublons à afficher dans la vue Run. La valeur par défaut est 0, ce qui signifie que tous les doublons sont affichés. Mille doublons peuvent être affichés au maximum.

 

Use rejects

Cochez cette case pour paramétrer les options définissant les enregistrements de doublons ajouter au flux de rejet. Définissez :

Element : Compte des doublons.

Operator : <, <=, =, >=, >.

Value : Saisissez la valeur manuellement..

Advanced settings

Uniserv Parameters

Pour plus d'informations, veuillez consulter le manuel utilisateur Uniserv mailRetrieval.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du Job et de chaque composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Le tUniservRTMailSearch requiert un composant d'entrée et un ou plusieurs composant(s) de sortie.

Limitation

Pour utiliser le composant tUniservRTMailSearch, le logiciel Uniserv mailRetrieval doit être installé.

Note

Avant d'utiliser le tUniservRTMailSearch, un pool d'index doit être créé. Vous pouvez créer un pool d'index grâce au composant tUniservRTMailBulk.

Scénario : Ajouter des contacts au pool d'index de mailRetrieval

Ce scénario décrit un Job qui ajoute des contacts à un pool d'index de mailRetrieval. Vous devez au préalable vous assurer que ces contacts existent déjà.

Le fichier d'entrée de ce scénario est sauvegardé dans le Repository, ce qui rend disponible le schéma des métadonnées.

Note

Les données de la source d'entrée doivent provenir du même pays.

Déposer et relier les composants

  1. Dans la vue Repository, développez le nœud Metadata et le répertoire dans lequel le fichier est sauvegardé. Glissez ce fichier dans l'espace de modélisation graphique.

    La boîte de dialogue suivante apparaît :

  2. Sélectionnez tFileInputDelimited et cliquez sur OK pour fermer la boîte de dialogue.

    Le composant s'affiche dans l'espace de modélisation graphique.

  3. Glissez les composants suivants de la Palette dans l'espace de modélisation graphique : deux composants tMap, un tUniservRTMailSearch et un tUniservRTMailOutput.

  4. Connectez le tMap au tUniservRTMailSearch à l'aide d'un lien Row > Main.

    Acceptez le schéma du tUniservRTMailSearch en cliquant sur Yes dans la fenêtre de propagation.

  5. Connectez les autres composants à l'aide de liens Row > Main.

Configurer les composants

  1. Double-cliquez sur le composant tMap_1 pour ouvrir la fenêtre de mapping de son schéma. Sur la gauche se trouve la structure du fichier d'entrée et sur la droite le schéma du tUniservRTMailSearch. En bas se trouve le Schema Editor, où vous pouvez trouver et éditer les attributs de chaque colonne.

  2. Mappez les colonnes du fichier d'entrée à leurs colonnes respectives dans le tUniservRTMailSearch. Pour ce faire, sélectionnez une colonne de la source d'entrée et glissez-la sur la colonne appropriée du côté droit.

  3. Quand une liste d'entrée contient un ID de référence, il est conseillé de l'accepter. Pour ce faire, créez une nouvelle colonne appelée IN_DBREF depuis le Schema Editor et connectez-la à votre ID de référence.

    Cliquez sur OK pour fermer la fenêtre.

  4. Double-cliquez sur le composant tUniservRTMailSearch pour ouvrir sa vue Basic settings.

  5. Dans la case Maximum of displayed "duplicates", saisissez 0 pour afficher tous les doublons.

    Sélectionnez Define rejects pour ouvrir la fenêtre de définition des rejets.

  6. Cliquez sur le bouton [+] pour insérer une ligne dans la fenêtre. Sélectionnez Duplicate count dans la colonne Elements, > dans la colonne Operator et 0 dans la colonne Value. De cette façon, tous les contacts existants sont écartés et seuls les nouveaux contacts sont ajoutés au pool d'index.

  7. Cliquez sur l'onglet Advanced settings et vérifiez les paramètres. Des paramètres par défaut ont été définis. Référez-vous au manuel de mailRetrieval pour plus de précisions.

  8. Double-cliquez sur le second composant tMap pour ouvrir la fenêtre de mapping de son schéma. Sur la gauche se trouve le schéma du tUniservRTMailSearch et sur la droite celui du tUniservRTMailOutput.

  9. Cliquez sur Auto map! pour mapper les champs automatiquement.

  10. Le seul champ devant être mappé manuellement est l'ID de référence. Pour ce faire, glissez OUT-DBREF vers le champ IN_DBREF du côté droit.

    Cliquez sur OK pour fermer la boîte de dialogue.

  11. Double-cliquez sur le composant tUniservRTMailOutput pour afficher sa vue Basic settings.

  12. Dans la liste Action on Data, sélectionnez Insert or update pour que tous les nouveaux contacts soient ajoutés au pool d'index.