tMDMDelete - 6.3

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Fonction

Le composant tMDMDelete supprime des enregistrements de données d'entités spécifiques du hub MDM.

Objectif

Ce composant efface des données maître du hub MDM.

Propriétés du tMDMDelete

Famille du composant

Talend MDM

 

Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Cliquez sur le bouton Sync columns afin de récupérer le schéma du composant précédent.

 

 

Built-in : Le schéma sera créé et conservé pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs. Voir également le Guide utilisateur du Studio Talend.

 

Use an existing connection

Cochez cette case et sélectionnez le composant tMDMConnection adéquat à partir de la liste Component pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

 

MDM version

Par défaut, l'option Server 6.0 est sélectionnée. Bien qu'il soit recommandé de migrer les Jobs existants vers cette nouvelle version, l'option Server 5.6 est disponible pour faciliter le processus de migration de vos Jobs, afin qu'ils continuent à fonctionner avec un serveur 6.0 sans modification. Pour ce faire, une option sur le serveur doit être activée pour accepter et traduire les requêtes de ces Jobs.

 

URL

Saisissez l'URL d'accès au serveur MDM.

 

Username et Password

Informations d'authentification de l'utilisateur du serveur MDM.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

 

Entity

Saisissez le nom de l'entité contenant les données que vous souhaitez effacer.

 

Data Container

Saisissez le nom du conteneur de données contenant les données que vous souhaitez effacer.

Type

Sélectionnez Master ou Staging pour spécifier sur quelle base de données effectuer l'action.

Use multiple conditions

Cochez cette case afin de filtrer les données maître à supprimer, en respectant certaines conditions.

Xpath : Saisissez entre guillemets le chemin d'accès et le nœud XML auquel vous souhaitez appliquer la condition.

Function : Sélectionnez dans la liste la condition à utiliser.

Value : Saisissez entre guillemets la valeur à utiliser.

Predicate : Sélectionnez un prédicat si vous utilisez plus d'une condition.

Pour plus d'informations concernant les opérateurs et les prédicats, consultez Propriétés du tMDMInput.

 

Keys (in sequence order)

Spécifiez le(s) champ(s) (dans l'ordre de la séquence) composant la clé lorsque l'entité possède une clé multiple.

 

Fire Delete event

Note

Cette case est disponible uniquement si vous sélectionnez l'option Master dans la liste Type.

Cochez cette case pour qu'un événement Delete soit généré et écrit dans le rapport UpdateReport, qui fournit un rapport complet sur toutes les actions de création, de mise à jour ou de suppression dans les données maître.

  • Source Name : saisissez, entre guillemets, le nom de la source générant l'événement de suppression.

  • Invoke before deleting process : cochez cette case pour permettre l'exécution d'un Processus Before Deleting pour vérifier l'événement Delete.

Pour plus d'informations concernant les rapports UpdateReport et les types de Processus, consultez le Guide utilisateur du Studio Talend.

 

Logical delete

Cochez cette case afin d'envoyer les données maître dans la Corbeille, et renseignez le chemin d'accès à la Corbeille (Recycle bin path). Une fois dans la Corbeille, les données maître peuvent être supprimées définitivement ou restaurées. Si vous laissez la case décochée, les données maître seront supprimées définitivement.

 

Die on error

Cochez cette case pour passer la ligne en erreur et terminer le processus afin d'obtenir des lignes ne contenant aucune erreur. Si nécessaire, vous pouvez récupérer les lignes en erreur en utilisant un lien de type Row > Rejects.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Si la case Use multiple conditions est cochée, le tMDMDelete peut fonctionner en standalone. Sinon, il requiert un lien d'entrée.

Scénario : Supprimer des données maître d'un hub MDM

Ce scénario décrit un Job à six composants qui supprime un enregistrement de données spécifié du référentiel XML MDM. Il utilise les composants tMDMCommit et tMDMRollback afin de ne propager les modifications à la base de données uniquement lorsque le Job est correctement exécuté.

Déposer et relier les composants

  1. Déposez un composant tMDMConnection, un tMDMCommit, un tMDMClose, un tMDMInput, un tMDMDelete et un tMDMRollback de la famille Talend MDM de la Palette dans l'espace de modélisation graphique.

  2. Reliez le tMDMInput au tMDMDelete à l'aide d'un lien Row > Main.

  3. Reliez le composant tMDMConnection au tMDMInput à l'aide d'un lien Trigger > OnSubjobOk.

  4. Reliez le tMDMDelete au tMDMCommit, le tMDMCommit au tMDMClose et le tMDMRollback au tMDMClose à l'aide de liens Trigger > OnComponentOk.

  5. Reliez le tMDMDelete au tMDMRollback à l'aide d'un lien Trigger > OnComponentError.

Configurer la connexion au serveur MDM

Dans ce scénario, un composant tMDMConnection est utilisé pour ouvrir une connexion au serveur MDM et la réutiliser ultérieurement dans le sous-job suivant, qui supprime l'enregistrement de données spécifié.

  1. Double-cliquez sur le tMDMConnection afin d'afficher sa vue Basic settings et définir ses propriétés de base.

  2. Dans le champ URL, saisissez entre guillemets l'URL du serveur MDM, par exemple : "http://localhost:8180/talendmdm/services/soap".

  3. Dans les champs Username et Password, saisissez respectivement votre identifiant et votre mot de passe pour vous connecter au serveur MDM.

  4. Double-cliquez sur le tMDMCommit pour afficher sa vue Basic settings.

    Ce composant commite les modifications apportées à la base de données lorsque le sous-job est exécuté avec succès.

  5. Dans la liste Component List, sélectionnez le composant de connexion au serveur que vous souhaitez fermer, si vous avez configuré plusieurs connexions à des serveurs MDM. Dans ce scénario, une seule connexion au serveur est ouverte, utilisez donc simplement le paramètre par défaut.

  6. Décochez la case Close Connection si elle est cochée. Dans cet exemple, le composant tMDMClose ferme la connexion au serveur MDM.

  7. Double-cliquez sur le composant tMDMRollback pour afficher sa vue Basic settings.

    Ce composant effectue un rollback des modifications et rétablit l'état précédent de la base de données si le sous-job échoue.

  8. Dans la liste Component List, sélectionnez le composant de connexion au serveur que vous souhaitez fermer, si vous avez configuré plusieurs connexions à des serveurs MDM. Dans ce scénario, une seule connexion au serveur est ouverte, utilisez donc simplement le paramètre par défaut.

  9. Décochez la case Close Connection si elle est cochée. Dans cet exemple, le composant tMDMClose ferme la connexion au serveur MDM.

  10. Double-cliquez sur le composant tMDMClose pour afficher sa vue Basic settings et définir ses propriétés de base.

    Note

    Le composant tMDMClose est utilisé pour fermer la connexion après l'exécution réussie du Job. Vous pouvez également fermer la connexion en cochant la case Close Connection dans les composants tMDMCommit et tMDMRollback. Dans un souci de démonstration, un tMDMClose est utilisé dans ce scénario.

  11. Dans la liste Component List, sélectionnez le composant dont vous souhaitez fermer la connexion au serveur, si vous avez configuré plus d'une connexion au serveur MDM. Dans ce scénario, une seule connexion est ouverte, utilisez simplement la configuration par défaut.

Configurer la récupération de données

  1. Double-cliquez sur le tMDMInput pour afficher sa vue Basic settings et définir ses propriétés de base.

  2. Dans la liste Property Type, sélectionnez Built-in afin de renseigner les champs manuellement.

    Si vous avez stocké vos informations de connexion au serveur MDM dans le référentiel des métadonnées, sélectionnez Repository dans la liste et les champs seront automatiquement renseignés.

  3. Dans la liste Schema, sélectionnez Built-in et cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir une boîte de dialogue.

    Vous pouvez définir la structure des données maître que vous souhaitez lire dans le hub MDM.

  4. Les données maître sont collectée dans trois colonnes de type String : Id, Name et Price. Cliquez sur OK pour fermer la boîte de dialogue et passer à l'étape suivante.

  5. Cochez la case Use an existing connection et, dans la liste Component List qui apparaît, sélectionnez le composant que vous avez configuré pour ouvrir votre connexion au serveur MDM.

    Dans ce scénario, une seule connexion au serveur MDM existe, utilisez donc la sélection par défaut.

  6. Dans le champ Entity, saisissez entre guillemets le nom de l'entité métier contenant les enregistrements de données que vous souhaitez lire. Ici, saisissez le nom de l'entité Product.

  7. Dans le champ Data Container, saisissez entre guillemets le nom du conteneur de données contenant les données maître que vous souhaitez lire. Dans cet exemple, utilisez le conteneur Product.

    Note

    La case Use multiple conditions est cochée par défaut.

  8. Dans la table Operations, définissez comme suit les conditions pour filtrer les données maître que vous souhaitez supprimer :

    • Cliquez sur le bouton [+] pour ajouter une nouvelle ligne.

    • Dans la colonne Xpath, saisissez entre guillemets le chemin Xpath et la balise du nœud XML sur lequel appliquer le filtre. Dans cet exemple, vous travaillez avec l'entité Agency, saisissez donc "Product/Name".

    • Dans la colonne Function, sélectionnez la fonction que vous souhaitez utiliser. Dans ce scénario, utilisez la fonction Contains.

    • Dans la colonne Value, saisissez la valeur de votre filtre. Filtrez les données maître dont le nom contient mug.

  9. Dans la vue Component, cliquez sur Advanced settings afin de configurer les paramètres avancés.

  10. Dans le champ Loop XPath query, saisissez entre guillemets la structure et le nom du nœud XML sur lequel la boucle doit être effectuée.

  11. Dans la table Mapping et dans la colonne XPath query, saisissez entre guillemets le nom de la balise XML dans laquelle vous souhaitez collecter les données maître, à côté du nom de la colonne de sortie correspondante.

Configurer la suppression de l'enregistrement de données

  1. Dans l'espace de modélisation graphique, double-cliquez sur le composant tMDMDelete afin d'afficher sa vue Basic settings et définir ses propriétés de base.

  2. Dans la liste Schema, sélectionnez Built-in puis cliquez sur le bouton [...] à côté du champ Edit Schema afin de décrire la structure des données maître dans le hub MDM.

  3. Cliquez sur le bouton [+] de droite afin d'ajouter une colonne de type String. Nommez cette colonne outputXML. Cliquez sur OK pour fermer la boîte de dialogue et passer à l'étape suivante.

  4. Cochez la case Use an existing connection, puis, dans la liste Component List qui apparaît, sélectionnez le composant que vous avez configuré pour ouvrir votre connexion au serveur MDM.

    Dans ce scénario, une seule connexion au serveur MDM existe, utilisez la sélection par défaut.

  5. Dans le champ Entity, saisissez le nom de l'entité métier contenant les données maître que vous souhaitez supprimer, l'entité Product dans cet exemple.

  6. Dans le champ Data Container, saisissez le nom du conteneur de données contenant les données à supprimer, Product dans cet exemple.

  7. Dans le tableau Keys, cliquez sur le bouton [+] pour ajouter une nouvelle ligne. Dans la colonne Keys, sélectionnez la colonne contenant la clé de l'entité Product. Dans ce scénario, la clé de l'entité Product est définie dans le champ Id.

    Note

    Si l'entité possède plusieurs clés, ajoutez autant de ligne que nécessaire pour les clés et sélectionnez-les en ordre séquentiel.

  8. Si nécessaire, cochez la case Fire Delete event, pour que l'événement de suppression soit généré et écrit dans le rapport UpdateReport.

  9. Cochez la case Logical delete si vous ne souhaitez pas supprimer les données maître de manière permanente. Cela envoie les données supprimées dans la corbeille. Une fois dans la corbeille, les données maître peuvent être restaurées ou supprimées définitivement. Si vous laissez la case décochée, les données maître seront supprimées définitivement.

Sauvegarder et exécuter le Job

  1. Appuyez sur les touches Ctrl+S afin de sauvegarder votre Job et vous assurer que tous les paramètres configurés seront pris en compte.

  2. Appuyez sur F6 pour exécuter votre Job.

Les données maître dont le nom contient "mug" ont été supprimées et envoyées dans la corbeille.