Propriétés du tMDMInput Standard - 7.3

Traitement de données MDM

Version
7.3
Language
Français
Product
Talend Data Fabric
Talend MDM Platform
Module
Studio Talend
Talend MDM Server
Talend MDM Web UI
Content
Création et développement > Systèmes tiers > Composants MDM > Composants MDM de traitement de données
Gouvernance de données > Systèmes tiers > Composants MDM > Composants MDM de traitement de données
Qualité et préparation de données > Systèmes tiers > Composants MDM > Composants MDM de traitement de données
Last publication date
2024-02-22

Ces propriétés sont utilisées pour configurer le tMDMInput s'exécutant dans le framework de Jobs Standard.

Le composant tMDMInput Standard appartient à la famille Talend MDM.

Le composant de ce framework est disponible dans tous les produits Talend.

Basic settings

Property Type

Peut être Built-in ou Repository.

 

Built-in : propriétés utilisées ponctuellement sans stockage dans le référentiel.

 

Repository : sélectionnez le fichier du référentiel dans lequel les propriétés sont stockées. Les champs suivants sont alors remplis automatiquement à l'aide des données collectées.

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (built-in) soit distant dans le Repository.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

 

Built-in : le schéma sera créé et conservé pour ce composant seulement. Scénario associé : consultez le Guide d'utilisation du Studio Talend.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans divers projets et Jobs. Scénario associé : consultez le Guide d'utilisation du Studio Talend.

Use an existing connection Cochez cette case si vous souhaitez utiliser un composant tMDMConnection configuré.

MDM version

Par défaut, l'option Server 6.0 est sélectionnée. Bien qu'il soit recommandé de migrer les Jobs existants vers cette nouvelle version, l'option Server 5.6 est disponible pour faciliter le processus de migration de vos Jobs, afin qu'ils continuent à fonctionner avec un serveur 6.0 sans modification. Pour ce faire, une option sur le serveur doit être activée pour accepter et traduire les requêtes de ces Jobs.

URL

Saisissez l'URL d'accès au serveur MDM.

Username et Password

Saisissez les informations d'authentification de l'utilisateur ou de l'utilisatrice du serveur MDM.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Entity

Saisissez le nom de l'entité métier contenant les données que vous souhaitez lire.

Data Container

Saisissez le nom du conteneur de données contenant les données à lire.

Type

Sélectionnez Master ou Staging pour spécifier sur quelle base de données effectuer l'action.

Use multiple conditions

Cochez cette case pour filtrer les données à l'aide de conditions.

  • Xpath : saisissez, entre guillemets, le nœud XML sur lequel appliquer la condition.

  • Function : sélectionnez l'opérateur à utiliser dans la liste. Les opérateurs suivants sont disponibles :

    • Contains : retourne un résultat contenant le ou les mot·s saisi·s. Notez que la recherche plein texte ne supporte pas les caractères spéciaux, par exemple @, #, $.
    • Contains the sentence : retourne un ou plusieurs résultat·s contenant la phrase saisie.
    • Joins With : cet opérateur est réservé pour usage ultérieur.
    • Starts With : retourne un résultat commençant par la chaîne saisie.
    • Equal : retourne un résultat correspondant à la valeur saisie.
    • Not Equal : retourne un résultat dont la valeur n'est pas nulle et est différente de la valeur saisie.
    • is greater than : retourne un résultat supérieur à la valeur numérique saisie. S'applique uniquement aux champs contenant des nombres.
    • is greater or equal : retourne un résultat supérieur ou égal à la valeur numérique saisie. S'applique uniquement aux champs contenant des nombres.
    • is lower than : retourne un résultat inférieur à la valeur numérique saisie. S'applique uniquement aux champs contenant des nombres.
    • is lower or equal : retourne un résultat inférieur ou égal à la valeur numérique saisie. S'applique uniquement aux champs contenant des nombres.
    • whole content contains : effectue une recherche plein texte utilisant le champ spécifié Xpath dans le conteneur de données sélectionné. Si vous saisissez une chaîne de caractères vide "" dans le champ Xpath et que vous sélectionnez whole content contains dans la liste Function (Fonction), les recherches seront effectuées sur tous les champs de toutes les entités du conteneur de données sélectionné.
    • is empty or null : retourne un champ vide ou une valeur nulle.

    Avant d'utiliser les conditions, ayez ceci à l'esprit :

    • Selon le type de champ vers lequel pointe Xpath, seuls certains opérateurs s'appliquent. Par exemple, si le champ est un booléen, seuls les opérateurs Equal et Not Equal sont applicables.

    • les recherches dans la base de données maître supportent les recherches plein texte et les recherches SQL standard, alors que les recherches dans la base de données de préparation supportent uniquement les recherches SQL standard. Pour plus d'informations concernant la gestion des modes de recherche dans les bases de données, consultez le Guide d'installation et de migration Talend.

    • Les recherches SQL standard considèrent le contenu de la recherche comme une phrase complète à mettre en correspondance. Les recherches plein texte considèrent le contenu de la recherche comme une phrase contenant différents mots. Les enregistrements correspondant à l'un des mots seront retournés. Par exemple, si le contenu de la recherche est "test first name", la recherche plein texte considère cette recherche comme trois mots indépendants "test", "first" et "name", alors que la recherche SQL standard la considère comme une phrase "test first name".

    • l'opérateur Not Equal ne supporte pas les champs multi-occurrence ou les champs de type complexe.

  • Value : saisissez, entre guillemets, la valeur souhaitée. Notez que si la valeur contient des caractères XML spéciaux, comme /, vous devez saisir la valeur entre guillemets simples également ("'ABC/XYZ'"), sinon la valeur est considérée comme XPath.
  • Predicate : sélectionnez un prédicat dans la liste déroulante.

    Les prédicats none (default), or, and et Not peuvent désormais être utilisés. Les autres prédicats serviront plus tard.

    • none (default) : est interprété comme and par défaut.
    • or : retourne un enregistrement si n'importe quelle condition séparée par ce prédicat est true.
    • and : retourne un enregistrement si toutes les conditions séparées par ce prédicat sont true.
    • Not : retourne un enregistrement si la condition sur laquelle ce prédicat est défini n'est pas true.
    Remarque : Le prédicat or est interprété uniquement s'il est défini sur toutes les conditions, sauf la dernière d'entre elles. Sinon, le prédicat or est toujours interprété comme and. Pour plus d'informations, consultez la description associée des comportements des filtres utilisant plusieurs conditions et prédicats dans Talend MDM, sur Talend Help Center (https://help.talend.com).

Si vous décochez cette case, vous avez la possibilité de sélectionner des ID particuliers devant être affichés dans la colonne ID value du tableau IDS.

Remarque :

Si vous décochez la case Use multiple conditions, l'option Batch Size de l'onglet Advanced settings ne sera plus disponible.

Skip Rows

Renseignez le nombre de lignes à ignorer.

Max Rows

Nombre maximum de lignes à traiter. Si Limit = 0, aucune ligne n'est lue ou traitée.

Die on error

Cochez cette case pour passer la ligne en erreur et terminer le processus afin d'obtenir des lignes ne contenant aucune erreur. Si nécessaire, vous pouvez récupérer les lignes en erreur en utilisant un lien de type Row > Rejects.

Advanced settings

Batch Size

Nombre de lignes dans chaque lot traité.

Remarque :

Cette option n'apparaît pas si vous avez décoché la case Use multiple conditions dans l'onglet Basic settings.

Loop XPath query

Nœud de la structure XML sur lequel est basée la boucle.

Mapping

Column : reflète le schéma tel qu'il est défini dans l'éditeur Edit Schema.

XPath query : saisissez les champs à extraire de la structure XML d'entrée.

Get Nodes : cochez cette case pour récupérer les nœuds XML avec les données.

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement au niveau du Job ainsi qu'au niveau de chaque composant.

Variables globales

Variables globales

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend.

Utilisation

Règle d'utilisation

Ce composant est utilisé comme composant de début. Il requiert un composant de sortie.

Si une entité MDM contient un grand nombre de champs de clés étrangères, la requête sur les enregistrements de données appartenant à l'entité utilisant le tMDMInput peut prendre du temps.

Pour plus d'informations concernant cette solution de contournement, consultez l'article How to read data effectively that pertains to an MDM entity with many foreign key fields (en anglais).

Pour plus d'informations concernant cette solution de contournement, consultez l'article How to read data effectively that pertains to an MDM entity with many foreign key fields (en anglais) sur Talend Help Center (https://help.talend.com).

Vous pouvez augmenter le délai avant suspension de la connexion pour un Job utilisant ce composant afin de faciliter le traitement d'un grand volume d'enregistrements de données. Pour plus d'informations, consultez les paramètres d’exécution avancés pour les paramètres JVM dans l'article Valeurs de délai avant expiration pour un Job utilisant des composants MDM sur Talend Help Center (https://help.talend.com).