Définir un schéma MDM - 6.4

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Définir un schéma d'entrée MDM

Cette section décrit la définition et le chargement d'un schéma MDM XML d'entrée. Pour définir et charger un schéma MDM XML de sortie, consultez Définir un schéma de sortie MDM .

Pour définir les valeurs à retrouver à partir d'une ou plusieurs entité(s) liée(s) à une connexion MDM procédez comme suit :

  1. Dans la vue Repository, développez le nœud Metadata puis cliquez-droit sur la connexion MDM pour laquelle vous souhaitez récupérer les valeurs de l'entité/des entités.

  2. Sélectionnez Retrieve Entity dans le menu contextuel.

    Une boîte de dialogue s'affiche.

  3. Sélectionnez l'option Input MDM afin de charger un schéma XML d'entrée, puis cliquez sur Next afin de passer à l'étape suivante.

  4. Dans le champ Entities, sélectionnez l'entité métier (schéma XML) à partir de laquelle vous souhaitez récupérer les valeurs.

    Le nom s'affiche automatiquement dans le champ Name.

    Note

    Vous êtes libre de saisir le nom que vous voulez dans ce champ. Cependant, il est conseillé de saisir le nom de l'entité pour laquelle vous récupérez le schéma.

  5. Cliquez sur Next pour passer à l'étape suivante.

    Note

    Le schéma de l'entité que vous avez sélectionnée, s'affiche dans le panneau Source Schema.

    Dans la boîte de dialogue ouverte, vous pouvez configurer les paramètres à prendre en compte lors de la définition du schéma XML.

    La boîte de dialogue relative au schéma est divisée en quatre panneaux :

    Panneau

    Description

    Source Schema

    Arborescence de l'entité chargée.

    Target schema

    Informations d'extraction et d'itération.

    Preview

    Aperçu du schéma cible.

    File viewer

    Visionneur des données brutes.

  6. Dans la zone Xpath loop expression, saisissez l'expression absolue du chemin XPath vers le nœud de la structure XML sur lequel appliquer l'itération. Vous pouvez également glisser le nœud du schéma source dans le champ Xpath du schéma cible. Le lien s'affiche en orange.

    Note

    Le champ Xpath loop expression est obligatoire.

  7. Au besoin, définissez une limite (Loop limit) afin de restreindre l'itération à un certain nombre de nœuds.

    Dans la capture d'écran ci-dessus, utilisez Features comme élément sur lequel effectuer une boucle, puisqu'il est répété dans l'entité Product :

    <Product>
        <Id>1</Id>
        <Name>Cup</Name>
        <Description/>
        <Features>
             <Feature>Color red</Feature>
             <Feature>Size maxi</Feature>
        <Features>
        ...
    </Product>
    <Product>
        <Id>2</Id>
        <Name>Cup</Name>
        <Description/>
        <Features>
             <Feature>Color blue</Feature>
             <Feature>Thermos</Feature>
        <Features>
       ...
    </Product>

    Ce faisant, le composant tMDMInput utilisant la connexion MDM va créer une nouvelle ligne pour chaque élément Feature rencontré.

  8. Afin de définir les champs à extraire, glissez le nœud correspondant du schéma source dans le champ Relative or absolute XPath expression.

    Note

    Cliquez sur le bouton [+] afin d'ajouter des lignes à la table, puis sélectionnez les champs à extraire. Appuyez sur la touche Ctrl ou Maj pour sélectionner plusieurs nœuds, groupés ou séparés, et glissez-les dans la table.

  9. Au besoin, saisissez un nom pour chaque colonne récupérée, dans le champ Column name.

    Note

    Vous pouvez prioriser l'ordre des champs à extraire, en sélectionnant le champ et en utilisant les flèches montante et descendante. Le lien du champ sélectionné s'affiche en bleu, et tous les autres en gris.

  10. Cliquez sur Finish afin de valider vos modifications et fermer la boîte de dialogue.

Le schéma nouvellement créé s'affiche sous le nœud Talend MDM correspondant dans la vue Repository.

Pour modifier le schéma créé, procédez comme suit :

  1. Dans la vue Repository, développez les nœuds Metadata puis Talend MDM et parcourez votre répertoire jusqu'au schéma que vous souhaitez modifier.

  2. Cliquez-droit sur le nom du schéma puis sélectionnez Edit Entity dans le menu contextuel.

    Une boîte de dialogue s'ouvre.

  3. Modifiez le schéma comme vous le souhaitez. Vous pouvez changer le nom du schéma selon vos besoins, et vous pouvez également personnaliser la structure du schéma dans le panneau correspondant. La barre d'outils vous permet d'ajouter, supprimer ou déplacer des colonnes dans votre schéma.

    Assurez-vous que le type de données dans la colonne Type est correctement défini.

    Pour plus d'informations concernant les types de données Java, à savoir le modèle de date, consultez Java API Specification (en anglais).

    Les types de données Talend les plus utilisés sont les suivants :

    • Object : est un type de données Talend générique qui permet le traitement des données sans tenir compte de leur contenu, par exemple, un fichier de données non supporté peut être traité à l'aide d'un composant tFileInputRaw en spécifiant qu'il comporte un type de données Object.

    • List : est une liste d'éléments de type primitifs, séparés par un espace, dans une définition de Schéma XML, définis à l'aide de l'élément xsd:list.

    • Dynamic : est un type de données pouvant être fixé pour une seule colonne à la fin d'un schéma afin de permettre le traitement des champs tels que les colonnes VARCHAR(100), également nommées 'Column<X>' ou si l'entrée comporte un en-tête, dans les noms de colonne figurant dans l'en-tête. Pour plus d'informations, consultez Schéma dynamique.

    • Document : est un type de données permettant le traitement d'un document XML en entier sans tenir compte de son contenu.

  4. Cliquez sur Finish afin de fermer la boîte de dialogue.

    La connexion MDM d'entrée (tMDMInput) est maintenant prête à être déposée dans l'un de vos Jobs.

Définir un schéma de sortie MDM

Cette section décrit la définition et le chargement d'un schéma XML MDM de sortie. Pour définir et charger un schéma XML MDM d'entrée, consultez Définir un schéma d'entrée MDM.

Pour définir les valeurs à écrire dans une ou plusieurs entité(s) liée(s) à une connexion MDM spécifique, procédez comme suit :

  1. Dans la vue Repository, développez le nœud Metadata et cliquez-droit sur la connexion MDM pour laquelle vous souhaitez écrire les valeurs de l'entité.

  2. Sélectionnez Retrieve Entity dans le menu contextuel.

    Une boîte de dialogue s'affiche.

  3. Sélectionnez l'option Output MDM afin de définir un schéma XML de sortie, puis cliquez sur Next pour procéder à l'étape suivante.

  4. Dans le champ Entities, sélectionnez l'entité métier (schéma XML) dans laquelle vous souhaitez écrire les valeurs.

    Le nom s'affiche automatiquement dans le champ Name.

    Note

    Vous êtes libre de saisir le nom que vous voulez dans ce champ. Cependant, il est conseillé de saisir le nom de l'entité pour laquelle vous récupérez le schéma.

  5. Cliquez sur Next pour procéder à l'étape suivante.

    Note

    Un schéma identique à celui de l'entité sélectionnée est automatiquement créé dans le panneau Linker Target, et les colonnes sont mappées automatiquement du panneau source au panneau cible. L'assistant définit automatiquement l'élément Id comme étant l'élément de boucle. Vous pouvez toujours choisir d'effectuer une boucle sur un autre élément.

    Vous pouvez définir les paramètres à prendre en compte lors de la définition du schéma XML.

  6. Cliquez sur Schema Management pour ouvrir une boîte de dialogue.

  7. Effectuez les modifications nécessaires à la définition du schéma XML que vous souhaitez écrire dans l'entité sélectionnée.

    Votre schéma dans la zone Linker Source doit correspondre au schéma dans la zone Linker Target, vous devez donc définir les éléments dans lesquels vous souhaitez écrire des valeurs.

  8. Cliquez sur OK pour fermer la boîte de dialogue.

    Le schéma défini s'affiche dans la colonne Schema list.

  9. Dans le panneau Linker Target, cliquez-droit sur l'élément que vous souhaitez définir comme élément de boucle et sélectionnez Set as loop element. Cela limitera l'itération à un ou plusieurs nœud(s).

    Ce faisant, le composant tMDMOutput utilisant cette connexion MDM créera une nouvelle ligne pour chaque élément ayant une "feature" différente.

    Note

    Vous pouvez prioriser l'ordre des champs à écrire, en sélectionnant le champ et en utilisant les flèches montante et descendante.

  10. Cliquez sur Finish afin de valider vos modifications et fermer la boîte de dialogue.

Le schéma nouvellement créé s'affiche sous la connexion MDM correspondante dans la vue Repository.

Pour modifier le schéma créé, procédez comme suit :

  1. Dans la vue Repository, développez les nœuds Metadata et Talend MDM puis parcourez le référentiel jusqu'au schéma que vous souhaitez modifier.

  2. Cliquez-droit sur le nom du schéma et sélectionnez Edit Entity dans le menu contextuel.

    Une boîte de dialogue s'affiche.

  3. Modifiez le schéma comme vous le souhaitez.

    Vous pouvez changer le nom du schéma selon vos besoins, et vous pouvez également personnaliser la structure du schéma dans le panneau correspondant. La barre d'outils vous permet d'ajouter, supprimer ou déplacer des colonnes dans votre schéma.

  4. Cliquez sur Finish afin de fermer la boîte de dialogue.

    La connexion MDM de sortie (tMDMOutput) est maintenant prête à être déposée dans l'un de vos Jobs.

Définir un schéma de réception MDM

Cette section décrit la définition d'un schéma MDM XML de réception basé sur une connexion MDM.

Pour définir le schéma XML que vous souhaitez recevoir selon une connexion MDM spécifique, procédez comme suit :

  1. Dans la vue Repository, développez le nœud Metadata puis cliquez-droit sur la connexion MDM pour laquelle vous souhaitez récupérer les valeurs de l'entité.

  2. Sélectionnez Retrieve Entity dans le menu contextuel.

    Une boîte de dialogue s'ouvre.

  3. Sélectionnez l'option Receive MDM afin de définir un schéma XML de réception puis cliquez sur Next pour passer à l'étape suivante.

  4. Dans le champ Entities, sélectionnez l'entité métier (schéma XML) selon laquelle vous souhaitez recevoir le schéma XML.

    Le nom s'affiche automatiquement dans le champ Name.

    Note

    Vous pouvez saisir tout texte dans ce champ, même s'il est recommandé de saisir le nom de l'entité selon laquelle vous souhaitez recevoir le schéma XML.

  5. Cliquez sur Next pour passer à l'étape suivante.