Configurer les métadonnées pour un fichier de sortie (Output) XML - 6.3

Talend Data Services Platform Studio Guide utilisateur

EnrichVersion
6.3
EnrichProdName
Talend Data Services Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Cette section décrit la définition et le chargement d'une connexion à un fichier de sortie (Output) XML. Pour définir et charger un schéma XML d'entrée (Input), consultez Configurer les métadonnées pour un fichier d'entrée (Input) XML.

Définir les propriétés générales

Dans cette étape, vous allez définir les propriétés générales des métadonnées, telles que le nom (champ Name), l'objectif (champ Purpose) et une Description.

  1. Dans l'assistant de configuration des métadonnées du fichier, renseignez le champ Name, qui est obligatoire, et les champs Purpose et Description si vous le souhaitez. Les informations que vous renseignez dans le champ Description apparaissent en tant qu'info-bulle lorsque vous placez le pointeur de votre souris sur la connexion.

    Note

    Lorsque vous saisissez les propriétés générales des métadonnées à créer, vous devez définir le type de connexion, entrée (input) ou sortie (output). Il est donc conseillé de saisir des informations susceptibles de vous aider à distinguer les schémas d'entrée et de sortie.

  2. Si nécessaire, définissez la version et le statut de la connexion dans les champs Version et Status, respectivement. Vous pouvez également gérer la version et le statut d'un élément du Repository dans la boîte de dialogue [Project Settings]. Pour plus d'informations, consultez Gérer les versions et Gérer les statuts, respectivement.

  3. Si nécessaire également, cliquez sur le bouton Select à côté du champ Path afin de sélectionner un dossier sous le nœud File XML. Ce dossier contient la connexion au fichier juste créé. Notez que vous ne pouvez pas sélectionnez de dossier pendant que vous éditez une connexion existante. Vous pouvez cependant déposer une connexion dans un nouveau dossier quand vous le souhaitez.

  4. Cliquez sur Next pour sélectionner le type de métadonnées.

Sélectionner le type de métadonnées (Output)

Dans cette étape, vous allez définir le type de métadonnées, Input ou Output. Dans cet exemple, sélectionnez le type Output.

  1. Dans la boîte de dialogue, sélectionnez Output XML.

  2. Cliquez sur Next pour définir le fichier de sortie, à partir d'un fichier XML, XSD ou à partir de rien.

Définir la structure du fichier de sortie à l'aide d'un fichier XML existant

Vous pouvez choisir de créer votre fichier manuellement ou de le créer à partir d'un fichier existant. Vous pouvez choisir de le créer manuellement (en sélectionnant Create manually), mais vous devrez alors configurer vous-même votre schéma, vos colonnes sources et vos colonnes cibles à l'étape 4 de l'assistant. Le fichier est créé lors de l'utilisation dans un Job d'un composant de sortie, comme le tAdvancedFileOutputXML.

Dans cet exemple, créez le ficher en chargeant un ficher existant XML ou XSD.

  1. Sélectionnez l'option Create from a file.

  2. Cliquez sur le bouton Browse... à côté du champ XML or XSD File, parcourez votre système jusqu'au fichier XML duquel la structure doit être appliquée au fichier de sortie et double-cliquez sur le fichier.

    La zone File Viewer affiche l'aperçu de la structure XML et la zone File Content affiche au maximum les cinquante premières lignes du fichier.

  3. Renseignez le champ Encoding si le système ne l'a pas détecté automatiquement.

  4. Dans le champ Limit, définissez le nombre de colonnes sur lesquelles effectuer la requête XPath, ou saisissez 0 si vous souhaitez l'effectuer sur toutes les colonnes.

  5. Dans la zone Output File Path, dans le champ Output file, renseignez le chemin d'accès à votre fichier de sortie. Si le fichier n'existe pas, il sera créé, lors de l'utilisation, dans un Job, du composant tAdvancedFileOutputXML. Si le fichier existe déjà, il sera écrasé.

  6. Cliquez sur Next pour définir le schéma.

Définir la structure du fichier de sortie à l'aide d'un fichier XSD

Cette procédure décrit comment définir la structure d'un fichier XML de sortie à partir d'un fichier XSD. Pour définir la structure XML à partir d'un fichier XML, consultez Définir la structure du fichier de sortie à l'aide d'un fichier XML existant.

Note

Lorsque vous chargez un fichier XSD,

  • les données sont sauvegardées dans le Repository et la métadonnées n'est pas affectée par la suppression ou le déplacement d'un fichier.

  • vous pouvez choisir un élément comme racine de votre arborescence XML.

Pour créer la structure XML de sortie à partir d'un fichier XSD, procédez comme suit :

  1. Sélectionnez l'option Create from a file.

  2. Cliquez sur le bouton Browse... à côté du champ XML or XSD File, parcourez votre système jusqu'au fichier XSD duquel la structure doit être appliquée au fichier de sortie et double-cliquez sur le fichier.

  3. Dans la boîte de dialogue qui apparaît, sélectionnez un élément de la liste Root, afin d'en faire la racine de votre arborescence XML et cliquez sur OK.

    La zone File Viewer affiche l'aperçu de la structure XML et la zone File Content affiche au maximum les cinquante premières lignes du fichier.

  4. Renseignez le champ Encoding si le système ne l'a pas détecté automatiquement.

  5. Dans le champ Limit, définissez le nombre de colonnes sur lesquelles effectuer la requête XPath, ou saisissez 0 si vous souhaitez l'effectuer sur toutes les colonnes.

  6. Dans la zone Output File Path, dans le champ Output file, renseignez le chemin d'accès à votre fichier de sortie. Si le fichier n'existe pas, il sera créé, lors de l'utilisation, dans un Job, du composant tAdvancedFileOutputXML. Si le fichier existe déjà, il sera écrasé.

  7. Cliquez sur Next pour définir le schéma.

Définition du schéma

Lorsque les opérations précédentes sont terminées, les colonnes de la zone Linker Source sont automatiquement mappées vers celles correspondantes dans la zone Linker Target, comme le montrent les flèches bleues.

Dans cette étape, configurez le schéma de sortie. Le tableau suivant décrit comment faire :

Pour...Effectuer...

Créer un schéma à partir de zéro ou éditer les colonnes du schéma source à passer au schéma cible

Dans la zone Linker Source, cliquez sur le bouton Schema Management afin d'ouvrir l'éditeur de schéma.

Définir un élément de boucle

Dans la zone Linker Target, cliquez-droit sur l'élément qui vous intéresse et sélectionnez Set As Loop Element dans le menu contextuel.

Note

Cette opération est obligatoire pour définir un élément sur lequel effectuer une boucle.

Définir un group element

Dans la zone Linker Target, cliquez-droit sur l'élément qui vous intéresse et sélectionnez Set As Group Element dans le menu contextuel.

Note

Vous pouvez configurer l'élément parent de l'élément de boucle en tant que group element à condition que l'élément parent ne soit pas la racine de l'arborescence XML.

Créer un élément fils pour un élément

Dans la zone Linker Target,

  • Cliquez-droit sur l'élément qui vous intéresse et sélectionnez Add Sub-element dans le menu contextuel, saisissez un nom pour le sous-élément dans la boîte de dialogue qui apparaît, puis cliquez sur OK.

  • Sélectionnez l'élément qui vous intéresse, cliquez sur le bouton [+] en bas, sélectionnez Create as sub-element dans la boîte de dialogue qui apparaît, puis cliquez sur OK. Ensuite, saisissez un nom pour le sous-élément dans la boîte de dialogue suivante et cliquez sur OK.

Créer un attribut pour un élément

Dans la zone Linker Target,

  • Cliquez-droit sur l'élément qui vous intéresse et sélectionnez Add Attribute dans le menu contextuel, saisissez un nom pour l'attribut dans la boîte de dialogue qui apparaît et cliquez sur OK.

  • Sélectionnez l'élément qui vous intéresse, cliquez sur le bouton [+] en bas, sélectionnez Create as attribute dans la boîte de dialogue qui apparaît, puis cliquez sur OK. Ensuite, saisissez un nom pour l'attribut dans la boîte de dialogue suivante et cliquez sur OK.

Créer un espace de nommage pour un élément

Dans la zone Linker Target,

  • Cliquez-droit sur l'élément qui vous intéresse et sélectionnez Add Name Space dans le menu contextuel, saisissez un nom pour l'espace de nommage dans la boîte de dialogue qui apparaît et cliquez sur OK.

  • Sélectionnez l'élément qui vous intéresse, cliquez sur le bouton [+] en bas, sélectionnez Create as name space dans la boîte de dialogue qui apparaît, puis cliquez sur OK. Ensuite, saisissez un nom pour l'espace de nommage dans la boîte de dialogue suivante et cliquez sur OK.

Supprimer un ou plusieurs éléments/attributs/espaces de nommage

Dans la zone Linker Target,

  • Cliquez-droit sur les éléments/attributs/espaces de nommage qui vous intéressent et sélectionnez Delete dans le menu contextuel.

  • Sélectionnez les éléments/attributs/espaces de nommage qui vous intéressent et cliquez sur le bouton [x] en bas.

  • Sélectionnez les éléments/attributs/espaces de nommage qui vous intéressent et appuyez sur la touche Suppr.

    Note

    Supprimer un élément supprime également ses enfants, s'il en a.

Ajuster l'ordre d'un ou plusieurs élément(s)

Dans la zone Linker Target, sélectionnez l'élément qui vous intéressent et cliquez sur les boutons et , afin de déplacer vers le haut ou vers le bas, respectivement, l'élément sélectionné.

Configurer une valeur statique pour un élément/attribut/espace de nommage

Dans la zone Linker Target, cliquez-droit sur l'élément/l'attribut/l'espace de nommage qui vous intéresse et sélectionnez Set A Fix Value dans le menu contextuel.

Note

  • La valeur que vous avez configurée va remplacer toute valeur récupérée du flux d'entrée dans votre Job.

  • Vous pouvez configurer une valeur statique pour un élément fils de l'élément de boucle uniquement, à condition que l'élément n'ait pas lui-même d'enfants et pas de mapping source-cible sur lui.

Créer un mapping source-cible

Sélectionnez la colonne qui vous intéresse, dans la zone Linker Source, déposez-la sur le nœud qui vous intéresse de la zone Linker Target et sélectionnez Create as sub-element of target node, Create as attribute of target node, ou Add linker to target node selon vos besoins, dans la boîte de dialogue qui apparaît, puis cliquez sur OK.

Si vous choisissez une option qui n'est pas permise pour le nœud cible, un message d'avertissement apparaît et l'opération échoue.

Supprimer un mapping source-cibleDans la zone Linker Target, cliquez-droit sur le nœud qui vous intéresse et sélectionnez Disconnect Linker dans le menu contextuel.
Créer une arborescence XML à partir d'un autre fichier XML ou XSDCliquez-droit sur tout élément du schéma dans la zone Linker Target et sélectionnez Import XML Tree dans le menu contextuel afin de charger un autre fichier XML ou XSD. Ensuite, vous devez créer manuellement les mappings source-cible et définir à nouveau le schéma de sortie.

Note

Vous pouvez sélectionner et déposer plusieurs champs à la fois, en utilisant les touches Ctrl ou Maj pour effectuer une sélection multiple et rendre le mapping plus rapide. Vous pouvez également effectuer une sélection multiple lors des opérations de clic-droit.

  1. Dans la zone Linker Target, cliquez-droit sur l'élément sur lequel vous souhaitez effectuer une boucle, puis, dans le menu contextuel, sélectionnez Set As Loop Element.

  2. Définissez les autres propriétés de fichier Output, puis cliquez sur Next pour passer à l'étape suivante.

Finaliser le schéma

L'étape 5 de l'assistant affiche le schéma final généré et vous permet de le modifier.

  1. Vous pouvez personnaliser le nom de la métadonnée dans le champ Name (par défaut metadata), ajouter un commentaire dans le champ Comment et apporter d'autres modifications, par exemple :

    • Si nécessaire, définissez à nouveau les colonnes en éditant les champs appropriés.

    • Ajoutez ou supprimez une colonne à l'aide des boutons [+] et [x].

    • Modifiez l'ordre des colonnes à l'aide des boutons et .

    Assurez-vous que le type de données dans la colonne Type est correctement défini.

    Pour plus d'informations concernant les types de données Java, à savoir le modèle de date, consultez Java API Specification (en anglais).

    Les types de données Talend les plus utilisés sont les suivants :

    • Object : est un type de données Talend générique qui permet le traitement des données sans tenir compte de leur contenu, par exemple, un fichier de données non supporté peut être traité à l'aide d'un composant tFileInputRaw en spécifiant qu'il comporte un type de données Object.

    • List : est une liste d'éléments de type primitifs, séparés par un espace, dans une définition de Schéma XML, définis à l'aide de l'élément xsd:list.

    • Dynamic : est un type de données pouvant être fixé pour une seule colonne à la fin d'un schéma afin de permettre le traitement des champs tels que les colonnes VARCHAR(100), également nommées 'Column<X>' ou si l'entrée comporte un en-tête, dans les noms de colonne figurant dans l'en-tête. Pour plus d'informations, consultez Schéma dynamique.

    • Document : est un type de données permettant le traitement d'un document XML en entier sans tenir compte de son contenu.

  2. Si le fichier XML sur lequel se base le schéma a été modifié, cliquez sur le bouton Guessafin de générer le schéma à nouveau. Notez que si vous avez personnalisé le schéma, la fonctionnalité Guess ne retient pas ces modifications.

  3. Cliquez sur Finish pour terminer la création du fichier XML de sortie. Le nouveau schéma apparaît dans le Repository, sous le nœud File xml correspondant.

Vous pouvez à présent déposer n'importe quelle connexion à un fichier ou n'importe quel schéma depuis le Repository dans l'espace de modélisation graphique en tant que nouveau composant tAdvancedFileOutputXML. Vous pouvez également la déposer sur un composant afin de réutiliser ses métadonnées.

Pour modifier une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Edit file xml afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour ajouter un nouveau schéma à une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Retrieve Schema dans le menu contextuel.

Pour éditer un schéma de fichier existant, cliquez-droit sur le schéma dans le Repository et sélectionnez Edit Schema dans le menu contextuel.