Configurer les métadonnées pour un fichier d'entrée (Input) XML

Talend ESB Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend ESB
task
Création et développement
EnrichPlatform
Studio Talend

Cette section décrit la définition et le chargement d'une connexion à un fichier d'entrée (Input) XML. Pour définir et charger un fichier de sortie (Output), consultez Configurer les métadonnées pour un fichier de sortie (Output) XML.

Définir les propriétés générales

Dans cette étape, vous allez définir les propriétés générales des métadonnées, telles que le nom (champ Name), l'objectif (champ Purpose) et une Description.

  1. Dans l'assistant de configuration des métadonnées du fichier, renseignez le champ Name, qui est obligatoire, et les champs Purpose et Description si vous le souhaitez. Les informations que vous renseignez dans le champ Description apparaissent en tant qu'info-bulle lorsque vous placez le pointeur de votre souris sur la connexion.

    Note

    Lorsque vous saisissez les propriétés générales des métadonnées à créer, vous devez définir le type de connexion, entrée (input) ou sortie (output). Il est donc conseillé de saisir des informations susceptibles de vous aider à distinguer les schémas d'entrée et de sortie.

  2. Si nécessaire, définissez la version et le statut de la connexion dans les champs Version et Status, respectivement. Vous pouvez également gérer la version et le statut d'un élément du Repository dans la boîte de dialogue [Project Settings]. Pour plus d'informations, consultez Gérer les versions et Gérer les statuts, respectivement.

  3. Si nécessaire également, cliquez sur le bouton Select à côté du champ Path afin de sélectionner un dossier sous le nœud File XML. Ce dossier contient la connexion au fichier juste créé. Notez que vous ne pouvez pas sélectionnez de dossier pendant que vous éditez une connexion existante. Vous pouvez cependant déposer une connexion dans un nouveau dossier quand vous le souhaitez.

  4. Cliquez sur Next pour sélectionner le type de métadonnées.

Sélectionner le type de métadonnées (Input)

Dans cette étape, vous allez définir le type de métadonnées, Input ou Output. Dans cet exemple, sélectionnez le type Input.

  1. Dans la boîte de dialogue, sélectionnez Input XML.

  2. Cliquez sur Next pour continuer.

Charger un fichier Input

Dans cette étape, vous allez sélectionner votre fichier d'entrée, son encodage, définir le nombre de colonnes sur lequel la requête XPath devra être exécutée. Vous pouvez également prévisualiser la structure du fichier XML ou XSD (XML Schema Definition) sélectionné.

Le fichier XML d'entrée utilisé pour expliquer cette étape contient des informations de contact. Sa structure se présente comme suit :

<contactInfo>
  <contact>
    <id>1</id>
    <firstName>Michael</firstName>
    <lastName>Jackson</lastName>
    <company>Talend</company>
    <city>Paris</city>
    <phone>2323</phone>
  </contact>
  <contact>
    <id>2</id>
    <firstName>Elisa</firstName>
    <lastName>Black</lastName>
    <company>Talend</company>
    <city>Paris</city>
    <phone>4499</phone>
  </contact>
  ...
</contactInfo>

Pour charger un fichier XML, procédez comme suit :

  1. Cliquez sur le bouton [Browse...] et parcourez votre répertoire jusqu'au fichier à charger. Sinon, saisissez le chemin d'accès au fichier XML à charger.

    Un aperçu de la structure du fichier lu s'affiche dans la zone Schema Viewer. Vous avez la possibilité de développer et de visualiser tous les niveaux de la structure XML du fichier.

  2. Renseignez le champ Encoding si le système ne l'a pas détecté automatiquement

  3. Dans le champ Limit, définissez le nombre de colonnes sur lesquelles effectuer la requête XPath, ou saisissez 0 si vous souhaitez l'effectuer sur toutes les colonnes.

  4. Cliquez sur Next pour continuer et définir les paramètres du schéma.

Charger un fichier XSD

Cette procédure décrit comment charger un fichier XSD pour obtenir une structure XML. Pour charger un fichier XML, consultez Charger un fichier Input.

Un fichier XSD est utilisé pour décrire le schéma des fichiers XML. La structure et les types d'éléments peuvent être décrits à l'aide du XSD suivant, utilisé comme XSD d'entrée d'exemple dans cette section.

<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified">
  <xs:element name="contactInfo">
    <xs:complexType>
      <xs:sequence>
        <xs:element maxOccurs="unbounded" ref="contact"/>
      </xs:sequence>
    </xs:complexType>
  </xs:element>
  <xs:element name="contact">
    <xs:complexType>
      <xs:sequence>
        <xs:element ref="id"/>
        <xs:element ref="firstName"/>
        <xs:element ref="lastName"/>
        <xs:element ref="company"/>
        <xs:element ref="city"/>
        <xs:element ref="phone"/>
      </xs:sequence>
    </xs:complexType>
  </xs:element>
  <xs:element name="id" type="xs:integer"/>
  <xs:element name="firstName" type="xs:NCName"/>
  <xs:element name="lastName" type="xs:NCName"/>
  <xs:element name="company" type="xs:NCName"/>
  <xs:element name="city" type="xs:NCName"/>
  <xs:element name="phone" type="xs:integer"/>
</xs:schema>

Pour plus d'informations concernant les schémas XML, consultez http://www.w3.org/XML/Schema (en anglais).

Note

Lorsque vous chargez un fichier XSD,

  • les données sont sauvegardées dans le Repository. Les métadonnées ne seront pas affectées par une suppression ou un déplacement du fichier.

  • vous pouvez choisir un élément en tant que racine de votre arborescence XML.

Pour charger un fichier XSD, procédez comme suit :

  1. Cliquez sur Browse... et parcourez votre système jusqu'au répertoire du fichier XSD à charger. Ou bien saisissez le chemin d'accès au fichier.

  2. Dans la boîte de dialogue qui apparaît, sélectionnez un élément dans la liste Root, afin d'en faire la racine de votre arborescence XML, puis cliquez sur OK.

    La zone Schema Viewer affiche un aperçu de la structure XML. Vous pouvez développer et visualiser chaque niveau de la structure XML du fichier.

  3. Dans le champ Encoding, saisissez le type d'encodage si le système ne le détecte pas automatiquement.

  4. Dans le champ Limit, saisissez le nombre de colonnes sur lesquelles exécuter la requête XPath, ou saisissez 0 si vous souhaitez l'exécuter sur touts les colonnes.

  5. Cliquez sur Next afin de configurer les paramètres du schéma.

Définir un schéma

Dans cette étape, vous allez renseigner les paramètres à prendre en compte pour la définition du schéma.

La fenêtre de définition du schéma est composée de quatre vues :

Vue

Description

Source Schema

Arborescence du fichier XML.

Target Schema

Informations d'extraction et d'itération.

Preview

Aperçu du schéma cible, ainsi que des données d'entrée des colonnes sélectionnées, affichées dans l'ordre défini.

Note

La fonctionnalité d'aperçu n'est pas disponible si vous chargez un fichier XSD.

File viewer

Fenêtre d'aperçu des données brutes.

Tout d'abord, définissez la boucle XPath ainsi que le nombre maximum d'itérations à effectuer. Pour ce faire :

  1. Peuplez le champ Xpath loop expression, avec l'expression Xpath absolue du nœud qui fait l'objet de l'itération. Vous pouvez le faire de deux manières :

    • Saisissez l'expression Xpath absolue du nœud qui fait l'objet de l'itération. Vous pouvez saisir l'expression entière ou appuyer sur Ctrl+Espace pour utiliser la liste d'autocomplétion.

      Ou,

    • Déposez le nœud sélectionné de l'arborescence Source Schema dans le champ Absolute XPath expression.

      Une flèche orange relie le nœud à l'expression correspondante.

    Note

    Le champ Xpath loop expression est obligatoire.

  2. Saisissez une limite de boucle dans le champ Loop limit pour restreindre le nombre de nœuds à itérer.

  3. Définissez les champs à extraire en déposant les nœuds appropriés de la vue Source Schema vers le champ Relative or absolute XPath expression.

    Note

    Vous pouvez sélectionner plusieurs nœuds à déposer dans le tableau, en appuyant sur Ctrl ou Maj, et en cliquant sur les nœuds adéquats. La flèche reliant un nœud sélectionné dans la zone Source Schema à celui déposé dans la zone Fields to extract est bleue. Les autres liens sont gris.

  4. Vous pouvez ajouter autant de colonnes à extraire que vous le souhaitez, supprimer des colonnes, ou en modifier l'ordre, à l'aide de la barre d'outils.

    • Saisissez l'expression Xpath absolue du nœud qui fait l'objet de l'itération. Vous pouvez saisir l'expression entière ou appuyer sur Ctrl+Espace pour utiliser la liste d'autocomplétion.

    • Modifiez l'ordre des colonnes à l'aide des boutons et .

  5. Dans le champ Column name, nommez les libellés des colonnes qui s'afficheront dans la vue d'aperçu du schéma (Schema preview).

  6. Cliquez sur Refresh preview pour afficher l'aperçu du schéma. Les champs apparaissent ainsi dans l'aperçu du schéma dans l'ordre imposé.

    Note

    L'aperçu n'est pas disponible si vous chargez un fichier XSD.

  7. Cliquez sur Next pour vérifier et éditer le schéma final.

Finaliser le schéma du fichier

Le schéma généré affiche les colonnes sélectionnées dans le fichier XML et vous permet de personnaliser ce schéma.

  1. Si nécessaire, renommez la métadonnée dans le champ Name, (metadata, par défaut), ajoutez un commentaire dans le champ Comment et procédez à d'autres modifications, par exemple :

    • Définissez les colonnes en éditant les champs correspondants.

    • Ajoutez ou supprimez une colonne à l'aide des boutons et .

    • Modifiez l'ordre des colonnes à l'aide des boutons et .

  2. Si le fichier XML sur lequel se base le schéma a été modifié, cliquez sur le bouton Guess afin de générer à nouveau le schéma.

  3. Cliquez sur Finish. La nouvelle connexion au fichier, ainsi que son schéma, s'affichent sous le nœud File XML du Repository.

Vous pouvez à présent déposer n'importe quelle connexion à un fichier ou n'importe quel schéma depuis le Repository dans l'espace de modélisation graphique en tant que nouveau composant tFileInputXML ou tExtractXMLField. Vous pouvez également la déposer sur un composant afin de réutiliser ses métadonnées. Pour plus d'informations sur l'utilisation des métadonnées centralisées, consultez Comment utiliser les métadonnées centralisées dans un Job et Paramétrer un schéma du Repository.

Pour modifier une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Edit file xml afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour ajouter un nouveau schéma à une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Retrieve Schema dans le menu contextuel.

Pour éditer un schéma de fichier existant, cliquez-droit sur le schéma dans le Repository et sélectionnez Edit Schema dans le menu contextuel.