Configurer un schéma générique à partir d'un fichier XML

Talend Data Fabric Studio Guide utilisateur

EnrichVersion
6.5
EnrichProdName
Talend Data Fabric
task
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Avertissement

Le fichier XML source à partir duquel vous pouvez créer un schéma générique doit être un schéma exporté depuis le Studio ou depuis un fichier XML ayant la même structure. Il ne peut cependant être exporté depuis un autre type de fichier XML.

Pour créer un schéma générique à partir d'un fichier source XML, procédez comme suit :

  1. Cliquez-droit sur Generic schemas dans la vue Repository et sélectionnez Create generic schema from xml.

  2. Dans la boîte de dialogue qui apparaît, sélectionnez le fichier source XML duquel prendre le schéma et cliquez sur Open.

  3. Dans l'assistant de création de schéma qui apparaît, renseignez le champ Name en saisissant un nom pour le schéma ou utilisez celui par défaut (metadata) et saisissez un commentaire, dans le champ Comment, si nécessaire.

    La structure du schéma du fichier source s'affiche dans le panneau Schema. Vous pouvez personnaliser les colonnes du schéma selon vos besoins.

    La barre d'outils vous permet d'ajouter, supprimer ou déplacer des colonnes de votre schéma.Vous pouvez également exporter le schéma courant en tant que fichier XML ou importer un schéma depuis un fichier XML. Il doit être un schéma exporté depuis le Studio, afin de remplacer le schéma courant.

    Assurez-vous que le type de données dans la colonne Type est correctement défini.

    Pour plus d'informations concernant les types de données Java, à savoir le modèle de date, consultez Java API Specification (en anglais).

    Les types de données Talend les plus utilisés sont les suivants :

    • Object : est un type de données Talend générique qui permet le traitement des données sans tenir compte de leur contenu, par exemple, un fichier de données non supporté peut être traité à l'aide d'un composant tFileInputRaw en spécifiant qu'il comporte un type de données Object.

    • List : est une liste d'éléments de type primitifs, séparés par un espace, dans une définition de Schéma XML, définis à l'aide de l'élément xsd:list.

    • Dynamic : est un type de données pouvant être fixé pour une seule colonne à la fin d'un schéma afin de permettre le traitement des champs tels que les colonnes VARCHAR(100), également nommées 'Column<X>' ou si l'entrée comporte un en-tête, dans les noms de colonne figurant dans l'en-tête. Pour plus d'informations, consultez Schéma dynamique.

    • Document : est un type de données permettant le traitement d'un document XML en entier sans tenir compte de son contenu.

  4. Cliquez sur Finish pour terminer la création du schéma générique. Le schéma créé s'affiche sous le nœud Generic schemas.