Finaliser le schéma du fichier - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13

Pourquoi et quand exécuter cette tâche

Le schéma généré affiche les colonnes sélectionnées dans le fichier XML et vous permet de personnaliser ce schéma.

Procédure

  1. Si nécessaire, renommez la métadonnée dans le champ Name, (metadata, par défaut), ajoutez un commentaire dans le champ Comment et procédez à d'autres modifications, par exemple :
    • Définissez les colonnes en éditant les champs correspondants.

    • Ajoutez ou supprimez une colonne à l'aide des boutons et .

    • Modifiez l'ordre des colonnes à l'aide des boutons et .

    Avertissement : Évitez d'utiliser tout mot-clé réservé à Java comme nom de colonne de schéma.
    Assurez-vous que le type de données dans la colonne Type est correctement défini.
    Pour plus d'informations concernant les types de données Java, à savoir le modèle de date, consultez Java API Specification (en anglais).
    Les types de données Talend les plus utilisés sont les suivants :
    • Object : est un type de données Talend générique qui permet le traitement des données sans tenir compte de leur contenu, par exemple, un fichier de données non supporté peut être traité à l'aide d'un composant tFileInputRaw en spécifiant qu'il comporte un type de données Object.

    • List : est une liste d'éléments de type primitifs, séparés par un espace, dans une définition de Schéma XML, définis à l'aide de l'élément xsd:list.

    • Dynamic : est un type de données pouvant être fixé pour une seule colonne à la fin d'un schéma afin de permettre le traitement des champs tels que les colonnes VARCHAR(100), également nommées ‘Column<X>’ ou si l'entrée comporte un en-tête, dans les noms de colonne figurant dans l'en-tête. Pour plus d'informations, consultez Schéma dynamique.

    • Document : est un type de données permettant le traitement d'un document XML en entier sans tenir compte de son contenu.

  2. Si le fichier XML sur lequel se base le schéma a été modifié, cliquez sur le bouton Guess afin de générer à nouveau le schéma. Notez que, si vous avez personnalisé le schéma, la fonctionnalité Guess ne retient pas ces modifications.
  3. Cliquez sur Finish (Terminer). La nouvelle connexion au fichier, ainsi que son schéma, s'affichent sous le nœud File XML du Repository.

Résultats

Vous pouvez à présent déposer n'importe quelle connexion à un fichier ou n'importe quel schéma depuis le Repository dans l'espace de modélisation graphique en tant que nouveau composant tFileInputXML ou tExtractXMLField. Vous pouvez également la déposer sur un composant afin de réutiliser ses métadonnées. Pour plus d'informations concernant l'utilisation des métadonnées centralisées, consultez Comment utiliser les métadonnées centralisées dans un Job et Paramétrer un schéma du Repository dans un Job.

Pour modifier une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Edit file xml afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour ajouter un nouveau schéma à une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Retrieve Schema dans le menu contextuel.

Pour modifier un schéma de fichier existant, cliquez-droit sur le schéma dans la vue Repository et sélectionnez Edit Schema dans le menu contextuel.