Valider un fichier XML - Cloud - 8.0

Validation XML

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants XML > Composants de validation XML
Gouvernance de données > Systèmes tiers > Composants XML > Composants de validation XML
Qualité et préparation de données > Systèmes tiers > Composants XML > Composants de validation XML
Last publication date
2024-02-21

Procédure

  1. Cliquez et déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFileList, un tDTDValidator, un tMap et un tFileOutputDelimited.
  2. Reliez le tFileList au tDTDValidator avec un lien Iterate et les composants restants avec des liens Row Main.
  3. Paramétrez les propriétés du composant tFileList afin qu'il récupère les fichiers XML du dossier.
    Cliquez sur le bouton [+] pour ajouter une ligne de masque de fichier et saisissez le masque suivant : *.xml. Rappelez-vous que le code Java nécessite des guillemets doubles.
    Paramétrez le chemin d'accès des fichiers XML à vérifier.
    Sélectionnez No dans la liste déroulante Case Sensitive.
  4. Dans la vue Component du composant tDTDValidator, le schéma est en lecture seule puisqu'il contient des informations standard de log relatives au processus de validation.
    Dans le champ Dtd file, parcourez votre système jusqu'au fichier DTD à utiliser comme référence.
  5. Dans le champ Xml file, appuyez sur Ctrl+Espace pour accéder à la liste des variables et double-cliquez sur la variable globale du FilePath en cours : tFileList.CURRENT_FILEPATH.
  6. Dans les divers messages à afficher dans la console Run, utilisez la variable jobName pour rappeler le nom du Job. Rappelez aussi le nom du fichier grâce à la variable : ((String)globalMap.get("tFileList_1_CURRENT_FILE")). Rappelez-vous que le code Java nécessite des guillemets doubles.
    Cochez la case Print to Console.
  7. Dans le composant tMap, cliquez sur le bouton [...] près de Map Editor et glissez-déposez les données du schéma standard à passer au fichier de sortie.
  8. Une fois le schéma de sortie défini, ajoutez une condition de filtre pour ne sélectionner que les informations de log lorsque le fichier XML est invalide.
    Saisissez d'abord la valeur souhaitée pour cette variable, l'opérateur en fonction du type de données filtrées puis la variable devant correspondre à cette condition. Dans ce cas : 0 == row1.validate.
  9. Puis (si cela n'est pas déjà effectué), reliez le tMap au tFileOutputDelimited via un lien Row > Main. Nommez-le errorsOnly.
  10. Dans l'onglet Basic settings du composant tFileOutputDelimited, paramétrez le chemin d'accès de destination du fichier délimité, les séparateurs de champs et l'encodage.
  11. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.
    Dans la console de la vue Run, les messages définis sont affichés pour chaque fichier invalide. Au même moment, le fichier de sortie est alimenté avec les données de log des fichiers invalides.