Valider un fichier XML

XML validation

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Data Fabric
Talend Real-Time Big Data Platform
Talend Open Studio for Big Data
Talend Open Studio for ESB
Talend ESB
Talend Open Studio for Data Integration
Talend Data Services Platform
Talend Big Data
Talend MDM Platform
Talend Data Integration
Talend Open Studio for MDM
Talend Data Management Platform
Talend Big Data Platform
task
Gouvernance de données > Systèmes tiers > Composants XML > Composants de validation XML
Création et développement > Systèmes tiers > Composants XML > Composants de validation XML
Qualité et préparation de données > Systèmes tiers > Composants XML > Composants de validation XML
EnrichPlatform
Studio Talend

Procédure

  1. Cliquez et déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFileList, un tDTDValidator, un tMap et un tFileOutputDelimited.
  2. Connectez le tFileList au tDTDValidator avec un lien Iterate et les composants restants avec des liens Row Main.
  3. Paramétrez les propriétés du composant tFileList afin qu'il récupère les fichiers XML du dossier.
    Cliquez sur le bouton [+] pour ajouter une ligne de masque de fichier et saisissez le masque suivant : *.xml. Rappelez-vous que le code Java nécessite des guillemets doubles.
    Paramétrez le chemin d'accès des fichiers XML à vérifier.
    Sélectionnez No dans la liste déroulante Case Sensitive.
  4. Dans la vue Component du composant tDTDValidate, le schéma est en lecture seule puisqu'il contient des informations standard de log relatives au processus de validation.
    Dans le champ Dtd file, parcourez votre système jusqu'au fichier DTD à utiliser comme référence.
  5. Dans le champ Xml file, appuyez sur Ctrl+Espace pour accéder à la liste des variables et sélectionnez la variable permettant de récupérer le chemin d'accès des fichiers : ((String)globalMap.get("tFileList_1_CURRENT_FILEPATH")).
  6. Dans les divers messages à afficher dans la console Run, utilisez la variable jobName pour rappeler le nom du Job. Rappelez aussi le nom du fichier grâce à la variable : ((String)globalMap.get("tFileList_1_CURRENT_FILE")). Rappelez-vous que le code Java requiert des guillemets doubles.
    Cochez la case Print to Console.
  7. Dans le composant tMap, glissez-déposez les informations du schéma standard que vous souhaitez passer au fichier de sortie.
  8. Une fois le schéma de sortie défini, ajoutez une condition de filtre pour ne sélectionner que les informations de log lorsque le fichier XML est invalide.

    Saisissez d'abord la valeur souhaitée pour cette variable, l'opérateur en fonction du type de données filtrées puis la variable devant correspondre à cette condition, ici : 0 == $row1[validate].

  9. Puis (si cela n'est pas déjà effectué) connectez le tMap au tFileOutputDelimited via un lien Row > Main. Nommez-le errorsOnly.
  10. Dans l'onglet Basic settings du composant tFileOutputDelimited, paramétrez le chemin d'accès de destination du fichier délimité, les séparateurs de champs et l'encodage.
  11. Enregistrez le Job et appuyez sur F6 pour l'exécuter.
    Dans la console de la vue Run, les messages définis sont affichés pour chaque fichier invalide. Au même moment, le fichier de sortie est alimenté avec les données de log des fichiers invalides.