Scénario : Valider un fichier XML - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario décrit un Job permettant de valider plusieurs fichiers d'un répertoire et de transmettre les informations de validation des fichiers non valides dans un fichier délimité.

  • Cliquez et déposez les composants suivants de la Palette : tFileList, tDTDValidator, tMap, tFileOutputDelimited.

  • Connectez le tFileList et le tDTDValidator avec un lien Iterate et les composants restants avec des liens Row Main.

  • Paramétrez les propriétés du composant tFileList afin qu'il récupère les fichiers XML du répertoire.

  • Dans le champ Filemask, saisissez le masque *.xml entre guillemets doubles.

  • Paramétrez le chemin d'accès des fichiers XML à vérifier.

  • Décochez la case Case Sensitive.

  • Dans la vue Component du composant tDTDValidate, le schéma est en lecture seule puisqu'il contient des informations de validation standard.

  • Paramétrez les propriétés du fichier DTD à utiliser comme référence, dans le champ DTD file.

  • Dans le champ Xml file, appuyez sur Ctrl+Espace pour accéder à la liste des variables globales et sélectionnez la variable permettant de récupérer le chemin d'accès des fichiers : ((String)globalMap.get("tFileList_1_CURRENT_FILE"))

  • Dans les divers messages à afficher dans la console Run, utilisez JobName pour afficher le libellé du Job. Rappelez aussi le nom du fichier grâce à la variable : ((String)globalMap.get("tFileList_1_CURRENT_FILE")).

  • Cochez la case Print to Console.

  • Dans le composant tMap, glissez-déposez les informations de validation du schéma standard que vous souhaitez passer au fichier de sortie.

  • Une fois que le schéma de sortie est défini, ajoutez un filtre de condition pour ne sélectionner que les informations lorsque le fichier XML n'est pas valide.

  • Saisissez d'abord la valeur souhaitée pour cette variable, l'opérateur en fonction du type de données filtrées puis la variable devant correspondre à cette condition, ici : 0 == $row1[validate]

  • Puis (si cela n'est pas déjà effectué) connectez le tMap au tFileOutputDelimited via un lien Row > Main. Nommez-le errorsOnly.

  • Dans l'onglet Basic settings du composant tFileOutputDelimited, paramétrez le chemin d'accès de destination du fichier délimité, les séparateurs de champs et l'encodage.

  • Enregistrez le Job et appuyez sur F6 pour l'exécuter.

Dans la console de la vue Run, les messages définis apparaissent pour chaque fichier invalide. Au même moment, le fichier de sortie est alimenté avec les informations de validation.