Configuration des composants - 6.4

XML validation

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants XML > Composants de validation XML
Gouvernance de données > Systèmes tiers > Composants XML > Composants de validation XML
Qualité et préparation de données > Systèmes tiers > Composants XML > Composants de validation XML
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tFileInputDelimited pour ouvrir sa vue Component.
  2. Dans le champ File name/Stream, spécifiez le chemin d'accès au fichier d'entrée. Dans cet exemple, le fichier d'entrée est E:/ShipOrder.csv.
    Dans le champ Header, saisissez 1 pour ignorer la première ligne (l'en-tête) du fichier d'entrée.
    Cliquez sur le bouton [...] à côté du champ Edit schema et définissez le schéma en ajoutant deux colonnes ID et ShipOrder de type String.
  3. Double-cliquez sur le composant tXSDValidator pour ouvrir sa vue Component.
  4. Cliquez sur le bouton Sync columns afin de récupérer le schéma du composant tFileInputDelimited précédent et, dans la boîte de dialogue qui s'ouvre, cliquez sur Yes pour propager le schéma aux deux composants tFileOutputDelimited.
    Ajoutez une ligne à la table Allocate en cliquant sur le bouton [+]. Cliquez dans la cellule de la colonne Input Column et sélectionnez la colonne XML ShipOrder à valider. Dans la colonne XSD File, saisissez le chemin d'accès au fichier XSD de référence, E:/ShipOrder.xsd dans cet exemple.
  5. Double-cliquez sur le premier tFileOutputDelimited pour ouvrir sa vue Component.
  6. Dans le champ File Name, spécifiez le chemin d'accès au fichier de sortie qui stockera les lignes valides. Dans cet exemple, le fichier est E:/ShipOrder_Valid.csv.
    Cochez la case Include Header pour inclure les en-têtes de colonnes dans le fichier de sortie.
  7. Double-cliquez sur le second tFileOutputDelimited pour ouvrir sa vue Component.
  8. Cliquez sur le bouton [...] à côté du champ Edit schema pour voir son schéma.
    Vous pouvez voir qu'une colonne supplémentaire errorMessage contenant les informations d'erreur pour les lignes invalides est ajoutée automatiquement au schéma, en plus des deux colonnes propagées.
  9. Dans le champ File Name, spécifiez le chemin d'accès au fichier de sortie qui va stocker les lignes invalides et les messages d'erreur. Dans cet exemple, le fichier est E:/ShipOrder_Invalid.csv.
    Cochez la case Include Header pour inclure les colonnes d'en-tête dans le fichier de sortie.