Scénario : Valider des flux de données par rapport à un fichier XSD - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario décrit un Job en Java qui valide une colonne XML dans un fichier d'entrée par rapport à un fichier XSD de référence et écrit les informations de log concernant les lignes invalides de la colonne dans un fichier délimité.

Pour un exemple d'utilisation du tXSDValidator validant un fichier XML, consultez Scénario : Valider un fichier XML.

  1. Déposez de la Palette dans l'espace de modélisation graphique les composants tFileInputDelimited, tXSDValidator ainsi que deux tFileOutputDelimited.

  2. Double-cliquez sur le composant tFileInputDelimited afin d'ouvrir sa vue Component et définir ses propriétés.

  3. Dans la liste Property Type, sélectionnez Built-In.

    Dans le champ File name/Stream, cliquez sur le bouton [...] afin de parcourir votre répertoire jusqu'au fichier d'entrée.

    Dans la liste Schema, sélectionnez Built-In.

    Cliquez sur Edit Schema et modifiez le schéma pour qu'il corresponde à celui du fichier d'entrée. Dans ce scénario, le fichier d'entrée contient deux colonnes : ID et ShipmentInfo. La colonne ShipmentInfo est une colonne XML nécessitant d'être validée.

  4. Dans l'espace de modélisation graphique, reliez le composant tFileInputDelimited au tXSDValidator à l'aide d'un lien Row > Main.

  5. Double-cliquez sur le composant tXSDValidator et configurez ses propriétés.

  6. Dans la liste Mode, sélectionnez Flow Mode.

    Dans la liste Schema, sélectionnez Built-In. Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.

    Pour voir ou modifier le schéma, cliquez sur le bouton [...].Cliquez sur le bouton [+] sous le tableau Allocate afin d'ajouter une ligne. Le nom de la première colonne du fichier d'entrée apparaît automatiquement dans le champ Input Column. Cliquez dans le champ et sélectionnez la colonne que vous souhaitez valider.

    Dans le champ XSD File, saisissez le chemin d'accès à votre fichier XSD de référence.

  7. Dans l'espace de modélisation, reliez le composant tXSDValidator au tFileOutputDelimited à l'aide d'un lien Row > Main afin d'écrire les informations concernant les lignes XML valides.

  8. Reliez le tXSDValidator au second tFileOutputDelimited à l'aide d'un lien Row > Rejects afin d'écrire les informations concernant les lignes XML invalides.

  9. Double-cliquez sur les composants tFileOutputDelimited l'un après l'autre et configurez leurs propriétés.

    Dans le champ File Name, parcourez votre répertoire jusqu'au fichier que vous souhaitez utiliser.

  10. Dans la liste Schema, sélectionnez Built-In puis cliquez sur le bouton Sync columns afin de récupérer le schéma du composant précédent.

  11. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

Les fichiers de sortie contiennent les informations concernant les lignes XML valides et invalides de la colonne spécifiée.