tXSDValidator - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tXSDValidator

Famille du composant

XML

 

Fonction

Le composant tXSDValidator valide un fichier XML entrant en fonction d'un fichier XSD et envoie les informations de validation à la sortie définie.

Objectif

Ce composant permet de vérifier les données et la qualité de la structure du fichier traité

Basic settings

Mode

Dans cette liste déroulante, sélectionnez :

-File pour valider un fichier d'entrée,

-Flow pour valider un flux d'entrée.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma de ce composant est en lecture seule. Il contient les informations standard de validation de fichier.

Note

Mode File uniquement

XSD file

Chemin d'accès au fichier XSD de référence. URL HTTP également supportée, par exemple http://localhost:8080/book.xsd.

Note

Mode File uniquement

XML file

Chemin d'accès au fichier XML à valider.

Note

Mode File uniquement

If XML is valid, display If XML is invalid, display

Saisissez un message à afficher dans la console Run basé sur le résultat de la comparaison.

Note

Mode File uniquement

Print to console

Cochez cette case pour afficher le message de validation.

Note

Mode Flow uniquement

Allocate

Spécifiez la ou les colonne(s) à valider ainsi que le chemin d'accès au fichier XSD de référence.

Advanced settings

Encoding

Saisissez, entre guillemets, le type d'encodage.

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

DIFFERENCE : résultat de la validation. Cette variable est une variable Flow et retourne une chaîne de caractères.

VALID : résultat de la validation. Cette variable est une variable Flow et retourne un booléen.

XSD_ERROR_MESSAGE : message d'erreur XSD généré par le composant. Cette variable est une variable Flow et retourne une chaîne de caractères.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant peut être utilisé en standalone mais il est généralement connecté à un composant de sortie pour rassembler les informations de validation.

Scénario : Valider des flux de données par rapport à un fichier XSD

Ce scénario décrit un Job en Java qui valide une colonne XML dans un fichier d'entrée par rapport à un fichier XSD de référence et écrit les informations de log concernant les lignes invalides de la colonne dans un fichier délimité.

Pour un exemple d'utilisation du tXSDValidator validant un fichier XML, consultez Scénario : Valider un fichier XML.

  1. Déposez de la Palette dans l'espace de modélisation graphique les composants tFileInputDelimited, tXSDValidator ainsi que deux tFileOutputDelimited.

  2. Double-cliquez sur le composant tFileInputDelimited afin d'ouvrir sa vue Component et définir ses propriétés.

  3. Dans la liste Property Type, sélectionnez Built-In.

    Dans le champ File name/Stream, cliquez sur le bouton [...] afin de parcourir votre répertoire jusqu'au fichier d'entrée.

    Dans la liste Schema, sélectionnez Built-In.

    Cliquez sur Edit Schema et modifiez le schéma pour qu'il corresponde à celui du fichier d'entrée. Dans ce scénario, le fichier d'entrée contient deux colonnes : ID et ShipmentInfo. La colonne ShipmentInfo est une colonne XML nécessitant d'être validée.

  4. Dans l'espace de modélisation graphique, reliez le composant tFileInputDelimited au tXSDValidator à l'aide d'un lien Row > Main.

  5. Double-cliquez sur le composant tXSDValidator et configurez ses propriétés.

  6. Dans la liste Mode, sélectionnez Flow Mode.

    Dans la liste Schema, sélectionnez Built-In. Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.

    Pour voir ou modifier le schéma, cliquez sur le bouton [...].Cliquez sur le bouton [+] sous le tableau Allocate afin d'ajouter une ligne. Le nom de la première colonne du fichier d'entrée apparaît automatiquement dans le champ Input Column. Cliquez dans le champ et sélectionnez la colonne que vous souhaitez valider.

    Dans le champ XSD File, saisissez le chemin d'accès à votre fichier XSD de référence.

  7. Dans l'espace de modélisation, reliez le composant tXSDValidator au tFileOutputDelimited à l'aide d'un lien Row > Main afin d'écrire les informations concernant les lignes XML valides.

  8. Reliez le tXSDValidator au second tFileOutputDelimited à l'aide d'un lien Row > Rejects afin d'écrire les informations concernant les lignes XML invalides.

  9. Double-cliquez sur les composants tFileOutputDelimited l'un après l'autre et configurez leurs propriétés.

    Dans le champ File Name, parcourez votre répertoire jusqu'au fichier que vous souhaitez utiliser.

  10. Dans la liste Schema, sélectionnez Built-In puis cliquez sur le bouton Sync columns afin de récupérer le schéma du composant précédent.

  11. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

Les fichiers de sortie contiennent les informations concernant les lignes XML valides et invalides de la colonne spécifiée.