tEXistGet - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tEXistGet

Famille de composant

Databases/eXist

 

Fonction

Le composant tEXistGet récupère des ressources à partir d'un serveur distant de base de données eXist.

Objectif

Le tEXistGet télécharge les ressources sélectionnées à partir d'un serveur distant de base de données dans un répertoire local.

Basic settings

Use an existing connection/Component List

Cochez cette case et sélectionnez le composant de connexion adéquat à partir de la liste Component List pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

Note

Lorsqu'un Job contient un Job parent et un Job enfant, la liste Component List présente uniquement les composants de connexion du Job du même niveau.

 

URI

URI de la base de données à laquelle vous souhaitez vous connecter.

 

Collection

Saisissez le chemin d'accès à la collection à laquelle vous souhaitez accéder, sur le serveur de la base de données.

 

Driver

Ce champ est automatiquement rempli. Par défaut, le nom du pilote standard s'affiche.

Note

Les utilisateurs peuvent spécifier un pilote différent, selon leurs besoins.

 

Username et Password

Informations d'authentification de l'utilisateur de base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles, puis cliquez sur OK afin de sauvegarder les paramètres.

 

Local directory

Chemin d'accès au fichier de destination.

 

Files

Cliquez sur le bouton [+] afin d'ajouter les lignes que vous souhaitez utiliser comme filtres :

Filemask : saisissez le nom du fichier ou le masque de fichier, en utilisant des caractères de remplacement (*) ou des expressions régulières.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

NB_FILE : Indique le nombre de fichiers traités. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est utilisé en tant que sous-job ou comme composant de sortie. La base de données eXist est un système de gestion de base de données open source, construit à l'aide de la technologie XML. Elle stocke des données XML selon le modèle de données XML et offre une fonction efficace de traitement de la requête XQuery, basée sur l'index. Pour plus d'informations concernant XQuery, consultez : XQuery (en anglais). Pour plus d'informations concernant les extensions de XQuery Update, consultez : XQuery update extension

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Limitation

Du fait d'une incompatibilité de licence, un ou plusieurs Jar requis pour utiliser ce composant ne sont pas fournis. Vous pouvez installer les Jar manquants pour ce composant en cliquant sur le bouton Install dans l'onglet Component. Vous pouvez également trouver les Jar manquants et les ajouter dans l'onglet Modules de la perspective Integration de votre studio. Pour plus d'informations, consultez la page https://help.talend.com/display/KB/How+to+install+external+modules+in+the+Talend+products (en anglais) ou la section décrivant comment configurer le studio, dans le Guide d'installation et de migration Talend.

Scénario : Récupérer des ressources à partir d'un serveur distant de base de données eXist

Ce scénario décrit un Job à un composant qui permet de récupérer des données à partir d'un serveur de base de données eXist et de télécharger les données dans un répertoire local.

Ce Job simple nécessite un composant : le tEXistGet.

  1. A partir de la Palette, déposez le composant tEXistGet dans l'espace de modélisation graphique.

  2. Double-cliquez sur le composant tEXistGet pour définir ses propriétés dans l'onglet Basic settings de sa vue Component.

  3. Renseignez le champ URI en saisissant l'adresse URI de la base de données eXist à laquelle vous souhaitez vous connecter.

    Dans ce scénario, l'URI est xmldb:exist://192.168.0.165:8080/exist/xmlrpc. Notez que cette adresse URI est destinée essentiellement à la démonstration et que ce n'est pas une adresse valide.

  4. Remplissez le champ Collection avec le chemin d'accès à la collection souhaitée sur le serveur de la base de données, /db/talend dans ce scénario.

  5. Renseignez le champ Driver en saisissant le pilote de la base de données XML, org.exist.xmldb.DatabaseImpl dans ce scénario.

  6. Remplissez les champs Username et Password avec admin et talend respectivement pour ce scénario.

  7. Cliquez sur le bouton [...] à côté du champ Local directory pour définir le chemin d'accès au répertoire dans lequel le fichier XML téléchargé à partir du serveur de la base de données sera sauvegardé.

    Dans ce scénario, faites pointer ce chemin vers votre bureau, par exemple :

    C:/Documents and Settings/galano/Desktop/ExistGet.

  8. Dans le champ Files, cliquez sur le bouton [+] afin d'ajouter une nouvelle ligne dans la zone Filemask et remplissez-la avec un nom de fichier complet pour récupérer les données à partir d'un fichier spécifique sur le serveur, ou avec un masque de fichier (filemask) pour récupérer les données à partir d'un ensemble de fichiers. Dans ce scénario, saisissez dictionary_en.xml.

  9. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

Le fichier XML dictionary_en.xml est récupéré et téléchargé dans le répertoire local défini préalablement.