tDatasetOutput - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Fonction

Le composant tDataSetOutput reçoit des données d'entrée des composants précédents et les écrit en sortie en tant que jeu de données que vous pouvez utiliser dans Talend Data Preparation.

Objectif

Ce composant vous permet de créer un jeu de données dans Talend Data Preparation.

Propriétés du tDataSetOutput

Famille du composant

Talend Data Preparation

 

Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

Url

Saisissez l'URL de l'application Web Talend Data Preparation, entre guillemets doubles.

 

Email

Saisissez l'adresse e-mail que vous utilisez pour vous connecter à l'application Web Talend Data Preparation, entre guillemets doubles. Ce champ est disponible uniquement en mode Create ou Update.

 

Password

Cliquez sur le bouton [...] et saisissez votre mot de passe de connexion à Talend Data Preparation, entre guillemets doubles. Ce champ est uniquement disponible en mode Create ou Update.

 

Mode

  • Create : crée un nouveau jeu de données à partir de vos données d'entrée dans Talend Data Preparation.

  • Update : utilise vos données d'entrée pour mettre à jour le jeu de données défini dans le champ Dataset Name.

  • Create or update: crée un nouveau jeu de données si le nom donné dans le champ Dataset Name n'est pas utilisé, ou bien met le jeu de données à jour si il existe déjà.

  • Livedataset : crée un jeu de données pouvant être importé dans Talend Data Preparation via l'exécution d'un Job à la demande dans Talend Administration Center.

 

Dataset Name

Saisissez le nom que vous souhaitez donner au nouveau jeu de données, entre guillemets doubles. Ce champ est disponible uniquement en mode Create, Update ou Create or update.

 

Limit

Spécifiez le nombre de lignes à traiter.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du Job ainsi qu'au niveau de chaque composant.

Utilisation

Ce composant nécessite des données d'entrée du composant précédent afin de créer ou de mettre à jour des jeux de données.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Scénario : Créer un jeu de données à partir d'un Job

Le composant tDatasetOutput reçoit des données d'entrée des composants précédents et les écrit en sortie en tant que jeu de données que vous pouvez utiliser dans Talend Data Preparation.

Le scénario suivant crée un Job simple qui :

  • extrait des informations d'une table d'une base de données contenant des données relatives à des clients,

  • écrit ces données en sortie sous forme d'un jeu de données que vous pouvez ouvrir et préparer dans Talend Data Preparation.

Ajouter et relier les composants

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tMysqlInput et un tDatasetOutput.

  2. Reliez le tMysqlInput au tDatasetOutput à l'aide d'un lien Row > Main.

Configurer les composants

Récupérer les données de la base de données

  1. Dans l'espace de modélisation graphique, sélectionnez le tMysqlInput, puis cliquez sur son onglet Component afin de définir ses paramètres simples.

  2. Dans la liste Property Type, sélectionnez Built-in afin de renseigner manuellement les informations de connexion.

  3. Dans la liste DB Version, sélectionnez la version de MySQL que vous utilisez, MySQL 5 dans cet exemple.

  4. Dans les champs Host, Port, Database, Username et Password, saisissez les informations de connexion à MySQL et les informations d'authentification à la base de données, entre guillemets doubles.

  5. Dans le champ Table Name, saisissez le nom de la table à lire, entre guillemets doubles.

  6. Dans le champ Query, saisissez entre guillemets doubles votre requête sur la base de données. Dans cet exemple, la requête est select * from employees afin de récupérer toutes les informations de la table employees, dans la base de données test.

  7. Cliquez sur Guess schema afin de récupérer automatiquement le schéma de la table de base de données ou saisissez manuellement le schéma en cliquant sur le bouton [...] à côté du champ Edit schema.

Créer le jeu de données dans Talend Data Preparation

  1. Dans l'espace de modélisation graphique, sélectionnez tDatasetOutput et cliquez sur son onglet Component pour définir ses paramètres simples.

  2. Cliquez sur le bouton Sync columns afin de récupérer le schéma du composant précédent, ou configurez manuellement le schéma en sélectionnant Built-in dans la liste Schema et en cliquant sur le bouton [...] à côté du champ Edit schema.

  3. Dans le champ URL, saisissez l'URL de l'application Web Talend Data Preparation, entre guillemets doubles. Le port 9999 est le port par défaut pour Talend Data Preparation.

  4. Dans le champ Email, saisissez l'adresse e-mail que vous utilisez pour vous connecter à l'application Web Talend Data Preparation, entre guillemets doubles.

  5. Sélectionnez le mode Create dans la liste Mode.

  6. Dans le champ Dataset Name, saisissez un nom pour votre jeu de données, entre guillemets doubles, tDatasetOutput_test dans cet exemple.

  7. Dans le champ Limit, saisissez un nombre au moins équivalent au nombre de lignes de votre fichier d'entrée. Dans cet exemple, la limite est de 500, car la table d'entrée contient 500 lignes.

Sauvegarder et exécuter le Job

  1. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

  2. Vous pouvez vous connecter à l'application Web Talend Data Preparation, dans laquelle le nouveau jeu de données est disponible dans la vue All datasets.