Création d'un jeu de données à partir d'un Job Talend

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.4
2.1
EnrichProdName
Talend MDM Platform
Talend Real-Time Big Data Platform
Talend Data Services Platform
Talend Big Data
Talend Data Management Platform
Talend Data Fabric
Talend ESB
Talend Data Integration
Talend Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Vous pouvez utiliser un Job Talend avec tout flux d'entrée afin de créer un jeu de données dans Talend Data Preparation.

Pour créer un jeu de données dans le Studio Talend, vous devez créer un Job utilisant le composant tDatasetOutput en sortie et le configurer pour qu'il utilise le mode Create. Vous pouvez utiliser tout type de flux d'entrée, mais le Job le plus simple pour créer un jeu de données est le suivant :

Procédure

  1. Dans l'espace de modélisation graphique, ajoutez un composant tRowGenerator et cliquez sur son onglet Component pour configurer ses paramètres simples.
  2. Cliquez sur le bouton [...] à côté de RowGenerator Editor afin de configurer un schéma pour vos données et choisir le nombre de lignes à générer.
  3. Dans l'espace de modélisation graphique, ajoutez un tDatasetOutput et cliquez sur son onglet Component pour configurer ses paramètres simples.
  4. Cliquez sur Sync Column afin de récupérer le schéma du composant précédent.
  5. Dans le champ URL, saisissez l'URL de l'application Web Talend Data Preparation, entre guillemets doubles. Le port 9999 est le port par défaut pour Talend Data Preparation.
  6. Dans le champ Email, saisissez l'adresse e-mail utilisée pour vous connecter à l'application Web Talend Data Preparation, entre guillemets doubles.
  7. Dans le champ Password, saisissez votre mot de passe de connexion à l'application Web Talend Data Preparation, entre guillemets doubles.
    L'utilisateur à qui appartiennent ces informations d'authentification sera le détenteur du nouveau jeu de données créé. Il sera aussi celui qui pourra partager ce jeu de données avec d'autres utilisateurs.
  8. Sélectionnez le mode Create dans la liste Mode.
    Choisir le mode Update vous permet d'utiliser l'entrée pour mettre à jour le jeu de données défini dans le champ Dataset Name.
  9. Dans le champ Dataset Name, saisissez un nom pour votre jeu de données, entre guillemets doubles, create_dataset_from_job, dans cet exemple.
  10. Reliez les deux composants à l'aide d'un lien Row > Main.
  11. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

Résultats

Vous pouvez vous connecter à l'application Web Talend Data Preparation, où le nouveau jeu de données est disponible dans la vue Datasets.