Création du Job dans le Studio Talend - 2.1

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.4
2.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

La première étape, lors de la création d'un jeu de données en temps réel est de créer un Job dans un projet distant, utilisant le composant tDatasetOutput en sortie.

Créer un jeu de données en temps réel à partir d'un fichier archive .zip est également possible avec un projet local.

Pour que votre Job puisse communiquer avec Talend Administration Center, il est recommandé d'ouvrir un projet avec une connexion distante.

Le Job le plus simple requis pour travailler sur le jeu de données en temps réel est le suivant :

Avant de commencer

Pour créer un jeu de données en temps réel fonctionnel lors de l'exécution de Talend Data Preparation avec une connexion https, effectuez la configuration suivante.

  • Récupérez le certificat de Talend Data Preparation, ou Certificate Authority et ajoutez-le à un nouveau fichier ou fichier existant .jks en suivant cet exemple : keytool -import -trustcacerts -alias <cert-alias> -file <dp_certificate.crt> -keystore <truststore.jks>
  • Reliez un composant tSetKeystore à un tRowGenerator à l'aide d'un lien OnSubjobOk, pour que le Job fasse confiance au certificat de Talend Data Preparation.

    Pour plus d'informations concernant la configuration du tSetKeystore, consultez la documentation du tSetKeystore.

Procédure

  1. Dans l'espace de modélisation graphique, ajoutez un composant d'entrée, un tRowGenerator dans cet exemple, puis cliquez sur l'onglet Component afin de configurer ses paramètres simples.
  2. Cliquez sur le bouton [...] à côté de RowGenerator Editor afin de définir un schéma pour vos données, puis choisissez le nombre de lignes à générer.
  3. Ajoutez un composant tDatasetOutput dans l'espace de modélisation graphique
  4. Reliez les deux composants tRowGenerator et tDatasetOutput à l'aide d'un lien Row > Main.
  5. Cliquez sur l'onglet Component du tDatasetOutput afin de configurer ses paramètres simples.
  6. Cliquez sur le bouton Sync Column, pour récupérer le schéma du composant précédent.
  7. Sélectionnez LiveDataset dans la liste Mode.

    Les champs Url et Limit sont automatiquement complétés.

  8. Sauvegardez votre Job.
  9. Si vous travaillez sur un projet local, cliquez-droit sur le nom de votre Job dans la vue Repository, puis cliquez sur Build Job pour exporter votre Job en tant qu'archive que vous pourrez charger dans Talend Administration Center.