Création du Job dans le Studio Talend - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Pour créer un Live dataset (jeu de données en temps réel), vous devez créer un Job utilisant le composant tDatasetOutput en sortie.

Avertissement :

Pour que le jeu de données puisse être récupéré par Talend Cloud Data Preparation, le nom de votre Job et de la tâche qui en découlera, doit avoir le préfixe dataprep_. Dans cet exemple, le Job est sauvegardé avec le nom dataprep_live_dataset_tmc.

Le Job le plus simple requis pour travailler sur le jeu de données en temps réel est le suivant :

Vous pouvez utiliser d'autres types de composants comme source de données, mais le Job doit forcément utiliser le composant tDatasetOutput en sortie.

Avant de commencer

  • Vous devez avoir la version 7.1 du Studio Talend.
  • Vous avez configuré une connexion au Cloud dans la fenêtre Preferences du Studio Talend. Pour plus d'informations, consultez Guide de prise en main de Talend Cloud.
  • Le nom de votre Job utilise le préfixe dataprep_.

Procédure

  1. Dans l'espace de modélisation graphique, ajoutez un composant d'entrée, un tRowGenerator dans cet exemple, puis cliquez sur l'onglet Component afin de configurer ses paramètres simples.
  2. Cliquez sur le bouton [...] à côté de RowGenerator Editor afin de configurer un schéma pour vos données et choisir le nombre de lignes à générer.
  3. Ajoutez un composant tDatasetOutput dans l'espace de modélisation graphique.
  4. Reliez les deux composants tRowGenerator et tDatasetOutput à l'aide d'un lien Row > Main.
  5. Cliquez sur l'onglet Component du composant tDatasetOutput pour définir ses paramètres simples.
  6. Cliquez sur Sync Column afin de récupérer le schéma du composant précédent.
  7. Sélectionnez LiveDataset dans la liste Mode.

    Les champs Url et Limit sont automatiquement complétés.

  8. Sauvegardez votre Job, et depuis l'arborescence de la vue Repository, cliquez droit sur votre Job et sélectionnez Publish to Cloud.

    La fenêtre Publish to Cloud s'ouvre, où vous pouvez saisir un numéro de version pour votre Job.

  9. Cliquez sur Finish.
  10. Lorsque la publication est terminée, vous avez la possibilité d'ouvrir la tâche nouvellement créée dans l'interface de Talend Cloud Management Console. Ignorez cette étape et cliquez sur OK.

    Cliquer sur Open Job Task vous permet d'ouvrir votre tâche dans l'interface de Talend Cloud Management Console. Vous pouvez ignorer ces champs pour vous rendre directement dans l'interface de Talend Cloud Data Preparation.

Résultats

Votre Job a été publié en tant que tâche dans Talend Cloud Management Console, où il est à présent disponible dans le menu Management > Tasks and plans dans le panneau de gauche.

Que faire ensuite

Si vous souhaitez exécuter votre tâche sur le moteur Cloud par défaut, vous pouvez vous rendre directement dans l'interface de Talend Cloud Data Preparation pour créer votre Live dataset.

Si vous souhaitez exécuter votre tâche sur un moteur distant ou sur un moteur Cloud qui n'est pas celui par défaut, allez dans l'application Talend Cloud Management Console afin de modifier la tâche :

  1. Sélectionnez la tâche dataprep_live_dataset_tmc.
  2. Placez votre curseur sur le panneau Configuration et cliquez sur l'icône représentant un crayon afin de modifier la tâche.
  3. Dans la liste déroulante Go Live > Runtime, sélectionnez votre moteur favori et, dans la liste déroulante Go Live > Run type, sélectionnez To be used in Plans only.

    Vous ne devez en aucun cas choisir une autre valeur pour ce champ. La tâche ne doit pas être planifiée, puisqu'elle sera déclenchée à la demande par les utilisateurs dans Talend Cloud Data Preparation.

  4. Cliquez sur Go Live.