tParallelize - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Fonction

Le composant tParallelize permet de synchroniser l'exécution d'un sous-job avec celle d'autres sous-jobs de votre job principal.

Objectif

Le tParallelize permet de gérer des systèmes de job complexes. Il exécute plusieurs sous-jobs simultanément et synchronise l'exécution d'un sous-job avec celle d'autres sous-jobs du même job principal.

Propriétés du tParallelize

Famille de composant

Orchestration

Basic settings

Wait For

end of first subjob : lance l'exécution du sous-job correspondant à la fin de l'exécution du premier sous-job.

 

 

end of all subjobs : lance l'exécution du sous-job correspondant à la fin de l'exécution de tous les sous-jobs.

 

Sleep Duration

Définit l'intervalle de temps (en secondes) entre chaque vérification de l'exécution du sous-job.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant peut être utilisé comme composant de début ou de milieu d'un job composé de plusieurs sous-jobs. Il peut être connecté au composant précédent/suivant à l'aide de connexion OnSubjobOk, Parallelize ou Synchronize. Vous pouvez utiliser autant de composants tParallelize que vous le souhaitez dans votre job.

Connections

Liens de sortie (de ce composant à un autre) :

Trigger : Synchronize, Parallelize.

Liens d'entrée (d'un autre composant à celui-ci) :

Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError.

Pour plus d'informations concernant les liens, consultez le Guide utilisateur du Studio Talend.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Scénario : Paralléliser/synchroniser les sous-jobs

Le scénario suivant décrit un job principal composé de cinq composants : un tParallelize et quatre tMsgBox représentant chacun un sous-job. Le composant tMsgBox_1 correspond au sous-job de déclenchement. Le composant tParallelize_1 exécute les composants tMsgBox_2 et tMsgBox_3 simultanément et synchronise le composant tMsgBox_4 afin qu'il s'exécute à la fin de l'exécution simultanée des sous-jobs.

  • Cliquez et déposez les quatre composants tMsgBox dans l'espace de modélisation.

  • Définissez les propriétés d'affichage des boîtes de dialogue comme vous le souhaitez.

Pour plus d'informations concernant les propriétés du tMsgBox, consultez tMsgBox.

  • Cliquez et déposez un composant tParallelize dans l'espace de modélisation.

  • Connectez le composant tMsgBox_1 au tParallelize_1 à l'aide d'une connexion OnSubjobOk, disponible à partir du menu contextuel. Cette connexion déclenchera le(s) sous-job(s) suivant(s) si le premier sous-job s'est exécuté sans échec.

  • Connectez le tParallelize_1 au tMsgBox_2 et au tMsgBox_3 à l'aide de connexions Parallelize, disponibles à partir du menu contextuel. Ces connexions vont simplement paralléliser l'exécution des deux sous-jobs connectés.

  • Connectez tParallelize_1 au composant tMsgBox_4 à l'aide d'une connexion Synchronize afin de séquencer l'exécution de ce quatrième sous-job.

  • Sélectionnez le composant tMsgBox_4 pour ensuite paramétrer ses propriétés dans l'onglet Basic settings.

  • Dans la liste déroulante Wait for de l'onglet Basic settings du composant tParallelize, sélectionnez parmi les options de séquençage end of first subjob ou end of all subjobs. Cela vous permettra de lancer l'exécution de votre quatrième sous-job soit à la fin du premier sous-job, soit à la fin de tous les sous-jobs.

  • Dans le champ Sleep Duration, définissez l'intervalle de temps (en secondes) entre chaque vérification de l'exécution du sous-job.

  • Enregistrez votre Job principal.

  • Cliquez sur F6 pour l'exécuter.

Les quatre boîtes de dialogue apparaissent dans l'ordre défini.

Le scénario décrit ci-dessus est un Job très simple montrant l'utilisation du composant tParallelize. Cependant, vous pouvez paralléliser/synchroniser des Jobs beaucoup plus complexes dans lesquels les sous-jobs du Job principal peuvent exécuter n'importe quelle tâche possible dans le Studio Talend.