tLoop - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Fonction

Le composant tLoop fait une boucle sur l'exécution d'une tâche.

Objectif

Le tLoop permet d'exécuter automatiquement une tâche ou un Job dans une boucle.

Si vous avez souscrit à l'une des solutions Big Data de Talend, ce composant est disponible dans les types de Job suivants :

Propriétés du tLoop

Famille de composant

Orchestration

 

Basic settings

Loop Type

Sélectionnez le type de boucle à effectuer : For ou While.

For : La tâche ou le Job est exécuté(e) pour le nombre de boucle défini.

While : La tâche ou le Job est exécuté(e) jusqu'à ce que la condition soit rencontrée.

For

From

Saisissez le numéro de la première instance sur laquelle la boucle doit commencer. Si vous sélectionnez l'instance numéro 2 comme instance de départ et que vous prenez un écart de 2, cela signifie que la boucle se fera sur tous les nombres pairs.

 

To

Saisissez la dernière instance sur laquelle la boucle doit passer.

 

Step

Saisissez l'écart entre deux instances avec lequel la boucle doit s'effectuer. Un écart de 2 signifie que la boucle passe toutes les deux instances.

 Values are increasingCochez cette case pour autoriser uniquement une séquence croissante.

While

Declaration

Saisissez une expression déclenchant la boucle.

 

Condition

Saisissez la condition devant être rencontrée pour que la boucle s'arrête.

 

Iteration

Saisissez l'expression décrivant l'opération à effectuer à chaque boucle.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Utilisation

Le composant tLoop est un composant de début et requiert une connexion de type Iterate au composant suivant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

CURRENT_VALUE : valeur courante. Disponible uniquement pour les boucles de type For. Cette variable est une variable Flow et retourne un entier.

CURRENT_ITERATION : numéro de séquence de l'itération courante. Cette variable est une variable Flow et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Connections

Liens de sortie (de ce composant à un autre) :

Row : Iterate.

Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError.

Liens d'entrée (d'un autre composant à celui-ci) :

Row : Iterate.

Trigger : OnSubjobOk, OnSubjobError, Run if, OnComponentOk, OnComponentError, Synchronize, Parallelize.

Pour plus d'informations concernant les liens, consultez le Guide utilisateur du Studio Talend.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Scénario : Exécuter un Job à partir d'une boucle

Ce scénario décrit un Job constitué d'un Job parent et d'un Job enfant. Le Job parent exécute une boucle qui permet d'exécuter un Job enfant cinq fois, avec une pause de trois secondes entre chaque exécution.

  1. Créez un Job nommé Parent puis déposez un tLoop, un tRunJob et un tSleep dans l'espace de modélisation graphique.

  2. Reliez le tLoop au tRunJob l'aide d'un lien Row > Iterate puis reliez le tRunJob au tSleep à l'aide d'un lien Row > Main.

  3. Créez un Job nommé Child puis déposez un tRowGenerator et un tLogRow dans l'espace de modélisation graphique.

  4. Reliez le tRowGenerator au tLogRow à l'aide d'un lien Row > Main.

  5. Dans la vue Basic settings du composant tLoop, définissez le type de boucle (For) puis saisissez le numéro de l'instance sur lequel commencer (1), le numéro de l'instance sur lequel finir (5) et l'écart à utiliser (1).

  6. Dans la vue Basic settings du composant tRunJob, sélectionnez le Job Child dans le champ Job.

  7. Dans la vue Basic settings du composant tSleep, saisissez la durée de la pause en secondes dans le champ Pause. Pour cet exemple, la pause est de 3 secondes.

  8. Double-cliquez sur le composant tRowGenerator afin d'ouvrir l'éditeur de schéma. Cliquez ensuite sur le bouton [+] afin d'ajouter quatre colonnes :

    • id, afin de générer les numéros de séquence

    • firstname, afin de générer des prénoms aléatoires

    • lastname, afin de générer des noms aléatoires

    • city, afin de générer des noms de ville aléatoires

    Pour plus d'informations concernant le tRowGenerator, consultez tRowGenerator.

  9. Appuyez sur F6 afin d'exécuter le Job Parent.

    Le Job Child est exécuté cinq fois avec une pause de trois secondes entre chacune des deux exécutions. Comme configuré dans le composant tRowGenerator, des informations personnelles aléatoires sont affichées dans la console Run.

Propriétés du tLoop dans des Jobs Spark Batch

Famille de composant

Orchestration

 

Basic settings

Loop Type

Sélectionnez le type de boucle à effectuer : For ou While.

For : La tâche ou le Job est exécuté(e) pour le nombre de boucle défini.

While : La tâche ou le Job est exécuté(e) jusqu'à ce que la condition soit rencontrée.

For

From

Saisissez le numéro de la première instance sur laquelle la boucle doit commencer. Si vous sélectionnez l'instance numéro 2 comme instance de départ et que vous prenez un écart de 2, cela signifie que la boucle se fera sur tous les nombres pairs.

 

To

Saisissez la dernière instance sur laquelle la boucle doit passer.

 

Step

Saisissez l'écart entre deux instances avec lequel la boucle doit s'effectuer. Un écart de 2 signifie que la boucle passe toutes les deux instances.

 Values are increasingCochez cette case pour autoriser uniquement une séquence croissante.

While

Declaration

Saisissez une expression déclenchant la boucle.

 

Condition

Saisissez la condition devant être rencontrée pour que la boucle s'arrête.

 

Iteration

Saisissez l'expression décrivant l'opération à effectuer à chaque boucle.

Utilisation dans des Jobs Spark Batch

Le composant tLoop est un composant de début et requiert une connexion de type Iterate au composant suivant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

CURRENT_VALUE : valeur courante. Disponible uniquement pour les boucles de type For. Cette variable est une variable Flow et retourne un entier.

CURRENT_ITERATION : numéro de séquence de l'itération courante. Cette variable est une variable Flow et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Spark Connection

Vous devez utiliser l'onglet Spark Configuration de la vue Run afin de définir la connexion à un cluster Spark donné pour le Job complet. De plus, puisque le Job attend ses fichiers .jar dépendants pour l'exécution, un (et un seul) composant relatif à un système de fichiers de la famille Storage est requis au sein du même Job, afin que Spark puisse utiliser ce composant pour se connecter au système de fichiers auquel les fichiers .jar dépendants du Job sont transférés :

Cette connexion fonctionne uniquement pour le Job dans lequel vous l'avez définie.

Scénario associé

Aucun scénario n'est disponible pour la version Spark Batch de ce composant.