Écrire des données en parallèle - 6.5

Talend Data Services Platform Studio Guide utilisateur

EnrichVersion
6.5
EnrichProdName
Talend Data Services Platform
EnrichPlatform
Studio Talend
task
Création et développement
Qualité et préparation de données

Notez que lorsque l'exécution parallèle est activée, il n'est pas possible d'utiliser les variables globales pour retrouver les valeurs de retour dans un sous-Job.

L'onglet Advanced settings de tous les composants de sortie de bases de données inclut l'option Enable parallel execution permettant d'améliorer le processus de traitement de données en les divisant en plusieurs fragments de flux traités simultanément.

Lorsque vous cochez la case Enable parallel execution, un champ Number of parallel executions s'affiche dans lequel vous pouvez saisir le nombre par lequel les données traitées actuellement sont divisées pour atteindre un niveau N de traitements parallèles.

Les données traitées sont alors exécutées en fragments N et pourront s'exécuter N fois plus vite qu'un traitement de données en un seul fragment.

Vous pouvez aussi configurer la parallélisation de flux de données à partir de l'espace de modélisation de la perspective Integration . Pour cela :

  1. Cliquez-droit sur le composant de sortie de base de données de votre Job et sélectionnez Parallelize dans la liste déroulante pour afficher une boîte de dialogue.

  2. Cochez la case Enable parallel execution et saisissez le nombre d'exécutions parallèles dans le champ correspondant. Sinon, appuyez sur Ctrl+Espace et sélectionnez dans la liste la variable de contexte adéquate.

  3. Cliquez sur OK pour valider les paramètres de parallélisation du flux de données.

    Le nombre d'exécution en parallèle apparaît à côté du composant de sortie de base de données dans l'espace de modélisation.