Utilisation de la parallélisation pour optimiser les performances des Jobs - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06

La parallélisation, en termes de Jobs Talend, signifie accomplir différents processus techniques via des exécutions parallèles. Lorsqu'il est bien conçu, un processus technique parallélisé peut être exécuté en moins de temps.

Le Studio Talend vous permet d'implémenter différents types de parallélisation selon les circonstances. Les circonstances peuvent être :

  1. Exécution parallèle de plusieurs sous-Jobs. Pour plus d'informations, consultez Exécuter plusieurs sous-Jobs en parallèle.

  2. Itérations parallèles pour lecture de données. Pour plus d'informations, consultez Lancer des itérations parallèles pour lire des données.

  3. Orchestration d'exécutions de sous-Jobs. Pour plus d'informations, consultez Orchestrer des exécutions parallèles de sous-Jobs.

  4. Accélération de l'écriture de données dans une base de données. Pour plus d'informations, consultez Écrire des données en parallèle.

  5. Accélération du traitement d'un flux de données. Pour plus d'informations, consultez Activer la parallélisation des flux de données.

La parallélisation est une fonctionnalité avancée et nécessite des connaissances basiques concernant les Jobs Talend, notamment comment créer et exécuter un Job ou un sous-Job, comment utiliser des composants et comment utiliser les différents types de liens reliant les composants ou les Jobs. Si vous ne possédez pas ces connaissances, consultez Qu'est-ce qu'un Job ?.