tPartitioner

Orchestration (Integration)

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Real-Time Big Data Platform
Talend Open Studio for Data Integration
Talend MDM Platform
Talend Data Management Platform
Talend Open Studio for Big Data
Talend Open Studio for ESB
Talend Data Integration
Talend Data Fabric
Talend Data Services Platform
Talend Big Data Platform
Talend ESB
Talend Open Studio for MDM
task
Création et développement > Systèmes tiers > Composants Orchestration (Intégration)
Gouvernance de données > Systèmes tiers > Composants Orchestration (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Orchestration (Intégration)
EnrichPlatform
Studio Talend

Ce composant partitionne les données d'entrée avant que le tCollector les transfère aux processus d'exécutions parallèles.

Le tPartitioner divise les enregistrements d'entrée en un nombre de process que le tCollector envoie pour exécution parallèle.

Notez que le Studio Talend permet l'implémentation automatique de la parallélisation à travers le Job sans l'utilisation de composants de parallélisation. Cette approche est recommandée. Pour plus d'informations, consultez la section décrivant l'activation de la parallélisation de flux de données du Guide utilisateur du Studio Talend. Cependant, si vous souhaitez comprendre comment utiliser ces composants de parallélisation, gardez à l'esprit que ces composants fonctionnent ensemble en étroite relation pour accomplir des exécutions parallèles de processus donnés. Le composant tPartitioner divise les enregistrements d'entrée en un nombre spécifique de process. Le tCollector envoie ces process aux composants suivants. Le tDepartitioner regroupe les sorties des process parallèles traités. Le composant tRecollector capture la sortie d'un tDepartitioner donné et envoie les données capturées au composant suivant.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.