L'onglet Parallelization - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data

Big Data Platform

Cloud API Services Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

L'onglet Parallelization (Parallélisation) disponible dans l'onglet des paramètres vous permet de configurer une connexion Row.

Vue Parallelization (Parallélisation).

Configurez les propriétés de parallélisation de vos liens Row selon les options décrites dans le tableau suivant.

Champ/Option Description
Partition row Sélectionnez cette option si vous devez partitionner les enregistrements d'entrée dans un nombre spécifique de process.
Remarque :

Cette option n'est pas disponible pour la dernière connexion Row du flux.

Departition row Sélectionnez cette option si vous souhaitez regrouper les sorties des process traités en parallèle.
Remarque :

Cette option n'est pas disponible pour la première connexion du flux Row.

Repartition row Sélectionnez cette option si vous devez partitionner les process d'entrée en un certain nombre de process et regrouper les sorties des process traités en parallèle.
Remarque :

Cette option n'est pas disponible pour la première et la dernière connexion du flux Row.

None (Aucun(e)) Option par défaut. Sélectionnez cette option lorsque vous ne souhaitez pas effectuer d'action sur les enregistrements d'entrée.
Merge sort partitions Cochez cette case pour utiliser l'algorithme Mergesort afin d'assurer la cohérence des données.

Cette case apparaît lorsque vous sélectionnez l'option Departition row ou Repartition row.

Number of Child Threads Saisissez le nombre de process que vous souhaitez obtenir en divisant les enregistrements d'entrée.

Ce champ apparaît lorsque vous sélectionnez l'option Partition row ou Departition row.

Buffer Size Saisissez le nombre de lignes à mettre en cache pour chaque process généré.

Ce champ n'apparaît pas si vous sélectionnez l'option None.

Use a key hash for partitions Cochez cette case pour utiliser le mode hachage pour répartir les enregistrements d'entrée, ce qui assure le regroupement des enregistrements répondant aux mêmes critères dans les mêmes process. Sinon, le mode de répartition des données est Round-Robin.

Cette case apparaît si vous sélectionnez l'option Partition row ou Repartition row.

Dans la table Key Columns qui apparaît après avoir coché la case, configurez les colonnes sur lesquelles vous souhaitez utiliser le mode hachage.