Configurer l'étape de dé-partitionnement - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data

Big Data Platform

Cloud API Services Platform

Cloud Big Data

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Procédure

  1. Cliquez sur le lien représentant l'étape de dé-partitionnement pour ouvrir sa vue Component. Cliquez ensuite sur l'onglet Parallelization.
    Vue Parallelization (Parallélisation).
    L'option Departition row a été automatiquement sélectionnée dans la zone Type. Si vous sélectionnez None, vous désactivez la parallélisation du flux de données sur ce lien. Notez que selon le lien que vous configurez, une option Repartition row peut être disponible dans la zone Type afin de re-partitionner un flux de données déjà dé-partitionné.
    Dans cette vue Parallelization, vous devez définir les propriétés suivantes :
    • Buffer Size : le nombre de lignes qui sont traitées avant que la mémoire soit libérée.
    • Merge sort partitions : cette option permet d'implémenter l'algorithme Mergesort afin d'assurer la cohérence des données.
  2. Si nécessaire, modifiez les valeurs dans le champ Buffer Size, pour adapter la capacité de la mémoire. Dans cet exemple, laissez la valeur par défaut.