Procédure
-
Double-cliquez sur le tDataShuffling pour afficher sa vue Basic settings et définir ses propriétés.
- Cliquez sur Sync columns afin de récupérer le schéma défini dans le composant d'entrée.
-
Dans la table Shuffling columns, cliquez quatre fois sur le bouton [+], pour ajouter quatre lignes, puis :
-
dans la colonne Column, sélectionnez les colonnes desquelles mélanger les données,
-
dans la colonne Group ID, sélectionnez l'identifiant de groupe pour chaque colonne. Les colonnes ayant le même identifiant de groupe sont mélangées ensemble.
Dans l'exemple ci-dessus, il y a deux groupes de colonnes à mélanger :-
Group ID 1 : credit_card
-
Group ID 2 : lname (nom de famille), fname (prénom) et mi (initiale du deuxième prénom)
-
-
Cliquez sur l'onglet Advanced settings.
Dans la colonne Partitioning columns, cliquez sur le bouton [+] pour ajouter une ligne.Le Job va mélanger les lignes de données originales partageant une même valeur pour les colonnes de partitions.Dans l'exemple ci-dessus, le composant est configuré pour appliquer le processus de mélange aux lignes partageant la même valeur pour la colonne country.