Accéder au contenu principal Passer au contenu complémentaire

Configurer le composant tDataShuffling

Procédure

  1. Double-cliquez sur le tDataShuffling pour afficher sa vue Basic settings et définir ses propriétés.
  2. Cliquez sur Sync columns afin de récupérer le schéma défini dans le composant d'entrée.
  3. Dans la table Shuffling columns, cliquez quatre fois sur le bouton [+], pour ajouter quatre lignes, puis :
    • dans la colonne Column, sélectionnez les colonnes desquelles mélanger les données,

    • dans la colonne Group ID, sélectionnez l'identifiant de groupe pour chaque colonne. Les colonnes ayant le même identifiant de groupe sont mélangées ensemble.

    Dans l'exemple ci-dessus, il y a deux groupes de colonnes à mélanger :
    • Group ID 1 : credit_card

    • Group ID 2 : lname (nom de famille), fname (prénom) et mi (initiale du deuxième prénom)

    Le Job va remplacer les numéros de cartes de crédit de la colonne credit_card par des valeurs de différentes lignes. Il va également conserver ensemble les noms de famille, prénoms et initiales du deuxième prénom des colonnes lname, fname et mi, puis les remplacer par des valeurs de lignes différentes.
  4. Cliquez sur l'onglet Advanced settings.
    Dans la colonne Partitioning columns, cliquez sur le bouton [+] pour ajouter une ligne.
    Le Job va mélanger les lignes de données originales partageant une même valeur pour les colonnes de partitions.
    Dans l'exemple ci-dessus, le composant est configuré pour appliquer le processus de mélange aux lignes partageant la même valeur pour la colonne country.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !