Configurer le composant tDataShuffling - 7.0

Data privacy

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tDataShuffling pour afficher sa vue Basic settings et définir ses propriétés.
  2. Cliquez sur Sync columns afin de récupérer le schéma défini dans le composant d'entrée.
  3. Dans la table Shuffling columns, cliquez quatre fois sur le bouton [+], pour ajouter quatre lignes, puis :
    • dans la colonne Column, sélectionnez les colonnes desquelles mélanger les données,

    • dans la colonne Group ID, sélectionnez l'identifiant de groupe pour chaque colonne. Les colonnes ayant le même identifiant de groupe sont mélangées ensemble.

    Dans l'exemple ci-dessus, il y a deux groupes de colonnes à mélanger :
    • Group ID 1 : credit_card

    • Group ID 2 : lname (nom de famille), fname (prénom) et mi (initiale du deuxième prénom)

    Le Job va remplacer les numéros de cartes de crédit de la colonne credit_card par des valeurs de différentes lignes. Il va également conserver ensemble les noms de famille, prénoms et initiales du deuxième prénom des colonnes lname, fname et mi, puis les remplacer par des valeurs de lignes différentes.
  4. Cliquez sur l'onglet Advanced settings.
    Dans la colonne Partitioning columns, cliquez sur le bouton [+] pour ajouter une ligne.
    Le Job va mélanger les lignes de données originales partageant une même valeur pour les colonnes de partitions.
    Dans l'exemple ci-dessus, le composant est configuré pour appliquer le processus de mélange aux lignes partageant la même valeur pour la colonne country.