Configurer les opérations de masquage - 7.0

Data privacy

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
EnrichPlatform
Studio Talend

Le fichier alpha_values.csv contient les valeurs alphabétiques autorisées : toutes les lettres de A à Z (sauf S, L, O, I, B, Z). Le fichier alphanum_values.csv contient les valeurs alphanumériques autorisées : les valeurs contenues dans le fichier alpha_values.csv et des chiffres.

Avant de commencer

  • Vous avez récupéré les fichiers alpha_values.csv et alphanum_values.csv depuis l'onglet Téléchargements du panneau de gauche de la page.
  • Vous avez défini des variables de contexte vers les fichiers alpha_values.csv et alphanum_values.csv. Pour plus d'informations, consultez Définir les variables de contexte pour un Job.

Procédure

  1. Double-cliquez sur le tPatternMasking pour afficher sa vue Basic settings dans l'onglet Component.
  2. Si nécessaire, cliquez sur Sync columns pour récupérer le schéma défini dans le composant d'entrée.
  3. Cliquez sur le bouton à côté de Edit schema pour ouvrir la fenêtre du schéma.

    Le tPatternMasking ajoute une colonne en lecture seule au schéma de sortie.

    La colonne ORIGINAL_MARK libelle les enregistrements de sortie :

    • les enregistrements originaux sont libellés comme true.
    • les enregistrements substitués sont libellés comme false.
  4. Sous la table Modifications, cliquez sur le bouton [+] pour ajouter dix lignes, pour configurer les opérations de masquage de données :
    Les neuf premières lignes définissent les opérations de masquage pour chacun des neufs premiers caractères dans les valeurs en entrée. La dernière ligne définit l'opération de masquage pour les deux derniers caractères dans les valeurs en entrée.
    Le tiret est utilisé comme séparateur dans les valeurs en entrée. Vous n'avez pas besoin de configurer d'opérations de masquage des données pour les séparateurs car les données masquées générées en sortie conservent les séparateurs des valeurs en entrée.
  5. Configurez les opérations de masquage des données pour le premier, le quatrième et le septième caractères des données d'entrée :
    1. Cliquez sur le champ Column to mask de la première ligne et sélectionnez la colonne qui contient les données à masquer.
      Dans cet exemple, sélectionnez MBI.
    2. Dans le champ Field type, sélectionnez Interval comme type de champ auquel appartiennent les données et saisissez la plage de valeurs numériques autorisées dans le champ Values.
      Dans cet exemple, l'objectif est de masquer le premier caractère par un chiffre compris entre 1 et 9 ("1,9"). Le quatrième et le septième caractère seront masqués par un chiffre compris entre 0 et 9 ("0,9").
    3. Appliquez la même configuration à la quatrième et à la septième ligne de la table Modifications.
  6. Configurez les opérations de masquage des données pour le deuxième, le cinquième, le huitième et le neuvième caractère des données d'entrée :
    1. Cliquez dans le champ Column to mask de la deuxième ligne et sélectionnez la colonne qui contient les données à masquer.
    2. Dans le champ Field type, sélectionnez Enumeration from file.
    3. Cliquez sur le champ Values et appuyez sur Ctrl + Espace pour sélectionner la variable correspondant au fichier qui contient les valeurs autorisées.
      Dans cet exemple, sélectionnez la variable correspondant au fichier qui contient les valeurs alphabétiques autorisées.
    4. Appliquez la même configuration à la cinquième, la huitième et la neuvième lignes de la table Modifications.
  7. Configurez les opérations de masquage des données pour le troisième et le sixième caractère des données d'entrée :
    1. Cliquez sur le champ Column to mask de la troisième ligne et sélectionnez la colonne qui contient les données à masquer.
    2. Dans le champ Field type, sélectionnez Enumeration from file.
    3. Cliquez sur le champ Values et appuyez sur Ctrl + Espace pour sélectionner la variable correspondant au fichier qui contient les valeurs autorisées.
      Dans cet exemple, sélectionnez la variable correspondant au fichier qui contient les valeurs alphanumériques autorisées.
    4. Appliquez la même configuration à la sixième ligne de la table Modifications.
  8. Configurez les opérations de masquage des données pour les deux derniers caractères des données d'entrée :
    1. Cliquez sur le champ Column to mask de la dernière ligne et sélectionnez la colonne qui contient les données à masquer.
    2. Dans le champ Field type, sélectionnez Interval comme type de champ auquel appartiennent les données et saisissez "0,99" comme plage de valeurs numériques autorisées dans le champ Values.
      Dans cet exemple, l'objectif est de masquer les caractères par des chiffres compris entre 0 et 9.
      Pour masquer chacun des deux caractères séparément, vous pouvez ajouter une ligne à la table Modifications, définir deux opération de masquage des données et saisir "0,9" comme plage de valeurs numériques autorisées.