Effets du masquage de données - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-04-16
En fonction du type sémantique de la colonne dans laquelle vous utilisez la fonction Mask data (obfuscation) (Masquer les données), l'effet peut varier.

Texte et types sémantiques

Dans le cas de données textuelles, Talend Data Preparation suggère automatiquement l'un des types sémantiques prédéfinis, l'un de vos types sémantiques ou le type Text. Dans le cas de types sémantiques personnalisés et prédéfinis, ils peuvent se baser sur une expression régulière ou sur un dictionnaire de valeurs.

Le tableau suivant liste les routines de masquage disponibles pour une colonne de type Text, ou tout type sémantique prédéfini ou personnalisé ainsi que ses effets sur la valeur Talendin 2018 is awesome par exemple.

Routine de masquage Description Paramètres Sortie
Semantic masking
  • Dans le cas de types sémantiques basés sur des expressions régulières, la fonction va générer des enregistrements aléatoires correspondant au modèle d'expression régulière.
    Remarque : Les types sémantiques construits avec des expressions régulières qui ne sont pas compatibles avec la bibliothèque dk.brics.automaton ne supportent pas le masquage sémantique. Tous les caractères de l'enregistrement sont remplacés aléatoirement.
  • Dans le cas de types sémantiques basés sur un dictionnaire, la fonction va remplacer les enregistrements par les valeurs extraites du dictionnaire utilisé pour créer le type sémantique.
Mode de masquage : Random ou Repeatable Äåòçôî ëð 1889 òn äipïåvu
Keep characters between two positions Tous les caractères compris dans l'intervalle sélectionné restent inchangés, tandis que ceux hors de l'intervalle sont supprimés.
  • Début de l'index : 11
  • Fin de l'index : 25
2018 is awesome
Generate from Char Pattern Un enregistrement contenant des caractères aléatoires sera créé depuis le modèle de votre choix.
  • Modèle de caractères : aaaaaa 9999 aaaaaaa
  • Mode de masquage : Random ou Repeatable
õaßayè 8908 æluäco
Remove characters between two positions Tous les caractères compris dans l'intervalle sélectionné sont supprimés, tandis que ceux hors de l'intervalle restent inchangés.
  • Début de l'index : 7
  • Fin de l'index : 14
Talend is awesome
Replace all Tous les caractères sont remplacés par le substitut de votre choix.
  • Remplacement : x
  • Mode de masquage : Random ou Repeatable
xxxxxxxxxxxxxxxxxxxxxxxxx
Replace all digits Tous les chiffres sont remplacés par le substitut de votre choix. Les lettres restent inchangées.
  • Remplacement : 9
  • Mode de masquage : Random ou Repeatable
Talend in 9999 is awesome
Replace all letters Toutes les lettres sont remplacées par le substitut de votre choix. Les chiffres restent inchangés.
  • Remplacement : y
  • Mode de masquage : Random ou Repeatable
yyyyyy yy 2018 yy yyyyyyy
Replace characters between two positions Tous les caractères compris dans l'intervalle sélectionné sont remplacés, tandis que ceux hors de l'intervalle restent inchangés.
  • Début de l'index : 1
  • Fin de l'index : 6
  • Remplacement : a
  • Mode de masquage : Random ou Repeatable
aaaaaa in 2018 is awesome
Replace n first characters Remplace les n premiers caractères par le substitut de votre choix. Les autres restent inchangés.
  • Nombre de caractères : 17
  • Remplacement : @
  • Mode de masquage : Random ou Repeatable
@@@@@@@@@@@@@@@@@ awesome
Replace n last characters Remplace les n derniers caractères par le substitut de votre choix. Les autres restent inchangés.
  • Nombre de caractères : 10
  • Remplacement : !
  • Mode de masquage : Random ou Repeatable
Talend in 2018 !!!!!!!!!!
Keep first n digits and replace following ones Keep the first n digits as is and replaces subsequent ones with random digits. Les caractères non numériques restent inchangés.
  • Nombre de chiffres : 1
  • Mode de masquage : Random ou Repeatable
Talend in 2436 is awesome
Keep last n digits and replace previous ones Conserve les N derniers chiffres et remplace les précédents par des chiffres aléatoires. Les caractères non numériques restent inchangés.
  • Nombre de chiffres : 2
  • Mode de masquage : Random ou Repeatable
Talend in 1618 is awesome

Valeurs numériques

Le tableau suivant liste les routine de masquage disponibles pour une colonne contenant des valeurs numériques, de type Integer ou Decimal, ainsi que leurs effets sur la valeur 21803 par exemple.

Routine de masquage Paramètres Sortie
Replace with random value
  • Variation maximale (%) : 10
  • Mode de masquage : Random ou Repeatable
21499
Generate value between two values
  • Valeur minimale : 20000
  • Valeur maximale : 22000
  • Mode de masquage : Random ou Repeatable
21876

Dates

Le tableau suivant liste les routines de masquage disponibles pour une colonne de type sémantique Date, ainsi que leurs effets sur la valeur 05/04/2018 par exemple.

Routine de masquage Paramètres Sortie
Replace with random date
  • Variation maximale (en jours) : 365
  • Mode de masquage : Random ou Repeatable
23/11/2017
Conservez l'année, le mois et le jour sur 01/01. N/A 01/01/2018