Effets du masquage de données - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
En fonction du type sémantique de la colonne dans laquelle vous utilisez la fonction Mask data (obfuscation) (Masquer les données), l'effet peut varier.

Texte et types sémantiques

Dans le cas de données textuelles, Talend Data Preparation suggère automatiquement l'un des types sémantiques prédéfinis, l'un de vos types sémantiques ou le type Text. Dans le cas de types sémantiques personnalisés et prédéfinis, ils peuvent se baser sur une expression régulière ou sur un dictionnaire de valeurs.

Le tableau suivant liste les routines de masquage disponibles pour une colonne de type Text, ou tout type sémantique prédéfini ou personnalisé ainsi que ses effets sur la valeur Talend in 2018 is awesome par exemple.

Routine de masquage Description Paramètres Sortie
Semantic masking Dans le cas d'un type sémantique Text, la fonction va générer des caractères aléatoires, en respectant le modèle de l'enregistrement original. Mode de masquage : Random ou Repeatable Äåòçôî ëð 1889 òn äipïåvu
Dans le cas de types sémantiques basés sur des expressions régulières, la fonction va générer des enregistrements aléatoires correspondant au modèle d'expression régulière.
Remarque : Les types sémantiques construits avec des expressions régulières qui ne sont pas compatibles avec la bibliothèque dk.brics.automaton ne supportent pas le masquage sémantique. Tous les caractères de l'enregistrement sont remplacés aléatoirement.
Dans le cas de types sémantiques basés sur un dictionnaire, la fonction va remplacer les enregistrements par les valeurs extraites du dictionnaire utilisé pour créer le type sémantique.
Keep characters between two positions Tous les caractères compris dans l'intervalle sélectionné restent inchangés, tandis que ceux hors de l'intervalle sont supprimés. Début de l'index : 11 2018 is awesome
Fin de l'index : 25
Generate from Char Pattern Un enregistrement contenant dse caractères aléatoires sera créé depuis le modèle de votre choix. Modèle de caractères : aaaaaa 9999 aaaaaaa õaßayè 8908 æluäco
Mode de masquage : Random ou Repeatable
Remove characters between two positions Tous les caractères compris dans l'intervalle sélectionné sont supprimés, tandis que ceux hors de l'intervalle restent inchangés. Début de l'index : 7 Talend is awesome
Fin de l'index : 14
Replace all Tous les caractères sont remplacés par le substitut de votre choix. Remplacement : x xxxxxxxxxxxxxxxxxxxxxxxxx
Mode de masquage : Random ou Repeatable
Replace all digits Tous les chiffres sont remplacés par le substitut de votre choix. Les lettres restent inchangées. Remplacement : 9 Talend in 9999 is awesome
Mode de masquage : Random ou Repeatable
Replace all letters Toutes les lettres sont remplacées par le substitut de votre choix. Les chiffres restent inchangés. Remplacement : y yyyyyy yy 2018 yy yyyyyyy
Mode de masquage : Random ou Repeatable
Replace characters between two positions Tous les caractères compris dans l'intervalle sélectionné sont remplacés, tandis que ceux hors de l'intervalle restent inchangés. Début de l'index : 1 aaaaaa in 2018 is awesome
Fin de l'index : 6
Remplacement : a
Mode de masquage : Random ou Repeatable
Replace n first characters Remplace les N premiers caractères par le substitut de votre choix. Les autres restent inchangés. Nombre de caractères : 17 @@@@@@@@@@@@@@@@@ awesome
Remplacement : @
Mode de masquage : Random ou Repeatable
Replace n last characters Remplace les N derniers caractères par le substitut de votre choix. Les autres restent inchangés. Nombre de caractères : 10 Talend in 2018 !!!!!!!!!!
Remplacement : !
Mode de masquage : Random ou Repeatable
Keep n first digits and replace following ones Keep the first n digits as is and replaces subsequent ones with random digits. Les caractères non numériques restent inchangés. Nombre de chiffres : 1 Talend in 2436 is awesome
Mode de masquage : Random ou Repeatable
Keep n last digits and replace previous ones Conserve les N derniers chiffres et remplace les précédents par des chiffres aléatoires. Les caractères non numériques restent inchangés. Nombre de chiffres : 2 Talend in 1618 is awesome
Mode de masquage : Random ou Repeatable

Valeurs numériques

Le tableau suivant liste les routine de masquage disponibles pour une colonne contenant des valeurs numériques, de type Integer ou Decimal, ainsi que leurs effets sur la valeur 21803 par exemple.

Routine de masquage Paramètres Sortie
Replace with random value Variation maximale (%) : 10 21499
Mode de masquage : Random ou Repeatable
Generate value between two values Valeur minimale : 20000 21876
Valeur maximale : 22000
Mode de masquage : Random ou Repeatable

Dates

Le tableau suivant liste les routines de masquage disponibles pour une colonne de type sémantique Date, ainsi que leurs effets sur la valeur 05/04/2018 par exemple.

Routine de masquage Paramètres Sortie
Replace with random date Variation maximale (en jours) : 365 23/11/2017
Mode de masquage : Random ou Repeatable
Keep year and set day and month to 01/01   01/01/2018