Fonctions de masquage de données dans les composants de masquage - 7.3

Confidentialité des données

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles

Différentes fonctions dans les composants de masquage peuvent varier selon le type de données de la colonne.

Il est recommandé d'utiliser les fonctions prédéfinies dans le composant avec des colonnes contenant des informations personnelles, comme des noms et prénoms, des adresses e-mail, des adresses, des numéros de Sécurité Sociale, des numéros de cartes de crédit, des numéros de comptes bancaires, les genres, les dates de naissance et les salaires.

Chiffrement conservant le format dans les composants de masquage

Le composant utilise des méthodes de base et de chiffrement préservant le format (FPE) pour générer des valeurs de sortie masquées dans un format similaire aux valeurs d'entrée.

Remarque : La version minimale requise pour utiliser la méthode FF1 with AES est Java 8u161. Pour pouvoir utiliser la méthode FPE avec les versions Java antérieures à 8u161, téléchargez les fichiers de règles Java Cryptography Extension (JCE) de juridiction illimitée du site d'Oracle.

Les méthodes FPE sont basées sur une norme National Institute Standards and Technology (NIST) :

  • La méthode FF1 with AES dépend de la norme Advanced Encryption Standard en mode CBC.
  • La méthode FF1 with SHA-2 dépend de la fonction de hachage sécurisée HMAC-256.

Les méthodes FPE sont des méthodes bijectives, sauf lors d'utilisation de tweaks.

Important : Les méthodes FPE chiffrent les données pour effectuer une pseudonymisation. Ces méthodes sont moins fortes que les algorithmes de chiffrement classiques. Si vous souhaitez conserver ce format de données, utilisez les composants de masquage. Sinon, utilisez le composant tDataEncrypt. Le chiffrement est plus fort.

Les méthodes FF1 with AES et FF1 with SHA-2 nécessitent un mot de passe pour générer des valeurs masquées chiffrées et répétables. Ces méthodes n'utilisent pas de graine.

Vous pouvez spécifier ce mot de passe dans le champ Password for FF1 method des paramètres avancés (Advanced Settings) du composant.

Vous pouvez utiliser des tweaks afin de ne pas effectuer la bijection. Le chiffrement est plus fort. Un tweak unique est généré pour chaque enregistrement et s'applique à toutes les données d'un enregistrement. Les tweaks changent à chaque exécution de Job. Vous pouvez révéler les données à l'aide du composant tDataUnmasking et des tweaks correspondants.

Chiffrement conservant le format dans le composant tDataMasking

Lorsque vous utilisez les méthodes FF1 with AES et FF1 with SHA-2, les valeurs d'entrée doivent contenir au moins deux caractères à masquer. Sinon, la fonction retourne null.

Par exemple, si vous souhaitez masquer S426A789QQ à l'aide de la fonction Keep first n digits and replace following ones avec les paramètres suivants :
  • FF1 with AES ou FF1 with SHA-2
  • L'alphabet Digits
  • "2" comme paramètre supplémentaire
Il n'y a que quatre chiffres à masquer car vous avez décidé de conserver les deux premiers chiffres. En résultat, la fonction retourne un null.

Le nombre minimum de caractères nécessaires dans les valeurs d'entrée dépend de l'alphabet (Alphabet) sélectionné.

Lorsque vous sélectionnez Best guess, le nombre de valeurs varie en fonction des alphabets représentés dans les valeurs d'entrée.

Alphabet Nombre minimum de caractères à masquer
Alphanumérique 4
Chiffres 6
Latin étendu 3
Hiragana 4
Katakana 3
Kanji 2
Hangul 2

Alphabets

Lors de l'utilisation de la fonction Replace all, Replace characters between two positions, Replace n first digits et Replace n last digits avec les méthodes FPE, vous pouvez sélectionner un alphabet.

Les caractères appartenant à l'alphabet sélectionné sont masqués par des caractères du même alphabet.

Lorsque vous sélectionnez l'alphabet Best guess, les valeurs masquées contiennent des caractères d'autres types de caractères affichés dans les valeurs d'entrée. Best guess est l'alphabet par défaut.

Tout caractère non reconnu est copié en sortie tel quel.

Les alphabets suivants sont supportés :

Alphabet Type de caractères Intervalle Unicode (version 11.0) Caractères correspondants
Alphanumeric Chiffres latins [0030-0039] [0-9]
Lettres minuscules latines [0061-007A] [a-z]
Lettres majuscules latines [0041-005A] [A-Z]
Chiffres Chiffres latins [0030-0039] [0-9]
Latin étendu Chiffres latins [0030-0039] [0-9]
Lettres minuscules latines [0061-007A] [a-z]
Lettres minuscules latines étendues [00DF-00F6] [00F8-00FF] [ß-ö] [ø-ÿ]
Lettres majuscules latines [0041-005A] [A-Z]
Lettres majuscules latines étendues [00C0-00D6] [00D8-00DE] [A-Z] [À-Ö] [Ø-Þ]
Hiragana Hiragana [3041-3096] 30FC 309D 309E [ぁ-ゖ] ー ゝ ゞ
Katakana Katakana moyenne chasse https://www.unicode.org/charts/PDF/UFF00.pdf [ヲ-ン][FF66-FF9D]
Full-width Katakana [30A1-30FA] 30FC 30FD 30FE [ァ-ヺ] ー ヽ ヾ
Extensions phonétiques : [31F0-31FF] [ㇰ-ㇿ]
Kanji Kanji Extension CJK A[FF66-FF9D: [4E00-9FEF] [3400-4DB5] [一-] [㐀-䶵]
Supplément B aux idéogrammes unifiés CJC : [20000-2A6D6] [𠀀-𪛖]
Supplément C aux idéogrammes unifiés CJC : [2A700-2B734] [𪜀-𫜴]
Supplément D aux idéogrammes unifiés CJC : [2B740-2B81D] [𫝀-𫠝]
Supplément E aux idéogrammes unifiés CJC : [2B820-2CEA1] [-]
Supplément F aux idéogrammes unifiés CJC : [2CEB0-2EBE0] [-]
Idéogrammes de compatibilité CJC : [F900-FA6D] [FA70-FAD9] [豈-舘] [-]
Supplément aux idéogrammes de compatibilité CJC : [2F800-2FA1D] [-]
Clés chinoises KangXi : [2F00-2FD5] [⼀-⿕]
Formes supplémentaires des clés CJC : [2E80-2E99] [2E9B-2EF3] [⺀-⺙] [⺛-⻳]
Symboles et ponctuation CJC : [3005-3005] [3007-3007] [3021-3029] [3038-303B] [々-々] [〇-〇] [〡-〩] [〸-〻]
Hangul Hangul [AC00-D7AF] [가-힯]