Restreindre encore plus l'utilisation des données sensibles - 7.0

Data privacy

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
EnrichPlatform
Studio Talend

Lors d'un mélange de données, il est recommandé de masquer les données sensibles. Rappelez-vous également de considérer les relations entre les colonnes lors du mélange de données et de vous assurer que le jeu de données original ne peut être reconstruit.

Dans ce scénario, les noms de famille et prénoms sont groupés, mais les adresses e-mail ne sont pas dans le même groupe. Ce qui signifie que la colonne email n'a aucune relation avec les colonnes lname et fname. Puisque la colonne email contient généralement des informations relatives aux noms et prénoms, cela peut permettre à des personnes malveillantes de reconstruire les données originales.

De plus, les colonnes address1, city et email ne sont dans aucun groupe, elle n'ont donc pas été mélangées. Cela signifie qu'il est possible de déduire, par exemple que Robert Damstra vit à 1619 Stillman Court, Lynnwood.

Avec ce scénario, vous pouvez restreindre encore plus l'utilisation des données sensibles :
  • Pour éviter l'utilisation de numéros de cartes de crédit réels, vous pouvez masquer les numéros de carte de crédit à l'aide du composant tDataMasking.

  • Pour éviter l'identification des clients par leur adresse e-mail, vous pouvez masquer les adresses e-mail à l'aide du composant tDataMasking.

  • Pour rendre plus difficile la lecture des adresses réelles, vous pouvez ajouter les colonnes address1 et city dans d'autres groupes.

Remarque :

Comme le tDataShuffling est supporté par le framework Spark, vous pouvez convertir ce Job standard en un Job Spark Batch en modifiant ses propriétés. Ainsi, vous n'avez pas besoin de redéfinir les paramètres des composants dans le Job.