Restreindre encore plus l'utilisation des données sensibles

Lors d'un mélange de données, il est recommandé de masquer les données sensibles. Rappelez-vous également de considérer les relations entre les colonnes lors du mélange de données et de vous assurer que le jeu de données d'origine ne peut être reconstruit.

Dans ce scénario, les noms de famille et prénoms sont groupés, mais les adresses e-mail ne sont pas dans le même groupe. Ce qui signifie que la colonne email n'a aucune relation avec les colonnes lname et fname. Puisque la colonne email contient généralement des informations relatives aux noms et prénoms, cela peut permettre à des personnes malveillantes de reconstruire les données d'origine.

De plus, les colonnes address1, city et email ne sont dans aucun groupe, elles n'ont donc pas été mélangées. Cela signifie qu'il est possible de déduire, par exemple que Robert Damstra vit à 1619 Stillman Court, Lynnwood.

Avec ce scénario, vous pouvez restreindre encore plus l'utilisation des données sensibles :

Pour éviter l'utilisation de numéros de cartes de crédit réels, vous pouvez masquer les numéros de carte de crédit à l'aide du composant tDataMasking.
Pour éviter l'identification des clients par leur adresse e-mail, vous pouvez masquer les adresses e-mail à l'aide du composant tDataMasking.
Pour rendre plus difficile la lecture des adresses réelles, vous pouvez ajouter les colonnes address1 et city dans d'autres groupes.

Remarque :

Comme le tDataShuffling est supporté par le framework Spark, vous pouvez convertir ce Job standard en un Job Spark Batch en modifiant ses propriétés. Ainsi, vous n'avez pas besoin de redéfinir les paramètres des composants dans le Job.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !

Laissez vos commentaires ici