tPatternMasking - 7.0

Data privacy

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de protection des données sensibles
EnrichPlatform
Studio Talend

Ce composant masque des données suivant un modèle spécifique et peut transformer les données source de manière cohérente, si nécessaire.

Si vous avez besoin de masquer des données hétérogènes, vous pouvez utiliser le tDataMasking. Pour plus d'informations, consultez tDataMasking.

Le tPatternMasking remplace des données correspondant à un modèle et des données génériques par des caractères aléatoires provenant d'une plage de dates spécifiée, d'un jeu de valeurs numériques ou d'un jeu de valeurs nommées. L'objectif est de protéger les données réelles tout en conservant un substitut fonctionnel lorsqu'il n'est pas recommandé d'afficher des données réelles sensibles.

Les données semblent toujours réelles et cohérentes et sont toujours utilisables à des fins de test et de formation. Le type de données le plus fréquent nécessitant une telle méthode de masquage est celui contenant des données personnelles.

Le tPatternMasking lit un jeu de données ligne par ligne et crée une version structurellement similaire mais non authentique des données, après avoir effectué les opérations de masquage de données sur les champs :
  • Le composant considère les espaces, barres obliques (/), tirets (-) et points (.) dans les données d'entrée, comme des séparateurs.
  • Le composant conserve le modèle des valeurs en entrée, dans les données masquées générées en sortie,.
  • Le composant génère une ligne pour chaque ligne d'entrée.

Par exemple, 615/67/7489 pourrait être masqué par 379/48/1789.

Lorsque les données d'entrée ne respectent pas le modèle défini, le tPatternMasking retourne null.

Pour plus d'informations concernant les technologies supportées par Talend, consultez .