Propriétés du tDataMasking - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Famille du composant

Data Quality

 

Basic settings

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Le schéma de sortie de ce composant contient une colonne en lecture seule, ORIGINAL_MARK. La colonne identifie par true ou false si l'enregistrement est un enregistrement original ou un substitut, respectivement.

 

 

Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

 

Modification

Définissez dans la table les champs à modifier et comment les modifier

Input Column : Sélectionnez la colonne du flux d'entrée pour laquelle générer des données similaires en modifiant ses valeurs.

Ces modifications se basent sur la fonction sélectionnée dans la colonne Function et le nombre de modifications défini dans la colonne Max Modification Count.

Function : Sélectionnez la fonction décidant du type de modification à effectuer afin de générer des données similaires de substitution. Par exemple, vous pouvez décider d'avoir des valeurs similaires en remplaçant ou ajout de lettres ou de nombres, des valeurs par des synonymes d'un fichier d'index ou en supprimant des valeurs en paramétrant la fonction à Set to null.

La liste Function varie selon le type de colonne. Pour plus d'informations concernant le comportement de la fonction, consultez Comportement des fonctions avec des données personnelles sensibles.

Par exemple, une colonne de type Long a une option Numeric variance dans la liste et une colonne String n'a pas cette fonction. La liste Function pour une colonne de type Date est spécifique aux dates, elle vous permet de décider du type de modification que vous souhaitez effectuer sur les valeurs de date.

-Parameter : ce champ est utilisé par certaines fonctions et est désactivé lorsqu'il n'est pas applicable. Lorsqu'il est applicable, saisissez un nombre ou une lettre pour décider du comportement de la fonction sélectionnée.

Advanced settings

Seed for random generator

Configurez un nombre aléatoire si vous souhaitez générer les mêmes échantillons de données aléatoires de substitution pour chaque exécution du Job. Ce champ est paramétré par défaut à 12345678.

Répéter l'exécution avec une valeur différente pour ce champ génère un échantillon différent. Laissez ce champ vide si vous souhaitez générer un échantillon différent à chaque exécution du Job.

 

Output the original row

Cochez cette case pour écrire en sortie les données originales en plus des données de substitution. Avoir les deux lignes de données peut être utile lors de processus de débogage ou de test.

 

Should null input returns null

Cette case est cochée par défaut. Lorsqu'elle est cochée, le composant écrit en sortie null lorsque les valeurs d'entrée sont nulles. Sinon, il retourne la valeur par défaut lorsque l'entrée est nulle, c'est-à-dire une chaîne de caractères vide pour les chaînes de caractères, 0 pour des valeurs numériques et la date actuelle pour les valeurs de date.

Ce paramètre n'a aucun effet sur la fonction Generate Sequence. Si l'entrée est nulle, cette fonction ne retourne pas de null, même si la case est cochée.

 

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Utilisation

Ce composant est une étape intermédiaire et nécessite un flux d'entrée et un flux de sortie.

Limitation

n/a