Data Preparation : nouvelles fonctionnalités - 7.2

Notes de version des produits Talend Data Integration

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Data Integration
Talend Data Management Platform
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
task
Installation et mise à niveau
Release Notes
Fonctionnalité Description
Remplir par magie Cette nouvelle fonctionnalité vous permet de définir un modèle se basant sur plusieurs exemples puis, via un algorithme d'apprentissage automatique, d'appliquer la transformation sur une colonne entière. Le remplissage par magie vous offre de nombreuses possibilités de formatage, pour n'importe quel type de données.
Extraction d'une partie d'un nom En exploitant un modèle de machine-learning, il est désormais possible de diviser un nom complet en plusieurs sous-parties telles que son titre, son premier prénom, son deuxième prénom, son nom de famille et son suffixe, améliorant ainsi l'efficacité du nettoyage et de la standardisation des jeux de données.
Extraction de parties selon des définitions sémantiques Il est possible, en tirant parti de la définition des types sémantiques, d'extraire différents types d'informations contenues dans une cellule, en plusieurs colonnes et ainsi d'améliorer l'efficacité du nettoyage et de la standardisation des jeux de données.
Masquage répétable et masquage de types sémantiques composés Le masquage de données a été amélioré et peut à présent gérer les graines, afin d'offrir un masquage répétable. Cela signifie que les valeurs source identiques seront toujours écrites en sortie avec les mêmes valeurs masquées.

De plus, il est désormais possible d'effectuer un masquage sémantique des types sémantiques composés, améliorant ainsi la confidentialité des données.

Autocomplétion Modifier une cellule depuis une colonne dont le type sémantique est basé sur un dictionnaire est à présent plus facile, grâce à l'ajout de l'autocomplétion. Choisissez parmi une liste de valeurs suggérées afin de garantir que vos données suivent le standard de vos types sémantiques.
Dédoublonnage En plus de la fonctionnalité existante de dédoublonnage pouvant s'appliquer sur une table complète, vous pouvez à présent appliquer une opération de dédoublonnage se basant sur les valeurs d'une ou plusieurs colonne(s), ce qui vous donne un plus grand contrôle des lignes à supprimer.