Extraire des parties d'un nom complet - 7.2

Guide d'utilisation de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Vous pouvez utiliser la fonctionnalité Extract full name parts pour extraire les différentes parties composant un nom complet dans différentes colonnes.

Pourquoi et quand exécuter cette tâche

Appliquée sur une colonne contenant des noms complets, cette fonction peut extraire des informations concernant les titres, les prénoms, les deuxièmes prénoms, les noms de famille, les suffixes et les surnoms via un modèle d'apprentissage automatique interne. Un score de confiance est également ajouté, pour vous donner une idée de la fiabilité du processus d'extraction, basé sur ce modèle.

Dans cet exemple, vous avez reçu un jeu de données contenant des informations concernant des souscripteurs à votre service en ligne, notamment leur nom complet ou leur date de souscription. Cependant, vous devez exporter ces données dans une solution CRM et le format des noms complets n'est pas idéal pour cette tâche. Pour correspondre au format attendu par votre CRM, il est préférable de séparer les parties du nom des clients dans des colonnes dédiées. Pour ce faire, appliquez simplement la fonctionnalité Extract full name parts sur la colonne contenant le nom des clients.

Procédure

  1. Cliquez sur l'en-tête de la colonne Name pour sélectionner son contenu.
  2. Dans le panneau des fonctions, saisissez Extract full name parts et cliquez sur le résultat pour ouvrir les options de l'option associée.
  3. Sélectionnez toutes les catégories que vous souhaitez extraire.
    Dans cet exemple, laissez toutes les cases cochées. Chaque catégorie est extraite dans une nouvelle colonne.
  4. Cliquez sur Submit.

Résultats

Les différentes informations des noms complets sont extraites et affichées séparément dans de nouvelles colonnes. Les données sont formatées, ce qui est plus pratique pour un export dans une solution CRM, ou simplement pour appliquer des filtres et travailler plus avant sur le jeu de données.