Convertir des noms d'organisations en leur forme abrégée à l'aide du remplissage par magie - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Preparation
task
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données

La fonction de remplissage par magie peut être utilisée pour transformer des noms, unités ou expressions en leur forme abrégée.

Dans cet exemple, le jeu de données à améliorer contient des données sur les personnes travaillant pour des organisations nationales ou internationales. Cependant, les noms complets des organisations sont souvent trop longs et moins connus que les acronymes correspondants. Afin de rendre le jeu de données plus simple à lire, vous allez utiliser la fonction de remplissage par magie pour convertir les noms complets en leurs acronymes.

Procédure

  1. Cliquez sur l'en-tête de la colonne organization pour la sélectionner.
  2. Dans le panneau des fonctions, saisissez Magic fill (remplir par magie) et cliquez sur le résultat pour afficher les options de la fonctionnalité associée.
  3. Dans le champ Input 1, saisissez l'une des valeurs de la colonne organization à transformer, World Wildlife Fund par exemple.
  4. Dans le champ Output 1, saisissez l'acronyme correspondant : WWF.
    Pour que la fonction puisse fonctionner, vous devez saisir au moins deux exemples complets de la transformation à appliquer. Vous pouvez ajouter jusqu'à trois autres exemples. Les exemples peuvent être extraits de votre jeu de données ou inventés. Plus vous saisissez d'exemples, plus le modèle sera identifié précisement par la fonction.
  5. Saisissez plus d'exemples avant-après dans les champs restant :
    • Federal Bureau of Investigation en tant que Input 2 et FBI en tant que Output 2
    • International Court of Justice en tant que Input 3 et ICJ en tant que Output 3
    • World Trade Organization en tant que Input 4 et WTO en tant que Output 4
    • European Union en tant que Input 5 et EU en tant que Output 5

    Selon ces exemples, la fonction va comprendre qu'il faut conserver uniquement la première lettre de chaque mot en majuscule pour transformer les noms complets en leur acronyme correspondant.

  6. Cliquez sur Submit.

Résultats

Une colonne est créée, où la transformation définie par vos exemples a été appliquée aux autres noms d'organisations. Vous pouvez reconnaître plus facilement les organisations de votre jeu de données.