Extraire des informations concernant les numéros de téléphone - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Vous pouvez utiliser la fonction Extract phone number information (Extraire des informations sur le numéro de téléphone) pour extraire de nouveaux types d’informations concernant les numéros de téléphone dans plusieurs nouvelles colonnes.

Cette fonction peut extraire des informations sur le type de téléphone, le pays, la région, la localisation, le nom de l’opérateur et le fuseau horaire. Cependant, le comportement de la fonction dépend du type sémantique de la colonne qui contient les données :

  • Si le type sémantique correspond à US Phone, UK Phone, DE Phone ou FR Phone, vous pouvez simplement sélectionner les champs de sortie souhaités et appliquer la fonction.
  • Si la colonne contient des numéros de différents pays, avec des formats différents et si le type sémantique de rapprochement est le type générique Phone number, vous devrez effectuer un formatage avant d’utiliser la fonction Extract phone number information. Cette étape est nécessaire car les nombres qui ne sont pas standardisés ont souvent une structure qui s’applique à plusieurs pays. Il est donc impossible de déterminer le pays auquel ils correspondent.

Prenez l’exemple d’un jeu de données contenant des informations simples sur des clients, par exemple le nom, pays de résidence et numéro de téléphone de clients du monde entier. Le but de cette préparation est de travailler sur les numéros de téléphone afin de ne garder que les clients ayant fourni un numéro de téléphone mobile comme information de contact. La fonction Extract phone number information pourrait afficher cette information sur le type de téléphone, mais elle ne peut pas être appliquée tant que les numéros ont des formats différents. Vous allez d’abord effectuer une opération de formatage sur la colonne phone, à l’aide des informations de la colonne country, pour ajouter une préfixe international à vos numéros. Talend Data Preparation peut ensuite extraire les informations de vos numéros de téléphone. Ceux-ci ont un format harmonisé et contiennent une information sur leur pays respectif.

Procédure

  1. Cliquez sur l'en-tête de la colonne phone pour sélectionner son contenu.
  2. Dans le panneau des fonctions, sélectionnez la fonction Format phone numbers (Formater les numéros de téléphone), appliquez-la en utilisant les informations de la colonne country et sélectionnez International comme format de sortie.

    Les numéros de téléphone ont maintenant un format unique, avec le code international comme préfixe. Il est maintenant possible d’identifier le pays à partir du numéro de téléphone et d’extraire les informations supplémentaires.

    Pour plus d’informations sur l’utilisation de la fonction Format phone numbers avec une autre colonne, consultez Formater des numéros de téléphone.

  3. Dans le panneau des fonctions, saisissez Extract phone number information et cliquez sur le résultat pour ouvrir les options de la fonction associée.
  4. Cochez la case correspondant aux catégories d’informations que vous souhaitez extraire.

    Chaque catégorie est exportée dans une colonne différente. Dans cet exemple, ne cochez pas la case Phone number region. Le jeu de données contient déjà des informations sur la région, sous forme de codes pays.

  5. Dans la liste déroulante Language, sélectionnez la langue de sortie souhaitée. Par exemple, English.
  6. Cliquez sur Submit.

Résultats

Après une brève étape de formatage, les colonnes contenant les diverses informations extraites des numéros de téléphone sont créées. Ces informations sont extraites par la Google phone library. Vous pouvez maintenant différencier facilement les numéros de téléphone provenant de lignes fixes ou mobiles et continuer votre préparation.

Les lignes qui étaient vides ou invalides génèrent des cellules vides après l’application de la fonction.