Générer un Job pour standardiser des numéros de téléphone

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
task
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Lorsque vous utilisez la perspective Profiling de votre studio pour analyser des numéros de téléphones dans une base de données, vous pouvez, ultérieurement, générer un Job prêt à l'emploi qui donnera le bon format aux numéros de téléphone de la colonne spécifiée.

Pour plus d'informations concernant les indicateurs relatifs aux numéros de téléphone, consultez Statistiques des numéros de téléphone.

Prérequis : une analyse de colonnes sur des numéros de téléphone doit avoir été créée et exécutée dans la perspective Profiling du studio. Pour des étapes détaillées concernant la création d'une analyse de colonne, consultez Définir les colonnes à analyser et configurer les indicateurs.

Pour standardiser des numéros de téléphone dans une colonne analysée, procédez comme suit :

  1. Dans la perspective Profiling de votre studio, configurez les indicateurs statistiques relatifs aux numéros de téléphone (Phone Number Statistics) sur la colonne contenant les numéros de téléphone.

  2. Exécutez cette analyse pour afficher les résultats dans la vue Analysis Results.

  3. Dans la table Phone Number Statistics et dans la liste Count, cliquez-droit sur Valid Phone Number Count, Possible Phone Number Count ou sur Well formed National Number Count puis sélectionnez Generate a standardization phone number job dans le menu contextuel.

La perspective Integration s'ouvre dans le Studio et affiche le Job généré, avec le composant tStandardizePhoneNumber. Pour plus d'informations concernant ce composant, consultez le chapitre Data Quality dans le Guide de référence des Composants Talend.

Un dossier pour le Job généré s'affiche également sous le nœud Job design dans la vue Repository de la perspective Integration.

Dans le Job généré, le composant d'entrée et le tStandardizePhoneNumber sont déjà configurés selon la connexion que vous utilisez pour l'analyse de colonne et selon la colonne que vous analysez.

Le composant de sortie est un composant de fichier mais vous pouvez le remplacer par un composant de sortie de base de données pour écrire les numéros de téléphone directement dans une base de données spécifique, par exemple.

Pour choisir le format à utiliser pour standardiser les numéros de téléphone :

  1. Double-cliquez sur le composant tStandardizePhoneNumber afin d'ouvrir sa vue Component.

  2. Dans la liste Phone number format for output, sélectionnez le format selon lequel vous souhaitez standardiser les numéros de téléphone dans la colonne sélectionnée.

  3. Sauvegardez vos modifications.

Pour configurer le composant de sortie :

  1. Double-cliquez sur le composant de sortie, puis, dans le champ File Name, renseignez le chemin d'accès au fichier de sortie qui contiendra les résultats de l'analyse des numéros de téléphone.

  2. Dans le champ Sheet Name, saisissez le nom de la feuille de calcul dans laquelle vous souhaitez écrire les résultats de la standardisation.

  3. Sauvegardez le Job et appuyez sur F6 pour l'exécuter.

    Les résultats de la standardisation des numéros de téléphone sont écrits dans la feuille Excel spécifiée.

  4. Si nécessaire, cliquez-droit sur le tFileOutputExcel dans le Job généré et sélectionnez Data Viewer.

    Un aperçu des données standardisées s'ouvre dans le studio.