Configurer les composants - 7.3

Traitement (Processing) (Intégration)

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)
Last publication date
2024-03-05

Procédure

  1. Double-cliquez sur le composant tFileInputDelimited afin d'ouvrir sa vue Basic settings dans la vue Component.
  2. Cliquez sur le bouton [...] à côté du champ File Name/Stream pour définir le chemin d'accès au fichier dont vous voulez extraire les informations.
    Dans ce scénario, le fichier d'entrée utilisé est test4. Il s'agit d'un fichier texte comportant trois colonnes : id, email et age.
    id;email;age
    1;anna@yahoo.net;24
    2;diana@sohu.com;31
    3;fiona@gmail.org;20
    Pour plus d'informations, consultez tfileinputdelimited_c.html.
  3. Cliquez sur le bouton Edit schema pour définir la structure des données du fichier d'entrée.
  4. Double-cliquez sur le composant tExtractRegexFields pour ouvrir sa vue Basic settings.
  5. À partir de la liste déroulante Field to split, sélectionnez la colonne à séparer, à savoir email dans ce scénario.
  6. Dans le panneau Regex, renseignez l'expression régulière à utiliser pour effectuer la correspondance. Dans ce scénario, une expression régulière "([a-z]*)@([a-z]*).([a-z]*)" est utilisée pour mettre en correspondance les trois parties d'une adresse e-mail : nom de l'utilisateur ou de l'utilisatrice, nom du domaine et nom du domaine de premier niveau.
    Pour plus d'informations concernant les expressions régulières consultez http://fr.wikipedia.org/wiki/Expression_régulière.
  7. Cliquez sur Edit schema pour ouvrir la boîte de dialogue Schema of tExtractRegexFields, cliquez cinq fois sur le bouton [+] pour ajouter cinq colonnes au schéma de sortie.
    Dans ce scénario, vous allez diviser la colonne d'entrée email en trois colonnes dans le flux de sortie, name, domain et tld. Les deux autres colonnes d'entrée seront extraites telles qu'elles sont.
  8. Double-cliquez sur le composant tLogRow pour ouvrir sa vue Component.
  9. Dans la zone Mode, sélectionnez Table (print values in cells of a table).