Configurer les composants - 6.4

Processing (Integration)

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)
EnrichPlatform
Studio Talend

Procédure

  1. Dans l'espace graphique, double-cliquez sur le composant tFileInputDelimited pour définir sa configuration de base.
  2. Cliquez sur le bouton [...] à côté du champ File Name/Streampour définir le chemin d'accès au fichier d'entrée.
    Dans ce scénario, le fichier d'entrée utilisé est test4. Il s'agit d'un fichier texte comportant trois colonnes : id, email et age.
    id;email;age
    1;anna@yahoo.net;24
    2;diana@sohu.com;31
    3;fiona@gmail.org;20
    Pour plus d'informations, consultez tFileInputDelimited.
  3. Cliquez sur le bouton [...] du champ Edit schema pour définir la structure des données du fichier d'entrée.
  4. Dans l'espace graphique, double-cliquez sur le composant tExtractRegexFields pour définir sa configuration de base (Basic settings).
  5. A partir de la liste déroulante Field to split, sélectionnez la colonne à séparer, à savoir email dans ce scénario.
  6. Dans le panneau Regex, renseignez l'expression régulière à utiliser pour effectuer la correspondance. Dans ce scénario, une expression régulière "([a-z]*)@([a-z]*).([a-z]*)" est utilisée pour mettre en correspondance les trois parties d'une adresse e-mail : utilisateur, domaine et domaine de premier niveau.
    Pour plus d'informations concernant les expressions régulières consultez http://fr.wikipedia.org/wiki/Expression_rationnelle.
  7. Cliquez sur Edit schema pour ouvrir la boîte de dialogue [Schema of tExtractRegexFields], cliquez cinq fois sur le bouton [+] pour ajouter cinq colonnes au schéma.
    Dans ce scénario, vous allez diviser la colonne d'entrée email en trois colonnes dans le flux de sortie, name, domain et tld. Les deux autres colonnes d'entrée seront extraites telles qu'elles sont.
  8. Double-cliquez sur le composant tLogRow pour ouvrir sa vue Component.
  9. Dans la zone Mode, sélectionnez Table (print values in cells of a table).