Configurer les composants - 7.1

Data extraction

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants d'extraction de données
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants d'extraction de données
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants d'extraction de données
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tFileInputDelimited afin d'afficher sa vue Basic settings et définir ses propriétés. Saisissez le nom du fichier d'entrée, le nombre de lignes d'en-tête à ignorer et définissez le schéma.
    1. Cliquez sur le bouton Edit Schema pour créer le schéma.
    2. Cliquez sur le bouton [+] pour ajouter une ligne Name__Telephone_Address au schéma, puis cliquez sur OK pour valider.
  2. Double-cliquez sur le tPatternExtract afin d'afficher sa vue Basic settings et définir ses propriétés.
    1. Dans la liste Column to check, sélectionnez la colonne dont vous voulez vérifier les données, par rapport au modèle défini, Name_Telephone_Address dans cet exemple.
    2. Dans la liste PROPERTY, sélectionnez Repository afin de vérifier les données par rapport à un modèle du DQ Repository.
    3. Cliquez sur le bouton [...] à côté du champ PROPERTY et sélectionnez Regex > internet > Email Address dans Pattern Selector.
  3. Dans la vue Basic settings du composant tFilterColumns, cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la boîte de dialogue Schema.
  4. Sélectionnez la colonne qui vous intéresse dans le schéma d'entrée, puis cliquez sur la flèche pointant vers la droite afin de copier la colonne dans le schéma de sortie. Cliquez sur OK pour fermer la boîte de dialogue.
  5. Double-cliquez sur le tFileOutputDelimited afin d'ouvrir sa vue Basic settings et définir les propriétés du composant.
    1. Dans le champ File Name, spécifiez le chemin d'accès au fichier dans lequel vous souhaitez écrire vos données de sortie.
    2. Si nécessaire, définissez les séparateurs de lignes et de champs, respectivement dans les champs Row Separator et Field Separator. Dans cet exemple, l'objectif est de séparer les adresses e-mail des clients par un point virgule.