Lire des lignes complètes dans un fichier délimité - Cloud - 8.0

FullRow

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants File (Intégration) > Composants FullRow
Gouvernance de données > Systèmes tiers > Composants File (Intégration) > Composants FullRow
Qualité et préparation de données > Systèmes tiers > Composants File (Intégration) > Composants FullRow
Last publication date
2024-02-21

Procédure

  1. Créez un Job et ajoutez un tFileInputFullRow et un tLogRow en saisissant leur nom dans l'espace de modélisation graphique ou en les déposant depuis la Palette.
  2. Reliez le tFileInputFullRow au tLogRow à l'aide d'un lien Row > Main..
  3. Double-cliquez sur le tFileInputFullRow pour ouvrir sa vue Basic settings dans l'onglet Component.
  4. Cliquez sur le bouton [...] du champ Edit schema pour voir les données à transférer au composant tLogRow. Notez que le schéma est en lecture seule et ne comporte qu'une seule colonne, line.
  5. Dans le champ File Name, parcourez votre système jusqu'au fichier à traiter ou saisissez son chemin d'accès. Dans ce scénario, le fichier est E:/states.csv.
  6. Dans le champ Row separator, renseignez le séparateur permettant d'identifier les fins de ligne. Dans cet exemple, la valeur par défaut est \n.
  7. Dans le champ Header, indiquez la valeur 1 pour ignorer les lignes d'en-tête au début du fichier.
  8. Double-cliquez sur le tLogRow pour ouvrir sa vue Basic settings dans l'onglet Component.
    Dans la zone Mode, sélectionnez Table (print values in cells of a table) pour afficher un résultat plus lisible.
  9. Appuyez sur Ctrl+S pour sauvegarder votre Job puis sur F6 pour l'exécuter.
    Comme affiché ci-dessus, les dix lignes de données du fichier states.csv sont lues une par une, en ignorant les séparateurs de champs, et les lignes de données complètes sont affichées dans la console.
    Pour extraire les champs des lignes, vous devez utiliser un tExtractDelimitedFields, un tExtractPositionalFields ou un tExtractRegexFields. Pour plus d'informations, consultez tExtractDelimitedFields, tExtractPositionalFields et tExtractRegexFields.