Lire des lignes complètes dans un fichier délimité - 7.0

FullRow

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants File (Intégration) > Composants FullRow
Gouvernance de données > Systèmes tiers > Composants File (Intégration) > Composants FullRow
Qualité et préparation de données > Systèmes tiers > Composants File (Intégration) > Composants FullRow
EnrichPlatform
Studio Talend

Procédure

  1. Créez un nouveau Job et ajoutez un tFileInputFullRow et un tLogRow en saisissant leur nom dans l'espace de modélisation graphique ou en les déposant depuis la Palette.
  2. Reliez le tFileInputFullRow au tLogRow à l'aide d'un lien Row > Main..
  3. Double-cliquez sur le tFileInputFullRow pour ouvrir sa vue Basic settings dans l'onglet Component.
  4. Cliquez sur le bouton [...] du champ Edit schema pour voir les données à transférer au composant tLogRow. Notez que le schéma est en lecture seule et ne comporte qu'une seule colonne, line.
  5. Dans le champ File Name, parcourez votre système jusqu'au fichier à traiter ou saisissez son chemin d'accès. Dans ce scénario, le fichier est E:/states.csv.
  6. Dans le champ Row separator, renseignez le séparateur permettant d'identifier les fins de ligne. Dans cet exemple, la valeur par défaut est \n.
  7. Dans le champ Header, indiquez la valeur 1 pour ignorer les lignes d'en-tête au début du fichier.
  8. Double-cliquez sur le tLogRow pour ouvrir sa vue Basic settings dans l'onglet Component.
    Dans la zone Mode, sélectionnez Table (print values in cells of a table) pour afficher un résultat plus lisible.
  9. Appuyez sur Ctrl+S pour sauvegarder votre Job puis sur F6 pour l'exécuter.
    Comme affiché ci-dessus, les dix lignes de données du fichier states.csv sont lues une par une, en ignorant les séparateurs de champs, et les lignes de données complètes sont affichées dans la console.
    Pour extraire les champs des lignes, vous devez utiliser un tExtractDelimitedFields, un tExtractPositionalFields ou un tExtractRegexFields. Pour plus d'informations, consultez tExtractDelimitedFields, tExtractPositionalFields et tExtractRegexFields.