Définir les paramètres de parsing de votre fichier Regex - Cloud - 7.3

Guide d'utilisation du Studio Talend

Version
Cloud
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-02-13

Pourquoi et quand exécuter cette tâche

Dans cette vue, vous pouvez définir les paramètres de parsing du fichier afin que le schéma du fichier soit correctement récupéré.

Procédure

  1. Définissez les séparateurs de champs et de lignes dans la zone File Settings.
    • Si nécessaire, vous pouvez modifier les chiffres dans le champ Field Separator afin de spécifier la longueur des colonnes de façon précise.

    • Si le séparateur de lignes de votre fichier n'est pas le caractère de fin de ligne standard, sélectionnez Custom String dans la liste Row Separator et spécifiez le caractère dans le champ Corresponding Character.

  2. Dans le panneau de paramétrage des expressions régulières, Regular Expression settings, saisissez l'expression régulière utilisée pour délimiter le fichier.
    Avertissement :

    Veillez à utiliser les bons guillemets (simples ou doubles) au moment de rédiger le code.

  3. Si votre fichier possède des en-têtes à exclure du contenu des données, cochez la case Header dans la zone Rows To Skip et configurez le nombre de lignes à ignorer dans le champ correspondant. De plus, si vous savez que le fichier contient des informations de pied de page, cochez la case Footer et définissez le nombre de lignes à ignorer.
  4. Le champ Limit of Rows vous permet de restreindre l'étendue du fichier qui fait l'analyse. Si nécessaire, cochez la case Limit et définissez ou sélectionnez le nombre de lignes souhaitées.
  5. Si le fichier contient des libellés de colonne, cochez la case Set heading row as column names afin de transformer la première ligne en libellés de colonne. Notez que le nombre de lignes d'en-tête à ignorer (champ Rows To Skip) est incrémenté de 1.
  6. Cliquez ensuite sur Refresh preview pour que les modifications soient prises en compte. Le bouton change d'apparence en Stop jusqu'à ce que l'aperçu soit rafraîchi.
  7. Cliquez sur Next afin de passer à l'étape suivante pour vérifier et personnaliser le schéma de fichier Regex généré.