Importer des métadonnées de fichier délimité - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06

Pourquoi et quand exécuter cette tâche

Vous pouvez importer les métadonnées d'un fichier délimité à partir d'un fichier CSV prédéfini.

Avant d'importer les métadonnées du fichier délimité à partir d'un fichier CSV, assurez-vous que chaque ligne de votre fichier CSV est conforme au format suivant :
Name*; Purpose; Description; Version(0.1 by default); Status(DEV|TEST|PROD); FilePath*; FileFormat(UNIX|WINDOWS|MAC); Encoding; FieldSeparatorValue; RowSeparatorValue; EscapeType; EscapeChar; TextEnclosure; FirstLineCaption(true|false); HeaderValue; FooterValue; RemoveEmptyRow(true|false); LimitValue; TableName*; Label*; Comment; DefaultValue; Key*(true|false); Length*; Nullable(true|false); Pattern; Precision; TalendType

Gardez à l'esprit que :

  • les champs marqués d'un astérisque (*) ne doivent pas être laissés vides.

  • Name est le nom de la connexion au fichier à créer sous le nœud File delimited. Vous pouvez créer plusieurs connexions à des fichiers en spécifiant différents noms de connexion.

  • TableName est le nom du schéma du fichier. Label est le nom de la colonne dans le schéma.

  • les séquences d'échappement doivent être utilisées pour spécifier des métacaractères ou caractères de contrôle CSV, comme ; ou \n.

  • le champ FirstLineCaption doit être paramétré à true et le champ HeaderValue doit être renseigné correctement si le fichier délimité contient une ligne d'en-tête et des lignes à ignorer.

L'exemple suivant vous explique comment importer les métadonnées d'un fichier délimité nommé directors.csv à partir d'un fichier CSV prédéfini nommé directors_metadata.csv.

Voici un abstract du fichier directors.csv, contenant deux colonnes id et name :

id;name
1;Gregg Araki
2;P.J. Hogan
3;Alan Rudolph

Le fichier CSV directors_metadata.csv contient deux lignes pour décrire les métadonnées du fichier directors.csv:

directors;Centralize directors metadata;Metadata of directors.csv; 0.1;DEV; E:\Talend\Data\Input\directors.csv;WINDOWS;UTF-8; "\";\""; "\"\\n\""; Delimited;;;true;1;;false;;directors_schema;id;;;false;1;true;;0;id_Integer
directors;Centralize directors metadata;Metadata of directors.csv;0.1;DEV; E:\Talend\Data\Input\directors.csv;WINDOWS;UTF-8; "\";\""; "\"\\n\""; Delimited;;;true;1;;false;;directors_schema;name;;;false;1;true;;0;id_String

Pour importer des métadonnées de connexion à un fichier délimité à partir du fichier CSV susmentionné, procédez comme suit :

Procédure

  1. Dans la vue Repository, développez le nœud Metadata et cliquez-droit sur File delimited.
  2. À partir du menu contextuel, sélectionnez l'option Import connections from CSV.
    La boîte de dialogue Import connections from CSV s'ouvre.
  3. Cliquez sur Browse... et parcourez votre système jusqu'au fichier CSV décrivant les métadonnées du fichier délimité, directors_metadata.csv dans cet exemple.
  4. Cliquez sur Finish pour fermer la boîte de dialogue.
    La boîte de dialogue Show Logs s'ouvre et liste les métadonnées importées et rejetées, s'il y en a.
  5. Cliquez sur OK pour fermer cette boîte de dialogue.
    Une nouvelle connexion à un fichier, nommée directors est créée sous le nœud File delimited dans la vue Repository, avec des propriétés comme définies dans le fichier CSV.