Importer des métadonnées de fichier délimité - 7.1

Guide utilisateur de Talend Big Data Studio

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data
task
Création et développement
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Vous pouvez importer les métadonnées d'un fichier délimité à partir d'un fichier CSV prédéfini.

Avant d'importer les métadonnées du fichier délimité à partir d'un fichier CSV, assurez-vous que chaque ligne de votre fichier CSV est conforme au format suivant :
Name*; Purpose; Description; Version(0.1 by default); Status(DEV|TEST|PROD); FilePath*; FileFormat(UNIX|WINDOWS|MAC); Encoding; FieldSeparatorValue; RowSeparatorValue; EscapeType; EscapeChar; TextEnclosure; FirstLineCaption(true|false); HeaderValue; FooterValue; RemoveEmptyRow(true|false); LimitValue; TableName*; Label*; Comment; DefaultValue; Key*(true|false); Length*; Nullable(true|false); Pattern; Precision; TalendType

Gardez à l'esprit :

  • les champs marqués d'un astérisque (*) ne doivent pas être laissés vides.

  • Name est le nom de la connexion au fichier à créer sous le nœud File delimited. Vous pouvez créer plusieurs connexions à des fichiers en spécifiant différents noms de connexion.

  • TableName est le nom du schéma du fichier. Label est le nom de la colonne dans le schéma.

  • les séquences d'échappement doivent être utilisées pour spécifier des métacaractères ou caractères de contrôle CSV, comme ; ou \n.

  • le champ FirstLineCaption doit être paramétré à true et le champ HeaderValue doit être renseigné correctement si le fichier délimité contient une ligne d'en-tête et des lignes à ignorer.

L'exemple suivant vous explique comment importer les métadonnées d'un fichier délimité nommé directors.csv à partir d'un fichier CSV prédéfini nommé directors_metadata.csv.

Voici un abstract du fichier directors.csv, contenant deux colonnes id et name :

id;name
1;Gregg Araki
2;P.J. Hogan
3;Alan Rudolph

Le fichier CSV directors_metadata.csv contient deux lignes pour décrire les métadonnées du fichier directors.csv:

directors;Centralize directors metadata;Metadata of directors.csv; 0.1;DEV; E:\Talend\Data\Input\directors.csv;WINDOWS;UTF-8; "\";\""; "\"\\n\""; Delimited;;;true;1;;false;;directors_schema;id;;;false;1;true;;0;id_Integer
directors;Centralize directors metadata;Metadata of directors.csv;0.1;DEV; E:\Talend\Data\Input\directors.csv;WINDOWS;UTF-8; "\";\""; "\"\\n\""; Delimited;;;true;1;;false;;directors_schema;name;;;false;1;true;;0;id_String

Pour importer des métadonnées de connexion à un fichier délimité à partir du fichier CSV susmentionné, procédez comme suit :

Procédure

  1. Dans la vue Repository, développez le nœud Metadata et cliquez-droit sur File delimited.
  2. À partir du menu contextuel, sélectionnez l'option Import connections from CSV.
    La boîte de dialogue Import connections from CSV s'ouvre.
  3. Cliquez sur Browse... et parcourez votre système jusqu'au fichier CSV décrivant les métadonnées du fichier délimité, directors_metadata.csv dans cet exemple.
  4. Cliquez sur Finish afin de fermer la boîte de dialogue.
    La boîte de dialogue Show Logs s'ouvre et liste les métadonnées importées et rejetées, s'il y en a.
  5. Cliquez sur OK pour fermer la boîte de dialogue.
    Une nouvelle connexion à un fichier, nommée directors est créée sous le nœud File delimited dans la vue Repository, avec des propriétés comme définies dans le fichier CSV.