Importer des métadonnées de fichier délimité

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
task
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Vous pouvez importer les métadonnées d'un fichier délimité à partir d'un fichier CSV prédéfini.

Avant d'importer les métadonnées du fichier délimité à partir d'un fichier CSV, assurez-vous que chaque ligne de votre fichier CSV est conforme au format suivant :

Name*; Purpose; Description; Version(0.1 by default); Status(DEV|TEST|PROD); FilePath*; FileFormat(UNIX|WINDOWS|MAC); Encoding; FieldSeparatorValue; RowSeparatorValue; EscapeType; EscapeChar; TextEnclosure; FirstLineCaption(true|false); HeaderValue; FooterValue; RemoveEmptyRow(true|false); LimitValue; TableName*; Label*; Comment; DefaultValue; Key*(true|false); Length*; Nullable(true|false); Pattern; Precision; TalendType

Note que :

  • les champs marqués d'un astérisque (*) ne doivent pas être laissés vides.

  • Name est le nom de la connexion au fichier à créer sous le nœud File delimited. Vous pouvez créer plusieurs connexions à des fichiers en spécifiant différents noms de connexion.

  • TableName est le nom du schéma du fichier. Label est le nom de la colonne dans le schéma.

  • les séquences d'échappement doivent être utilisées pour spécifier des métacaractères ou caractères de contrôle CSV, comme ; ou \n.

  • le champ FirstLineCaption doit être paramétré à true et le champ HeaderValue doit être renseigné correctement si le fichier délimité contient une ligne d'en-tête et des lignes à ignorer.

L'exemple suivant vous explique comment importer les métadonnées d'un fichier délimité nommé directors.csv à partir d'un fichier CSV prédéfini nommé directors_metadata.csv.

Voici un abstract du fichier directors.csv, contenant deux colonnes id et name :

id;name
1;Gregg Araki
2;P.J. Hogan
3;Alan Rudolph

Le fichier CSV directors_metadata.csv contient deux lignes pour décrire les métadonnées du fichier directors.csv:

directors;Centralize directors metadata;Metadata of directors.csv; 0.1;DEV; E:\Talend\Data\Input\directors.csv;WINDOWS;UTF-8; "\";\""; "\"\\n\""; Delimited;;;true;1;;false;;directors_schema;id;;;false;1;true;;0;id_Integer
directors;Centralize directors metadata;Metadata of directors.csv;0.1;DEV; E:\Talend\Data\Input\directors.csv;WINDOWS;UTF-8; "\";\""; "\"\\n\""; Delimited;;;true;1;;false;;directors_schema;name;;;false;1;true;;0;id_String

Pour importer des métadonnées de connexion à un fichier délimité à partir du fichier CSV susmentionné, procédez comme suit :

  1. Dans la vue Repository, développez le nœud Metadata et cliquez-droit sur File delimited.

  2. Dans le menu contextuel, sélectionnez Import connections from CSV.

    La boîte de dialogue [Import connections from CSV] s'ouvre.

  3. Cliquez sur Browse... et parcourez votre système jusqu'au fichier CSV décrivant les métadonnées du fichier délimité, directors_metadata.csv dans cet exemple.

  4. Cliquez sur Finish pour fermer la boîte de dialogue.

    La boîte de dialogue [Show Logs] s'ouvre et liste les métadonnées importées et rejetées, s'il y en a.

  5. Cliquez sur OK pour fermer la boîte de dialogue.

    Une nouvelle connexion à un fichier, nommée directors est créée sous le nœud File delimited dans la vue Repository, avec des propriétés comme définies dans le fichier CSV.