Configurer un schéma File Positional - 6.5

Talend ESB Studio Guide utilisateur

EnrichVersion
6.5
EnrichProdName
Talend ESB
task
Création et développement
EnrichPlatform
Studio Talend

Si vous devez souvent lire et/ou écrire des données dans des fichiers positionnels, vous pouvez centraliser les métadonnées de ces fichiers dans le Repository afin de les réutiliser facilement. Les métadonnées de type File Positional peuvent être utilisées pour définir les propriétés des composants tInputFilePositional, tFileOutputPositional et tFileInputMSPositional.

L'assistant [New Positional File] regroupe la connexion au fichier et la définition du schéma en une seule procédure de quatre étapes.

Pour créer une connexion à un fichier délimité à partir de zéro, développez le nœud Metadata du Repository. Ensuite, cliquez-droit sur File Positional puis sélectionnez Create file positional dans le menu contextuel afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour centraliser une connexion à un fichier que vous avez définie dans un Job ainsi que son schéma, cliquez sur l'icône dans la vue Basic settings du composant correspondant afin d'ouvrir l'assistant de configuration des métadonnées du fichier. Notez que Built-in doit être sélectionné dans la liste Property Type.

Définissez ensuite les propriétés générales et le schéma du fichier dans l'assistant.

Définir les propriétés générales

  1. Dans l'assistant de configuration des métadonnées du fichier, renseignez le champ Name, qui est obligatoire et les champs Purpose et Description si vous le souhaitez. Les informations que vous renseignez dans le champ Description apparaissent en tant qu'info-bulle lorsque vous placez le pointeur de votre souris sur la connexion.

  2. Si nécessaire, définissez la version et le statut de la connexion dans les champs Version et Status, respectivement. Vous pouvez également gérer la version et le statut d'un élément du Repository dans la boîte de dialogue [Project Settings]. Pour plus d'informations, consultez Gérer les versions et Gérer les statuts, respectivement.

  3. Si nécessaire également, cliquez sur le bouton Select à côté du champ Path afin de sélectionner un dossier sous le nœud File positional. Ce dossier contient la connexion au fichier créée. Notez que vous ne pouvez pas sélectionner de dossier pendant que vous modifiez une connexion existante. Vous pouvez cependant déposer une connexion dans un nouveau dossier quand vous le souhaitez.

  4. Cliquez sur Next lorsque vous avez configuré les propriétés générales.

Définir le chemin, le format et les marqueurs de position du fichier

  1. Sélectionnez le type d'encodage (Encoding) et le format du système d'exploitation (Format) dans lequel le fichier a été créé. Ces informations sont utilisées afin de pré-remplir les champs suivants. Si le système d'exploitation souhaité n'est pas proposé dans la liste, ignorez ce champ.

    Le fichier est chargé et la zone File Viewer donne un instantané du fichier et vous permet de placer les marqueurs de position.

  2. Cliquez sur l'aperçu du fichier et définissez la position des marqueurs sur la règle afin de définir les propriétés des colonnes du fichier. Une flèche de couleur orange vous aide à affiner la position du marqueur.

    Les champs Field Separator et Marker position sont automatiquement remplis par une série de chiffres séparés par des virgules.

    Les chiffres dans le champ Field Separator représentent le nombre de caractères entre les séparateurs, c'est-à-dire la longueur des colonnes dans le fichier chargé. L'astérisque symbolise tous les caractères restants jusqu'à la fin de la ligne, à partir du séparateur précédent. Vous pouvez changer ces chiffres afin de spécifier la longueur des colonnes de façon précise.

    Le champ Marker position indique la position exacte de chaque marqueur sur la règle, en nombre de caractères. Vous pouvez affiner la position exacte du marqueur en saisissant la valeur exacte de position.

    Afin de déplacer un marqueur, cliquez sur une flèche et glissez-la vers sa nouvelle position. Pour retirer un marqueur, cliquez sur sa flèche et faites-la glisser vers la règle, jusqu'à ce qu'une icône apparaisse.

  3. Cliquez sur Next pour continuer.

Configurer les paramètres de parsing du fichier

Dans cette vue, vous pouvez définir les paramètres de parsing du fichier afin que le schéma du fichier soit correctement récupéré.

A ce stade, l'aperçu affiche les colonnes du fichier par la position de marqueurs.

  1. Définissez les séparateurs de champs et de lignes dans la zone File Settings.

    • Si nécessaire, vous pouvez modifier les chiffres dans le champ Field Separator afin de spécifier la longueur des colonnes de façon précise.

    • Si le séparateur de lignes de votre fichier n'est pas le caractère de fin de ligne standard, sélectionnez Custom String dans la liste Row Separator et spécifiez le caractère dans le champ Corresponding Character.

  2. Si votre fichier possède des en-têtes à exclure du contenu des données, cochez la case Header dans la zone Rows To Skip et configurez le nombre de lignes à ignorer dans le champ correspondant. De plus, si vous savez que le fichier contient des informations de pied de page, cochez la case Footer et définissez le nombre de lignes à ignorer.

  3. La zone Limit of Rows vous permet de restreindre l'étendue du fichier à analyser. Si nécessaire, cochez la case Limit et définissez ou sélectionnez le nombre de lignes souhaité.

  4. Si le fichier contient des libellés de colonne, cochez la case Set heading row as column names afin de transformer la première ligne en libellés de colonne. Notez que le nombre de lignes d'en-tête à ignorer est incrémenté de 1.

  5. Cliquez sur le bouton Refresh Preview dans le panneau de prévisualisation (Preview) afin que les paramètres prennent effet. Un aperçu du résultat s'affiche dans le panneau Preview.

  6. Cliquez sur Next afin passer à l'étape suivante pour vérifier et personnaliser le schéma de fichier généré.

Vérifier et personnaliser le schéma du fichier

L'étape 4 affiche le schéma final généré. Remarquez que tous les caractères du fichier pouvant être mal interprétés par le programme par la suite sont remplacés par un caractère neutre. Par exemple, les tirets soulignés remplacent les astérisques.

  1. Renommez le schéma (par défaut, metadata) et modifiez les colonnes du schéma comme souhaité.

    Assurez-vous que le type de données dans la colonne Type est correctement défini.

    Pour plus d'informations concernant les types de données Java, à savoir le modèle de date, consultez Java API Specification (en anglais).

    Les types de données Talend les plus utilisés sont les suivants :

    • Object : est un type de données Talend générique qui permet le traitement des données sans tenir compte de leur contenu, par exemple, un fichier de données non supporté peut être traité à l'aide d'un composant tFileInputRaw en spécifiant qu'il comporte un type de données Object.

    • List : est une liste d'éléments de type primitifs, séparés par un espace, dans une définition de Schéma XML, définis à l'aide de l'élément xsd:list.

    • Dynamic : est un type de données pouvant être fixé pour une seule colonne à la fin d'un schéma afin de permettre le traitement des champs tels que les colonnes VARCHAR(100), également nommées 'Column<X>' ou si l'entrée comporte un en-tête, dans les noms de colonne figurant dans l'en-tête. Pour plus d'informations, consultez Schéma dynamique.

    • Document : est un type de données permettant le traitement d'un document XML en entier sans tenir compte de son contenu.

  2. Pour générer à nouveau le schéma du fichier positionnel, cliquez sur le bouton Guess. Notez cependant que toute modification ou personnalisation du schéma n'est pas conservée lorsque vous cliquez sur Guess.

  3. Une fois vos changements effectués, cliquez sur Finish pour fermer l'assistant.

Le nouveau schéma apparaît dans l'arborescence du Repository, sous le nœud de la connexion File positional appropriée. Vous pouvez glisser-déposer la métadonnée du Repository dans l'espace de modélisation graphique en tant que nouveau composant. Vous pouvez également la déposer sur un composant afin de réutiliser ses métadonnées. Pour plus d'informations sur l'utilisation des métadonnées centralisées, consultez Comment utiliser les métadonnées centralisées dans un Job et Paramétrer un schéma du Repository dans un Job.

Pour modifier une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Edit file positional afin d'ouvrir l'assistant de configuration des métadonnées du fichier.

Pour ajouter un nouveau schéma à une connexion à un fichier existante, cliquez-droit sur la connexion dans le Repository et sélectionnez Retrieve Schema dans le menu contextuel.

Pour éditer un schéma de fichier existant, cliquez-droit sur le schéma dans le Repository et sélectionnez Edit Schema dans le menu contextuel.