Configurer les composants - 6.5

MS Delimited

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants File (Intégration) > Composants MS Delimited
Gouvernance de données > Systèmes tiers > Composants File (Intégration) > Composants MS Delimited
Qualité et préparation de données > Systèmes tiers > Composants File (Intégration) > Composants MS Delimited
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tFileInputMSDelimited pour ouvrir l'éditeur Multi Schema Editor.
  2. Cliquez sur le bouton Browse... à côté du champ File name pour indiquer où se trouve le fichier délimité multi-schéma que vous voulez traiter.
  3. Dans la zone File Settings, renseignez :
    -le type d'encodage de votre fichier source, à partir de la liste déroulante. Cette option permet de garantir une certaine cohérence entre tous les fichiers d'entrée et de sortie.
    -les séparateurs de champ et de ligne utilisés dans le fichier source.
    Remarque :

    Cochez la case Use Multiple Separator et configurez les champs qui suivent si différents séparateurs de champs sont utilisés pour séparer les schémas du fichier source.

    Un aperçu des données du fichier source apparaît automatiquement dans le panneau d'affichage Preview.
    Remarque :

    La colonne Column 0, qui contient généralement l'indicateur de type des enregistrements est sélectionnée par défaut. Vous pouvez cependant définir n'importe quelle autre colonne comme clé primaire en cochant sa case associée.

  4. Cliquez sur le bouton Fetch Codes à droite du panneau Preview pour cataloguer les types de schémas et les enregistrements du fichier source. Dans ce scénario, le fichier source comporte trois types de schémas (A, B, C).
    A partir du panneau d'affichage Fetch Codes, cliquez sur chacun des trois types pour que la structure de leurs données s'affiche dans le panneau Preview.
  5. Cliquez dans les cellules de la ligne Name et choisissez le nom des colonnes de chacun des schémas sélectionnés.
    Dans ce scénario, les colonnes se lisent comme suit :
    -Schéma A : Type, DiscName, Author, Date,
    -Schéma B : Type, SongName,
    -Schéma : Type, LibraryName.
    Vous devez à présent définir, à partir des données d'entrée, la clé primaire qui permettra de conserver leur unicité (dans ce scénario, il s'agit de DiscName). Il vous faut pour cela :
  6. Sélectionner, à partir du panneau d'affichage Fetch Codes, le schéma contenant la colonne que vous voulez définir comme clé primaire (dans ce scénario, il s'agit du schéma A) pour en afficher la structure.
  7. Cliquer dans la cellule Key correspondant à la colonne DiscName et cocher la case qui s'affiche alors.
  8. Cliquer n'importe où dans l'éditeur pour que la mention false, dans la case Key, devienne true.
    Vous devez maintenant indiquer le schéma "père" auquel vous voulez rattacher les autres schémas "fils" (dans ce scénario, il s'agit de DiscName). Il vous faut pour cela :
  9. Sélectionner le schéma B, à partir du panneau d'affichage Fetch Codes, puis cliquer sur le bouton flèche droite pour le déplacer vers la droite.
    Faire de même pour le schéma C.
    Remarque :

    Le champ Cardinality n'est pas obligatoire. Il vous permet de déterminer le nombre (ou l'intervalle) de champs des schémas "fils" rattachés au schéma "père". Cependant, si vous entrez un nombre ou un intervalle inexact et essayez d'exécuter le Job, un message d'erreur apparaîtra.

  10. Dans le [Multi Schema Editor], cliquez sur le bouton OK pour valider tous les changements que vous venez d'effectuer et fermer l'éditeur de schémas.
    Les trois schémas définis, ainsi que les types d'enregistrements correspondants, s'affichent automatiquement dans la vue Basic settings du composant tFileInputMSDelimited.
    Les trois schémas que vous avez définis dans l'éditeur [Multi Schema Editor] sont automatiquement communiqués aux trois composants tLogRow.
  11. Si nécessaire, cliquez sur le bouton Edit schema dans la vue Basic settings de chacun des composants tLogRow pour avoir un aperçu des structures de données en entrée et en sortie, telles que vous les avez définies dans le Multi Schema Editor, ou pour les modifier.