Scénario 2 : Utiliser les métadonnées d'intégration de données Talend - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le scénario suivant crée un Job à trois composants, lisant des données d'un fichier d'entrée, transformées via un mapping créé dans la perspective Mapping et écrivant en sortie les données transformées dans un nouveau fichier. Le Job utilise les métadonnées d'intégration de données Talend.

Copier une version modifiable des fichiers d'exemple

  1. Dans la perspective Mapping, dans la vue Data Mapper, développez le nœud Hierarchical Mapper et, dans le dossier Other Projects, cliquez-droit sur Examples et sélectionnez Copy dans le menu contextuel.

  2. Dans la vue Data Mapper, cliquez-droit à la racine du nœud Hierarchical Mapper puis sélectionnez Paste dans le menu contextuel.

    Cela copie une version modifiable de tous les fichiers d'exemple en lecture seule, dans votre Workspace local.

Ajouter et relier les composants

  1. Dans la perspective Integration, créez un nouveau Job standard et nommez-le di_to_di.

  2. Cliquez sur l'emplacement où vous souhaitez ajouter le premier composant, dans l'espace de modélisation graphique, commencez à saisir tFileInputDelimited puis cliquez sur le nom du composant lorsqu'il apparaît dans la liste proposée, afin de le sélectionner.

  3. Répétez l'opération pour ajouter un tHMap et un tFileOutputXML.

  4. Reliez le tFileInputDelimited au tHMap à l'aide d'un lien Row > Main puis reliez le composant tHMap au tFileOutputXML à l'aide d'un lien Row > Main.

Configurer les propriétés du tFileInputDelimited

  1. Sélectionnez le composant tFileInputDelimited pour configurer ses propriétés.

  2. Dans l'onglet Basic settings, cliquez sur le bouton [...] à côté du champ Filename/Stream puis parcourez votre système de fichiers jusqu'à l'emplacement où est stocké le fichier Excel d'entrée, ou saisissez manuellement le chemin entre guillemets doubles. Dans cet exemple, utilisez <PATH_TO_WORKSPACE>/<PROJECT_NAME>/Sample Data/CSV/PurchaseOrderPayPal/PayPalPO.csv.

  3. Cochez la case CSV options.

  4. Dans le champ Field Separator, saisissez une virgule entre guillemets doubles (",").

  5. Dans le champ Header, saisissez 1.

  6. Cliquez sur le bouton [...] à côté du champ Edit schema afin de définir le schéma.

  7. Ajoutez trois colonnes et nommez-les txn_id, payment_date et first_name : ces noms correspondent au nom des trois premières colonnes du fichier d'entrée et sont suffisantes pour l'objectif de cet exemple. Cliquez sur OK.

  8. Laissez les autres paramètres tels qu'ils sont.

Configurer les propriétés du tFileOutputXML

  1. Sélectionnez le composant tFileOutputXML pour paramétrer ses propriétés.

  2. Dans l'onglet Basic settings, cliquez sur le bouton [...] à côté du champ File Name puis parcourez votre système jusqu'à l'emplacement où sera stocké votre fichier de sortie, ou saisissez manuellement le chemin entre guillemets doubles.

  3. Cliquez sur le bouton [...] à côté du champ Edit schema afin de définir le schéma.

  4. Ajoutez trois colonnes dans le schéma d'entrée sur la gauche et nommez-les id, date et name, copiez-les vers le schéma de sortie sur la droite, puis cliquez sur OK.

  5. Laissez les autres éléments tels qu'ils sont.

Configurer le tHMap

  1. Sélectionnez le tHMap pour configurer ses propriétés.

  2. Cliquez sur le bouton [...] à côté du champ Open Map Editor pour créer un nouveau mapping basé sur l'entrée et la sortie du tHMap.

  3. Dans la boîte de dialogue tHMap Structure Generate/Select qui s'ouvre, sélectionnez Generate hierarchical mapper structure based on the schema puis cliquez sur Next afin de générer la structure d'entrée.

  4. Procédez de la même manière pour la structure de sortie.

  5. Dans l'éditeur Map editor qui s'ouvre, glissez l'élément txn_id de Input (map) vers l'élément id de Output (map). Procédez de la même manière afin de mapper payment_date avec date et first_name avec name puis sauvegardez vos modifications.

Sauvegarder et exécuter le Job

  1. Appuyez sur les touches Ctrl+S pour sauvegarder votre Job.

  2. Dans l'onglet Run, cliquez sur le bouton Run pour exécuter le Job.

  3. Parcourez votre système jusqu'à l'emplacement où se trouve le fichier de sortie, afin de vérifier qu'un fichier XML contenant les mêmes données que le fichier CSV d'entrée a bien été créé.