Scénario 1 : Utiliser les métadonnées de Talend Data Mapper - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Le scénario suivant crée un Job à trois composants, lisant les données d'un fichier d'entrée transformé à l'aide d'un mapping précédemment créé dans la perspective Mapping et écrit en sortie les données transformées dans un nouveau fichier. Il fonctionne avec les métadonnées de Talend Data Mapper.

Copier une version modifiable des fichiers d'exemple

  1. Dans la perspective Mapping, dans la vue Data Mapper, développez le nœud Hierarchical Mapper et le dossier Other Projects, cliquez-droit sur Examples et sélectionnez Copy dans le menu contextuel.

  2. Dans la vue Data Mapper, cliquez-droit à la racine du nœud Hierarchical Mapper puis sélectionnez Paste dans le menu contextuel.

    Cela copie une version modifiable de tous les fichiers d'exemple en lecture seule dans votre Workspace local.

Ajouter et relier les composants

  1. Dans la perspective Integration, créez un nouveau Job et nommez-le tdm_to_tdm.

  2. Cliquez sur l'emplacement, dans l'espace de modélisation graphique, où vous souhaitez ajouter le premier composant. Commencez à saisir tFileInputRaw puis cliquez sur le nom du composant lorsqu'il apparaît dans la liste proposée, afin de le sélectionner.

  3. Répétez l'opération pour ajouter un composant tHMap et un tFileOutputRaw.

  4. Reliez le tFileInputRaw au composant tHMap à l'aide d'un lien Row > Main. Renommez le lien input puis connectez le composant tHMap au tFileOutputRaw à l'aide d'un lien Row > Main. Nommez ce lien output. Lorsque le Studio vous propose d'obtenir le schéma du composant cible, cliquez sur Yes.

Configurer les propriétés du tFileInputRaw

  1. Sélectionnez le tFileInputRaw afin de configurer ses propriétés.

  2. Dans l'onglet Basic settings, cliquez sur le bouton [...] à côté du champ Filename puis parcourez votre système jusqu'au fichier d'entrée. Vous pouvez également saisir son chemin manuellement entre guillemets doubles. Dans cet exemple, utilisez <PATH_TO_WORKSPACE>/<PROJECT_NAME>/Sample Data/CSV/PurchaseOrderPayPal/PayPalPO.csv.

  3. Dans la zone Mode sélectionnez Read the file as a string et laissez les autres champs tels quels.

Configurer les propriétés du tFileOutputRaw

  1. Sélectionnez le composant tFileOutputRaw afin de définir ses propriétés.

  2. Dans l'onglet Basic settings, cliquez sur le bouton [...] puis parcourez votre système jusqu'à l'emplacement où se trouvera le fichier de sortie, ou saisissez manuellement le chemin entre guillemets doubles. Laissez les autres paramètres tels qu'ils sont.

Configurer les propriétés du tHMap

  1. Sélectionnez le composant tHMap afin de définir ses propriétés.

  2. Cliquez sur le bouton [...] à côté du champ Map Path pour ouvrir la boîte de dialogue et sélectionnez le mapping à utiliser, Maps/CSV/POPayPalCsv_PO2, puis cliquez sur OK. Ce mapping transforme un fichier CSV en un fichier XML.

  3. Dans la zone Read Input As, vérifiez que l'option Single Column est sélectionnée.

  4. Dans la zone Write Output As, vérifiez que l'option String (single column) est sélectionnée.

Sauvegarder et exécuter le Job

  1. Appuyez sur les touches Ctrl+S afin de sauvegarder votre Job.

  2. Dans l'onglet Run, cliquez sur le bouton Run pour exécuter le Job.

  3. Parcourez votre système jusqu'à l'emplacement où se trouve le fichier de sortie, afin de vérifier qu'un fichier XML contenant les mêmes données que le fichier CSV d'entrée a bien été créé.