Scénario 1 : Récupérer des données à partir d'un protocole HTTP - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario décrit un Job comprenant trois composants, qui récupère un fichier d'un site internet HTTP, lit des données du fichier récupéré et affiche les données dans la console.

Déposer et relier les composants

  1. De la Palette, déposez les composants tFileFetch, tFileInputDelimited et tLogRow dans l'espace de modélisation graphique.

  2. Reliez le tFileFetch au tFileInputDelimited à l'aide d'un lien Trigger > OnSubjobOk ou OnComponentOk.

  3. Reliez le tFileInputDelimited au tLogRow à l'aide d'un lien Row > Main.

Configurer les composants

  1. Double-cliquez sur le tFileFetch pour ouvrir sa vue Basic settings.

  2. Sélectionnez le protocole que vous souhaitez utiliser. Ici, utilisez le protocole http.

  3. Dans le champ URI, saisissez l'URI où le fichier peut être récupéré. Vous pouvez coller l'URI directement dans votre navigateur afin de visualiser les données du fichier.

  4. Dans le champ Destination directory, sélectionnez le répertoire dans lequel le fichier récupéré doit être stocké. Dans cet exemple, saisissez D:/Output.

  5. Dans le champ Destination filename, saisissez le nouveau nom du fichier si vous souhaitez le renommer. Dans cet exemple, new.txt.

  6. Si nécessaire, cochez la case Add header et définissez une ou plusieurs requêtes HTTP comme conditions de récupération. Par exemple, vous pouvez récupérer le fichier s'il a été modifié depuis une date précise.

    Dans le tableau Headers, dans le champ Name, saisissez "If-Modified-Since" puis saisissez "Sat, 29 Oct 1994 19:43:31 GMT" dans le champ Value. Pour plus d'informations concernant la définition d'en-têtes HTTP, consultez Header Field Definitions (en anglais).

  7. Double-cliquez sur le tFileInputDelimited pour ouvrir sa vue Basic settings.

  8. Dans le champ File name, saisissez le chemin d'accès complet au fichier récupéré stocké localement.

  9. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la boîte de dialogue [Schema]. Dans cet exemple, ajoutez une colonne output pour stocker les données du fichier récupéré.

  10. Laissez les autres paramètres tels qu'ils sont.

Sauvegarder et exécuter le Job

  1. Appuyez sur les touches Ctrl+S pour sauvegarder votre Job.

  2. Appuyez sur F6 ou cliquez sur le bouton Run de la vue Run pour l'exécuter.

    Les données du fichier récupéré s'affichent dans la console.