Scénario 2 : Réutiliser un cookie stocké pour récupérer des fichiers via un protocole HTTP - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario décrit un Job comprenant deux composants, qui se connecte à un site Web HTTP donné et, à l'aide d'un cookie stocké dans un répertoire local spécifié, récupère les données de ce site.

Déposer et relier les composants

  1. Déposez deux composants tFileFetch de la Palette dans l'espace de modélisation graphique.

  2. Reliez ces deux composants (en tant que sous-jobs) à l'aide d'un lien Trigger > OnSubjobOk.

Configurer les composants

Configurer le premier sous-job

  1. Double-cliquez sur le tFileFetch_1 afin d'ouvrir sa vue Component et définir ses propriétés.

  2. Dans la liste Procotol, sélectionnez le protocole que vous souhaitez utiliser. Ici, utilisez le protocole https.

  3. Dans le champ URI, saisissez l'URI via laquelle vous pouvez vous connecter au site Web et récupérer la page Web. Dans cet exemple, l'URI est https://www.codeproject.com/script/Membership/LogOn.aspx?download=true.

  4. Dans le champ Destination directory, parcourez votre répertoire jusqu'au dossier dans lequel stocker la page Web récupérée. Ce dossier sera créé à la volée s'il n'existe pas. Dans cet exemple, saisissez D:/download.

  5. Dans le champ Destination filename, saisissez un nouveau nom pour la page Web si vous souhaitez le modifier. Dans cet exemple, saisissez codeproject.html.

  6. Dans le tableau Parameters, cliquez deux fois sur le bouton [+] pour ajouter deux lignes et renseignez les informations d'authentification pour accéder au site Web souhaité.

    Dans la colonne Name du tableau Parameters, saisissez respectivement le nom des deux lignes, Email et Password, requises par le site Web auquel vous vous connectez.

    Dans la colonne Value, saisissez les informations correspondantes, respectivement votre adresse e-mail et votre mot de passe.

  7. Cochez la case Save cookie.

  8. Dans le champ Cookie file, saisissez le chemin d'accès complet au fichier dans lequel vous souhaitez stocker le cookie. Dans cet exemple, le chemin est D:/download/cookie.

  9. Cliquez sur l'onglet Advanced settings pour ouvrir cette vue.

  10. Cochez la case Support redirection afin que la requête de redirection soit répétée jusqu'à ce que la redirection réussisse.

Configurer le second sous-job

  1. Double-cliquez sur le tFileFetch_2 afin d'ouvrir sa vue Component et définir ses propriétés.

  2. Dans la liste Procotol, sélectionnez http.

  3. Dans le champ URI, saisissez l'adresse à partir de laquelle récupérer les fichiers qui vous intéressent. Dans cet exemple, l'adresse est  http://www.codeproject.com/script/articles/download.aspx?file=/KB/DLL/File_List_Downloader/FLD02June2011_Source.zip&rp=http://www.codeproject.com/Articles/203991/File-List-Downloader.

  4. Dans le champ Destination directory, parcourez votre répertoire jusqu'au dossier dans lequel vous souhaitez stocker les fichiers récupérés. Ce dossier peut être automatiquement créé s'il n'existe pas durant le processus d'exécution. Dans cet exemple, saisissez D:/download.

  5. Dans le champ Destination Filename, saisissez un nouveau nom pour le fichier si vous souhaitez le modifier. Dans cet exemple, saisissez source.zip.

  6. Décochez la case POST method pour désactiver le tableau Parameters.

  7. Cochez la case Read cookie.

  8. Dans le champ Cookie file, parcourez votre système jusqu'au fichier utilisé pour sauvegarder le cookie. Dans cet exemple, le fichier est D:/download/cookie.

Sauvegarder et exécuter le Job

  1. Sauvegardez votre Job en appuyant sur les touches Ctrl+S.

  2. Appuyez sur F6 pour l'exécuter ou cliquez sur le bouton Run dans l'onglet Run.

    Allez dans le dossier local D:/download pour vérifier le fichier téléchargé.