Scénario : Récupérer les billets fréquemment mis à jour sur un blog - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario Java à deux composants a pour but de récupérer les billets qui sont souvent mis à jour sur un blog, à partir d'un flux RSS local Talend, en utilisant le composant tRSSInput.

  1. A partir de la Palette, cliquez-déposez les composants suivants dans l'éditeur graphique : le tRSSInput et le tLogRow.

  2. Cliquez-droit sur le premier pour le connecter au second à l'aide d'un lien de type Row Main.

  3. Dans l'éditeur graphique, sélectionnez le tRSSInput et cliquez sur la vue Component pour définir la configuration de base (Basic settings) du tRSSInput.

  4. Saisissez l'URL d'accès au flux RSS. Dans ce scénario, le tRSSInput est associé au flux RSS Talend : http://feeds.feedburner.com/Talend.

  5. Cochez/décochez les autres cases selon vos besoins. Dans ce scénario, on veut afficher les informations de deux articles datés du 20 juillet 2008.

  6. Dans l'espace graphique, sélectionnez le tLogRow puis cliquez sur la vue Component pour en définir la configuration de base. Pour plus d'informations sur les propriétés du composant tLogRow, consultez Propriétés du tLogRow.

  7. Enregistrez le Job puis appuyez sur F6 pour l'exécuter.

    Le composant tRSSInput a accédé au flux RSS du site de Talend à votre place et en a organisé les informations pour vous.

Deux billets sont affichés sur la console. Chacun d'eux a ses propres titre, description, date de publication et URL du flux RSS correspondante. Les blogs présentent le dernier billet en premier et vous pouvez faire défiler vers le bas pour lire les billets les plus anciens.