tRSSOutput - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tRSSOutput

Famille du composant

Internet

 

Fonction

Le composant tRSSOutput écrit des fichiers XML RSS_Feed ou Atom_Feed.

Objectif

Le tRSSOutput permet de créer des fichiers XML contenant des flux RSS ou Atom.

Basic settings

File Name

Chemin d'accès et nom du fichier à traiter, et/ou variable à utiliser.

Pour plus d'informations concernant l'utilisation et la définition de variables, consultez le Guide utilisateur du Studio Talend.

 

Encoding

Sélectionnez l'encodage à partir de la liste ou sélectionnez Custom et définissez-le manuellement. Ce champ est obligatoire pour la manipulation des données des bases de données.

 

Append

Cochez cette option pour ajouter des nouvelles lignes à la fin du fichier.

 

Mode

Sélectionnez RSS ou ATOM selon le flux que vous souhaitez générer.

 

Channel (en mode RSS)

Note

Les informations à renseigner dans cette zone concernent l'intégralité des données saisies, du site, etc. plutôt que des éléments particuliers.

Title : Saisissez un titre significatif.

Description : Entrez une description du contenu qui vous semble suffisamment détaillée.

Publication date : Renseignez la date adéquate.

Link : Saisissez l'URL appropriée.

 

Feed (en mode ATOM)

Title : Saisissez un titre significatif.

Link : Saisissez l'URL appropriée.

Id : Saisissez l'URL valide correspondant au champ Link.

Update date : Saisissez la date de mise à jour.

Author name : Saisissez le nom de l'auteur.

 

Optionnal Channel Elements

Renseignez dans le tableau les informations relatives aux métadonnées du flux RSS. Cliquez sur le bouton [+] pour ajouter de nouvelles lignes :

Element Name : nom de la métadonnée.

Element Value : contenu de la métadonnée.

 

Schema type et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma est soit local (Built-in), soit distant dans le Repository

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Dans le contexte d'utilisation du tRSSInput, le schéma est composé de quatre colonnes : TITLE, DESCRIPTION, PUBDATE et Link. Les paramètres de titre sont en lecture seule, contrairement à leur type et leur longueur.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du Job ainsi qu'au niveau de chaque composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant doit obligatoirement être relié à un composant de début ou un composant intermédiaire.

Scénario 1 : Créer un flux RSS et stocker les fichiers sur un serveur FTP

Ce scénario Java a pour but de :

  • créer un flux RSS pour des fichiers que vous souhaitez partager avec d'autres personnes, et

  • stocker l'ensemble des fichiers sur un serveur FTP.

Ce scénario permet d'écrire un fichier XML de flux RSS à partir d'une table MySQL contenant des informations concernant des livres. Il ajoute également des liens vers les fichiers stockés sur un serveur FTP au cas où les utilisateurs voudraient avoir accès aux fichiers dans leur intégralité.

Déposer et relier les composants

  1. A partir de la Palette, cliquez-déposez les composants suivants dans l'éditeur graphique : le tMysqlInput, le tRSSOutput et le tFTPPut.

  2. Cliquez-droit sur le tMysqlInput et connectez-le au tRSSOutput à l'aide d'un lien de type Row Main.

  3. Cliquez-droit sur le tMysqlInput et connectez-le au tFTPPut à l'aide d'un lien de type OnSubjobOk.

Définir la source des données d'entrée

  1. Dans l'espace graphique, sélectionnez le tMysqlInput.

  2. Cliquez sur la vue Component pour définir la configuration de base (Basic settings) du tMysqlInput.

  3. Configurez le champ Property type en mode Repository puis cliquez sur le bouton [...] pour sélectionner la base de données adéquate dans la liste. Les détails de connexion ainsi que le schéma sont remplis automatiquement.

  4. Dans le champ Table Name, saisissez le nom de votre table ou cliquez sur le bouton [...] et sélectionnez le nom de la table à partir de la liste. Dans ce scénario, la table Mysql de données saisies s'appelle "rss_talend" et le schéma comporte quatre colonnes, TITLE, Description, PUBDATE, et LINK.

  5. Dans le champ Query, saisissez la requête de base de données en faisant particulièrement attention à ce que l'ordre des champs corresponde au schéma défini, ou cliquez sur Guess Query.

Créer un flux RSS

  1. Dans l'espace graphique, sélectionnez le composant tRSSOutput.

  2. Cliquez sur la vue Component pour définir la configuration de base (Basic settings) du tRSSOutput.

  3. Dans le champ File name, utilisez le nom de fichier et son chemin d'accès définis par défaut ou parcourez vos dossiers pour définir votre propre fichier XML de sortie.

  4. Sélectionnez le type d'encodage à partir de la liste Encoding Type.

  5. Dans la zone Mode, sélectionnez RSS.

  6. Dans le panneau Channel, saisissez un titre, une description, une date de publication et un lien définissant l'ensemble de vos données saisies.

  7. Sélectionnez le type de schéma dans la liste Schema puis cliquez sur Edit Schema pour le modifier si nécessaire.

    Note

    Vous pouvez également cliquer sur Sync Column pour récupérer le schéma généré par le composant précédent.

  8. Enregistrez votre Job puis appuyez sur F6 pour en exécuter la première partie.

    Le composant tRSSOutput a créé en sortie un flux RSS au format XML pour les fichiers définis.

Ecrire des fichiers entiers sur un serveur FTP

Pour stocker des fichiers complets sur un serveur FTP :

  1. Dans l'espace graphique, sélectionnez le FTPPut et cliquez sur la vue Component pour définir la configuration de base (Basic settings) du tFTPPut.

  2. Saisissez le nom du serveur et le numéro de port dans les champs correspondants.

  3. Renseignez vos détails de connexion dans les champs Username et Password.

  4. Parcourez vos dossier jusqu'au répertoire local ou tapez manuellement le chemin d'accès dans le champ Local directory.

  5. Entrez les détails du serveur de répertoire distant.

  6. Sélectionnez le mode de transfert à partir de la liste Transfer mode.

  7. Dans le panneau Files, cliquez sur le bouton [+] pour ajouter des lignes puis remplissez les masques de fichiers de tous les fichiers à copier sur le répertoire distant. Dans ce scénario, les fichiers à enregistrer sur le serveur FTP sont tous des fichiers texte.

  8. Enregistrez votre Job puis appuyez sur F6 pour l'exécuter.

Les fichiers définis sont copiés sur le serveur distant.

Scénario 2 : Créer un flux RSS contenant des métadonnées

Ce scénario Java à deux composants a pour but de créer un flux RSS contenant des métadonnées et de rediriger les informations obtenues dans un fichier XML de flux RSS en sortie.

Déposer et relier les composants

  • A partir de la Palette, cliquez-déposez les composants tRSSInput et tRSSOutput dans l'éditeur graphique.

    Cliquez-droit sur le tRSSInput et connectez-le au tRSSOutput à l'aide d'un lien de type Row Main.

Configurer les composants

  1. Double-cliquez sur le composant tRSSInput pour ouvrir sa vue Basic settings et définir sa configuration de base.

  2. Saisissez l'URL du RSS_Feed. Dans ce scénario, le composant tRSSOutput mène au RSS_Feed http://feeds.feedburner.com/Talend.

  3. Dans l'espace graphique, double-cliquez sur le composant pour ouvrir sa vue Component et définir sa configuration de base (Basic settings).

  4. Dans le champ File name, utilisez le nom de fichier de sortie et son chemin d'accès définis par défaut ou parcourez vos dossiers pour définir votre propre fichier XML de sortie.

  5. Sélectionnez le type d'encodage à partir de la liste Encoding Type.

  6. Dans la zone Mode, sélectionnez RSS.

  7. Dans le panneau Channel, saisissez un titre, une description, une date de publication et un lien définissant l'ensemble de vos données saisies.

  8. Dans le tableau Optional Channel Element, définissez les métadonnées de votre flux RSS. Dans ce scénario, le flux comprend deux métadonnées : copyright, à laquelle est associée la valeur tos, et language, à laquelle est associée la valeur en_us.

  9. Sélectionnez le type de schéma dans la liste Schema puis cliquez sur Edit Schema pour le modifier si nécessaire.

    Note

    Vous pouvez également cliquer sur Sync Column pour récupérer le schéma généré par le composant précédent.

Sauvegarder et exécuter le Job

  1. Appuyez sur Ctrl+S pour sauvegarder votre Job.

  2. Appuyez sur F6 ou cliquez sur le bouton Run de l'onglet Run pour l'exécuter.

Les fichiers définis sont copiés dans le fichier XML de sortie et les métadonnées apparaissent sous le nœud <channel>, en dessous des informations de base du flux RSS.

Scénario 3 : Créer un fichier XML de flux ATOM

Ce scénario Java décrit un Job à deux composants, qui génère des données et les écrit dans un fichier XML de flux ATOM.

Déposer et relier les composants

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFixedFlowInput du groupe Misc et un tRSSOutput du groupe Internet.

  2. Cliquez-droit sur le tFixedFlowInput et connectez-le au tRSSOutput à l'aide d'un lien Row Main.

  3. Une fenêtre pop-up s'affiche et vous demande si vous souhaitez passer le schéma du tRSSOutput au tFixedFlowInput, cliquez sur Yes (Oui).

Configurer les composants

  1. Dans l'espace de modélisation graphique, double-cliquez sur le tFixedFlowInput afin d'afficher sa vue Component et définir ses Basic settings.

  2. Dans le champ Number of rows, laissez le paramètre par défaut, 1, pour ne générer qu'une ligne de données.

  3. Dans la zone Mode, laissez sélectionnée l'option Use Single Table et remplissez le tableau Values. Notez que le champ Column du tableau Values est rempli par les colonnes du schéma défini dans le composant.

  4. Dans le champ Value du tableau Values, saisissez les données que vous souhaitez envoyer au composant suivant.

  5. Dans l'espace de modélisation, double-cliquez sur le composant tRSSOutput afin d'afficher sa vue Component et définir ses Basic settings.

  6. Cliquez sur le bouton [...] à côté du champ File Name afin de définir le répertoire et le nom du fichier XML de sortie.

  7. Dans la zone Mode, sélectionnez ATOM pour générer un fichier XML de flux ATOM.

    Avertissement

    Comme le format du flux ATOM est strict, des informations par défaut sont requises afin de créer le fichier XML. Le schéma du tRSSOutput comprend donc des colonnes par défaut contenant ces informations. Ces colonnes par défaut sont grisées pour indiquer qu'elles ne doivent pas être modifiées. Si vous choisissez de modifier le schéma du composant, le fichier XML ATOM créé ne sera pas valide.

  8. Dans la zone Feed, saisissez un titre, un lien, un ID, la date de mise à jour, et le nom de l'auteur, afin de définir vos données comme un tout.

Sauvegarder et exécuter le Job

  1. Appuyez sur Ctrl+S pour sauvegarder votre Job.

  2. Appuyez sur F6 ou cliquez sur le bouton Run de l'onglet Run pour l'exécuter.

Le composant tRSSOutput crée un flux de sortie ATOM au format XML.