tSPSSOutput - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Propriétés du tSPSSOutput

Famille du composant

Business Intelligence

 

Fonction

Le composant tSPSSOutput écrit des données dans un fichier SPSS (.sav).

Objectif

Le tSPSSOutput écrit ou ajoute des données à un fichier SPSS. Il crée les fichiers SPSS directement ou écrase ceux qui existent déjà.

Basic settings

Sync schema

Cliquez sur ce bouton pour synchroniser le schéma avec les colonnes du fichier SPSS d'entrée.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, sélectionnez No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-in : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

 

Filename

Nom ou chemin d'accès du fichier SPSS à à écrire.

 

Write Type

Sélectionnez dans la liste le type d'action à effectuer :

Write: écrit simplement les nouvelles données.

Append: écrit les nouvelles données à la suite de celles existantes.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant ne peut être utilisé comme composant de début. Il nécessite un flux d'entrée.

Avertissement

Avant de pouvoir utiliser toutes les fonctionnalités des composants SPSS, assurez-vous de suivre les étapes suivantes : -Si vous avez déjà installé SPSS, ajoutez le chemin du répertoire SPSS, qui se présente comme suit : SET PATH=%PATH%;<DR>:\program\SPSS. -Si vous n'avez pas encore installé SPSS, copiez le lib SPSS IO "spssio32.dll" à partir du CD d'installation et copiez-le dans votre répertoire "system32".

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Limitation

Oracle fournit deux types de plateformes JVM (32 bits et 64 bits). Par défaut, la JVM utilisée dans un système d'exploitation 64 bits est la version 64 bits de cette JVM. Le fichier JSPSS.dll utilisé par ce composant est compilé dans la version 32 bits de la JVM. Il est donc nécessaire de configurer la JVM 32 bits pour exécuter un Job dans un Studio Talend, installé sous un système d'exploitation 64 bits.

Pour ce faire, procédez comme suit :

  1. Ouvrez le Job dans l'espace de modélisation graphique.

  2. Cliquez sur l'onglet Run et cliquez sur l'onglet Advanced settings.

  3. Cochez la case Use specific JVM arguments et cliquez sur le bouton New....

  4. Dans le champ Set the VM argument, saisissez -d32 et cliquez sur OK afin de valider.

Scénario : Ecrire des données dans un fichier .sav

Ce scénario décrit un Job très simple qui écrit des données d'entrée dans un fichier .sav.

Construire le Job

  1. Glissez-déposez de la Palette dans l'espace de modélisation graphique un tRowGenerator et un tSPSSOutput.

  2. Cliquez-droit sur le tRowGenerator, et connectez-le au tSPSSOutput, à l'aide d'un lien Row Main.

Configurer le composant d'entrée

  1. Dans l'espace de modélisation graphique, double-cliquez sur le tRowGenerator afin d'afficher sa vue Basic settings et ouvrir son éditeur. Vous pouvez définir votre schéma.

  2. Cliquez sur le bouton [+] afin d'ajouter les colonnes que vous voulez écrire dans le fichier .sav.

  3. Définissez le schéma, et configurez les paramètres des colonnes.

    Avertissement

    Vérifiez que vous avez défini la longueur de vos colonnes. Dans le cas contraire, un message d'erreur s'affichera lors de la construction du Job.

  4. Cliquez sur OK afin de valider votre schéma et fermer l'éditeur.

Configurer le composant de sortie

  1. Double-cliquez sur le tSPSSOutput afin d'afficher sa vue Component et définir ses propriétés.

  2. Cliquez sur le bouton [...] à côté du champ Filename, et parcourez votre répertoire jusqu'au fichier SPSS .sav dans lequel vous souhaitez écrire les données.

  3. Cliquez sur le bouton [...] à côté du bouton Sync columns, afin de synchroniser les colonnes avec celles du composant précédent. Dans cet exemple, le schéma devant être inséré dans le fichier .sav est composé de deux colonnes : id et country.

  4. Si nécessaire, cliquez sur le bouton Edit schema pour voir/éditer le schéma défini.

  5. Dans la liste Write Type, sélectionnez Write (écrire) ou Append (écrire à la suite), pour simplement écrire les données d'entrée dans le fichier .sav, ou bien les écrire à la fin de ce même fichier.

Exécuter le Job

Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.

Les données générées par le tRowGenerator sont écrites dans le fichier .sav défini.