tSPSSInput

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Data Quality
Talend Open Studio for Big Data
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Open Studio for Data Integration
task
Gouvernance de données
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Fonction

Le composant tSPSSInput lit les données de fichiers SPSS (.sav).

Objectif

Le tSPSSInput envoie des données SPSS pour les écrire, dans un autre fichier par exemple.

Propriétés du tSPSSInput

Famille du composant

Business Intelligence

 

Basic settings

Sync schema

Cliquez sur ce bouton pour synchroniser le schéma avec les colonnes du fichier SPSS d'entrée.

 

Schema et Edit Schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Pour ce composant, le schéma des métadonnées est directement récupéré à partir du fichier SPSS d'entrée, c'est pourquoi il est en lecture seule.

Vous pouvez cliquer sur Edit schema pour voir les métadonnées qui ont été récupérées.

 

File name

Indiquez le nom ou le chemin d'accès au fichier SPPS à lire.

 

Translate labels

Cochez cette case pour traduire les étiquettes (labels) des valeurs stockées.

Note

Si vous cochez cette case, vous devrez à nouveau récupérer les métadonnées.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Global Variables

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est utilisé comme composant de début. Il requiert un composant de sortie.

Avertissement

Avant de pouvoir utiliser toutes les fonctionnalités des composants SPSS, assurez-vous de suivre les étapes suivantes : -Si vous avez déjà installé SPSS, ajoutez le chemin du répertoire SPSS, qui se présente comme suit : SET PATH=%PATH%;<DR>:\program\SPSS. -Si vous n'avez pas encore installé SPSS, copiez le lib SPSS IO "spssio32.dll" à partir du CD d'installation et copiez-le dans votre répertoire "system32".

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Limitation

Oracle fournit deux types de plateformes JVM (32 bits et 64 bits). Par défaut, la JVM utilisée dans un système d'exploitation 64 bits est la version 64 bits de cette JVM. Le fichier JSPSS.dll utilisé par ce composant est compilé dans la version 32 bits de la JVM. Il est donc nécessaire de configurer la JVM 32 bits pour exécuter un Job dans un Studio Talend, installé sous un système d'exploitation 64 bits.

Pour ce faire, procédez comme suit :

  1. Ouvrez le Job dans l'espace de modélisation graphique.

  2. Cliquez sur l'onglet Run et cliquez sur l'onglet Advanced settings.

  3. Cochez la case Use specific JVM arguments et cliquez sur le bouton New....

  4. Dans le champ Set the VM argument, saisissez -d32 et cliquez sur OK afin de valider.

Scénario : Afficher le contenu d'un fichier SPSS

Le scénario suivant crée un Job à deux composants qui permet de lire chaque ligne d'un fichier SPSS (.sav) et de les afficher en sortie dans la console de log de la vue Run.

Construire le Job

  1. A partir de la Palette, déposez les composants tSPSSInput et tLogRow dans l'espace graphique.

  2. Cliquez-droit sur le composant tPSSInput et connectez-le au tLogRow à l'aide d'un lien de type Main Row.

Configurer le composant d'entrée

  1. Double-cliquez sur le composant tSPSSInput pour afficher la vue Basic settings et configurer ses paramètres.

  2. Cliquez sur le bouton [...] à côté du champ Filename pour parcourir vos dossiers jusqu'au fichier SPSS que vous voulez lire.

  3. Cliquez sur le bouton [...] à côté du champ Sync schema. Un message apparaît à l'écran pour vous inviter à récupérer le schéma du fichier SPSS sélectionné.

  4. Cliquez sur le bouton Yes pour fermer le message.

  5. Si nécessaire, cliquez sur le bouton [...] à côté du champ Edit schema pour visualiser la structure de données prédéfinie dans le fichier SPSS source.

  6. Cliquez sur le bouton OK pour fermer la boîte de dialogue.

Exécuter du Job

Sauvegardez votre Job, et appuyez sur F6 afin de l'exécuter.

Le fichier SPSS est lu ligne par ligne, et les champs extraits sont affichés dans la console.

Convertir les valeurs stockées

Afin d'effectuer de convertir les valeurs stockées, procédez comme suit :

  1. Dans la vue Basic settings, cochez la case Translate label si vous voulez traduire les étiquettes (labels) des valeurs stockées.

  2. Cliquez à nouveau sur le bouton Sync Schema, afin de récupérer le schéma après traduction.

    Un message apparaît, vous demandant si vous souhaitez récupérer le schéma du fichier SPSS défini.

  3. Cliquez sur Yes (Oui) pour fermer le message et procéder à l'étape suivante.

    Un second message s'ouvre et vous demande si vous souhaitez propager les modifications.

  4. Cliquez sur Yes (Oui) afin de fermer le message et passer à l'étape suivante.

  5. Enregistrez le Job puis appuyez sur la touche F6 pour l'exécuter.

Le fichier SPSS est lu ligne par ligne et les champs extraits sont affichés sur la console de log de la vue Run, après conversion des valeurs stockées.