Visualisation dans le studio des données stockées dans Hadoop - 6.3

Talend Big Data Platform Studio Guide utilisateur

EnrichVersion
6.3
EnrichProdName
Talend Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Avertissement

Les informations contenues dans cette section concernent les utilisateurs ayant souscrit au Studio Talend et ne sont pas applicables pour les utilisateurs de Talend Open Studio for Big Data.

Lors de la conception ou de l'exécution d'un Job, vous pouvez avoir besoin de visualiser les données source à traiter ou les données de sortie après l'exécution. L'aperçu des données (Data viewer) vous permet d'accéder aux données directement à partir du studio, sans utiliser d'outil supplémentaire.

Dans la plupart des cas, le seul prérequis est d'avoir configuré correctement la connexion du Job à la distribution Hadoop où sont stockées les données.

  • Pour voir les données source, cliquez-droit sur le composant d'entrée que vous utilisez, par exemple le tHDFSInput. Dans le menu contextuel, sélectionnez Data viewer.

  • Pour visualiser les données de sortie après une exécution, cliquez-droit sur le composant de sortie, par exemple le tHDFSOutput. Dans le menu contextuel, sélectionnez Data viewer.

La capture d'écran suivante montre l'aperçu des données (Data viewer) lues depuis un serveur Hadoop distant. Le schéma des données est défini dans le composant duquel est appelé le Data Viewer.

Notez que, si vous utilisez une distribution Hadoop MapR, c'est-à-dire que vous avez installé son client MapR sur la machine où se trouve le studio, vous devez configurer l'argument -Djava.library.path afin que le studio accède à la bibliothèque native de ce client MapR.

  1. Dans la barre de menu du studio, cliquez sur Window > Preferences pour ouvrir la fenêtre [Preferences].

  2. Développez Talend et sélectionnez Run/Debug.

  3. Dans la zone Job Run VM arguments, cliquez sur New pour afficher la boîte de dialogue [Set the VM Argument].

  4. Configurez l'argument -Djava.library.path. Par exemple, saisissez -Djava.library.path=C:\opt\mapr\lib\native\Windows_7, si vous utilisez Windows 7, ou saisissez -Djava.library.path=/opt/mapr/lib si vous utilisez Linux.

  5. Cliquez sur OK pour fermer la boîte de dialogue. Cet argument est ajouté à la table Argument.

  6. Cliquez sur Apply afin de valider les modifications et cliquez sur OK pour fermer la fenêtre [Preferences].