Construire le Job - Cloud - 8.0
Hive
- Version
- Cloud
- 8.0
- Language
- Français
- Product
- Talend Big Data
- Talend Big Data Platform
- Talend Data Fabric
- Talend Data Integration
- Talend Data Management Platform
- Talend Data Services Platform
- Talend ESB
- Talend MDM Platform
- Talend Open Studio for Big Data
- Talend Open Studio for Data Integration
- Talend Open Studio for ESB
- Talend Real-Time Big Data Platform
- Module
- Studio Talend
- Content
- Création et développement > Systèmes tiers > Composants Database (Intégration) > Composants Hive
- Gouvernance de données > Systèmes tiers > Composants Database (Intégration) > Composants Hive
- Qualité et préparation de données > Systèmes tiers > Composants Database (Intégration) > Composants Hive
Procédure
-
Dans la vue Repository du Studio Talend, cliquez-droit sur Job Designs, puis cliquez sur Create Standard Job.
-
Nommez votre Job.
-
Cliquez sur Finish.
-
Ajoutez un composant tPreJob dans votre espace de modélisation graphique.
-
Ajoutez un tHiveConnection dans votre espace de modélisation graphique.
-
Double-cliquez sur le composant tHiveConnection, sélectionnez Repository dans la liste Property Type et la connexion Database Connection précédemment créée.
-
Cliquez-droit sur le composant tPreJob.
-
Sélectionnez et reliez le tPreJob au tHiveConnection.
-
Ajoutez un tHiveInput dans votre espace de modélisation graphique.
-
Sélectionnez-le et cochez la case Use an existing connection, puis sélectionnez le composant tHiveConnection dans la liste Component List.
-
Dans le champ Query, saisissez show tables pour exécuter une requête affichant les tables disponibles dans la base de données.
-
Ajoutez un composant tLogRow dans votre espace de modélisation graphique.
-
Cliquez-droit sur le composant tHiveInput et sélectionnez .
-
Cliquez sur le tLogRow pour relier les deux composants. Ils afficheront les informations de la requête ci-dessus.
-
Depuis l'onglet Component du tLogRow, sélectionnez Table (print values in celles of a table).
-
Ajoutez un composant tPostJob dans votre espace de modélisation graphique.
-
Ajoutez un tHiveClose dans votre espace de modélisation graphique.
-
Reliez le tPostJob au tHiveClose à l'aide d'un lien On Component Ok afin de fermer la connexion ouverte.
-
Depuis l'onglet Run, cliquez sur Run pour exécuter le Job et assurer une connexion à Hive sur HDInsight, ainsi que la lisibilité des données de la table.