Construire le Job - 7.2

Hive

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Database > Composants Hive
Gouvernance de données > Systèmes tiers > Composants Database > Composants Hive
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants Hive

Procédure

  1. Dans la vue Repository du Studio Talend, cliquez-droit sur Job Designs et cliquez sur Create Standard Job.
  2. Nommez votre Job.
  3. Cliquez sur Finish.
  4. Ajoutez un composant tPreJob dans votre espace de modélisation graphique.
  5. Ajoutez un tHiveConnection dans votre espace de modélisation graphique.
  6. Double-cliquez sur le composant tHiveConnection, sélectionnez Repository dans la liste Property Type et la connexion Database Connection précédemment créée.
  7. Cliquez-droit sur le composant tPreJob.
  8. Sélectionnez Trigger > On Component Ok et reliez le tPreJob au tHiveConnection.
  9. Ajoutez un tHiveInput dans votre espace de modélisation graphique.
  10. Sélectionnez-le et cochez la case Use an existing connection, puis sélectionnez le composant tHiveConnection dans la liste Component List.
  11. Dans le champ Query, saisissez show tables pour exécuter une requête affichant les tables disponibles dans la base de données.
  12. Ajoutez un composant tLogRow dans votre espace de modélisation graphique.
  13. Cliquez-droit sur le composant tHiveInput et sélectionnez Row > Main.
  14. Cliquez sur le tLogRow pour relier les deux composants. Ils afficheront les informations de la requête ci-dessus.
  15. Depuis l'onglet Component du tLogRow, sélectionnez Table (print values in celles of a table).
  16. Ajoutez un composant tPostJob dans votre espace de modélisation graphique.
  17. Ajoutez un tHiveClose dans votre espace de modélisation graphique.
  18. Reliez le tPostJob au tHiveClose à l'aide d'un lien On Component Ok afin de fermer la connexion ouverte.
  19. Depuis l'onglet Run, cliquez sur Run pour exécuter le Job et assurer une connexion à Hive sur HDInsight, ainsi que la lisibilité des données de la table.