tHiveInput - Cloud - 8.0

Hive

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Database (Intégration) > Composants Hive
Gouvernance de données > Systèmes tiers > Composants Database (Intégration) > Composants Hive
Qualité et préparation de données > Systèmes tiers > Composants Database (Intégration) > Composants Hive
Last publication date
2024-02-21

Ce composant extrait des données de Hive et les envoie au composant qui suit.

Hive vous permet d'accéder à des tables externes de Spark mais ne supporte pas les transactions ACID.

Le tHiveInput est le composant dédié à la base de données Hive (le système de data warehouse Hive). Il peut exécuter une requête HiveQL données afin d'extraire des données de Hive.

Lorsque ACID est activé côté Hive, un Job Spark ne peut pas supprimer ou mettre à jour une table, à moins que des données soient compactées, ce Job ne peut pas non plus lire correctement des données agrégées d'une table Hive. Cette limitation est connue et décrite dans le système de suivi des bugs : https://issues.apache.org/jira/browse/SPARK-15348 (en anglais).

Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.

Pour plus de technologies supportées par Talend, consultez Composants Talend.