Écrire des données dans la table - 7.3

Hive

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Database (Intégration) > Composants Hive
Gouvernance de données > Systèmes tiers > Composants Database (Intégration) > Composants Hive
Qualité et préparation de données > Systèmes tiers > Composants Database (Intégration) > Composants Hive
Last publication date
2024-02-22

Pourquoi et quand exécuter cette tâche

Configurer le tHiveLoad

Procédure

  1. Double-cliquez sur le tHiveLoad pour ouvrir sa vue Component.
  2. Cochez la case Use an existing connection et, dans la liste Component list, sélectionnez la connexion configurée dans le composant tHiveConnection utilisé dans ce Job.
  3. Dans le champ Load action, sélectionnez LOAD pour écrire des données du fichier d'exemple présenté au début du scénario.
  4. Dans le champ File path, saisissez le chemin d'accès au répertoire dans lequel sont stockées les données. Dans cet exemple, les données sont stockées sur le système HDFS utilisé.

    Dans un cas d'utilisation réel, vous pouvez utiliser le tHDFSOutput afin d'écrire des données dans un système HDFS. Vous devez également vous assurer que l'application Hive a les droits et les autorisations nécessaires pour écrire et également déplacer les données.

    Pour plus d'informations sur le tHDFSOutput, consultez tHDFSOutput.

    Pour plus d'informations concernant les droits et permissions, consultez la documentation ou contactez l'administrateur du cluster Hadoop utilisé.

    Notez que si vous devez lire des données depuis un système de fichiers local autre que le système HDFS, vous devez vous assurer que les données lues sont stockées dans le système de fichiers local de la machine sur laquelle le Job est exécuté. Cochez ensuite la case Local dans la vue Basic settings. Par exemple, lorsque le mode de connexion à Hive est Standalone, le Job est exécuté sur la machine sur laquelle l'application Hive est installée. Les données sont donc stockées sur cette machine.
  5. Dans le champ Table name, saisissez le nom de la table cible dans laquelle charger les données. Dans ce scénario, saisissez employees.
  6. Dans la liste Action on file, sélectionnez APPEND.
  7. Cochez la case Set partitions et, dans le champ qui apparaît, saisissez le nom de la partition dans laquelle vous souhaitez ajouter des données. Dans ce scénario, cette partition est country='US'.