Définir le schéma - 6.5

Hive

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants Hive
Gouvernance de données > Systèmes tiers > Composants Database > Composants Hive
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants Hive
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tHiveCreateTable pour ouvrir sa vue Component.
  2. Cochez la case Use an existing connection et, dans la liste Component list, sélectionnez la connexion configurée dans le composant tHiveConnection utilisé dans ce Job.
  3. Cliquez sur le bouton à côté du champ Edit schema pour ouvrir l'éditeur de schéma.
  4. Cliquez quatre fois sur le bouton pour ajouter quatre lignes dans la colonne Column. Renommez-les respectivement Id, FirstName, LastName et Reg_date.
    Notez que vous ne pouvez pas utilisez les mots-clés réservés à Hive pour nommer les colonnes, comme par exemple location ou date.
  5. Dans la colonne Type, sélectionnez le type de données dans chaque colonne. Dans ce scénario, Id est de type Integer, Reg_date est de type Date et les autres lignes sont de type String.
  6. Dans la colonne DB type, sélectionnez le type Hive de chaque colonne correspondant au type de données défini. Par exemple, Id est de type INT et Reg_date est de type TIMESTAMP.
  7. Dans la colonne Data pattern, définissez le modèle correspondant à celui des données brutes. Dans cet exemple, utilisez le modèle par défaut.
  8. Cliquez sur OK pour valider ces modifications.