Accéder au contenu principal Passer au contenu complémentaire

Écrire des données depuis HDFS à l'aide des métadonnées

Grâce au composant tHDFSOutput, vous pouvez écrire des données dans HDFS.

Avant de commencer

Procédure

  1. Dans le Repository, développez Metadata > Hadoop Cluster, puis la métadonnée du cluster Hadoop de votre choix.
    1. Glissez-déposez la métadonnée HDFS dans l'espace de modélisation graphique (Designer).
      Vous arrivez dans la fenêtre Components.
    2. Sélectionnez un composant tHDFSOutput.
  2. Ajoutez un composant d'entrée.

    Exemple

    Ajoutez un composant tRowGenerator pour générer des données fictives à des fins de test (consultez Générer des données aléatoires).
  3. Cliquez-droit sur le composant d'entrée.
    1. Sélectionnez Row > Main.
    2. Cliquez sur le tHDFSOutput pour relier les deux composants.
  4. Double-cliquez sur le composant tHDFSOutput.

    Le composant est déjà configuré avec les informations de connexion de la métadonnée HDFS.

  5. Dans le champ File Name, renseignez le chemin d'accès et le nom du fichier de votre choix.
  6. Facultatif : Dans la liste Action, sélectionnez Overwrite.

Résultats

Votre composant d'entrée (comme le tRowGenerator) lit les données et le tHDFSOutput les écrit dans votre système HDFS, à l'aide d'une connexion définie dans les métadonnées.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !