Configurer l'itération - 7.0

HDFS

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants File (Intégration) > Composants HDFS
Gouvernance de données > Systèmes tiers > Composants File (Intégration) > Composants HDFS
Qualité et préparation de données > Systèmes tiers > Composants File (Intégration) > Composants HDFS
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le composant tHDFSList pour ouvrir sa vue Component.
  2. Dans la zone Version, sélectionnez la distribution d'Hadoop à laquelle vous êtes connecté ainsi que sa version.
  3. Dans la zone Connection, saisissez les valeurs des paramètres requis pour vous connecter à HDFS.
    Dans un cas d'utilisation réelle, vous pouvez utiliser le composant tHDFSConnection afin de créer une connexion et la réutiliser à partir du composant en question. Pour plus d'informations, consultez tHDFSConnection.
  4. Dans le champ HDFS Directory, saisissez le chemin d'accès au dossier dans lequel se trouvent les fichiers à itérer. Dans cet exemple, le répertoire est /user/ychen/data/hdfs/out/.
  5. Dans le champ FileList Type, sélectionnez File.
  6. Dans la table Files, cliquez sur le bouton pour ajouter une ligne et saisissez * entre guillemets afin d'effectuer une boucle sur les fichiers existants.