Configurer le tHDFSInput - 6.4

Processing (Integration)

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Processing (Intégration)
Gouvernance de données > Systèmes tiers > Composants Processing (Intégration)
Qualité et préparation de données > Systèmes tiers > Composants Processing (Intégration)
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tHDFSInput pour ouvrir sa vue Component.
  2. Cliquez sur le bouton situé à côté du champ Edit schema afin de vérifier si le schéma reçu dans les étapes précédentes a été correctement défini.
    Notez que si vous avez créé ce Job à partir d'un Job vierge, vous devez cliquer sur le bouton afin d'ajouter manuellement ces colonnes au schéma. Si le schéma a été défini dans le Repository, vous pouvez sélectionner l'option Repository dans la liste Schema de la vue Basic settings afin de le réutiliser. Pour plus d'informations sur comment définir un schéma dans le Repository, consultez le chapitre décrivant la gestion des métadonnées dans le Guide utilisateur de Studio Talend ou le chapitre décrivant le nœud Hadoop cluster du Repository dans le Guide de prise en main de Talend Open Studio for Big Data .
  3. Si vous effectuez des changements dans le schéma, cliquez sur OK afin de valider ces changements et acceptez la propagation proposée par la boîte de dialogue qui s'affiche.
  4. Dans le champ Folder/File, saisissez le chemin d'accès au fichier source que vous souhaitez que le Job lise. Vous pouvez également parcourir votre système de fichiers afin de définir ce chemin.
    Si le fichier ne se trouve pas dans le système HDFS utilisé, vous devez le placer dans le système HDFS. Pour cela, vous pouvez par exemple utiliser le tFileInputDelimited et le tHDFSOutput dans un Job Standard.