tHDFSRowCount - 7.0

HDFS

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants File (Intégration) > Composants HDFS
Gouvernance de données > Systèmes tiers > Composants File (Intégration) > Composants HDFS
Qualité et préparation de données > Systèmes tiers > Composants File (Intégration) > Composants HDFS
EnrichPlatform
Studio Talend

Ce composant lit un fichier dans HDFS ligne par ligne afin de déterminer le nombre de lignes qu'il contient.

Le tHDFSRowCount compte le nombre de lignes d'un fichier donné dans HDFS.Si le fichier à traiter est un fichier Hadoop de type séquence ou un ensemble de données volumineux, il est recommandé d'utiliser un composant tAggregateRow pour compter les enregistrements.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.