Scénario : Transfert de données de HDFS vers le framework Spark de Amazon S3

Amazon EMR distribution

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Open Studio for Big Data
Talend Big Data Platform
Talend Big Data
Talend Real-Time Big Data Platform
Talend Data Fabric
task
Création et développement > Création de Jobs > Distributions Hadoop > Amazon EMR
EnrichPlatform
Studio Talend

Les instructions suivantes expliquent comment lire et traiter un fichier dans HDFS et sauvegarder les résultats dans Amazon S3 via un Job Spark - Big Data Batch.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Étant donné que Spark n'est pas dépendant d'un système de fichiers en particulier, vous devrez spécifier quel système de fichiers vous utilisez pour votre Job Spark.