Scénario : Transfert de données de HDFS vers le framework Spark de Amazon S3

Amazon S3

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data Platform
Talend Big Data
Talend Data Integration
Talend Data Services Platform
Talend ESB
Talend Open Studio for Data Integration
Talend Data Fabric
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
Talend MDM Platform
Talend Data Management Platform
Talend Open Studio for Big Data
task
Qualité et préparation de données > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
Gouvernance de données > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
Création et développement > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
EnrichPlatform
Studio Talend

Les instructions suivantes expliquent comment lire et traiter un fichier dans HDFS et sauvegarder les résultats dans Amazon S3 via un Job Spark - Big Data Batch.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Étant donné que Spark n'est pas dépendant d'un système de fichiers en particulier, vous devrez spécifier quel système de fichiers vous utilisez pour votre Job Spark.