Scénario : Transfert de données de HDFS vers le framework Spark de Amazon S3

Amazon S3

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend ESB
Talend Big Data
Talend Open Studio for Data Integration
Talend Real-Time Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Open Studio for ESB
Talend Data Integration
Talend Open Studio for Big Data
Talend Data Services Platform
Talend Big Data Platform
Talend MDM Platform
Talend Open Studio for MDM
task
Qualité et préparation de données > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
Gouvernance de données > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
Création et développement > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
EnrichPlatform
Studio Talend

Les instructions suivantes expliquent comment lire et traiter un fichier dans HDFS et sauvegarder les résultats dans Amazon S3 via un Job Spark - Big Data Batch.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Étant donné que Spark n'est pas dépendant d'un système de fichiers en particulier, vous devrez spécifier quel système de fichiers vous utilisez pour votre Job Spark.