Scénario : Transfert de données de HDFS vers le framework Spark de Amazon S3

Amazon S3

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Open Studio for ESB
Talend Data Fabric
Talend Big Data
Talend Open Studio for MDM
Talend ESB
Talend Big Data Platform
Talend Open Studio for Data Integration
Talend Real-Time Big Data Platform
Talend Data Integration
Talend MDM Platform
Talend Open Studio for Big Data
Talend Data Services Platform
Talend Data Management Platform
task
Gouvernance de données > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
Qualité et préparation de données > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
Création et développement > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
EnrichPlatform
Studio Talend

Les instructions suivantes expliquent comment lire et traiter un fichier dans HDFS et sauvegarder les résultats dans Amazon S3 via un Job Spark - Big Data Batch.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Étant donné que Spark n'est pas dépendant d'un système de fichiers en particulier, vous devrez spécifier quel système de fichiers vous utilisez pour votre Job Spark.