Créer un Job Big Data Batch pour utiliser Spark ou YARN

Pour le traitement de Big Data, le Studio Talend vous permet de créer des Jobs Batch et Streaming s'exécutant sur Spark ou MapReduce.

Avant de commencer

Sélectionnez la perspective Integration (Window > Perspective > Integration).

Procédure

Dans le Repository, cliquez-droit sur Job Designs.
1. Sélectionnez Create Big Data Batch Job.
Dans le champ Name, saisissez un nom.
Exemple
ReadHDFS_Spark_or_YARN
Sélectionnez un Framework.
- Spark
- MapReduce (deprecated)
Facultatif : Dans le champ Purpose, saisissez un objectif.
Exemple
Read and sort customer data
Facultatif : Dans le champ Description, saisissez une description.
Exemple
Read and sort customer data stored in HDFS from a Big Data Batch Job running on Spark or YARN

Note InformationsConseil : Saisir un objectif dans le champ Purpose et une Description permet une meilleure organisation.
Cliquez sur Finish.

Résultats

L'espace de modélisation graphique (Designer) ouvre un Job vide.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !

Laissez vos commentaires ici