Terminez la configuration de la connexion Google Dataproc dans l'onglet Spark configuration de la vue Run de votre Job. Cette connexion fonctionne uniquement pour le Job dans lequel vous l'avez définie.
Seul le mode Yarn client est disponible pour ce type de cluster.
Les informations contenues dans cette section concernent uniquement les utilisateurs et utilisatrices ayant souscrit à Talend Data Fabric ou à un produit Big Data de Talend, et ne sont pas applicables aux utilisateurs et utilisatrices de Talend Open Studio for Big Data.
Procédure
Résultats
-
Une fois la connexion configurée, vous pouvez personnaliser les performances de Spark, même si ce n'est pas obligatoire, en suivant la procédure décrite dans :
-
Personnaliser Spark pour les Jobs Apache Batch Spark pour les Jobs Spark Batch.
-
Personnaliser Spark pour les Jobs Apache Spark Streaming pour les Jobs Spark Streaming.
-
-
Il est recommandé d'activer le système de log et de points de contrôle Spark, dans l'onglet de configuration de Spark, dans la vue Run de votre Job Spark, afin de permettre de déboguer et reprendre votre Job Spark lorsqu'une erreur survient :