Exécuter un Job sur Spark ou YARN
Dans ce tutoriel, créez un Job Big Data Batch s'exécutant sur Spark ou YARN et lisant des données depuis HDFS.
Créer un projet dans le Studio Talend
Créer un projet est la première étape d'utilisation du Studio Talend. Les projets vous permettent d'organiser votre travail.
Procédure
Résultats
Créer un Job Big Data Batch pour utiliser Spark ou YARN
Pour le traitement de Big Data, le Studio Talend vous permet de créer des Jobs Batch et Streaming s'exécutant sur Spark ou MapReduce.
Avant de commencer
Procédure
Résultats
Exécuter un Job sur Spark
Dans ce tutoriel, découvrez comment exécuter un Job sur Spark, dans le Studio Talend.
Configurer une connexion HDFS pour exécution sur Spark
Grâce au composant tHDFSConfiguration, vous pouvez connecter votre système de fichiers HDFS à Spark.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Vous avez également configuré une métadonnée HDFS (consultez Créer une définition de métadonnée de cluster Hadoop et Importer une définition de métadonnée de cluster Hadoop).
Procédure
-
Dans le Repository, développez , puis la métadonnée du cluster Hadoop de votre choix.
- Cliquez sur OK.
Résultats
Que faire ensuite
Lire des données depuis une connexion HDFS sur Spark
En utilisant une métadonnée HDFS prédéfinie, vous pouvez lire des données depuis un système de fichiers HDFS sur Spark.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Vous avez également configuré une métadonnée HDFS (consultez Créer une définition de métadonnée de cluster Hadoop et Importer une définition de métadonnée de cluster Hadoop).
- Vous avez configuré votre connexion HDFS sur Spark (consultez Configurer une connexion HDFS pour exécution sur Spark).
Procédure
Résultats
Exécuter un Job sur YARN
Dans ce tutoriel, découvrez comment exécuter un Job sur YARN, dans le Studio Talend.
Configurer une connexion HDFS pour exécution sur YARN
Grâce au composant tHDFSConfiguration, vous pouvez connecter votre système de fichiers HDFS à YARN.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Vous avez également configuré une métadonnée HDFS (consultez Créer une définition de métadonnée de cluster Hadoop et Importer une définition de métadonnée de cluster Hadoop).
Procédure
Résultats
Que faire ensuite
Lire des données depuis une connexion HDFS sur YARN
En utilisant une métadonnée HDFS prédéfinie, vous pouvez lire des données depuis un système de fichiers HDFS sur YARN.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Vous avez également configuré une métadonnée HDFS (consultez Créer une définition de métadonnée de cluster Hadoop et Importer une définition de métadonnée de cluster Hadoop).