Premières étapes de l'utilisation du Big Data dans le Studio Talend
Dans ce tutoriel, vous effectuez vos premiers pas avec Big Data dans le Studio Talend.
Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
Créer un projet dans le Studio Talend
Créer un projet est la première étape d'utilisation du Studio Talend. Les projets vous permettent d'organiser votre travail.
Procédure
Résultats
Créer un Job pour utiliser une connexion à un cluster Hadoop
Les projets du Studio Talend contiennent des Jobs. Dans les Jobs, vous pouvez construire des workflows via les composants, ce qui vous permet d'effectuer des actions spécifiques.
Avant de commencer
Procédure
Résultats
Créer une définition de métadonnée de cluster Hadoop
Vous pouvez créer une définition de métadonnée de cluster Hadoop pour pouvoir configurer rapidement votre composant avec les informations de connexion au cluster Hadoop. Le Studio Talend vous permet également d'importer une définition de métadonnée de cluster.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Sélectionnez la perspective Integration ( ).
Procédure
Résultats
Importer une définition de métadonnée de cluster Hadoop
Vous pouvez importer votre configuration de cluster Hadoop pour créer une définition de métadonnée de cluster Hadoop pour pouvoir configurer les composants rapidement avec ces informations. Le Studio Talend vous permet également de créer une définition de métadonnée de cluster à partir de zéro.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Sélectionnez la perspective Integration ( ).
Procédure
Résultats
Écrire et lire des données dans HDFS
Dans ce tutoriel, découvrez comment écrire des données dans HDFS à l'aide de données aléatoirement générées. Ensuite, apprenez à lire les données depuis HDFS, à les trier et à afficher les résultats dans la console.
Générer des données aléatoires
Avec l'aide du composant tRowGenerator, le Studio Talend peut créer des données aléatoires vous permettant de tester ses fonctionnalités.
Pourquoi et quand exécuter cette tâche
Procédure
Résultats
Que faire ensuite
Écrire des données depuis HDFS à l'aide des métadonnées
Grâce au composant tHDFSOutput, vous pouvez écrire des données dans HDFS.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Vous devez également avoir une métadonnée HDFS configurée (consultez Créer une définition de métadonnée de cluster Hadoop et Importer une définition de métadonnée de cluster Hadoop).
Procédure
Résultats
Lire des données depuis HDFS à l'aide des métadonnées
Grâce au composant tHDFSInput, vous pouvez lire des données depuis HDFS.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Vous devez également avoir une métadonnée HDFS configurée (consultez Créer une définition de métadonnée de cluster Hadoop et Importer une définition de métadonnée de cluster Hadoop).
- Vous devez avoir écrit des données dans HDFS (consultez Écrire des données depuis HDFS à l'aide des métadonnées).