Fusionner les informations relatives aux films et aux cinéastes à l'aide d'un Job Apache Spark Batch - 7.2

Guide de prise en main de Talend Real-Time Big Data Platform

Version
7.2
Language
Français (France)
Product
Talend Real-Time Big Data Platform
Module
Studio Talend
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Content
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Nettoyage de données
Qualité et préparation de données > Profiling de données
Ce scénario présente comment :
  1. Créer un Job Talend pour Apache Spark Batch. Consultez Créer un Job Spark Batch pour plus de détails.

  2. Ajouter et relier les composants à utiliser dans un Job Spark Batch. Consultez Déposer et relier les composants Spark pour plus de détails.

  3. Configurer les composants d'entrée à l'aide de la métadonnées du Repository. Consultez Configurer les données d'entrée pour plus de détails.

  4. Configurer la transformation pour effectuer une jointure sur les données d'entrée. Consultez Configurer la transformation de données pour plus de détails.

  5. Écrire les données transformées dans ADLS. Consultez Écrire la sortie dans Azure ADLS Gen1 pour plus de détails.