Fusionner les informations relatives aux films et aux réalisateurs à l'aide d'un Job Apache Spark Batch - 7.3

Guide de prise en main de Talend Big Data Platform

author
Talend Documentation Team
EnrichVersion
7.3
EnrichProdName
Talend Big Data Platform
task
Création et développement
Installation et mise à niveau
Qualité et préparation de données > Nettoyage de données
Qualité et préparation de données > Profiling de données
EnrichPlatform
Studio Talend
Talend Administration Center
Talend DQ Portal
Talend Installer
Talend Runtime
Ce scénario présente comment :
  1. Créer un Job Talend pour Apache Spark Batch. Consultez Créer un Job Spark Batch pour plus de détails.

  2. Ajouter et relier les composants à utiliser dans un Job Spark Batch. Consultez Déposer et relier les composants Spark pour plus de détails.

  3. Configurer les composants d'entrée à l'aide de la métadonnées du Repository. Consultez Configurer les données d'entrée pour plus de détails.

  4. Configurer la transformation pour effectuer une jointure sur les données d'entrée. Consultez Configurer la transformation de données pour plus de détails.

  5. Écrire les données transformées dans ADLS. Consultez Écrire la sortie dans Azure ADLS Gen1 pour plus de détails.