Accéder au contenu principal Passer au contenu complémentaire

Lier les composants pour définir le flux de données Delta Lake

Glissez et liez les composants à utiliser pour lire et traiter vos données Delta Lake.

Procédure

  1. Dans la perspective Integration du Studio Talend, créez un Job Spark Batch vide, à partir du nœud Job Designs, dans la vue Repository.
  2. Dans l'espace de modélisation, saisissez le nom du composant à utiliser et sélectionnez ce composant dans la liste qui apparaît. Dans ce scénario, les composants sont tS3Configuration (libellé s3_flights), deux composants tDeltaLakeInput (libellés flights_latest_version et flights_first_version, respectivement), deux composants tAggregateRow (libellés count_per_flights), deux composants tPartition (libellés repart), un tMap et un tFileOutputDelimited.
  3. Connectez ces composants à l'aide d'un lien de type Row > Main comme illustré dans l'image ci-dessus.
  4. Laissez le composant tS3Configuration seul, sans connexion.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !