Calculer l'évolution jour après jour des vols aux États-Unis en utilisant un jeu de données Delta Lake - 7.2

Delta Lake

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Composants Technical > Composants Delta Lake
Gouvernance de données > Systèmes tiers > Composants Technical > Composants Delta Lake
Qualité et préparation de données > Systèmes tiers > Composants Technical > Composants Delta Lake

Le Job de ce scénario utilise un jeu de données Delta Lake d'exemple afin de calculer jour après jour l'indicateur clé de performance (KPI) de vols aux États-Unis.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.

Prérequis :
  • Avec Delta Lake, vous devez utiliser le système de fichier S3, Azure ou HDFS.
  • Assurez-vous que les identifiants à utiliser ont les permissions et droits d'accès de lecture et d'écriture sur ce système de fichiers.
  • Le jeu de données Delta Lake d'exemple à utiliser a été téléchargé depuis Talend Help Center et sauvegardé dans votre système de fichiers.
    Ce jeu de données est utilisé à des fins de démonstration uniquement, il contient deux snapshots de vols américains par date, ce qui implique une évolution de ces vols à chaque date.

Même s'il n'est pas toujours requis, il est recommandé d'installer un Jobserver Talend sur le nœud d'extrémité de votre cluster Hadoop. Dans la boîte de dialogues Preferences de votre Studio ou dans Talend Administration Center s'il est disponible pour exécuter vos Jobs, définissez ce Jobserver comme serveur d'exécution distant de vos Jobs.