Effectuer une jointure entre deux sources de données avec le composant tMap dans le Studio Talend - 8.0

Version
8.0
Language
Français (France)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Création de Jobs

Effectuer une jointure entre deux sources de données avec le composant tMap dans le Studio Talend

Dans ce tutoriel, apprenez à effectuer une jointure sur deux sources de données avec le composant tMap dans le Studio Talend.

Ce tutoriel utilise un fichier .csv. Si vous n'avez pas de fichier .csv, cliquez sur l'onglet Téléchargements et enregistrez le fichier movies.csv sur votre machine.

Ce tutoriel utilise également un autre fichier délimité. Si vous n'avez pas d'autre fichier délimité, cliquez sur l'onglet Téléchargements et enregistrez le fichier directors.txt sur votre machine.

Créer un projet dans le Studio Talend

Créer un projet est la première étape d'utilisation du Studio Talend. Les projets vous permettent d'organiser votre travail.

Procédure

  1. Sélectionnez Create a new project.
  2. Saisissez un nom pour votre projet.

    Exemple

    TalendDemo
  3. Cliquez sur Create.
  4. Cliquez sur Finish.

Résultats

Votre projet s'ouvre. Vous êtes prêt·e à travailler dans le Studio Talend.

Créer un Job pour effectuer une jointure sur des sources de données

Les projets du Studio Talend contiennent des Jobs. Dans les Jobs, vous pouvez construire des workflows via les composants, ce qui vous permet d'effectuer des actions spécifiques.

Avant de commencer

Sélectionnez la perspective Integration (Window > Perspective > Integration).

Procédure

  1. Dans le Repository, cliquez-droit sur Job Designs.
    1. Sélectionnez Create Standard Job.
  2. Dans le champ Name, saisissez un nom.

    Exemple

    tMapJoin
  3. Facultatif : Dans le champ Purpose, saisissez un objectif.

    Exemple

    Joining two different data sources in Studio Talend
  4. Facultatif : Dans le champ Description, saisissez une description.

    Exemple

    Using the tMap component to turn two different data sources into one
    Conseil : Saisir un objectif dans le champ Purpose et une Description permet une meilleure organisation.
  5. Cliquez sur Finish.

Résultats

L'espace de modélisation graphique (Designer) ouvre un Job vide.

Effectuer une jointure sur les données à l'aide du composant tMap

Le tMap vous permet de transformer et de router des données d'une ou plusieurs source·s vers une ou plusieurs destination·s.

Créer une définition de métadonnées pour le composant tMap

Créer une définition de métadonnée vous permet de configurer des informations réutilisables à travers tous les composants.

Avant de commencer

Ce tutoriel utilise un fichier délimité. Si vous n'avez pas de fichier délimité, cliquez sur l'onglet Téléchargements et enregistrez le fichier directors.txt sur votre machine.

Procédure

  1. Dans le Repository, développez Metadata, File delimited et cliquez sur Create file delimited.
  2. Dans le champ Name, saisissez un nom.

    Exemple

    directors
  3. Facultatif : Dans le champ Purpose, saisissez un objectif.

    Exemple

    Joining the directors data to the movies database
  4. Facultatif : Dans le champ Description, saisissez une description.

    Exemple

    Reusable shareable directors metadata
    Conseil : Saisir un objectif dans le champ Purpose et une Description permet une meilleure organisation.
  5. Cliquez sur Next.
  6. Cliquez sur Browse et sélectionnez le fichier de votre choix dans l'explorateur de fichiers.
  7. Facultatif : Configurez les paramètres du fichier.

    Exemple

    • Dans la zone File Settings, sélectionnez votre séparateur de champs dans la liste Field Separator et modifiez-le, si nécessaire.
      Remarque : Le séparateur de champs (Field Separator) le plus utilisé est ;.
    Conseil : Dans l'onglet Preview, cliquez sur le bouton Refresh Preview pour vérifier votre configuration.
  8. Cliquez sur Next.
  9. Facultatif : Dans le champ Name, saisissez un nom.

    Exemple

    directorsSchema
  10. Mettez à jour le schéma dans la zone Schema, pour qu'il soit identique à la structure du fichier d'exemple.

    Exemple

    • Modifiez le nom Column0 à directorID et le nom Column1 à directorName.
    • Modifiez la longueur (Length) de directorID à 4 et la longueur Length de directorName à 40.
  11. Cliquez sur Finish.

Résultats

Dans le Repository, sous Metadata, vous pouvez voir et utilise votre métadonnée.

Configurer un tMap pour effectuer une jointure sur deux sources de données

Le tMap vous permet de transformer et de router des données d'une ou plusieurs source·s vers une ou plusieurs destination·s. Dans cet exemple, vous allez apprendre à effectuer une jointure sur deux sources de données.

Pourquoi et quand exécuter cette tâche

Ce tutoriel utilise deux définitions de métadonnées à des fins de démonstration : movies 0.1 et directors 0.1. Pour suivre ce tutoriel, vous pouvez :
  1. Cliquez sur l'onglet Téléchargements et enregistrez le fichier metadata_movies_directors.zip sur votre machine.
  2. Dans le Repository, développez Metadata. Cliquez-droit sur File Delimited et sélectionnez Import items.
  3. Sélectionnez Select archive file: puis cliquez sur Browse pour sélectionner le fichier metadata_movies_directors.zip.
  4. Sélectionnez movies 0.1 et directors 0.1.
  5. Cliquez sur Finish.

Vous pouvez également apprendre à créer ces deux définitions de métadonnées (consultez Créer une définition de métadonnées pour le composant tMap).

Procédure

  1. Glissez-déposez les métadonnées movies 0.1 et directors 0.1 dans l'espace de modélisation graphique (Designer).
    1. Dans les deux cas, sélectionnez le composant tFileInputDelimited.
  2. Ajoutez un composant tMap.
  3. Cliquez-droit sur le composant movies.
    1. Sélectionnez Row > Main.
    2. Cliquez sur le tMap pour relier les deux composants.
  4. Répétez les trois étapes précédentes pour le composant directors.
  5. Double-cliquez sur le composant tMap.
    Vous arrivez dans la fenêtre de configuration du composant tMap.
  6. Du côté droit de l'écran, cliquez sur Add output table.
  7. Saisissez un nom pour la table de sortie.

    Exemple

    joinedOutput
  8. Cliquez sur OK.
  9. Dans la table d'entrée row1, sélectionnez les colonnes movieID, title, releaseYear, url puis glissez-déposez-les sur la table de sortie JoinedOutput.