Supprimer les champs inutiles des enregistrements relatifs aux vols - Cloud

Guide des processeurs de Talend Cloud Pipeline Designer

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
Création et développement > Création de Pipelines
Last publication date
2024-02-27

Un pipeline avec une source locale, un processeur Data Cleansing, un processeur Field Remover et une destination de test.

Avant de commencer

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Téléchargez le fichierfield_remover-fields.csv. Il contient un jeu de données local avec une liste de vols et leurs informations (indicatif d'avion, numéro de vol, adresse OACI 24 bits, enregistrement du vol, origine, destination, etc.).

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, un jeu de données de destination Test.

Procédure

  1. Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Remove fields from flight records (Supprimer des champs des enregistrements relatifs aux vols)
  3. Cliquez sur ADD SOURCE (AJOUTER UNE SOURCE) pour ouvrir le panneau vous permettant de sélectionner vos données sources, ici un fichier local contenant des informations relatives à des vols.
    Aperçu d'un échantillon de données avec des enregistrements relatifs aux vols.

    Vous pouvez voir dans l'échantillon qu'il manque un grand nombre de numéros de vol.

  4. Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur le bouton + et ajoutez un processeur Data Cleansing au pipeline. Le panneau de configuration s'ouvre.
  6. Donnez un nom significatif au processeur.

    Exemple

    mark empty flight numbers as N/A (marquer les numéros de vol vides comme N/A)
  7. Configurez le processeur :
    1. Sélectionnez Fill cells with value (Remplir les cellules avec une valeur) dans la liste Function name (Nom de la fonction).
    2. Sélectionnez .crop dans la liste Fields to process (Champs à traiter).
    3. Sélectionnez Value (Valeur) dans la liste Use with et saisissez N/A dans le champ Value (Valeur), car vous souhaitez ajouter N/A là où les numéros de vol manquent.
  8. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de nettoyage.

    Aperçu du processeur Data Cleansing après remplacement des numéros de vols vides par le texte N/A.
  9. Cliquez sur le bouton + et ajoutez un processeur Field Remover au pipeline. Le panneau de configuration s'ouvre.
  10. Donnez un nom significatif au processeur.

    Exemple

    remove unnecessary fields (supprimer les champs inutiles)
  11. Pour supprimer les champs dont vous n'avez pas besoin, ici les adresses OACI 24 bits, les codes de type OACI et l'horodatage du jour du vol, configurez le processeur comme suit :
    1. Sélectionnez ou saisissez .icao24 dans la liste Field to remove (Champ à supprimer).
    2. Ajoutez un élément et sélectionnez .typecode dans la liste Input (Entrée).
    3. Ajoutez un élément et sélectionnez .day dans la liste Input (Entrée).
  12. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de suppression.

    Aperçu du processeur Field Remover après suppression des enregistrements.

    Les champs inutiles sont supprimés.

  13. Cliquez sur l'élément ADD DESTINATION (AJOUTER UNE DESTINATION) et sélectionnez le jeu de données qui contiendra les données nettoyées.
    Renommez-le si nécessaire.
  14. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, cliquez sur le bouton Run (Exécuter) pour ouvrir le panneau vous permettant de sélectionner votre profil d'exécution.
  15. Sélectionnez dans la liste votre profil d'exécution (pour plus d'informations, consultez Profils d'exécution), puis cliquez sur Run (Exécuter) pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d'exécution. Les données sont nettoyées et les champs inutiles sont supprimés en fonction des conditions définies.