Remplir des enregistrements vides par une valeur fixe - Cloud

Guide des processeurs de Talend Cloud Pipeline Designer

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
Création et développement > Création de Pipelines
Last publication date
2024-02-27

Un pipeline avec une source Test, un processeur Data cleansing et une destination Test.

Avant de commencer

  • Vous avez précédemment créé une connexion au système stockant vos données source.

    Ici, une connexion de test.

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Téléchargez et extrayez le fichier type_converter-datacleansing-taxi.zip. Il contient des données hiérarchiques relatives aux taxis, notamment les heures de prise en charge, de fin de course, les tarifs.

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, un jeu de données Test.

Procédure

  1. Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Fill empty cells with appropriate value
  3. Cliquez sur ADD SOURCE pour ouvrir le panneau vous permettant de sélectionner vos données sources. Les données relatives aux taxis contenant une colonne avec des enregistrements vides (store_and_fwd_flag).

    Exemple

    Aperçu d'un échantillon de données relatives à des taxis.
  4. Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur le bouton + et ajoutez un processeur Data cleansing au pipeline. Le panneau de configuration s'ouvre.
  6. Donnez un nom significatif au processeur.

    Exemple

    fill empty cells with N/A value
  7. Dans la zone Configuration :
    1. Sélectionnez Fill cells with value dans la liste Function name car vous souhaitez ajouter le prix de la taxe au prix de la dépense.
    2. Sélectionnez .store_and_fwd_flag dans la liste Fields to process, car cela correspond au champ avec les enregistrements vides.
    3. Sélectionnez Value dans la liste Use with et saisissez N/A dans le champ Value, car vous souhaitez remplacer tous les enregistrements vides par la valeur N/A (non applicable).
  8. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de nettoyage.

    Aperçu du processeur Data cleansing après remplacement des enregistrements vides par le texte N/A.
  9. Cliquez sur l'élément ADD DESTINATION (AJOUTER UNE DESTINATION) et sélectionnez le jeu de données qui contiendra les données nettoyées.
    Renommez-le si nécessaire.
  10. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, cliquez sur le bouton Run (Exécuter) pour ouvrir le panneau vous permettant de sélectionner votre profil d'exécution.
  11. Sélectionnez dans la liste votre profil d'exécution (pour plus d'informations, consultez Profils d'exécution), puis cliquez sur Run (Exécuter) pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d’exécution, les enregistrements vides sont remplacés par la valeur fixe indiquée et le flux de sortie est envoyé au système cible que vous avez indiqué.