Remplir des enregistrements vides par une valeur fixe - Cloud

Guide des processeurs de Talend Cloud Pipeline Designer

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Pipeline Designer
task
Création et développement > Création de Pipelines

Avant de commencer

  • Vous avez précédemment créé une connexion au système stockant vos données source.

    Ici, une connexion de test.

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Ici, des données hiérarchiques concernant des taxis, notamment les heures de prise en charge et de fin de course, les tarifs, etc. (téléchargez le fichier type_converter-datacleansing-taxi.json depuis l'onglet Téléchargements dans le panneau de gauche de la page).

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, un jeu de données Test.

Procédure

  1. Cliquez sur ADD PIPELINE dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Fill empty cells with appropriate value
  3. Cliquez sur ADD SOURCE pour ouvrir le panneau vous permettant de sélectionner vos données source, ici les données relatives aux taxis contenant une colonne avec des enregistrements vides (.store_and_fwd_flag).

    Exemple

  4. Sélectionnez votre jeu de données et cliquez sur SELECT pour l’ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur et ajoutez un processeur Data cleansing au pipeline. Le panneau de configuration s'ouvre.
  6. Donnez un nom significatif au processeur.

    Exemple

    fill empty cells with N/A value
  7. Dans la zone CONFIGURATION :
    1. Sélectionnez Fill cells with value dans la liste Function name car vous souhaitez ajouter le prix de la taxe au prix de la dépense.
    2. Sélectionnez .store_and_fwd_flag dans la liste Fields to process, car cela correspond au champ avec les enregistrements vides.
    3. Sélectionnez Value dans la liste Use with et saisissez N/A dans le champ Value, car vous souhaitez remplacer tous les enregistrements vides par la valeur N/A (non applicable).
  8. Cliquez sur SAVE pour sauvegarder votre configuration.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération de nettoyage.

  9. Cliquez sur l'élément ADD DESTINATION et sélectionnez le jeu de données qui contiendra les données nettoyées.
    Renommez-le si nécessaire.
  10. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, sélectionnez votre profil d'exécution dans la liste (pour plus d'informations, consultez Run profiles).
  11. Cliquez sur l'icône d'exécution pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d’exécution, les enregistrements vides sont remplacés par la valeur fixe indiquée et le flux de sortie est envoyé au système cible que vous avez indiqué.