Comparer le nombre d'accidents d'avion et filtrer les compagnies aériennes - Cloud

Guide des processeurs de Talend Cloud Pipeline Designer

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Pipeline Designer
task
Création et développement > Création de Pipelines

Avant de commencer

  • Vous avez précédemment créé une connexion au système stockant vos données source.

    Ici, une connexion de test.

  • Vous avez précédemment ajouté le jeu de données contenant vos données source.

    Un jeu de données contenant des données relatives à des compagnies aériennes, avec le nombre d'incidents et d'accidents, ainsi que le nombre de morts, etc (téléchargez le fichier numbers-airlines.csv depuis l'onglet Téléchargements dans le panneau de gauche de cette page).

  • Vous avez créé la connexion et le jeu de données associé qui contiendra les données traitées.

    Ici, un jeu de données Test.

Procédure

  1. Cliquez sur Add pipeline (Ajouter un pipeline) dans la page Pipelines. Votre nouveau pipeline s’ouvre.
  2. Donnez-lui un nom significatif.

    Exemple

    Compare number of air crashes and filter airlines
  3. Cliquez sur ADD SOURCE pour ouvrir le panneau vous permettant de sélectionner vos données source, ici les données relatives aux compagnies aériennes et aux crashs d'avions.

    Exemple

  4. Sélectionnez votre jeu de données et cliquez sur Select (Sélectionner) pour l'ajouter au pipeline.
    Renommez-le si nécessaire.
  5. Cliquez sur et ajoutez un processeur Number au pipeline. Le panneau de configuration s'ouvre.
  6. Donnez un nom significatif au processeur.

    Exemple

    compare number of fatal accidents
  7. Dans la zone Configuration :
    1. Sélectionnez Compare numbers dans la liste Function name.
    2. Sélectionnez .fatal_accidents_85_99 dans la liste Fields to process puisque vous souhaitez comparer cette valeur de champ (nombre d'accidents fatals) à votre valeur personnalisée.
    3. Activez l'option Create new column et nommez la colonne comparison.
    4. Sélectionnez greater or equals than dans la liste Compare mode, sélectionnez Value dans la liste Use with et saisissez 2 dans le champ Value. Vous pouvez comparer le nombre d'accidents fatals par compagnie aérienne et voir lesquelles ont subi au moins deux accidents fatals.
  8. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Vous pouvez prévisualiser vos données avant et après la comparaison.

    Les valeurs ont été comparées et un nouveau champ vous permet d'afficher les compagnies aériennes ayant subi au moins deux accidents fatals (true) et celles en ayant subi moins (false).

  9. Cliquez sur et ajoutez un processeur Filter au pipeline. Le panneau de configuration s'ouvre.
  10. Donnez un nom significatif au processeur.

    Exemple

    airlines with at least 2 fatal accidents
  11. Dans la zone FILTERS :
    1. Sélectionnez .comparison dans la liste Input, pour filtrer les compagnies aériennes en se basant sur cette valeur.
    2. Sélectionnez NONE dans la liste Optionally select a function to apply, car vous ne souhaitez pas appliquer de fonction tout en filtrant les enregistrements.
    3. Sélectionnez == dans la liste Operator et saisissez true dans la liste Value, car vous souhaitez filtrer sur les compagnies aériennes ayant subi plusieurs accidents fatals.
  12. Cliquez sur Save (Sauvegarder) pour sauvegarder votre configuration.

    Examinez la prévisualisation du processeur afin de comparer vos données avant et après l'opération.

  13. Cliquez sur l'élément ADD DESTINATION et sélectionnez le jeu de données qui contiendra les données traitées.
    Renommez-le si nécessaire.
  14. Dans la barre d'outils en haut de Talend Cloud Pipeline Designer, sélectionnez votre profil d'exécution dans la liste (pour plus d'informations, consultez Run profiles).
  15. Cliquez sur l'icône d'exécution pour exécuter votre pipeline.

Résultats

Votre pipeline est en cours d'exécution, les données sont comparées et filtrées selon les conditions définies. Vous pouvez voir que 19 compagnies aériennes ont subi plusieurs accidents fatals. La sortie est envoyée dans le système cible indiqué.