Vergleichen der Anzahl der Vorfälle bei Airlines und Filtern der betroffenen Airlines - Cloud

Prozessorhandbuch für Talend Cloud Pipeline Designer

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
Design und Entwicklung > Konzeption von Pipelines
Last publication date
2024-02-29

Eine Pipeline mit einer Testquelle, einem Prozessor vom Typ „Numbers (Zahlen)“, einem Prozessor vom Typ „Filter“ und einem Testziel.

Vorbereitungen

  • Sie haben zuvor eine Verbindung zu dem System erstellt, in dem die Quelldaten gespeichert sind.

    In diesem Beispiel eine Testverbindung.

  • Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.

    Laden Sie folgende Datei herunter und extrahieren Sie sie: numbers-airlines.zip. Sie enthält einen Datensatz mit Daten zu Airlines, darunter die Anzahl der Zwischenfälle und Unfälle sowie Todesfälle usw.

  • Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.

    In diesem Beispiel ein Testdatensatz.

Prozedur

  1. Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
  2. Legen Sie einen sinnvollen Namen für die Pipeline fest.

    Example

    Compare number of air crashes and filter airlines (Anzahl der Flugzeugabstürze vergleichen und Airline filtern)
  3. Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um ein Fenster zu öffnen, in dem Sie die Quelldaten, in diesem Fall Daten zu Airlines und Flugzeugabstürzen, auswählen können.

    Example

    Vorschau eines Datenbeispiels über Airlines und Flugzeugabstürze.
  4. Wählen Sie den Datensatz aus und klicken Sie auf Select (Auswählen), um ihn zur Pipeline hinzuzufügen.
    Benennen Sie ihn um, falls erforderlich.
  5. Klicken Sie auf Plus und fügen Sie einen Prozessor vom Typ Number (Zahl) zur Pipeline hinzu. Daraufhin wird das Konfigurationsfenster geöffnet.
  6. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    compare number of fatal accidents (Anzahl tödlicher Unfälle vergleichen)
  7. Führen Sie im Bereich Configuration (Konfiguration) Folgendes durch:
    1. Wählen Sie Compare numbers (Zahlen vergleichen) in der Liste Function name (Funktionsname) aus.
    2. Wählen Sie .fatal_accidents_85_99 (Tödliche Unfälle 85-99) in der Liste Fields to process (Zu verarbeitende Felder) aus, um diesen Feldwert (Anzahl der tödlichen Unfälle) mit Ihrem spezifischen Wert zu vergleichen.
    3. Aktivieren Sie die Option Create new column (Neue Spalte erstellen) und geben Sie ihr den Namen comparison (Vergleich).
    4. Wählen Sie greater or equals than (Größer oder gleich) in der Liste Compare mode (Vergleichsmodus) und Value (Wert) in der Liste Use with (Verwenden mit) aus und geben Sie 2 in das Feld Value (Wert) ein. Dadurch können Sie die Anzahl der tödlichen Unfälle pro Airline vergleichen und diejenigen identifizieren, die mindestens zwei tödliche Unfälle zu verzeichnen hatten.
  8. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.

    Sie können eine Vorschau Ihrer Daten vor und nach dem Vergleich anzeigen.

    Die Werte werden verglichen und in einem neuen Feld können die Airlines angezeigt werden, die mindestens zwei tödliche Unfälle hatten (true), sowie die Airlines mit weniger als zwei tödlichen Unfällen (false).

    Vorschau des Prozessors vom Typ „Numbers (Zahlen)“ nach dem Anwenden einer Vergleichsregel auf die Anzahl der Unfälle.
  9. Klicken Sie auf Plus und fügen Sie einen Prozessor vom Typ Filter zur Pipeline hinzu. Daraufhin wird das Konfigurationsfenster geöffnet.
  10. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    airlines with at least 2 fatal accidents (Airlines mit mindestens 2 tödlichen Unfällen)
  11. Führen Sie im Bereich Filters (Filter) Folgendes durch:
    1. Wählen Sie .comparison (Vergleich) in der Liste Input (Eingabe) aus, da Sie die Airlines basierend auf diesem Wert filtern möchten.
    2. Wählen Sie None (Keine) in der Liste Optionally select a function to apply (Optional eine anzuwendende Funktion auswählen) aus, da bei der Filterung der Datensätze keine Funktion angewendet werden soll.
    3. Wählen Sie == in der Liste Operator aus und geben Sie true in der Liste Value (Wert) ein, um die Airlines auszufiltern, die die Voraussetzung von „2 oder mehr tödliche Unfälle“ erfüllen.
  12. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.

    Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor dem Vorgang mit denjenigen nach dem Vorgang zu vergleichen.

    Vorschau des Prozessors vom Typ „Filter“ nach dem Anwenden eines Filters auf „true“-Werte.
  13. Klicken Sie auf ADD DESTINATION (ZIEL HINZUFÜGEN) und wählen Sie den Datensatz aus, der die verarbeiteten Daten aufnehmen soll.
    Benennen Sie ihn um, falls erforderlich.
  14. Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
  15. Wählen Sie Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter „Ausführungsprofile“) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.

Ergebnisse

Ihre Pipeline wird ausgeführt, die Daten werden verglichen und gemäß den von Ihnen festgelegten Bedingungen gefiltert. Sie werden feststellen, dass 19 Airlines im Datensatz mindestens zwei tödliche Unfälle zu verzeichnen hatten. Die Ausgabe wird an das von Ihnen angegebene Zielsystem gesendet.