Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Kombinieren französischer Luftfahrtbetreiber mit dem Umsatz in Frankreich

Eine komplexe Pipeline mit drei Quelldatensätzen und zwei Join-Prozessoren.

Vorbereitungen

  • Sie haben zuvor eine Verbindung zu dem System erstellt, in dem die Quelldaten gespeichert sind.

    In diesem Beispiel eine Testverbindung und eine Amazon S3-Verbindung.

  • Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.

    Der erste Datensatz von links enthält Daten zu den Luftfahrzeugen wie Betreiber, Breiten- und Längengrad, der rechte Datensatz von rechts enthält die Daten zu den Fluggesellschaften, die mit den Quelldaten kombiniert werden sollen: Betreiber und Länder.

    Der zweite Datensatz von links enthält die Umsatzdaten wie Ländern, Regionen, Lieferdaten, der zweite Datensatz von rechts enthält das Ergebnis der ersten Join-Operation. Die zu kombinierenden Daten sind die Länderdaten.

  • Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.

    In diesem Beispiel eine Testverbindung.

Prozedur

  1. Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
  2. Legen Sie einen sinnvollen Namen für die Pipeline fest.

    Example

    Join air operator and country data (Luftfahrtbetreiber- und Länderdaten verknüpfen)
  3. Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um ein Fenster zu öffnen, in dem Sie die linken Daten, in diesem Fall eine Liste der Luftfahrzeuge, auswählen können.

    Example

    Vorschau eines Datenbeispiels über Luftfahrzeuge.
  4. Wählen Sie den Datensatz aus und klicken Sie auf Select (Auswählen), um ihn zur Pipeline hinzuzufügen.
    Benennen Sie ihn um, falls erforderlich.
  5. Klicken Sie auf Plus und fügen Sie einen Prozessor vom Typ Join zur Pipeline hinzu. Auf der Arbeitsfläche wird eine andere Platzhalterquelle angezeigt.
  6. Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um den rechten Datensatz auszuwählen, in diesem Fall eine Liste der Fluggesellschaften mit Betreiber- und Länderdaten.

    Example

    Vorschau eines Datenbeispiels über Fluggesellschaften.
  7. Öffnen Sie das Konfigurationsfenster des Prozessors vom Typ Join.
  8. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    join operators (Betreiber verknüpfen)
  9. Wählen Sie Inner join in der Liste Join type (Join-Typ) aus, da die übereinstimmenden Datenelemente aus den linken und rechten Datensätzen im Ergebnissatz aufgeführt werden sollen.
  10. Führen Sie im Bereich Conditions (Bedingungen) Folgendes durch:
    1. Wählen Sie den Pfad zum vorhandenen Datenelement im linken Datensatz, mit dem der Vergleich durchgeführt werden soll, in der Liste Left key (Linker Schlüssel) aus bzw. geben Sie ihn ein (in diesem Beispiel .Op (Betreiber)).
    2. Wählen Sie den Pfad zum vorhandenen Datenelement im rechten Datensatz, mit dem der Vergleich durchgeführt werden soll, in der Liste Right key (Rechter Schlüssel) aus bzw. geben Sie ihn ein (in diesem Beispiel .Op (Betreiber)).

      In diesem Bereich können Sie die avpath-Syntax verwenden.

  11. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.

    Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor dem Join-Vorgang mit denjenigen nach dem Vorgang zu vergleichen.

    Vorschau des Prozessors vom Typ „Join“ nach dem Anwenden eines Inner Join-Vorgangs.
  12. Klicken Sie auf Plus und fügen Sie einen Prozessor vom Typ Filter zur Pipeline hinzu. Daraufhin wird das Konfigurationsfenster geöffnet.
  13. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    filter on FR operators (FR-Betreiber ausfiltern)
  14. Führen Sie im Bereich Filters (Filter) Folgendes durch:
    1. Wählen Sie .Country (Land) in der Liste Input (Eingabe) aus, da Sie die Betreiber basierend auf diesem Wert filtern möchten.
    2. Wählen Sie None (Keine) in der Liste Optionally select a function to apply (Optional eine anzuwendende Funktion auswählen) aus, da bei der Filterung der Datensätze keine Funktion angewendet werden soll.
    3. Wählen Sie == in der Liste Operator (Betreiber) aus und geben Sie France(Frankreich) in die Liste Value (Wert) ein, um die Betreiber aus Frankreich auszufiltern.
  15. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.

    Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor dem Filtervorgang mit denjenigen nach dem Vorgang zu vergleichen.

    Vorschau des Prozessors vom Typ „Filter“ nach dem Anwenden eines Filters auf französische Betreiber.
  16. Klicken Sie auf Plus und fügen Sie einen Prozessor vom Typ Join zur Pipeline hinzu. Auf der Arbeitsfläche wird eine andere Platzhalterquelle angezeigt.
  17. Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um den Datensatz auszuwählen, der mit dem bereits vorhandenen kombiniert werden soll, in diesem Fall eine Liste des Umsatzes mit Lieferdaten.

    Example

    Vorschau eines Datenbeispiels über regionale Umsätze.
  18. Öffnen Sie das Konfigurationsfenster des Prozessors vom Typ Join.
  19. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    join countries (Länder verknüpfen)
  20. Wählen Sie Inner join in der Liste Join type (Join-Typ) aus, da die übereinstimmenden Datenelemente aus den linken und rechten Datensätzen im Ergebnissatz aufgeführt werden sollen.
  21. Führen Sie im Bereich Conditions (Bedingungen) Folgendes durch:
    1. Wählen Sie den Pfad zum vorhandenen Datenelement im linken Datensatz, mit dem der Vergleich durchgeführt werden soll, in der Liste Left key (Linker Schlüssel) aus bzw. geben Sie ihn ein (in diesem Beispiel .Country (Land)).
    2. Wählen Sie den Pfad zum vorhandenen Datenelement im rechten Datensatz, mit dem der Vergleich durchgeführt werden soll, in der Liste Right key (Rechter Schlüssel) aus bzw. geben Sie ihn ein (in diesem Beispiel .Country (Land).

      In diesem Bereich können Sie die avpath-Syntax verwenden.

  22. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.

    Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor dem Join-Vorgang mit denjenigen nach dem Vorgang zu vergleichen.

    Vorschau des Prozessors vom Typ „Join“ nach dem Anwenden eines Inner Join-Vorgangs.
  23. Klicken Sie auf das Element ADD DESTINATION (ZIEL HINZUFÜGEN) neben dem Prozessor vom Typ Join und wählen Sie den Datensatz aus, der Ihre Join-Daten aufnehmen soll.
    In diesem Fall wird ein Testausgabedatensatz mit aktivierter Option Log records to STDOUT (Datensätze in STDOUT protokollieren) hinzugefügt.
  24. Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
  25. Wählen Sie Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter „Ausführungsprofile“) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.

Ergebnisse

Ihre Pipeline wird ausgeführt, in der generierten Ausgabe werden die Daten der französischen Betreiber mit den Umsatzdaten für Frankreich kombiniert. Zeigen Sie die Logs an, um die nach den Join-Operationen generierten Datensätze einzusehen:
Pipeline-Logs mit den generierten Datensätzen nach den Join-Operationen.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!