Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Filtern einer Liste mit Kunden nach deren Registrierungsdatum und Einkommen

Eine komplexe Pipeline mit einem Quelldatensatz, zwei Prozessoren vom Typ „Filter“ und drei Zielen.

Vorbereitungen

  • Sie haben zuvor eine Verbindung zu dem System erstellt, in dem die Quelldaten gespeichert sind.

    In diesem Beispiel eine Verbindung zu einer Datenbank.

  • Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.

    Laden Sie folgende Datei herunter und extrahieren Sie sie: filter-python-customers.zip. Sie enthält eine Liste der Kunden mit einem Feld für das Registrierungsdatum (im Anhang dieses Dokuments bereitgestellt).

  • Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.

    In diesem Beispiel die in HDFS gespeicherten Dateien.

Prozedur

  1. Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
  2. Legen Sie einen sinnvollen Namen für die Pipeline fest.

    Example

    Filter on Registration and Revenue (Nach Registrierung und Einkommen filtern)
  3. Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um ein Fenster zu öffnen, in dem Sie Ihre Datenquelle auswählen können, in diesem Beispiel eine Liste der in einer Datenbank gespeicherten Kunden.

    Example

    Vorschau eines Datenbeispiels über Kunden.
  4. Wählen Sie den Datensatz aus und klicken Sie auf Select (Auswählen), um ihn zur Pipeline hinzuzufügen.
    Benennen Sie ihn um, falls erforderlich.
  5. Klicken Sie auf Plus und fügen Sie einen Prozessor vom Typ Filter zur Pipeline hinzu. Das Konfigurationsfenster wird geöffnet.
  6. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    customers registered in 2000 (Im Jahr 2000 registrierte Kunden)
  7. Führen Sie im Bereich Filters (Filter) Folgendes durch:
    1. Wählen Sie .RegistrationDate (Registrierungsdatum) in der Liste Input (Eingabe) aus, da Sie die Kunden basierend auf diesem Wert filtern möchten.
    2. Wählen Sie None (Keine) in der Liste Optionally select a function to apply (Optional eine anzuwendende Funktion auswählen) aus, da bei der Filterung der Datensätze keine Funktion angewendet werden soll.
    3. Wählen Sie Contains (Enthält) in der Liste Operator aus und geben Sie 2000 in der Liste Value (Wert) ein, um die Kunden auszufiltern, deren Registrierungsdatum das Jahr 2000 enthält.

      In diesem Bereich können Sie die avpath-Syntax verwenden.

  8. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.
  9. Klicken Sie auf Plus und fügen Sie einen weiteren Prozessor vom Typ Filter zur Pipeline hinzu. Das Konfigurationsfenster wird geöffnet.
  10. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    customers with revenue > 90000 (Kunden mit Einkommen > 90000)
  11. Führen Sie im Bereich Filters (Filter) Folgendes durch:
    1. Wählen Sie .Revenue (Einkommen) in der Liste Input (Eingabe) aus, da Sie die Kunden basierend auf diesem Wert filtern möchten.
    2. Wählen Sie None (Keine) in der Liste Optionally select a function to apply (Optional eine anzuwendende Funktion auswählen) aus, da bei der Filterung der Datensätze keine Funktion angewendet werden soll.
    3. Wählen Sie > in der Liste Operator aus und geben Sie 90000 in die Liste Value (Wert) ein, um die Kunden mit einem Einkommen über 90000 auszufiltern.
  12. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.
  13. Klicken Sie auf die Schaltfläche Doesn't match filter (Stimmt nicht mit Filter überein) neben dem ersten hinzuzufügenden Prozessor vom Typ Filter und wählen Sie den Datensatz aus, der die Daten aufnehmen soll, die nicht den Filterkriterien entsprechen.
  14. Legen Sie für das Ziel einen aussagekräftigen Namen fest.

    Example

    other registration date (Anderes Registrierungsdatum)
  15. Klicken Sie auf das Element ADD DESTINATION (ZIEL HINZUFÜGEN) neben dem zweiten Filter-Prozessor und wählen Sie den Datensatz aus, der die Daten aufnehmen soll, die nicht den Filterkriterien entsprechen.
    Benennen Sie ihn um, falls erforderlich.
  16. Klicken Sie auf die Schaltfläche Doesn't match filter (Stimmt nicht mit Filter überein)neben dem zweiten Prozessor vom Typ Filter und wählen Sie den Datensatz aus, der die zurückgewiesenen Daten aufnehmen soll.
  17. Legen Sie für das Ziel einen aussagekräftigen Namen fest.

    Example

    other customers (Andere Kunden)
  18. (Optional) Sehen Sie sich die letzte Vorschau des Prozessors vom Typ Filter an, um zu prüfen, wie Ihre Daten nach der Filterung aussehen.
    Vorschau des Prozessors vom Typ „Filter“ nach der Filterung.
  19. Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
  20. Wählen Sie Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter „Ausführungsprofile“) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.

Ergebnisse

Die Pipeline wird ausgeführt, die Daten werden gemäß den von Ihnen angegebenen Bedingungen gefiltert und die Ausgabe wird an das von Ihnen angegebene Zielsystem gesendet.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!