Neuanordnen der Datenelemente einer Studie zum Kundenverhalten - Cloud

Prozessorhandbuch für Talend Cloud Pipeline Designer

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Pipeline Designer
Content
Design und Entwicklung > Konzeption von Pipelines
Last publication date
2024-02-29

Eine Pipeline mit einer Testquelle, einem Prozessor vom Typ „Field selector (Feldauswahl)“ und einem HDFS-Ziel.

Vorbereitungen

  • Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.

    Laden Sie folgende Datei herunter und extrahieren Sie sie: field_selector-customers.zip. Sie enthält einen Datensatz mit einer Studie zum Kundenverhalten (Typ der Kunden, die Gerät X oder Y verwenden, usw.).

  • Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.

    In diesem Beispiel eine in HDFS gespeicherte Datei.

Prozedur

  1. Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
  2. Legen Sie einen sinnvollen Namen für die Pipeline fest.

    Example

    Restructure Customer Schema (Kundenschema neu strukturieren)
  3. Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um ein Fenster zu öffnen, in dem Sie die Quelldaten, in diesem Fall die manuell als Testdatensatz eingegebene Kundenstudie, auswählen können.

    Example

    Vorschau eines Datenbeispiels mit Benutzergeräte-Datensätzen
  4. Wählen Sie den Datensatz aus und klicken Sie auf Select (Auswählen), um ihn zur Pipeline hinzuzufügen.
    Benennen Sie ihn um, falls erforderlich.
  5. Klicken Sie auf Plus und fügen Sie einen Prozessor vom Typ Field selector (Feldauswahl) zur Pipeline hinzu. Daraufhin wird das Konfigurationsfenster geöffnet.
  6. Geben Sie einen sinnvollen Namen für den Prozessor an.

    Example

    restructure fields (Felder neu strukturieren)
  7. Im Bereich Selectors (Selektoren) im Modus Advanced (Erweitert):
    1. Wählen Sie id (ID) in der Liste Input (Eingabe) aus und geben Sie identifier (Kennung) in die Liste Output (Ausgabe) ein, da Sie das Feld id (ID) auswählen und umbenennen und dieselbe Feldposition beibehalten möchten.
    2. Klicken Sie auf das Pluszeichen (+), um ein neues Element hinzuzufügen, und wählen Sie .location[0].country (.Standort[0].Land) in der Liste Input (Eingabe) und country (Land) in der Liste Output (Ausgabe) aus, da Sie das Feld country (Land) von der ursprünglichen Position auf die höchste Schema-Ebene versetzen möchten.
    3. Klicken Sie auf das Pluszeichen (+), um ein neues Element hinzuzufügen, wählen Sie .devices (.Geräte) in der Liste Input (Eingabe) aus und geben Sie .devices_used (.Verwendete_Geräte) in der Liste Output (Ausgabe) ein, da Sie das Feld devices (Geräte) auswählen und dieselbe Feldposition beibehalten möchten.
    4. Klicken Sie auf das Pluszeichen (+), um ein neues Element hinzuzufügen, und geben Sie .devices[*]{.name == "other"}.ip (.Geräte[*]{.Name == "Andere"}.IP) in der Liste Input (Eingabe) und other_devices (Andere_Geräte) in der Liste Output (Ausgabe) ein, da Sie alle Felder devices (Geräte) mit einem untergeordneten Feld name (Name) gleich other (Andere) auswählen möchten.

      In diesem Bereich können Sie die avpath-Syntax verwenden.

  8. Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.

    Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor der Umstrukturierung mit denjenigen danach zu vergleichen.

    Vorschau des Prozessors vom Typ „Field selector (Feldauswahl)“ nach der Umstrukturierung der Datensätze.
  9. Klicken Sie auf ADD DESTINATION (ZIEL HINZUFÜGEN) und wählen Sie den Datensatz aus, der die neu organisierten Daten aufnehmen soll.
    Benennen Sie ihn um, falls erforderlich.
  10. Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
  11. Wählen Sie Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter „Ausführungsprofile“) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.

Ergebnisse

Die Pipeline wird ausgeführt, die Daten werden gemäß den von Ihnen angegebenen Bedingungen neu organisiert und die Ausgabe wird an das von Ihnen angegebene Zielsystem gesendet.