Vorbereitungen
-
Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.
In diesem Beispiel ein Datensatz mit JSON- und XML-Feldern, die Benutzerdaten wie Namen und Adressen enthalten:
Laden Sie die Datei unparsed-users.csv über die Registerkarte Downloads im linken Fensterbereich dieser Seite herunter.
Importieren Sie die Datei als lokalen Datensatz und konfigurieren Sie das Feld Header mit 1, um die erste Zeile der DAtei als Header festzulegen.
-
Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.
In diesem Beispiel ein Testdatensatz.
Prozedur
-
Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
-
Legen Sie einen sinnvollen Namen für die Pipeline fest.
Example
Parse JSON and XML user fields (JSON- und XML-Benutzerfelder parsen)
-
Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um ein Fenster zu öffnen, in dem Sie die Quelldaten, in diesem Fall die manuell als Testdatensatz eingegebenen, nicht geparsten JSON- und XML-Benutzerdaten, auswählen können.
-
Wählen Sie den Datensatz aus und klicken Sie auf Select (Auswählen), um ihn zur Pipeline hinzuzufügen.
Benennen Sie den Datensatz um, falls erforderlich.
-
Klicken Sie auf
und fügen Sie einen Prozessor vom Typ Parser zur Pipeline hinzu. Daraufhin wird das Konfigurationsfenster geöffnet.
-
Geben Sie einen sinnvollen Namen für den Prozessor an.
Example
parse JSON fields (JSON-Felder parsen)
-
Führen Sie im Bereich Configuration (Konfiguration) Folgendes durch:
-
Wählen Sie JSON in der Liste Format aus, da zunächst die JSON-Eingabefelder geparst werden sollen.
-
Wählen Sie .json in der Liste Field to process (Zu verarbeitendes Feld) aus, um die JSON-Felder zu transformieren, die dem Alter der Benutzer entsprechen.
-
Aktivieren Sie Enforce number as double (Zahl als Doppelwert forcieren), um sicherzustellen, dass Eingabezahlen, wie z. B. Altersangaben, in den Datentyp Doppelwert (Double) konvertiert werden.
Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor dem Parsen mit denjenigen danach zu vergleichen.
-
Klicken Sie auf
und fügen Sie einen anderen Prozessor vom Typ Parser zur Pipeline hinzu. Daraufhin wird das Konfigurationsfenster geöffnet.
-
Geben Sie einen sinnvollen Namen für den Prozessor an.
Example
parse XML fields (XML-Felder parsen)
-
Führen Sie im Bereich Configuration (Konfiguration) Folgendes durch:
-
Wählen Sie XML in der Liste Format aus, da die XML-Eingabefelder geparst werden sollen.
-
Wählen Sie .xml in der Liste Field to process (Zu verarbeitendes Feld) aus, um die XML-Felder zu transformieren, die den Benutzeradressen entsprechen.
-
Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.
Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor dem Parsen mit denjenigen danach zu vergleichen.
-
Klicken Sie auf ADD DESTINATION (ZIEL HINZUFÜGEN) und wählen Sie den Datensatz aus, der Ihre Ausgabedaten aufnehmen soll.
Benennen Sie den Datensatz um, falls erforderlich.
-
Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
-
Wählen Sie in Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter Ausführungsprofile) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.
Ergebnisse
Ihre Pipeline wird ausgeführt, die JSON- und XML-Eingabedaten werden geparst und in JSON- und XML-Objekte transformiert.