Vorbereitungen
-
Sie haben zuvor eine Verbindung zu dem System erstellt, in dem die Quelldaten gespeichert sind.
In diesem Beispiel eine Testverbindung.
-
Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.
In diesem Beispiel hierarchische Taxidaten, d. h. Abholzeit, Ankunftszeit, Tarif usw. (laden Sie die Datei type_converter-datacleansing-taxi.json über die Registerkarte Downloads im linken Bereich dieser Seite herunter).
-
Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.
In diesem Beispiel ein Testdatensatz.
Prozedur
-
Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
-
Legen Sie einen sinnvollen Namen für die Pipeline fest.
Example
Fill empty cells with appropriate value (Leere Zellen mit zutreffendem Wert füllen)
-
Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN), um ein Fenster zu öffnen, in dem Sie Ihre Quelldaten, in diesem Fall die taxibezogenen Daten mit einer Spalte mit leeren Daten, auswählen können (.store_and_fwd_flag).
Example
-
Wählen Sie den Datensatz aus und klicken Sie auf Select (Auswählen), um ihn zur Pipeline hinzuzufügen.
Benennen Sie den Datensatz um, falls erforderlich.
-
Klicken Sie auf
und fügen Sie einen Prozessor vom Typ Data cleansing (Datenbereinigung) zur Pipeline hinzu. Daraufhin wird das Konfigurationsfenster geöffnet.
-
Geben Sie einen sinnvollen Namen für den Prozessor an.
Example
Fill empty cells with appropriate value (Leere Zellen mit N/A-Wert füllen)
-
Führen Sie im Bereich Configuration (Konfiguration) Folgendes durch:
-
Wählen Sie Fill cells with value (Zellen mit Werten füllen) in der Liste Function name (Funktionsname) aus, da der Steuerbetrag zum Kaufpreis hinzugefügt werden soll.
-
Wählen Sie .store_and_fwd_flag in der Liste Fields to process (Zu verarbeitende Felder) aus, da dies dem Feld mit leeren Datenelementen entspricht.
-
Wählen Sie Value (Wert) in der Liste Use with (Verwenden mit) aus und geben Sie N/A in das Feld Value (Wert) ein, um alle leere Datenelemente durch den Wert „N/A“ („Not available“: Nicht verfügbar) zu ersetzen.
-
Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.
Sehen Sie sich die Vorschau des Prozessors an, um die Daten vor dem Bereinigungsvorgang mit denjenigen nach dem Vorgang zu vergleichen.
-
Klicken Sie auf ADD DESTINATION (ZIEL HINZUFÜGEN) und wählen Sie den Datensatz aus, der Ihre bereinigten Daten aufnehmen soll.
Benennen Sie den Datensatz um, falls erforderlich.
-
Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
-
Wählen Sie in Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter Ausführungsprofile) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.
Ergebnisse
Ihre Pipeline wird ausgeführt, die leeren Datenelemente werden durch den von Ihnen angegebenen festen Wert ersetzt und der Ausgabe-Flow wird an das von Ihnen angegebene Zielsystem gesendet.