Vorbereitungen
-
Sie haben zuvor eine Verbindung zu dem System erstellt, in dem die Quelldaten gespeichert sind.
In diesem Beispiel eine Testverbindung.
-
Sie haben zuvor den Datensatz hinzugefügt, der die Quelldaten enthält.
In diesem Beispiel ein Datensatz mit Daten zu schlechten Autofahrern, u. a. der Prozentsatz der aufgrund von Geschwindigkeit, Alkohol, Ablenkungen in tödliche Zusammenstöße verwickelte Fahrer, Informationen zu Autoversicherungen usw. (laden Sie die Datei sampling-drivers.csv über die Registerkarte Downloads im linken Bereich dieser Seite herunter).
-
Sie haben außerdem die Verbindung und den zugehörigen Datensatz erstellt, der die verarbeiteten Daten aufnehmen soll.
In diesem Beispiel ein auf einem FTP-Servr gespeicherter Ausgabeordner.
Prozedur
Ergebnisse
Die Pipeline wird ausgeführt, die Datenteilgruppe auf der Grundlage der von Ihnen angegebenen Anzahl an Datensätzen erstellt und die Ausgabe an den von Ihnen angegebenen FTP-Ordner gesendet. Diese Datenteilgruppen können dann von Datenwissenschaftlern für Predictive Analytics verwendet werden.