Erstellen von Testdatensätzen - Cloud

Nutzungshandbuch für Talend Cloud Data Preparation

Version
Cloud
Language
Deutsch
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration und Überwachung > Verwaltung von Verbindungen
Datenqualität und Datenaufbereitung > Bereinigung von Daten
Datenqualität und Datenaufbereitung > Verwaltung von Datensätzen
Last publication date
2024-04-18

Wie erstellen Sie einen Datensatz basierend auf einem von Ihnen manuell eingegebenen Schema?

Testdatensätze stellen eine vorgegebene Gruppe von Werten bereit, ohne dass dazu ein realer Datensatzspeicher vorhanden sein muss, sodass das Produkt ganz problemlos getestet werden kann.

Prozedur

  1. Gehen Sie zu Datasets (Datensätze) > Add dataset (Datensatz hinzufügen).
  2. Geben Sie im Fensterbereich Add a new dataset (Neuen Datensatz hinzufügen) einen Namen für den Testdatensatz ein.
  3. Wählen Sie die Testverbindung aus, die Sie zuvor erstellt haben und über die Sie Ihre Daten hinzufügen möchten.
  4. Wählen Sie das Format der Daten aus:
    • CSV: In diesem Fall wird für die Schemafelder folgendes Format erwartet:
      • Muss mit den Zeichen [A-Za-z_] beginnen.
      • Darf nur die Zeichen [A-Za-z0-9_] enthalten.
      • Darf nur durch Semikola getrennt werden.
      Beispiel: Vorname;Nachname;Telefon1;Telefon2;Adresse;Land;Firma
      Anmerkung: Wenn Sie kein Format angeben, wird standardmäßig ein generisches Format erstellt.
    • JSON: In diesem Fall müssen die JSON-Werte einem spezifischen Format entsprechen und konsistent sein: Folge von Datensätzen, einer nach dem anderen, jeweils durch einen Zeilenvorschub (oder nicht) voneinander getrennt. Jeder einzelne Datensatz braucht nicht unbedingt auf einer einzelnen Zeile untergebracht zu sein. Letztendlich entsprechen die Daten im Textbereich nicht einem typischen JSON-Dokument mit eckigen Klammern.

      Beispiel:

        {
          "Id": 3146717,
          "PosTime": 1525097499899,
          "Latitude": 48.8585,
          "Longitude": 2.4921,
          "Operator": "Air France"
        }
        {
          "Id": 3757865,
          "PosTime": 1525097474634,
          "Latitude": 48.5018,
          "Longitude": 2.2246,
          "Operator": "Lufthansa"
        }
    • AVRO: In diesem Fall müssen Sie ebenfalls das Schema Ihrer Avro-Datensätze eingeben. Dieses entspricht einem JSON-Dokument mit spezifischer Syntax, siehe die Beschreibung in der Avro Apache-Dokumentation.
  5. Geben Sie im Bereich Values (Werte) Ihre Daten ein bzw. fügen Sie sie ein.
    Die Größe der Daten darf 32 Kilobyte nicht überschreiten.
    Konfigurationsseite für neuen Datensatz mit manuell eingegebenen JSON-Werten
  6. (Optional) Klicken Sie auf View sample (Sample anzeigen), um zu prüfen, ob die Daten gültig sind.
  7. Klicken Sie auf Validate (Validieren), um den Datensatz zu speichern.

Ergebnisse

Sie werden zum Fensterbereich „Overview (Übersicht)“ des Datensatzes weitergeleitet, in dem verschiedene Informationen und Metadaten angezeigt werden.

Um den Inhalt des Datensatzes zu visualisieren und zu verstehen, öffnen Sie den Fensterbereich Sample. Sie können dann prüfen, ob Ihre Daten gültig sind.

Fensterbereich mit Datensatz-Sample
Sample-Fensterbereich mit Tabellenansicht der JSON-Datensatzwerte