Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Eigenschaften des Datengenerators

Zu konfigurierende Eigenschaften, damit Ihre Testdaten automatisch als Datensatz generiert werden können.

Der Datengenerator ist unidirektional und kann nur als Quelldatensatz in einer Pipeline verwendet werden.

Datengenerator-Verbindung

Eigenschaft

Konfiguration

Selection (Auswahl) Wählen Sie Data generator (Datengenerator) aus bzw. geben Sie diese Auswahl ein.
Configuration (Konfiguration)
Engine Wählen Sie eine Engine in der Liste aus.
Beschreibung Geben Sie einen Anzeigenamen (obligatorisch) und eine Beschreibung (optional) für die Verbindung ein.

Datensatz des Datengenerators

Eigenschaft Konfiguration
Dataset name (Datensatzname) Geben Sie einen Anzeigenamen für den Datensatz ein. Dieser Name wird in allen Talend Cloud-Anwendungen als eindeutige Kennung für den Datensatz verwendet.
Verbindung Wählen Sie Ihre Verbindung in der Liste aus. Wenn Sie einen Datensatz basierend auf einer vorhandenen Verbindung erstellen, ist dieses Feld schreibgeschützt.
Type (Typ) Wählen Sie den Typ des zu erstellenden Datensatzes aus:
  • Batch - wenn Sie einmalig Datensätze generieren möchten. Die Pipeline, die diesen Datensatz verwendet, muss eine Batch-Pipeline sein.
  • Streaming - wenn alle N Millisekunden Datensätze in einer Streaming-Pipeline generiert werden sollen. Die Pipeline, die diesen Datensatz verwendet, muss eine Streaming-Pipeline sein. Darüber hinaus können Sie das Abfrageintervall in Millisekunden im Feld Polling configuration (Abfragekonfiguration) des Quelldatensatzes festlegen.
Main (Haupt) Rows (Zeilen) Geben Sie die Anzahl der zu generierenden Datensätze ein.
Fields (Felder) Legen Sie die Felder und die Art der zu generierenden Daten fest. Sie können vordefinierte Typen nutzen, um die Generierung spezifischer Daten zu vereinfachen:
  • Name: Geben Sie den Namen des Felds ein, das generiert werden soll.
    Beispiel:
    firstname 
  • Type (Typ): Wählen Sie in der Liste den Datentyp aus, den Sie Ihrem Feld zuweisen möchten. Je nach ausgewählten Typ können zusätzliche Felder zur Konfiguration der Daten angezeigt werden.
    Beispiel:
    First Name
  • Blank % (Leer %): Geben Sie den Prozentsatz leerer, zu generierender Felder an bzw. wählen Sie ihn aus.

    Beispiel: 5, d. h. fünf Prozent der generierten Vornamenfelder sind leer.

Random within list (Willkürlich in Liste) Wenn Sie diesen Typ auswählen, können Sie manuell willkürliche Elemente mit benutzerdefinierten Werten und Gewichten zu Ihren generierten Feldern hinzufügen.

So können Sie beispielsweise das Feld hair_color (Haarfarbe) mit drei Elementen generieren: brown (braun) mit dem Gewicht 0,4 (40 % der generierten Werte), red (rot) mit dem Gewicht 0,4 (40 % der generierten Werte) und blond (blond) mit dem Gewicht 0,2 (20 % der generierten Werte).

Advanced (Erweitert) Use seed (Seed verwenden) Aktivieren Sie diese Option, wenn Sie ein spezifisches Seed zur Initialisierung eines Generators für willkürliche Zahlen verwenden möchten.

Mithilfe von Seeds können Sie dieselben Ergebnisse beibehalten.

Beispiel: 123456

Enable custom locales (Benutzerdefinierte Ländereinstellungen aktivieren) Aktivieren Sie diese Option, um eine benutzerdefinierte Sprache und den entsprechenden Ländercode in der Liste auszuwählen. Der Standardwert ist en-us.

Sie haben die Möglichkeit, mehrere Ländereinstellungen vorzunehmen: In diesem Fall werden die Datensätze nach dem Zufallsprinzip mit den verschiedenen ausgewählten Ländereinstellungen erstellt. Dadurch können Sie den Wert einiger Typen entsprechend dieser Ländereinstellungen ändern (Beispiel: Adressspezifische Datensätze fallen je nach ausgewählter Ländereinstellung unterschiedlich aus).

Konfiguration des Datengenerator-Quelldatensatzes

Im Quelldatensatz Ihrer Pipeline zu konfigurierende Felder.

Eigenschaft Konfiguration
Random rows number (Zeilenanzahl nach Zufallsprinzip) Aktivieren Sie diese Option, wenn eine willkürliche Anzahl Zeilen in Übereinstimmung mit einem von Ihnen festgelegten Mindestwert (Minimum rows number (Min. Zeilenanzahl)) und Höchstwert (Maximum rows number (Max. Zeilenanzahl)) generiert werden soll.
Polling configuration (Abfragekonfiguration) (nur wenn Sie Datensätze mit dem Streaming-Typ erstellt haben)
  • Legen Sie auf der Registerkarte Main (Haupt) den Zeitraum zwischen jeder Generierung einer Datensatzgruppe im Feld Min poll interval (Min. Abfrageintervall) fest.
  • Legen Sie auf der Registerkarte Advanced (Erweitert) die Anzahl der für jede Gruppe generierten Datensätze im Feld Max poll records (Max. Abfragedatensätze) fest. Der Standardwert ist 1.

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!