Propriétés du générateur de données - Cloud

Guide des connecteurs des applications Talend Cloud

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
Content
Administration et monitoring > Gestion des connexions
Création et développement > Création de Pipelines
Last publication date
2023-11-23

Propriétés à configurer pour pouvoir générer automatiquement vos données de test en tant que jeu de données.

Le générateur de données (Data generator) est unidirectionnel et peut uniquement être utilisé comme jeu de données source dans votre pipeline.

Connexion du générateur de données

Propriété

Configuration

Selection (Sélection) Sélectionnez ou saisissez Data generator.
Configuration
Moteur Sélectionnez votre moteur dans la liste.
Description Saisissez un nom d'affichage (obligatoire) et une description (facultative) pour la connexion.

Jeu de données du générateur de données

Propriété Configuration
Dataset name Saisissez un nom pour le jeu de données. Ce nom sera utilisé comme identifiant unique du jeu de données dans toutes les applications Talend Cloud.
Connexion Sélectionnez votre connexion dans la liste.
Saisissez Sélectionnez le type de jeu de données à créer :
  • Batch (Lot) si vous souhaitez générer une fois des enregistrements. Le pipeline utilisant ce jeu de données sera un pipeline de type batch.
  • Streaming (Flux) si vous souhaitez générer des enregistrements toutes les N millisecondes dans un pipeline de type streaming. Le pipeline utilisant ce jeu de données sera un pipeline de type streaming et vous pourrez définir l'intervalle d'interrogation en millisecondes dans le champ Polling configuration (Configuration de l'interrogation) du jeu de données source.
Main Rows (Lignes) Saisissez le nombre d'enregistrements à générer.
Champ Définissez les champs et la nature des données à générer. Vous pouvez utiliser des types prédéfinis pour vous aider à générer des données spécifiques :
  • Name (Nom) : saisissez le nom du champ à générer.
    Exemple :
    firstname 
  • Type : sélectionnez dans la liste le type de données que vous souhaitez donner à votre champ. Selon le type sélectionné, des champs supplémentaires peuvent s'afficher pour configurer vos données.
    Exemple :
    First Name
  • Blank % (% vide) : saisissez ou sélectionnez le pourcentage de champs vides à générer.

    Exemple : 5, pour 5 % de champs de prénoms vides générés.

Random within list (Aléatoire au sein d'une liste) Si vous sélectionnez ce type, vous pouvez manuellement ajouter à vos champs générés des éléments aléatoires avec des valeurs personnalisées et des poids.

Par exemple, vous pouvez générer un champ nommé hair_color avec trois éléments : brown avec un poids de 0.4 (40 % des valeurs générées), red avec un poids de 0.4 (40 % des valeurs générées) et blond avec un poids de 0.2 (20 % des valeurs générées).

Advanced Use seed (Utiliser une graine) Activez cette option si vous souhaitez utiliser une graine spécifique pour initialiser un générateur de nombres aléatoires.

Les graines vous permettent de conserver les mêmes résultats.

Exemple : 123456

Enable custom locales (Activer les locales personnalisées) Activez cette option et sélectionnez dans la liste une langue et un code pays. Par défaut, la valeur est en-us.

Vous pouvez sélectionnez plusieurs locales : dans ce cas, les enregistrements seront créés à l'aide des différentes locales sélectionnées, de manière aléatoire. Cela vous permet de modifier la valeur de certains types selon ces locales (par exemple, les enregistrements d'adresses varient selon la locale sélectionnée).

Configuration du jeu de données source du générateur de données

Champs à configurer dans le jeu de données source de votre pipeline.

Propriété Configuration
Random rows number (Nombre de lignes aléatoire) Activez cette option si vous souhaitez générer un nombre aléatoire de lignes, avec une valeur minimale (Minimum rows number) et une valeur maximale (Maximum rows number) que vous définissez.
Polling configuration (Configuration de l'interrogation) (seulement si vous avez créé des enregistrements de type streaming (flux))
  • Dans l'onglet Main, configurez l'intervalle de temps entre chaque génération d'un ensemble d'enregistrements, dans le champ Min poll interval.
  • Dans l'onglet Advanced, configurez le nombre d'enregistrements générés pour chaque ensemble dans le champ Max poll records. Par défaut, la valeur est 1.