Ajout d'un jeu de données depuis une base de données - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation

Talend Cloud Data Preparation peut se connecter à différentes bases de données et les utiliser comme sources afin de créer un nouveau jeu de données.

Par défaut, Talend Cloud Data Preparation fournit la connectivité vers les bases de données suivantes :

  • MariaDB
  • MySQL
  • Derby
  • PostgreSQL
  • SQL Server
  • Azure SQL
  • Snowflake
  • Redshift

Dans cet exemple, vous souhaitez préparer des données clients stockées dans une base de données MySQL. Saisissez vos informations de connexion à la base de données directement dans l'interface de Talend Cloud Data Preparation et créez un nouveau jeu de données à partir de ces données.

Procédure

  1. Dans la vue Datasets (Jeux de données) de la page d'accueil de Talend Cloud Data Preparation, cliquez sur la flèche blanche près du bouton Add Dataset (Ajouter un jeu de données).
  2. Sélectionnez Database (Base de données).

    Le formulaire Add a database dataset (Ajouter un jeu de données depuis une base de données) s'ouvre.

  3. Dans le champ Dataset name, saisissez le nom à donner à votre jeu de données.
  4. Dans la liste déroulante Database type (Type de base de données), sélectionnez le type de la base de données à laquelle vous connecter, MySQL dans cet exemple.
  5. Dans le champ JDBC URL (URL JDBC), saisissez l'URL pour accéder à votre base de données MySQL.

    Le formulaire fournit un modèle d'URL dans lequel vous pouvez adapter les valeurs afin de les faire correspondre à vos informations de connexion:

    • Remplacez localhost par votre adresse IP.
    • Remplacez 3306 par le numéro du port configuré pour MySQL. 3306 est le port par défaut pour MySQL.
    • Remplacez db par le nom de la base de données à laquelle vous souhaitez vous connecter.
  6. Dans les champs Username (Utilisateur) et Password (Mot de passe), saisissez respectivement votre identifiant et votre mot de passe de connexion à MySQL.
  7. Cliquez sur Test connection.
    Si la connexion est établie, la seconde partie du formulaire s'affiche, dans laquelle vous pouvez saisir une requête pour votre base de données. Si ce n'est pas le cas, un message d'erreur s'affiche, détaillant les raisons de l'échec de la connexion.

    Vérifiez que MySQL autorise les connexions à partir de Talend Cloud Data Preparation.

  8. Dans le champ Query (Requête), saisissez la requête pour obtenir les informations à récupérer de la table stockée dans votre base de données.

    Dans cet exemple, toutes les informations de la table nommée customers seront récupérées et écrites en sortie en tant que jeu de données.

  9. Cliquez sur le bouton Add dataset (Ajouter un jeu de données) au bas du formulaire.

Résultats

Les données extraites de la table customers, dans votre base de données MySQL s'ouvrent directement. Vous pouvez commencer à travailler sur votre préparation, de la même manière que d'habitude.

Les données sont toujours stockées dans la base de données MySQL, Talend Cloud Data Preparation récupère seulement un échantillon sur demande.

Le jeu de données est ajouté à la liste dans la vue Datasets de la page d'accueil.