Ajout d'un jeu de données depuis une base de données - 7.3

Guide d'utilisation de Talend Data Preparation

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données
Last publication date
2023-11-29

Talend Data Preparation peut se connecter à différentes bases de données et les utiliser comme sources afin de créer un nouveau jeu de données.

Par défaut, Talend Data Preparation fournit la connectivité vers les bases de données suivantes :

  • AthenaDB
  • Azure SQL
  • Derby
  • MariaDB
  • MySQL
  • PostgreSQL
  • Redshift
  • Snowflake
  • SQL Server

La liste des pilotes utilisés pour ces connexions pré-configurées est disponible dans le fichier <TDP_installation_path>/dataprep/services/tcomp/config/jdbc_config.json.

Dans cet exemple, vous souhaitez préparer des données clients stockées dans une base de données MySQL. Saisissez vos informations de connexion à la base de données directement dans l'interface de Talend Data Preparation et créez un nouveau jeu de données à partir de ces données.

Procédure

  1. Dans la vue Datasets (Jeux de données) de la page d'accueil de Talend Data Preparation, cliquez sur la flèche blanche près du bouton Add Dataset (Ajouter un jeu de données).
  2. Sélectionnez Database (Base de données).

    Le formulaire Add a database dataset (Ajouter un jeu de données depuis une base de données) s'ouvre.

  3. Dans le champ Dataset name, saisissez le nom à donner à votre jeu de données.
  4. Dans la liste déroulante Database type (Type de base de données), sélectionnez le type de la base de données à laquelle vous connecter, MySQL dans cet exemple.

    Cette liste peut être enrichie manuellement. Pour plus d'informations, consultez "Ajouter un type de base de données".

  5. Dans le champ JDBC URL (URL JDBC), saisissez l'URL pour accéder à votre base de données MySQL.

    Le formulaire fournit un modèle d'URL dans lequel vous pouvez adapter les valeurs afin de les rapprocher de vos informations de connexion :

    • Remplacez localhost par votre adresse IP.
    • Remplacez 3306 par le numéro du port configuré pour MySQL. 3306 est le port par défaut pour MySQL.
    • Remplacez db par le nom de la base de données à laquelle vous souhaitez vous connecter.
  6. Dans les champs Username (Utilisateur) et Password (Mot de passe), saisissez respectivement votre identifiant et votre mot de passe de connexion à MySQL.
  7. Cliquez sur Test connection.
    Si la connexion est établie, la seconde partie du formulaire s'affiche, dans laquelle vous pouvez saisir une requête pour votre base de données. Si ce n'est pas le cas, un message d'erreur s'affiche, détaillant les raisons de l'échec de la connexion.

    Vérifiez que MySQL autorise les connexions à partir de Talend Data Preparation.

  8. Dans le champ Query (Requête), saisissez la requête pour obtenir les informations à récupérer de la table stockée dans votre base de données.

    Dans cet exemple, toutes les informations de la table nommée customers seront récupérées et écrites en sortie en tant que jeu de données.

  9. Cliquez sur le bouton Add dataset (Ajouter un jeu de données) au bas du formulaire.

Résultats

Les données extraites de la table customers, dans votre base de données MySQL s'ouvrent directement. Vous pouvez commencer à travailler sur votre préparation, de la même manière que d'habitude.

Les données sont toujours stockées dans la base de données MySQL, Talend Data Preparation récupère seulement un échantillon sur demande.

Le jeu de données est ajouté à la liste dans la vue Datasets de la page d'accueil.