Ajouter un jeu de données depuis Azure DLS Gen2 - 8.0

Guide d'utilisation de Talend Data Preparation

Version
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Data Preparation
Content
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-03-27

Talend Data Preparation peut se connecter à différentes bases de données et les utiliser comme sources afin de créer un jeu de données.

Dans cet exemple, vous souhaitez préparer des données relatives à des client·es, stockées dans Azure Data Lake Storage Gen2. Saisissez vos informations de connexion directement dans l'interface de Talend Data Preparation et créez un jeu de données à partir de ces données.

Avant de commencer

Procédure

  1. Dans la vue Datasets de la page d'accueil de Talend Data Preparation, cliquez sur la flèche blanche près du bouton Add Dataset.
  2. Sélectionnez Azure DLS Gen2.

    Le formulaire Add Azure DLS Gen2 dataset (Ajouter un jeu de données Azure DLS Gen2) s'ouvre.

  3. Dans le champ Dataset name, saisissez le nom à donner à votre jeu de données.
  4. Saisissez le nom du compte (Account name) auquel vous souhaitez accéder.
  5. Dans la liste déroulante Authentication type (Type d'authentification), sélectionnez votre type d'authentification.
    • Si vous sélectionnez Shared Key (Clé partagée), saisissez votre clé de compte dans le champ Account key.
    • Si vous sélectionnez Shared Access Signature (Signature d'accès partagée), saisissez votre signature d'accès partagé Azure dans le champ Azure Shared Access Signature.
    • Si vous sélectionnez Azure Active Directory, saisissez l'ID de votre tenant dans le champ Tenant ID, votre ID client dans le champ Client ID et votre secret client dans le champ Client Secret.
  6. Cliquez sur Test connection.
    Si la connexion est établie, la seconde partie du formulaire est affichée, dans laquelle vous pouvez saisir une requête ou sélectionner directement un module Salesforce dans la liste proposée. Si ce n'est pas le cas, un message d'erreur s'affiche, détaillant les raisons de l'échec de la connexion.
  7. Dans le champ Container, saisissez le nom du conteneur et, dans le champ Blob path, saisissez le chemin d'accès au Blob où sont situées les données.
  8. Sélectionnez le format du schéma source, CSV, Avro, Json ou Parquet.
  9. Cliquez sur le bouton Add dataset (Ajouter un jeu de données) au bas du formulaire.

Résultats

Les données extraites de ADLS Gen2 s'ouvrent directement dans la grille et vous pouvez commencer à travailler sur votre préparation de la manière habituelle.

Les données sont toujours stockées dans ADLS Gen2, Talend Data Preparation récupère un échantillon à la demande.

Le jeu de données est ajouté à la liste dans la vue Datasets de la page d'accueil.