Accéder au contenu principal Passer au contenu complémentaire

Créer une préparation sur une table Databricks Delta

Utilisez une connexion Azure Data Lake Gen2 pour créer un jeu de données depuis une table Databricks Delta et utilisez-la dans Talend Cloud Data Preparation.

Procédure

  1. Cliquez sur Connections (Connexions) > Add connection (Ajouter une connexion).
  2. Dans le panneau qui s'ouvre, sélectionnez le type de connexion à créer.

    Exemple

    Azure Data Lake Storage Gen2
  3. Sélectionnez votre moteur dans la liste Engine.
    Note InformationsRemarque :
    • Il est recommandé d'utiliser Moteur distant Gen2 plutôt que Moteur Cloud pour le design pour un traitement avancé des données.
    • Si aucun Moteur distant Gen2 n'a été créé depuis Talend Management Console ou s'il existe mais semble indisponible, ce qui signifie qu'il n'est pas en cours de fonctionnement, vous ne pourrez pas sélectionner de type de connexion (Connection type) dans la liste ou sauvegarder la nouvelle connexion.
    • Les types de connexion disponibles dépendent du moteur sélectionné.
  4. Sélectionnez le type de connexion à créer.
    Ici, sélectionnez Azure Data Lake Storage Gen2.
  5. Renseignez les propriétés de la connexion pour accéder à votre système de fichiers Azure Data Lake Storage Gen2 comme décrit dans Propriétés Azure Data Lake Storage Gen2, vérifiez la connexion et cliquez sur Add dataset (Ajouter un jeu de données).
  6. Dans le panneau Add a new dataset, nommez votre jeu de données.

    Exemple

    Databricks Delta table (Table Databricks Delta)
  7. Renseignez les propriétés requises pour accéder à la table Delta dans votre compte de stockage.
  8. Dans le champ Format, sélectionnez Delta.
  9. Cliquez sur View sample (Voir l'échantillon) pour afficher un aperçu de votre jeu de données et cliquez sur Validate (Valider) pour finaliser la création de votre jeu de données.
  10. Pour créer une préparation sur la Table Databricks Delta, vous pouvez :
    • Dans la liste Dataset (Jeux de données), placez votre curseur sur le jeu de données à utiliser comme source d'une préparation, cliquez sur l'icône Talend Cloud Data Preparation et sélectionnez Add (Ajouter) pour commencer à travailler directement sur ces données.
    • Depuis la liste des préparations, cliquez sur le bouton Add preparation. Dans le formulaire qui s'ouvre, nommez votre préparation, sélectionnez le jeu de données source, précédemment créé et cliquez sur Submit.

Résultats

La préparation s'ouvre directement sur une recette vide. Vous pouvez commencer à effectuer des opérations de préparations sur votre jeu de données Databricks Delta. La préparation sera créée dans le dossier dans lequel vous travaillez actuellement. De plus, votre préparation sera automatiquement sauvegardée dans la liste des préparations et toutes les modifications seront également sauvegardées automatiquement.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !