Talend Cloud Data Preparation sur Talend Cloud Data Inventory - Cloud

Guide d'utilisation de Talend Cloud Data Preparation

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Preparation
Content
Administration et monitoring > Gestion des connexions
Qualité et préparation de données > Gestion des jeux de données
Qualité et préparation de données > Nettoyage de données
Last publication date
2024-04-16

L'inventaire commun de jeux de données pour Talend Cloud Data Inventory, Talend Cloud Pipeline Designer et Talend Cloud Data Preparation, apporte une expérience unifiée à travers les différentes applications de Talend Cloud.

Même si vous n'avez pas souscrit à l'application Talend Cloud Data Inventory standalone, vous pourrez bénéficier de plusieurs nouvelles fonctionnalités et améliorations de votre expérience dans Talend Cloud Data Preparation, grâce à l'architecture commune, à la différence des versions hybrides et on-premises.

Ces ajouts ont également un impact sur votre utilisation de Talend Cloud Data Preparation puisqu'ils apportent de nouveaux concepts. Les modifications les plus importantes sont les suivantes :

  • Nouveau concept de connexions réutilisables

    Pour créer un jeu de données distant, stocké dans Salesforce ou Amazon S3 par exemple, utilisez le bouton Add dataset, sélectionnez la plateforme et saisissez vos informations de connexion à chaque fois. Vous pouvez configurer ces informations une fois et les sauvegarder en tant que connexion réutilisable (Connection) pour les réutiliser dans de nouveaux jeux de données, à tout moment. Ces connexions à vos data stores sont listées dans l'onglet Connections.

    Onglet Connections (Connexions) ouvert.
  • Connectivité native étendue

    Différents nouveaux types de connexions sont disponibles nativement dans l'application. Créez des préparations sur des jeux de données depuis des bases de données, des systèmes de fichiers, des systèmes distribués, des plateformes et bien d'autres sources encore. Pour la liste de sources complètes auxquelles vous pouvez vous connecter, consultez la Liste des connecteurs supportés.

    Cependant, gardez à l'esprit que Talend Cloud Data Preparation ne supporte pas les formats hiérarchiques et ne supporte pas le Streaming.

  • Chargement direct des fichiers locaux

    Dans la page Datasets, un nouveau bouton Drop a file or browse est disponible, vous permettant d'importer facilement et rapidement vos fichiers locaux. Vous pouvez glisser-déposer vos fichiers sur la page du jeu de données ou parcourir votre système pour les trouver. Un formulaire s'ouvre, dans lequel vous pouvez paramétrer une configuration pour le jeu de données ou cliquer sur Auto-detect pour détecter automatiquement les paramètres.

    Bouton Drop your file anywhere (Déposez le fichier n'importe où) présenté.
  • Nouveaux indicateurs dans la liste des jeux de données

    Lorsque vous ouvrez votre liste de jeux de données, vous pouvez voir de nouvelles colonnes, contenant de nouveaux indicateurs.

    Nouveaux indicateurs présentés dans la liste des jeux de données.
    • Tout d'abord, une barre de statistiques détaille la répartition des enregistrements vides, valides et invalides dans le jeu de données. Placez votre curseur sur chaque couleur pour accéder au pourcentage exact ainsi qu'au nombre d'enregistrements.
    • De plus, une nouvelle fonctionnalité dans l'application vous permet d'appliquer une note sur le jeu de données en vous basant sur sa qualité et d'autres critères personnels. La note visible dans la liste des jeux de données est une moyenne des notes appliquées par les utilisateurs et utilisatrices ayant accès à ce jeu de données.
    • Enfin, le score de confiance, représenté par un bouclier, vous donne un aperçu global de la qualité et de la complétude de votre jeu de données, en un clin d'œil. Il agrège différents indicateurs, comme l'indicateur de qualité, l'indicateur de présence d'une note ou d'une certification.
  • Partage plus flexible

    La nouvelle boîte de dialogue de partage vous permet d'attribuer un rôle à à d'autres utilisateurs et utilisatrices lors du partage de connexions, jeux de données, ou dossiers de préparation avec d'autres utilisateurs et utilisatrices. Les rôles Viewer, Editor, ou Owner ont différents niveaux de droits sur les actions à effectuer sur les objets partagés. Pour attribuer un rôle spécifique à un collaborateur, ouvrez la boîte de dialogue de partage, sélectionnez l'utilisateur ou l'utilisatrice ou le groupe avec lequel partager votre objet, puis cliquez sur Add as....

    Le rôle attribué à une personne peut être modifié à tout moment. Vous pouvez même vous retirer vous-même de la liste des contributeurs sur un objet partagé spécifique.

    Liste déroulante Add as... (Ajouter en tant que...) déroulée.
  • Sauvegarde d'une préparation

    À l'aide du bouton Add dataset (Ajouter un jeu de données), vous pouvez créer un jeu de données lorsque vous créez une préparation.

    Un jeu de données sélectionné.

    Une autre manière de créer des préparations facilement a été ajoutée. Directement depuis votre liste de jeux de données, placez votre curseur sur un jeu de données et cliquez sur l'icône Talend Cloud Data Preparation. Cliquez sur Add pour commencer à nettoyer vos données immédiatement.

    Icône Talend Cloud Data Preparation sélectionnée.
  • Origine et destination des jeux de données

    En plus de son rôle de raccourci de création de préparation, le bouton Talend Cloud Data Preparationqui s'affiche lorsque vous passez votre curseur sur un jeu de données a un autre objectif très utile. Lorsque vous cliquez sur cette icône pour un jeu de données spécifique, vous pouvez voir toutes les préparations créées à partir de celui-ci et qui les a créées, ce qui vous donne plus d'informations sur l'utilisation de votre jeu de données.

    Icône Talend Cloud Data Preparation sélectionnée.
  • Suppression des jeux de données en temps réel (live datasets)

    Compte tenu de l'extension de la connectivité et des nouvelles fonctionnalités apportées par cette version, la création et l'utilisation de jeux de données en temps réel ne sont plus réalisables. Tous les jeux de données en temps réel sont à présent inutilisables.

  • Make line as header

    Cette fonction n'est plus disponible depuis le panneau des fonctions de vos préparations. Vous pouvez, à la place, sélectionner la ligne à utiliser comme en-tête dans votre jeu de données, dans les propriétés du jeu de données, lors de l'import.

  • Fichiers Excel avec plusieurs feuilles de travail

    Lorsque vous chargez un fichier Excel contenant plusieurs feuilles, seule la première est importée par défaut, mais vous pouvez choisir la feuille à importer dans le formulaire de création du jeu de données. Cependant, la fonctionnalité Auto-detect n'est pas supportée pour ce type de fichiers.