Nettoyer et transformer vos données avec Talend Data Preparation ou Talend Pipeline Designer - Cloud

Guide de prise en main de Talend Cloud Data Inventory avec Snowflake

Version
Cloud
Language
Français (France)
Product
Talend Cloud
Module
Talend Data Inventory
Talend Data Preparation
Talend Pipeline Designer
Content
Gouvernance de données

Les jeux de données ajoutés à Talend Cloud Data Inventory peuvent être utilisés comme source pour des pipelines ou comme matériel brut pour des préparations.

La liste des jeux de données et la vue détaillée des jeux de données sont des points d'entrée vers les autres applications Talend Cloud : Talend Cloud Pipeline Designer et Talend Cloud Data Preparation, afin de pouvoir, sans interruption, nettoyer ou transformer vos ressources de données, ce qui va améliorer leur Talend Trust Score™.

  • Talend Cloud Data Preparation est une application en libre-service permettant aux travailleurs de l'information de simplifier et accélérer le processus laborieux et consommateur de temps qu'est la préparation de données pour analyse ou d'autres tâches orientées données. Cet outil vous permet d'effectuer des opérations de nettoyage, standardisation ou mise en forme de vos données, à l'aide d'une grande variété de fonctions. Il offre également des fonctionnalités d'exploration et de profiling de données.
  • Talend Cloud Pipeline Designer est un outil d’intégration moderne et flexible que vous pouvez utiliser pour traiter, facilement et puissamment, des données à grande échelle. Il fournit une interface graphique basée Web, afin de créer des pipelines complexes de bout en bout permettant de traiter des données au repos ou à la volée, instantanément via le framework à la lecture du schéma et de voir les données en action grâce à la fonctionnalité d'aperçu en temps réel.

Procédure

  1. Pour créer un pipeline ou une préparation à partir d'un jeu de données, plusieurs possibilités s'offrent à vous :
    • Depuis la liste des jeux de données, placez votre curseur sur le jeu de données à utiliser comme source d'un pipeline ou d'une préparation.
    • Depuis la vue détaillée du jeu de données, placez votre curseur en haut à droite de la sous-barre d'en-tête.
    • Depuis la vue d'ensemble du jeu de données, allez dans la tuile Pipelines ou Preparations.
  2. De là, vous pouvez :
    • Cliquez sur l'icône de Talend Cloud Pipeline Designer ou allez dans la tuile Pipelines si vous souhaitez concevoir un pipeline avec ce jeu de données comme source.
    • Cliquez sur l'icône de Talend Cloud Data Preparation ou allez dans la tuile Preparations si vous souhaitez travailler sur une préparation utilisant ces données comme matériel source.
      Avertissement : Les jeux de données de type hiérarchique ne sont pas supportés par Talend Cloud Data Preparation, vous ne pouvez donc pas créer de préparation à partir de ceux-ci.
    Selon l'application sélectionnée, les pipelines ou préparations existant·es ayant été créé·es depuis ce jeu de données seront listé·es, avec le nom de la personne les ayant créé·es.

    Dans le cas de préparations, en plus de la liste des préparations existantes, vous pourrez voir la liste des préparations compatibles. Ces préparations ont été créées sur un jeu de données ayant le même modèle que le jeu de données sélectionné. Vous pouvez cliquer sur le bouton Use pour l'appliquer directement.

  3. Cliquez sur Add pour créer un jeu de données ou une préparation.

Résultats

L'application dédiée s'ouvre et vous pouvez commencer à travailler directement sur votre pipeline ou préparation.
Remarque : Si un jeu de données est utilisé comme source pour des pipelines ou préparations, il ne peut être supprimé avant que les pipelines ou préparations en question ne soient supprimé·es.