Concepts de Talend Data Preparation - 2.1

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.4
2.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Ces définitions vous aideront a saisir les concepts principaux de Talend Data Preparation.
Jeux de données
Un jeux de données contient les données brutes qui peuvent être utilsées comme matière première pour une ou plusieurs préparations. Il se présente sous forme de tableau sur lequel vous pouvez appliquer les étapes de votre recette sans affecter les données d'origine. Un jeux de données peut être réutilisé par plusieurs préparations.
Préparation
La préparation fait le lien entre le jeux de données et la recette. C'est le résultat final que vous souhaitez atteindre avec vos données. Vous pouvez exporter le résultat de votre préparation en tant que fichier local, ou bien vers d'autres solutions de stockage. Une préparation se sert d'un jeux de données et lui applique une recette pour produire un résultat. Les données d'origine ne sont jamais modifiées.
Recette
Littéralement, une recette est définie comme "une suite d'étapes à accomplir avec une liste d'ingrédients pour concevoir ou préparer quelque chose". Dans Talend Data Preparation, les ingrédients sont vos données brutes, aussi appelés jeux de données, et les étapes sont les différentes functions appliquées aux jeux de données. Visuellement, la recette est formée par le séquence verticale de fonctions qui se trouve dans le panneau de gauche. Une recette est liée au jeux de données via la préparation. Chaque évolution de la recette est automatiquement enregistrée dans la préparation.
Fonction
Une fonction est une action appliquée à une ligne ou une colonne de votre jeux de données, comme la suppression de lignes vides. Puisque les fonctions sont appliquées dans le contexte d'une préparation, elles ne modifient pas les données d'origine. Les fonctions que vous appliquez sont listées dans la recette, dans l'ordre chronologique.