Export d'une préparation effectuée sur un jeu de données d'une base de données - Cloud

Guide utilisateur de Talend Cloud Data Preparation

author
Talend Documentation Team
EnrichVersion
Cloud
EnrichProdName
Talend Cloud
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Lorsque vous avez terminé de préparer votre jeu de données extrait d'une base de données, vous pouvez exporter vos données.

Procédure

  1. Cliquez sur le bouton Export (Exporter) dans la barre en haut de l'application.
  2. Si le résultat de votre préparation est plus volumineux que la taille de votre échantillon actuel, 10 000 lignes par défaut, sélectionnez une option d'export :
    • si vous sélectionnez Current sample (Échantillon actuel), seul l'échantillon sur lequel vous avez travaillé sera exporté.
    • si vous sélectionnez All data (Toutes les données), toutes les étapes de préparation effectuées sur votre échantillon seront appliquées au reste du jeu de données.
  3. Choisissez d'exporter vos données vers un fichier local ou vers un cluster Hadoop.
    • Si vous exportez vos données en tant que fichier local csv ou xlsx, l'opération d'export sera traitée sur le serveur de Talend Data Preparation.
    • Si vous exportez vos données vers un cluster Hadoop, l'export sera traité directement sur le cluster. Choisissez le type du fichier de sortie csv, avro ou parquet. Saisissez le chemin vers votre emplacement favori où sauvegarder votre fichier. Si vous choisissez l'authentification via Kerberos, saisissez votre Principal et le chemin vers votre fichier keytab.
  4. Cliquez sur Confirm (Confirmer).

Résultats

Dans le cas d'un export vers un fichier local, si vous choisissez d'exporter uniquement l'échantillon actuel, le téléchargement démarre automatiquement. Si vous avez sélectionné All data (Toutes les données) pour exporter l’intégralité des données, l'export est lancé en tâche de fond. Vous pouvez vérifier le statut de l'export et télécharger votre fichier de sortie via la page Export history (Historique d'exports). Pour plus d'informations, consultez Page d'historique des exports.

L'export déclenche un rafraîchissement dans les données récupérées de la base de données, garantissant ainsi que les données affichées en sortie sont toujours à jour.

Cependant, à cause de ce rafraîchissement, il est possible qu'un jeu de données initialement inférieur à 10 000 lignes, excède désormais cette limite. Dans ce cas :

  • Si vous exportez vers un fichier local, seul l'échantillon est conservé.
  • Si vous exportez vers un cluster Hadoop, toutes les données sont exportées.