Export d'une préparation effectuée sur un jeu de données d'une base de données - 2.1

Guide utilisateur de Talend Data Preparation

author
Talend Documentation Team
EnrichVersion
6.4
2.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Qualité et préparation de données > Nettoyage de données
EnrichPlatform
Talend Data Preparation
Lorsque vous avez terminé de préparer votre jeu de données extrait d'une base de données, vous pouvez exporter vos données.

Procédure

  1. Cliquez sur le bouton Export dans la barre en haut de l'application.
  2. Si le résultat de votre préparation est plus volumineux que la taille de votre échantillon actuel, 10 000 lignes par exemple, sélectionnez une option d'export :
    • si vous sélectionnez Current sample, seul l'échantillon sur lequel vous avez travaillé sera exporté.
    • si vous sélectionnez All data, toutes les étapes de préparation effectuées sur votre échantillon seront appliquées au reste du jeu de données.
  3. Choisissez d'exporter vos données vers un fichier local ou vers un cluster Hadoop.
    • Si vous exportez vos données en tant que fichier local csv ou xlsx, l'opération d'export sera traitée sur le serveur de Talend Data Preparation.
    • Si vous exportez vos données vers un cluster Hadoop, l'export sera traité directement sur le cluster. Choisissez le type du fichier de sortie csv, avro ou parquet. Saisissez le chemin vers votre emplacement favori où sauvegarder votre fichier. Si vous choisissez l'authentification via Kerberos, saisissez votre Principal et le chemin vers votre fichier keytab.
  4. Cliquez sur Confirm.

Résultats

Dans le cas d'un export vers un fichier local, si vous choisissez d'exporter uniquement l'échantillon courant (Current sample), le téléchargement démarre automatiquement. Si vous avez sélectionné All data pour exporter les données complètes, l'export est lancé en tâche de fond. Vous pouvez vérifier le statut de l'export et télécharger le fichier de sortie dans la page Export history. Pour plus d'informations, consultez Page d'historique des exports.

L'export déclenche un rafraîchissement dans les données récupérées de la base de données, garantissant ainsi que les données affichées en sortie sont toujours à jour.

Cepedant, à cause de ce rafraîchissement, il est possible qu'un jeu de données initialement inférieur à 10 000 lignes, excède désormais cette limite. Dans ce cas :

  • Si vous exportez vers un fichier local, seul l'échantillon est conservé.
  • Si vous exportez vers un cluster Hadoop, toutes les données sont exportées.