Accéder au contenu principal Passer au contenu complémentaire

Export d'une préparation effectuée sur un jeu de données d'une base de données

Lorsque vous avez terminé de préparer votre jeu de données extrait d'une base de données, vous pouvez exporter vos données.

Procédure

  1. Cliquez sur le bouton Export (Exporter) dans la barre en haut de l'application.
  2. Si le résultat de votre préparation est plus volumineux que la taille de votre échantillon actuel, 10 000 lignes par défaut, sélectionnez une option d'export :
    • si vous sélectionnez Current sample (Échantillon actuel), seul l'échantillon sur lequel vous avez travaillé sera exporté.
    • si vous sélectionnez All data (Toutes les données), toutes les étapes de préparation effectuées sur votre échantillon seront appliquées au reste du jeu de données.
  3. Choisissez d'exporter vos données vers un fichier local ou vers un cluster Hadoop.
    • Si vous exportez vos données en tant que fichier local csv ou xlsx, l'opération d'export sera traitée sur le serveur de Talend Data Preparation.
    • Si vous exportez vos données vers un cluster Hadoop, l'export sera traité directement sur le cluster. Choisissez le type du fichier de sortie csv, avro ou parquet. Saisissez le chemin vers votre emplacement favori où sauvegarder votre fichier. Si vous choisissez l'authentification via Kerberos, saisissez votre Principal et le chemin vers votre fichier keytab.
  4. Cliquez sur Confirm (Confirmer).

Résultats

Dans le cas d'un export vers un fichier local, si vous choisissez d'exporter uniquement l'échantillon actuel, le téléchargement démarre automatiquement. Si vous avez sélectionné All data (Toutes les données) pour exporter l’intégralité des données, l'export est lancé en tâche de fond. Vous pouvez vérifier le statut de l'export et télécharger votre fichier de sortie via la page Export history (Historique d'exports). Pour plus d'informations, consultez Page d'historique des exports (uniquement en anglais).

L'export déclenche l’actualisation des données récupérées depuis la base de données, garantissant ainsi que les données affichées en sortie sont toujours à jour.

Cependant, à cause de cette actualisation, il est possible qu'un jeu de données initialement inférieur à 10 000 lignes, en vienne à excéder cette limite. Dans ce cas :

  • Si vous exportez vers un fichier local, seul l'échantillon est conservé.
  • Si vous exportez vers un cluster Hadoop, toutes les données sont exportées.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !