Écrire l'échantillon de données dans S3 - 7.1

Databricks

author
Talend Documentation Team
EnrichVersion
Cloud
7.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
task
Création et développement > Création de Jobs > Distributions Hadoop > Databricks
Création et développement > Création de Jobs > Serverless > Databricks
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le composant tFixedFlowIput pour ouvrir sa vue Component.
  2. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur de schéma.
  3. Cliquez sur le bouton [+] pour ajouter les colonnes du schéma comme dans l'image ci-dessous.
  4. Cliquez sur OK afin de valider ces modifications et acceptez la propagation proposée par la boîte de dialogue qui s'ouvre.
  5. Dans la zone Mode, sélectionnez le bouton radio Use Inline Content et collez les données copiées dans le champ Content qui s'affiche.
  6. Dans le champ Field separator, saisissez un point-virgule (;).
  7. Double-cliquez sur le composant tFileOutputParquet pour ouvrir sa vue Component.
  8. Cochez la case Define a storage configuration component et sélectionnez le composant tS3Configuration configuré dans les étapes suivantes.
  9. Cliquez sur le bouton Sync columns pour vous assurer que le schéma du tFileOutputParquet est le même que celui du tFixedFlowInput.
  10. Dans le champ Folder/File, saisissez le nom du dossier S3 à utiliser pour stocker l'échantillon de données. Par exemple, saisissez /sample_user. Comme vous avez spécifié votre bucket et dossier my_bucket/my_folder à utiliser dans le tS3Configuration pour stocker les données métier dans S3, le répertoire dans S3 devient my_bucket/my_folder/sample_user.
  11. Dans la liste déroulante Action, sélectionnez Create si le dossier sample_user n'existe pas encore. Si ce dossier existe déjà, sélectionnez Overwrite.