Si vous avez un compte Amazon S3, vous pouvez vouloir aller plus loin. Une fois que vous avez chargé un fichier dans S3, vous pouvez créer une connexion à ce bucket S3 et récupérer le jeu de données à partir de Talend Cloud Pipeline Designer.
Vous pourrez alors reproduire le cas d’utilisation avec le jeu de données hébergé dans Amazon S3.
Avant de commencer
-
Assurez-vous que votre utilisateur·rice ou groupe d’utilisateurs et d'utilisatrices dispose des autorisations appropriées pour accéder aux ressources d’Amazon S3.
Si vous ne disposez pas de ces autorisations, vous pouvez essayer une des options suivantes.- (recommandée) Demandez à l’administrateur qui gère votre compte Amazon de vous donner/de donner à votre utilisateur·rice les autorisations S3 appropriées.
- Implémentez votre politique d’accès en suivant la documentation Amazon si vous êtes autorisé(e) à le faire.
- (non recommandée) Joindre la politique AmazonS3FullAccess à votre groupe/votre utilisateur·rice via la console IAM. Cela vous permet de lire les ressources S3 et d’écrire dans ces ressources S3 sans restriction dans un bucket spécifique. Cependant, ceci est une solution rapide qui n’est pas recommandée par Talend.
Remarque : L’erreur par défaut qui s’affiche lorsque vous essayez d’accéder aux ressources S3 sans autorisation suffisante est Bad Gateway. -
Récupérez le fichier financial_transactions.avro dans l’onglet Téléchargements du panneau de gauche de cette page.
Procédure
Résultats
Dans la page Datasets (Jeux de données), le nouveau jeu de données est ajouté à la liste et peut être utilisé pour reproduire le cas d’utilisation précédemment créé.
Avant d'exécuter ce pipeline, choisissez si vous souhaitez écraser les données existantes sur S3 ou les fusionner, dans l'onglet de configuration du jeu de données de destination :
Une fois que votre pipeline est exécuté, les données mises à jour sont visibles dans le fichier situé sur Amazon S3.