Configurer la connexion à S3 à utiliser pour stocker les données métier - 7.2

Amazon S3

EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
EnrichPlatform
Studio Talend
task
Création et développement > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
Gouvernance de données > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3
Qualité et préparation de données > Systèmes tiers > Services Amazon (Intégration) > Composants Amazon S3

Procédure

  1. Double-cliquez sur le tS3Configuration pour ouvrir sa vue Component.

    Spark utilise ce composant pour se connecter au système S3 dans lequel les données métier sont stockées. Dans ce scénario, l'échantillon de données sur les incidents de rue sont écrits et chiffrés dans S3.

  2. Cochez la case Use s3a Filesystem, les cases Inherit credentials from AWS role et use SSE-KMS encryption.
  3. Saisissez les identifiants d'accès au compte AWS à utiliser.
    • Si la politique de sécurité de votre entreprise le permet, dans les champs Access Key et Secret Key, saisissez les identifiants.

      Si vous ne connaissez pas les identifiants à utiliser, contactez l'administrateur de votre système AWS ou consultez Getting Your AWS Access Keys dans la documentation AWS (en anglais).

    • Si la politique de sécurité de votre entreprise ne vous permet pas d'entrer vos identifiants dans une application client, sélectionnez Inherit credentials from AWS role pour obtenir les identifiants de sécurité temporaires basés rôle d'AWS provenant des métadonnées de votre instance EMR. Un rôle IAM doit avoir été associé à cette instance EMR.

      Pour plus d'informations sur l'utilisation d'un rôle IAM pour obtenir des permissions, consultez Utilisation d'un rôle IAM dans la documentation AWS.

  4. Cochez la case Use SSE-KMS encryption pour permettre au Job de vérifier et d'utiliser le service de chiffrement SSE-KMS de votre cluster.
  5. Dans le champ Bucket name, saisissez le nom du bucket à utiliser pour stocker les données d'échantillon. Ce bucket doit déjà exister lorsque vous lancez votre Job. Par exemple, saisissez my_bucket/my_folder.