Accéder au contenu principal Passer au contenu complémentaire

Configurer la connexion à S3 à utiliser pour stocker les données métier

Procédure

  1. Double-cliquez sur le tS3Configuration pour ouvrir sa vue Component.

    Spark utilise ce composant pour se connecter au système S3 dans lequel les données métier sont stockées. Dans ce scénario, l'échantillon de données sur les incidents de rue sont écrits et chiffrés dans S3.

  2. Cochez les cases Inherit credentials from AWS role et Use SSE-KMS encryption
  3. Saisissez les identifiants d'accès au compte AWS à utiliser.
    • Si la politique de sécurité de votre entreprise le permet, dans les champs Access Key et Secret Key, saisissez les identifiants.

      Si vous ne connaissez pas les identifiants à utiliser, contactez l'administrateur de votre système AWS ou consultez Getting Your AWS Access Keys dans la documentation AWS (en anglais).

    • Si la politique de sécurité de votre entreprise ne vous permet pas d'entrer vos identifiants dans une application client, sélectionnez Inherit credentials from AWS role pour obtenir les identifiants de sécurité temporaires basés rôle d'AWS provenant des métadonnées de votre instance EMR. Un rôle IAM doit avoir été associé à cette instance EMR.

      Pour plus d'informations sur l'utilisation d'un rôle IAM pour obtenir des permissions, consultez Utilisation d'un rôle IAM dans la documentation AWS.

  4. Cochez la case Use SSE-KMS encryption pour permettre au Job de vérifier et d'utiliser le service de chiffrement SSE-KMS de votre cluster.
  5. Dans le champ Bucket name, saisissez le nom du bucket à utiliser pour stocker les données d'échantillon. Ce bucket doit déjà exister lorsque vous lancez votre Job. Par exemple, saisissez my_bucket/my_folder.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !