ビジネスデータの保存に使うS3への接続を設定する

手順

tS3Configurationをダブルクリックして[Component] (コンポーネント)ビューを開きます。

Sparkはこのコンポーネントを使って、ビジネスデータが保存されているS3システムに接続します。このシナリオでは、ストリートインシデントに関するサンプルデータがS3に書き込まれ、暗号化されます。
[Inherit credentials from AWS role] (AWSロールから認証情報を継承)チェックボックスと[use SSE-KMS encryption] (SSE-KMS暗号化の使用)
使うAWSアカウントのアクセス認証情報を入力します。
- 組織のセキュリティポリシーで許可されている場合は、[Access Key] (アクセスキー)フィールドと[Secret Key] (シークレットキー)フィールドに認証情報を入力します。
  使う認証情報がわからない場合は、AWSシステムの管理者に問い合わせるか、AWSドキュメントのAWS アクセスキーの取得をご確認ください。
- 組織のセキュリティポリシーでクライアントアプリケーションの認証情報を公開できない場合は、[Inherit credentials from AWS role] (AWSロールから認証情報を継承)を選択して、EMRインスタンスメタデータからロールベースの一時的なAWSセキュリティ認証情報を取得します。このEMRインスタンスに関連付けるには、IAMロールが指定されている必要があります。
  IAMロールを使ってアクセス許可を付与する方法は、AWSドキュメントのAmazon EC2インスタンスで実行されるアプリケーションにIAMロールを使用してアクセス許可を付与するをご覧ください。
ジョブがクラスターのSSE-KMS暗号化サービスを検証して利用できるようにするには、[Use SSE-KMS encryption] (SSE-KMS暗号化の使用)チェックボックスをオンにします。
[Bucket name] (バケット名)フィールドに、サンプルデータの保管に使うバケットの名前を入力します。このバケットは、ジョブを起動する時に存在している必要があります。たとえば、my_bucket/my_folderと入力します。

ビジネスデータの保存に使うS3への接続を設定する - 7.3

Amazon EMR distribution

手順