ビジネスデータの保存に使うS3への接続を設定する - 7.3

Amazon EMR distribution

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > ジョブデザイン > Hadoopディストーション > Amazon EMR

手順

  1. tS3Configurationをダブルクリックして[Component] (コンポーネント)ビューを開きます。

    Sparkはこのコンポーネントを使って、ビジネスデータが保存されているS3システムに接続します。このシナリオでは、ストリートインシデントに関するサンプルデータがS3に書き込まれ、暗号化されます。

  2. [Inherit credentials from AWS role] (AWSロールから認証情報を継承)チェックボックスと[use SSE-KMS encryption] (SSE-KMS暗号化の使用)
  3. 使うAWSアカウントのアクセス認証情報を入力します。
    • 組織のセキュリティポリシーで許可されている場合は、[Access Key] (アクセスキー)フィールドと[Secret Key] (シークレットキー)フィールドに認証情報を入力します。

      使う認証情報がわからない場合は、AWSシステムの管理者に問い合わせるか、AWSドキュメントのAWS アクセスキーの取得をご確認ください。

    • 組織のセキュリティポリシーでクライアントアプリケーションの認証情報を公開できない場合は、[Inherit credentials from AWS role] (AWSロールから認証情報を継承)を選択して、EMRインスタンスメタデータからロールベースの一時的なAWSセキュリティ認証情報を取得します。このEMRインスタンスに関連付けるには、IAMロールが指定されている必要があります。

      IAMロールを使ってアクセス許可を付与する方法の詳細は、AWSドキュメントのAmazon EC2インスタンスで実行されるアプリケーションにIAMロールを使用してアクセス許可を付与するを参照してください。

  4. ジョブがクラスターのSSE-KMS暗号化サービスを検証して利用できるようにするには、[Use SSE-KMS encryption] (SSE-KMS暗号化の使用)チェックボックスをオンにします。
  5. [Bucket name] (バケット名)フィールドに、サンプルデータの保管に使うバケットの名前を入力します。このバケットは、ジョブを起動する時に存在している必要があります。たとえば、my_bucket/my_folderと入力します。