Amazon S3との間でデータをロード/アンロードする - 7.2

Amazon Redshift

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > Amazonサービス > Amazon Redshift
データガバナンス > サードパーティーシステム > Amazonサービス > Amazon Redshift
データクオリティとプレパレーション > サードパーティーシステム > Amazonサービス > Amazon Redshift

このシナリオでは、区切り記号付きファイルを生成してS3にアップロードし、S3上のファイルからのデータをRedshiftにロードしてコンソールに表示し、次にデータをRedshiftクラスターのスライスごとにRedshiftからS3上のファイルにアンロードし、最後に、アンロードされたS3上のファイルをリスト表示し、取得するジョブについて説明します。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

前提条件:

次のコンテキスト変数が作成済みで、[Repository] (リポジトリー)ツリービューに保存されていること。コンテキスト変数の詳細は、『 Talend Studioユーザーガイド』を参照してください。

  • redshift_host: Redshiftクラスターの接続エンドポイントURL。

  • redshift_port: データベースサーバーのリスニングポート番号。

  • redshift_database: データベースの名前。

  • redshift_username: データベース認証のユーザー名。

  • redshift_password: データベース認証のパスワード。

  • redshift_schema: スキーマの名前。

  • s3_accesskey: Amazon S3にアクセスするためのアクセスキー。

  • s3_secretkey: Amazon S3にアクセスするためのシークレットキー。

  • s3_bucket: Amazon S3バケットの名前。

上記スクリーンショットのコンテキスト値はすべて、あくまでも例示用です。