サンプルデータをS3に書き込む - 7.2

Databricks

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > ジョブデザイン > Hadoopディストーション > Databricks
ジョブデザインと開発 > ジョブデザイン > Serverless > Databricks

手順

  1. tFixedFlowIput コンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。

    例え

  2. [Edit schema] (スキーマを編集)の横の[...]ボタンをクリックし、スキーマエディターを開きます。
  3. この画像に示すように、[+]ボタンをクリックしてスキーマカラムを追加します。

    例え

  4. [OK]をクリックしてこれらの変更を確認し、ポップアップ表示されるダイアログボックスで求められるプロパゲーションを承認します。
  5. [Mode] (モード)エリアの[Use Inline Content] (インラインコンテンツを使う)ラジオボタンを選択して、上記のサンプルデータを、表示されている[Content] (コンテンツ)フィールドに貼り付けます。
  6. [Field separator] (フィールド区切り)フィールドでセミコロン(;)を入力します。
  7. tFileOutputParquetコンポーネントをダブルクリックすると、[Component] (コンポーネント)ビューが開きます。

    例え

  8. [Define a storage configuration component] (ストレージ設定コンポーネントを定義)チェックボックスをオンにして、前のステップで設定したtS3Configurationコンポーネントを選択します。
  9. tFileOutputParquettFixedFlowInputと同じスキーマを持つように、[Sync columns] (カラムの同期)をクリックします。
  10. [Folder/File] (フォルダー/ファイル)フィールドで、サンプルデータに保管するために使うS3フォルダーの名前を入力します。たとえば/sample_userと入力します。tS3ConfigurationでビジネスデータをS3に保管するために使うフォルダーとしてmy_bucket/my_folderを指定したので、S3上の最終的なディレクトリーはmy_bucket/my_folder/sample_userとなります。
  11. [Action] (アクション)ドロップダウンリストで、sample_userフォルダーがまだ存在しない場合は[Create] (作成)を、このフォルダーが既に存在する場合は[Overwrite] (上書き)を選択します。