出力の書き込み - 8.0

Talend Open Studio for Big Data 入門ガイド

Version
8.0
Language
日本語 (日本)
EnrichDitaval
Open Studio for Big Data
Product
Talend Open Studio for Big Data
Module
Talend Studio
Content
インストールとアップグレード
ジョブデザインと開発
2つのtFileInputDelimitedコンポーネントでは、予想される映画データと拒否される映画データをローカルファイルシステムの異なるディレクトリーに書き込むように設定されています。次にこれらのファイルはtAzureStoragePutにより既存のAzure Blobコンテナーにアップロードされます。

手順

  1. out1リンクを受け取るtFileOutputDelimitedコンポーネントをダブルクリックします。

    [Basic settings] (基本設定)ビューがStudioの下側に開きます。

  2. [File Name] (ファイル名)フィールドで、結果を書き込む必要のあるディレクトリーを入力します。このシナリオではC:/tos_bd_gettingstarted_source_files/temps/out.csvです。映画の監督の名前を含むレコードがここに入ります。
  3. [Field separator] (フィールド区切り)フィールドで、二重引用符の間に;を入力します。
  4. Click [Advanced settings] (詳細設定)タブをクリックしてビューを開き、[Throw an error if the file already exists] (ファイルが既に存在する場合はエラーをスローする)チェックボックスをオフにして、コンポーネントが同じ名前の既存のファイルを上書きできるようにします。
  5. 同じ操作を繰り返して、rejectリンクを受け取るtFileOutputDelimitedを設定しますが、[File Name] (ファイル名)フィールドでディレクトリーをC:/tos_bd_gettingstarted_source_files/temps/reject.csvに設定します。
  6. tAzureStoragePutをダブルクリックして、その[Component] (コンポーネント)ビューを開きます。
  7. [Account Name] (アカウント名)フィールドおよび[Account Key] (アカウントキー)フィールドで、使用するAzure Blobストレージアカウントの認証情報を入力します。このストレージアカウントへの適切なアクセス権をシステム管理者から得ていることを確認します。
  8. [Container] (コンテナー)フィールドに、使用するAzure Blobコンテナーの名前を入力します。このコンテナーは既に存在している必要があります。
  9. [Local folder] (ローカルフォルダー)フィールドにtFileOutputDelimitedコンポーネントが出力ファイルを書き込むディレクトリーを入力します。この例では、ディレクトリーはC:/tos_bd_gettingstarted_source_files/tempsになります。
  10. [Azure storage folder] (Azure Storageフォルダー)フィールドでAzureにアップロードするデータを保存するために使用するフォルダーの名前を入力します。存在しない場合、このフォルダーは、上記で[Container name] (コンテナ名)フィールドで指定したコンテナーにただちに作成されます。
  11. [F6]を押してジョブを実行します。

タスクの結果

[Run] (実行)ビューがStudioの下側に自動的に開き、このジョブの実行の進行状況を示します。

完了したら、出力がAzure Blobストレージコンテナーに書き込まれたことを確認できます。