tAzureAdlsGen2Outputの標準プロパティ - 7.3

Azure Data Lake Store

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > クラウドストレージ > Azure > Azure Data Lake Storage Gen2コンポーネント
データガバナンス > サードパーティーシステム > クラウドストレージ > Azure > Azure Data Lake Storage Gen2コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > クラウドストレージ > Azure > Azure Data Lake Storage Gen2コンポーネント
Last publication date
2023-08-08

これらのプロパティは、標準ジョブのフレームワークで実行されているtAzureAdlsGen2Outputを設定するために使われます。

標準tAzureAdlsGen2Outputコンポーネントは、Cloudファミリーに属しています。

このフレームワークのコンポーネントは、すべてのサブスクリプションベースのTalend製品で利用できます。

基本設定

[Property Type] (プロパティタイプ)

接続の詳細を設定する方法を選択します。

  • [Built-In] (組み込み): このコンポーネントの接続の詳細がローカルに設定されます。関連するすべての接続のプロパティ値を手動で指定する必要があります。

  • [Repository] (リポジトリー): [Repository] (リポジトリー) > [Metadata] (メタデータ)で一元的に保存された接続の詳細が、このコンポーネントによって再使用されます。このチェックボックスの横にある [...] ボタンをクリックし、表示された [Repository Content] (リポジトリーの内容)ダイアログボックスで、再使用する接続の詳細を選択すると、関連するすべての接続のプロパティに値が自動的に入力されます。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

  • [Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

  • [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。
注: 変更を加えると、スキーマは自動的に組み込みになります。
  • [View schema] (スキーマを表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

[Sync colnmns] (カラムの同期)

このボタンをクリックすると、ジョブで接続されている先行コンポーネントからスキーマが取得されます。

[Authentication method] (認証方式)

ドロップダウンリストで、次の認証方式を1つ選択します。

  • [Shared key] (共有キー)アカウントアクセスキーが必要です。関連情報は、Manage a storage accountをご覧ください。
  • [Shared Access Signatures] (共有アクセス署名): 共有アクセス署名が必要です。詳細は、Constructing the Account SAS URIをご覧ください。
  • Azure Active Directory: このオプションを選択すると、接続を確立する時にAzure Active Directory認証を使用できます。関連情報は、Azure AD Authenticationをご覧ください。
注: Azure Active Directoryオプションは、TalendのR2020-06以降のStudioマンスリーアップデートをインストール済みである場合のみ利用できます。詳細は管理者にお問い合わせください。

[Account name] (アカウント名)

アクセスする必要のあるData Lake Storageアカウントの名前を入力します。このアカウントへの適切なアクセス権をシステム管理者から得ていることを確認します。

[Endpoint suffix] (エンドポイントサフィックス)

Azure Storageのサービスエンドポイントを入力します。

アカウント名とAzure Storageサービスエンドポイントの組み合わせにより、ストレージアカウントのエンドポイントが形成されます。

[Shared key] (共有キー)

アクセスする必要のあるストレージアカウントに関連付けられたキーを入力します。どのアカウントでも利用できるキーが2つあり、このアクセスにはデフォルトでどちらのキーも使用できます。キーの取得方法については、Manage a storage accountをお読みください。

このフィールドは、[Authentication method] (認証方法)ドロップダウンリストで[Shared key] (共有キー)を選択した場合に利用できます。

[SAS token] (SASトークン)

自分のアカウントのSASトークンを入力します。SASが生成された後は、Microsoft Azureポータルで許可されている各サービスのSASトークンを取得できます。SASトークンの形式はhttps://<$storagename><$service>.core.windows.net/<$sastoken>となります。<$storagename>はストレージアカウント名、<$service>は許可されているサービスの名前(Blob、file、queue、またはtable)、<$sastoken>はSASトークンの値です。詳細は、「Constructing the Account SAS URI」(Account SAS URIの構築)をお読みください。

このフィールドは、[Authentication method] (認証方法)ドロップダウンリストから [Shared access signature] (共有アクセス署名)を選択した場合に使用できます。

[Check connection] (接続を確認)

このボタンをクリックすると、提供された接続パラメーターを検証できます。

[Check connection] (ファイルシステム)

ターゲットBlobコンテナーの名前を入力します。

このフィールドの右側にある[...]ボタンをクリックして、ダイアログボックスのリストから目的のBlobコンテナーを選択することもできます。

[Blobs Path] (ブロブパス)

ターゲットBLOBへのパスを入力します。

[Format] (形式)

受信データの形式を設定します。現在、次の形式がサポートされています: CSVAVROJSON、およびParquet

[Field Delimiter] (フィールド区切り)

フィールド区切りを指定ドロップダウンリストで、 [Semicolon] (セミコロン)[Comma] (コンマ)[Tabulation] (集計)、および[Space] (スペース)を選択できます。 [Other] (その他)を選択して、[Custom field delimiter] (カスタムフィールド区切り)cxvフィールドに独自の項目を入力することもできます。

[Record Separator] (レコード区切り)

レコード区切りを設定するために使われます。ドロップダウンリストでは、LFCRCRLFを選択できます。[Other] (その他)を選択して[Custom Record Separator] (カスタムのレコード区切り)フィールドに独自の文字を入力することもできます。

[Text Enclosure Character] (テキストエンクロージャー文字)

テキストを囲むために使用される文字を入力します。

[Escape character] (エスケープ文字)

エスケープする行の文字を入力します。

[Header] (ヘッダー)

データにヘッダー行を挿入する場合は、このチェックボックスをオンにします。スキーマのカラム名がカラムヘッダとして使用されます。

[File Encoding] (ファイルエンコーディング)

ドロップダウンリストでファイルエンコーディングを選択します。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

[Max batch size] (最大バッチサイズ)

各バッチで許可される最大行数を設定するために使われます。

パフォーマンスの問題が発生している場合を除き、デフォルト値は変更しないでください。バッチサイズを増やすとパフォーマンスが向上しますが、値が大きすぎるとジョブが失敗する可能性があります。

[Blob Template Name] (Blobテンプレート名)

生成されたBlobファイルの名前プレフィックスとして文字列を入力します。生成されるBlobファイルの名前は、名前のプレフィックスとそれに続く別の文字列になります。

グローバル変数

ERROR_MESSAGE

エラー発生時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。

NB_LINE

正しく処理された行数。これはAfter変数で、整数を返します。

使用方法

使用ルール

このコンポーネントは通常、ジョブまたはサブジョブの終了コンポーネントとして使い、常に入力リンクが必要です。