tAzureStorageInputTableの標準プロパティ - 7.2

Azure Storage Table

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > クラウドストレージ > Azure > Azure Storage Tableコンポーネント
データガバナンス > サードパーティーシステム > クラウドストレージ > Azure > Azure Storage Tableコンポーネント
データクオリティとプレパレーション > サードパーティーシステム > クラウドストレージ > Azure > Azure Storage Tableコンポーネント

このプロパティはStandardジョブフレームワークで実行されているtAzureStorageInputTableを設定するために使います。

[Standard] (標準) tAzureStorageInputTableコンポーネントは、Cloudファミリーに属しています。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで利用できます。

基本設定

[Property Type] (プロパティタイプ)

接続の詳細を設定する方法を選択します。

  • [Built-In] (組み込み): このコンポーネントの接続の詳細がローカルに設定されます。関連するすべての接続のプロパティ値を手動で指定する必要があります。

  • [Repository] (リポジトリー): [Repository] (リポジトリー) > [Metadata] (メタデータ)で一元的に保存された接続の詳細が、このコンポーネントによって再使用されます。このチェックボックスのとなりにある [...] ボタンをクリックし、表示された [Repository Content] (リポジトリーの内容)ダイアログボックスで、再使用する接続の詳細を選択すると、関連するすべての接続のプロパティに値が自動的に入力されます。

[Connection Component] (接続コンポーネント)ドロップダウンリストから他の接続コンポーネントを選択した場合、このプロパティは利用できません。

[Connection Component] (接続コンポーネント)

ドロップダウンリストで、Azure Storageへの接続を設定するために接続の詳細を使用するコンポーネントを選択します。

アカウント名

アクセスする必要のあるストレージアカウントの名前を入力します。ストレージアカウント名は、使用するMicrosoft Azure Storageシステムのストレージアカウントダッシュボード内にあります。このストレージアカウントへの適切なアクセス権をシステム管理者から得ていることを確認します。

[Account key] (アカウントキー)

アクセスする必要のあるストレージアカウントに関連付けられたキーを入力します。どのアカウントにも使用できるキーが2つあり、デフォルトでは、どちらもこのアクセスに使用できます。

[Protocol] (プロトコル)

作成する接続のプロトコルを選択します。

Use Azure Shared Access Signature

アカウントキーを使用せずにストレージリソースにアクセスするには、このチェックボックスをオンにしてShared Access Signature (SAS)を使用します。詳細は、Using Shared Access Signatures (SAS)をご覧ください。

表示される[Azure Shared Access Signature]フィールドに、アカウントのSAS URLを二重引用符で囲んで入力します。SASの生成後に、Microsoft Azureポータルで許可されている各サービスのSAS URLが取得できます。SAS URLの形式はhttps://<$storagename><$service>.core.windows.net/<$sastoken>となります。<$storagename>はストレージアカウント名、<$service>は許可されているサービスの名前(Blobfilequeuetableのいずれか)、<$sastoken>はSASトークンの値です。詳細は、Constructing the Account SAS URIをご覧ください。

SASの期間が有効であることをご確認ください。SASが有効となる開始時刻と無効となる有効期限を生成時に設定できます。また、ジョブの実行時にSASがまだ有効であることを確認する必要があります。

[Table name] (テーブル名)

エンティティの取得元となるテーブルの名前を指定します。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

  • [Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

  • [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

このコンポーネントのスキーマは、各エンティティの3つのシステムプロパティを説明する次のカラムで事前定義されています。

  • PartitionKey: エンティティが属するパーティションのパーティションキー。

  • RowKey: パーティション内のエンティティの行キー。

    PartitionKeyRowKeyは、テーブル内のすべてのエンティティを一意に識別する文字列型の値であり、ユーザーはすべての挿入、更新、削除操作にそれらを含める必要があります。

  • [Timestamp] (タイムスタンプ): エンティティが最後に変更された時刻。このDateTime値は、Azureサーバーによって維持され、ユーザーが変更することはできません。

これらのシステムプロパティの詳細は、Understanding the Table service data modelを参照してください。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

フィルターの式を使用

このチェックボックスをオンにし、表示される[Filter expressions] (フィルター式)テーブルに入力して、取得するエンティティのフィルターに使う条件を指定します。[+]ボタンをクリックして必要な数の行(1つの条件に1行)を追加し、各条件に次のパラメーターの値を設定します。

  • [Column] (カラム): 条件を適用するプロパティの名前を指定します。
  • [Function] (関数): セルをクリックし、ドロップダウンリストから使う比較演算子を選択します。
  • [Value] (値): プロパティの比較に使う値を指定します。
  • [Predicate] (述語): 条件を組み合わせるために使う述語を選択します。
  • [Field type] (フィールドタイプ): セルをクリックして、ドロップダウンリストからカラムのタイプを選択します。

生成されたフィルター式は、読み取り専用の[Effective filter] (有効なフィルター)フィールドに表示されます。

フィルター式の詳細は、Querying tables and entitiesを参照してください。

[Die on error] (エラー発生時に強制終了)

このチェックボックスをオンにすると、エラー発生時にジョブの実行が停止されます。

詳細設定

名前のマッピング

コンポーネントスキーマのカラム名をAzureテーブルエンティティのプロパティ名にマップするには、このテーブルに入力します(両者が異なる場合)。

  • [Schema column name] (スキーマカラム名): コンポーネントスキーマのカラム名を二重引用符で囲んで入力します。
  • [Entity property name] (エンティティプロパティ名): Azureテーブルエンティティのプロパティ名を二重引用符で囲んで入力します。

たとえば、3つのスキーマカラムCompanyIDEmployeeIDEmployeeNameがある場合、これらはそれぞれ、PartitionKeyRowKeyNameエンティティプロパティの値をフィードするために使われます。カラムPartitionKeyRowKeyは既に自動的にスキーマに追加されており、それらのマッピング関係を指定する必要がないからです。必要な操作は、1つの行を追加して、Azureテーブルからデータを取得する時に[Schema column name] (スキーマカラム名)セルの値を"EmployeeName"に、[Entity property name] (エンティティプロパティ名)セルの値を"Name"に設定して、EmployeeNameカラムのマッピング関係を指定する ことだけです。

[tStatCatcher Statistics] (tStatCatcher統計情報)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

NB_LINE

処理された行数。これはAfter変数で、整数を返します。

ERROR_MESSAGE

エラー発生時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。

使用方法

[Usage rule] (使用ルール)

このコンポーネントは通常、ジョブまたはサブジョブの開始コンポーネントとして使い、常に出力リンクが必要です。