tAmazonAuroraOutputの標準プロパティ - 7.3

Amazon Aurora

Version
7.3
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > Amazonサービス > Amazon Aurora
データガバナンス > サードパーティーシステム > Amazonサービス > Amazon Aurora
データクオリティとプレパレーション > サードパーティーシステム > Amazonサービス > Amazon Aurora
Last publication date
2024-02-22

これらのプロパティは、標準ジョブのフレームワークで実行されているtAmazonAuroraOutputを設定するために使われます。

標準tAmazonAuroraOutputコンポーネントは、Cloudファミリーとデータベースファミリーに属しています。

このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。

注: このコンポーネントは、動的データベースコネクターの特定のバージョンです。データベース設定に関連するプロパティは、データベースタイプの選択に応じて異なります。動的データベースコネクターについては、動的データベースコンポーネントをご覧ください。

基本設定

[Database] (データベース)

データベースのタイプをリストから選択し、[Apply] (適用)をクリックします。

[Property Type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

 

[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。

 

[Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。続くデータベース接続フィールドは、取得されたデータを使用して自動的に入力されます。

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用する場合は、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)ドロップダウンリストから、目的の接続コンポーネントを選択します。

注: ジョブに親ジョブと子ジョブが含まれている時は、2つのレベルの間の既存の接続を共有する必要がな場合(たとえば、親ジョブで作成した接続を子ジョブと共有するなど)には、以下を実行する必要があります。
  1. 親レベルで、共有するデータベース接続を、そのデータベース接続そのものを作成する接続コンポーネントの[Basic settings] (基本設定)ビューに登録します。

  2. 子レベルで、登録済みのそのデータベース接続を読み取るために専用の接続コンポーネントを使用します。

ジョブレベル全体でデータベース接続を共有する方法の例は、Talend Studioユーザーガイドをご覧ください。

[Host] (ホスト)

Amazon AuroraデータベースのIPアドレスまたはホスト名を入力します。

[Port] (ポート)

Amazon Auroraデータベースのリッスンポート番号を入力します。

データベース

使用するデータベースの名前を入力します。

[Username] (ユーザー名)[Password] (パスワード)

データベースユーザー認証データを入力します。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、OKをクリックして設定を保存します。

[Table] (テーブル)

書き込むテーブルの名前を入力します。一度に1つのテーブルしか書き込めないことにご注意ください。

[Action on table] (テーブルでのアクション)

定義済みのテーブルで、次のオペレーションの1つを実行できます。

  • [None] (なし): 操作は行われません。

  • [Drop and create table] (ドロップしてテーブルを作成): テーブルが削除され、再作成されます。

  • [Create table] (テーブルを作成): テーブルが存在しないため、作成されます。

  • [Create table if not exists] (テーブルが存在しない場合は作成): テーブルが存在しない場合は作成されます。

  • [Drop table if exists and create] (テーブルが存在する場合はドロップして作成): テーブルが既に存在する場合は削除されて再作成されます。

  • [Clear table] (テーブルをクリア): テーブルの内容が削除されます。

  • [Truncate table] (テーブルを切り詰め): テーブルのコンテンツがすぐに削除されます。ただし、オペレーションをロールバックすることはできません。

[Action on data] (データでのアクション)

定義済みテーブルのデータで、次の操作の1つを実行できます。

  • [Insert] (挿入): テーブルに新しいエントリー-が追加されます。重複が見つかると、ジョブは停止します。

  • [Update] (アップデート): 既存のエントリーが変更されます。

  • [Insert or update] (挿入またはアップデート): 新しいレコードを挿入します。指定された参照を持つレコードが既に存在する場合は、アップデートされます。

  • [Update or insert] (アップデートまたは挿入): 指定された参照を使用してレコードをアップデートします。レコードが存在しない場合は、新しいレコードが挿入されます。

  • [Delete] (削除): 入力フローに対応するエントリーを削除します。

  • [Replace] (置換): テーブルに新しいエントリーを追加します。プライマリキーまたはユニークなインデックスで、テーブル内の古い行に新しい行と同じ値のものがある場合は、新しい行が挿入される前に古い行が削除されます。

  • [Insert or update on duplicate key or unique index] (重複キーまたはユニークなインデックスの挿入またはアップデート): 挿入する値が存在しない場合は、エントリーを追加します。挿入する値が既に存在し、ユニークなインデックスまたはプライマリキーに違反するリスクがある場合は、エントリーをアップデートします。

  • [Insert Ignore]: 重複キーエラーを防ぐために新しい行のみ追加します。

警告:

[Update] (アップデート)[Delete] (削除)操作のベースとなるプライマリキーとして、少なくとも1つのカラムを指定する必要があります。それには、[Edit schema] (スキーマを編集) をクリックし、プライマリキーに指定するカラムの横にあるチェックボックスをオンにします。高度な用途として、[Advanced settings] (詳細設定)ビューをクリックし、アップデートおよび削除オペレーションのプライマリキーを同時に定義することもできます。これを設定するには、以下のようにします:[Use field options] (フィールドオプションの使用)チェックボックスをオンにし、[Key in update column] (アップデートカラムの入力)で、アップデート操作のベースとするカラム名の横にあるチェックボックスをオンにします。削除操作についても、[Key in delete column] (削除カラムのキー)で同じ手順を実行します。

ダイナミックスキーマ機能は以下のモードで使用できます: [Insert] (挿入)[Update] (アップデート)[Insert or update] (挿入またはアップデート)[Update or insert] (アップデートまたは挿入)[Delete] (削除)

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

このコンポーネントは、ダイナミックスキーマ機能の利点を備えているので、ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、Talend Studioユーザーガイドをご覧ください。

このダイナミックスキーマ機能は、テーブルの不明なカラムを取得する目的で設計されており、この目的に限り使用をお勧めします。テーブルの作成で使用することは勧められていません。

 

[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

再使用するスキーマに整数またはファンクションのデフォルト値が指定されている場合は、これらのデフォルト値を引用符で囲まないようにご注意ください。引用符で囲まれている場合は手動で削除します。

詳細は、Talend Studioユーザーガイドでテーブルスキーマに関連する説明をご覧ください。

 

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマを表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

[Specify a data source alias] (データソースエイリアスを指定)

このチェックボックスをオンにして、データソース設定で定義した共有接続プールを使用するために、 Talend Runtime 側で作成したデータソースのエイリアスを指定します。このオプションは、 Talend Runtime 内にジョブをデプロイして実行する時にのみ機能します。

このチェックボックスは、[Use an existing connection] (既存の接続を使用)チェックボックスをオンにすると表示されなくなります。

[Data source alias] (データソースエイリアス)

Talend Runtime 側に作成されたデータソースのエイリアスを入力します。

このフィールドは、[Specify a data source alias] (データソースのエイリアスの指定)チェックボックスが選択される場合にのみ表示されます。

[Die on error] (エラー発生時に強制終了)

このチェックボックスはデフォルトで選択されています。エラーの発生した行をスキップし、エラーが発生していない行の処理を完了するには、このチェックボックスをオフにします。必要に応じて[Row] (行) > [Rejects] (リジェクト)リンクを使用してエラーの発生している行を取得できます。

詳細設定

[Additional JDBC parameters] (追加のJDBCパラメーター)

作成するデータベース接続に接続の追加プロパティを指定します。

[Basic settings] (基本設定]ビューの[Use an existing connection] (既存の接続を使用)チェックボックスをオンにすると、このフィールドは表示されなくなります。

注:

事前定義済みのグローバル変数のリストにアクセスするには、[Ctrl] + [Space]を押します。

挿入の拡張

行を1つずつ挿入するのでなく、指定した一連の行を一括挿入するには、このチェックボックスをオンにします。システムパフォーマンスが大幅に向上します。

このチェックボックスは、[Basic settings] (基本設定)ビューの[Action on data] (データでのアクション)リストで[Insert] (挿入)オプションが選択されている場合にのみ使用できます。

注:

このオプションは[Reject] (リジェクト)リンクと互換性がありません。したがって、このコンポーネントに[Row] (行) > [Rejects] (リジェクト)リンクを使用する場合は、このチェックボックスをオフにする必要があります。

[Number of rows per insert] (挿入あたりの行数)

オペレーションごとに挿入される行数を指定します。指定する値が大きいほどメモリの使用量が増えるため、パフォーマンスがその分低下します。

このフィールドは、[Extend Insert] (拡張インサート)チェックボックスが選択される場合にのみ表示されます。

[Use Batch] (バッチを使用)

このチェックボックスをオンにして、データ処理のバッチモードを有効にします。

このチェックボックスは、[Basic settings] (基本設定)ビューの[Action on data] (データでのアクション)リストから[Update] (アップデート)または[Delete] (削除)オプションが選択されている場合にのみ使用できます。

[Batch Size] (バッチサイズ)

各バッチで処理するレコードの数を指定します。

このフィールドは、[Use batch mode] (バッチモードを使用)チェックボックスがオンの場合のみ表示されます。

[Commit every] (コミットする間隔)

データベースにコミットされる前にバッチに含める行数を入力します。このオプションにより、トランザクションの質(ただしロールバックは含まない)、特に高いパフォーマンスレベルが保証されます。

追加のカラム

このオプションにより、SQLファンクションを呼び出してカラムにアクションを実行できます。ただし、挿入、アップデート、削除のアクションでないこと、事前処理を必要とするアクションでないことが条件です。このオプションは、データベーステーブルを作成したばかりの時は利用できません(事前に削除した場合でも)。テーブルの下の[+]ボタンをクリックしてカラムを追加し、各カラムに次のパラメーターを設定するために使われます。

  • [Name] (名前): 変更または挿入するスキーマカラムの名前を入力します。

  • [SQL expression:] (SQL式): 対応するカラム内のデータを変更する、またはカラム内にデータを挿入するために実行するSQLステートメントを入力します。

  • [Position] (位置):参照カラムに対して実行されるアクションに応じて、[Before] (実行前)[After] (実行後)または[Replace] (置換)を選択します。

  • [Reference column] (参照カラム): 新しいカラム、または変更するカラムを探すか、または置換するためにtAmazonAuroraOutput使える参照カラムを入力します。

フィールドオプションの使用

対応するカラムのリクエストをカスタマイズする場合、特に、データに対して複数のアクションが実行される場合に、このチェックボックスをオンにします。

  • [Key in update] (キー入力アップデート): データのアップデートに基づいて対応するカラムのチェックボックスをオンにします。

  • [Key in delete] (削除の入力): データ削除の基準とする対応するカラムのチェックボックスをオンにします。

  • [Updatable] (アップデート可能): 対応するカラムのデータをアップデートできる場合は、チェックボックスをオンにします。

  • 挿入可能: 対応する列のデータを挿入できる場合は、チェックボックスをオンにします。

[Use Hint Options] (Hint句を使用)

クエリーの実行を最適化するためのヒントを設定するには、このチェックボックスをオンにします。

[Hint Options] (ヒントオプション)

テーブルの下の[+]ボタンをクリックしてヒントを追加し、各ヒントに次のパラメーターを設定するために使われます。このテーブルは、[Use Hint Options] (ヒントオプションの使用)チェックボックスが選択されている場合にのみ表示されます。

  • [HINT] (ヒント):構文/*+ */を使って、必要とするヒントを指定します。

  • [POSITION] (位置):SQLステートメントのどこにヒントを置くかを指定します。

  • SQL STMT*: 使用するSQLステートメント[INSERT] (挿入), [UPDATE] (アップデート)、または[DELETE] (削除)を選択します。

[Debug query mode] (デバッグクエリーモード)

このチェックボックスをオンにすると、データベースのエントリーの処理中に各ステップが表示されます。

[Use duplicate key update mode insert] (重複キーアップデートモードの挿入を使用)

このチェックボックスをオンにしてONDUPLICATE KEY UPDATEモードをアクティブにし[+]表示されたテーブルの下のボタンをクリックして、アップデートするカラムを追加し、対応するカラムで実行するアップデートアクションを指定します。

  • [Column] (カラム): アップデートするカラムの名前を入力します。

  • [Value] (値):カラムに対して実行するアクションを入力します。

このチェックボックスは、[Basic settings] (基本設定)ビューの[Action on data] (データでのアクション)リストから[Insert] (挿入)オプションが選択されている場合にのみ有効です。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

グローバル変数

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

NB_LINE_UPDATED: アップデートされた行の数。これはAfter変数で、整数を返します。

NB_LINE_INSERTED: 挿入された行の数。これはAfter変数で、整数を返します。

NB_LINE_DELETED: 削除された行の数。これはAfter変数で、整数を返します。

NB_LINE_REJECTED: 拒否された行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、Talend Studioユーザーガイドをご覧ください。

使用方法

使用ルール

このコンポーネントは、出力コンポーネントとして使用する必要があります。このコンポーネントを使って、Amazon Auroraデータベース内のテーブルまたはテーブルのデータにアクションを実行できます。また、[Row] (行) > [Rejects] (リジェクト)リンクを使って、エラーのあるデータをフィルタリングするリジェクトフローを作成することもできます。同様のシナリオについては、をご覧ください。

[Dynamic settings] (ダイナミック設定)

[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からデータベース接続をダイナミックに選択します。この機能は、データストラクチャーが同じでデータベースが異なるデータベーステーブルにアクセスする必要がある場合、特に、Talend Studioを介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。

[Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。

ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。