tCassandraOutputBulkExecの標準プロパティ - Cloud - 8.0

Cassandra

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Cassandra
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Cassandra
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Cassandra

このプロパティはStandardジョブフレームワークで実行されているtCassandraOutputBulkExecを設定するために使います。

[Standard] (標準)tCassandraOutputBulkExecコンポーネントは、ビッグデータファミリーとデータベースNoSQLファミリーに属しています。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで利用できます。

基本設定

[Property type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。

[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。

[Schema] (スキーマ)[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続をアップデート): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。

    変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

 

[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

再使用するスキーマに整数またはファンクションのデフォルト値が指定されている場合は、これらのデフォルト値を引用符で囲まないようにご注意ください。引用符で囲まれている場合は手動で削除します。

詳細は、Talend Studioユーザーガイドでテーブルスキーマに関連する説明をご覧ください。

[DB Version] (DBバージョン)

使用するCassandraバージョンを選択します。

[Host] (ホスト)

Cassandraサーバーのホスト名またはIPアドレス。

[Port] (ポート)

Cassandraサーバーのリスニングポート番号。

[Required authentication] (必要な認証)

このチェックボックスをオンにすると、Cassandra認証の認証情報が提供されます。

[Username] (ユーザー名)

このフィールドにCassandra認証のユーザー名を入力します。

このフィールドは、[Required authentication] (必要な認証)チェックボックスがオンになっている場合のみ利用できます。

[Password] (パスワード)

このフィールドにCassandra認証のパスワードを入力します。

パスワードを入力するためには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符で囲んで入力して[OK]をクリックし、設定を保存します。

このフィールドは、[Required authentication] (必要な認証)チェックボックスがオンになっている場合のみ利用できます。

[Keyspace]

SSTableの書き込み先にキースペースの名前を入力します。

[Column family] (カラムファミリー)

SSTableの書き込み先にカラムファミリーの名前を入力します。

[Mapping type] (マッピングタイプ)

マッピングのタイプをドロップダウンリストから選択します。[manual] (手動)を選択した場合は、[Mapping] (マッピング)フィールドに"0=id, 1=name, 2=birthday"のようにマッピングを入力する必要があります。

このフィールドは、お使いのデータベースのバージョンがCassandra 4.x/4.0.xである場合のみ利用できます。

[File name] (ファイル名)

SSTableの書き込み先にファイル名を入力します。

このフィールドは、お使いのデータベースのバージョンがCassandra 4.x/4.0.xである場合のみ利用できます。

[Partitioner] (パーティショナー)

Cassandraクラスター全体でのデータの分散方法を決定するパーティショナーを選択します。

  • ランダム

  • Murmur3

  • [Order preserving] (オーダー保存): キーがUTF8文字列であると想定されているため、推奨されません。

パーティショナーの詳細は、http://wiki.apache.org/cassandra/Partitionersをご覧ください。

このフィールドは、お使いのデータベースのバージョンがCassandra 3.3.x/3.2.x/3.1.x/3.0.xである場合のみ利用できます。

[Schema statement] (スキーマステートメント)

使用するカラムファミリーのスキーマを定義し、オンザフライで作成するステートメントを入力します。

  • このステートメントは、サーバーに送信する前の、このコンポーネントで定義した[SSTable directory] (SSTableディレクトリー)にクエリー結果をローカルで保管するCassandraプリペアドステートメントです。プリペアドステートメントの詳細は、プリペアドステートメントをご覧ください。

  • Cassandraカラムファミリーは、同種のレコードの行のコレクションのコンテナーになります。そのスキーマには、定義したコンポーネントスキーマと厳密に同じカラムが含まれている必要があります。つまり、両方のスキーマのカラム名とカラムの順序を同一にする必要があります。

このスキーマステートメントの例は、[Schema statement] (スキーマステートメント)フィールドに提供されています:
create table ks.tb (id int, name text, birthday timestamp, primary key(id, birthday)) with clustering order by (birthday desc)
[id][name]、および[birthday]カラムを含む[tb]というカラムファミリーがキースペース[ks]の下に作成されます。

カラムファミリーの詳細は、標準カラムファミリーをご覧ください。

このフィールドは、お使いのデータベースのバージョンがCassandra 3.3.x/3.2.x/3.1.x/3.0.xである場合のみ利用できます。

[SSTable directory] (SSTableディレクトリー)

SSTableのローカルディレクトリーを指定します。SSTableへの完全パスは、指定されたキースペース名とカラムファミリー名が追加されたローカルディレクトリーになります。

たとえば、ローカルディレクトリーを/home/talend/sstable、キースペース名としてtestk、カラムファミリー名としてtestcを指定すると、SSTableへの完全パスは/home/talend/sstable/testk/testc/となります。

このフィールドは、お使いのデータベースのバージョンがCassandra 3.3.x/3.2.x/3.1.x/3.0.xである場合のみ利用できます。

[Buffer size] (バッファーサイズ)

Cassandraに書き込まれる前にSSTableが到達する必要があるサイズを指定します。

このフィールドは、お使いのデータベースのバージョンがCassandra 3.3.x/3.2.x/3.1.x/3.0.xである場合のみ利用できます。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

グローバル変数

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、Talend Studioユーザーガイドをご覧ください。

使用方法

使用ルール

このコンポーネントは、データベースにロードするデータが特定の変換を必要としない場合に主に使います。

制限事項

現在、このコンポーネントを実行すると、ジョブ全体が終了します。