tCassandraInput標準プロパティ - 7.3

Cassandra

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Cassandra
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Cassandra
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Cassandra

このプロパティは[Standard] (標準)ジョブフレームワークで実行されているtCassandraInputを設定するために使用します。

[Standard] (標準)tCassandraInputコンポーネントは、ビッグデータおよびデータベースNoSQLファミリーのコンポーネントです。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。

基本設定

[Property type] (プロパティタイプ)

[Built-In] (組み込み)または[Repository] (リポジトリー)のいずれか。

[Built-In] (組み込み): プロパティデータは一元的に保存されません。

[Repository] (リポジトリー): プロパティを保存するリポジトリーファイルを選択します。

[Use existing connection] (デフォルト接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)で該当する接続コンポーネントをクリックします。

[DB Version] (DBバージョン)

使用するCassandraバージョンを選択します。

[API type] (APIタイプ)

このドロップダウンリストは、[DB version] (DBバージョン)リストからCassandra2.0バージョン(非推奨)を選択した場合にのみ表示されます。この[API type] (APIタイプ)リストから[Datastax]を選択して、CassandraでCQL 3(Cassandraクエリー言語)を使用するか、Hector(非推奨)を選択してCQL 2を使用します。

Hector APIはCassandra v2.0のサポートと共に廃止されることにご注意ください。

CQLコマンドの進化に伴い、[Basic settings] (基本設定)ビューで設定できるパラメーターは異なります。

[Host] (ホスト)

Cassandraサーバーのホスト名またはIPアドレス。

[Port] (ポート)

Cassandraサーバーのリスニングポート番号。

[Required authentication] (認証の要求)

このチェックボックスをオンにすると、Cassandra認証の認証情報が提供されます。

このチェックボックスは、[Use existing connection] (既存の接続を使用)チェックボックスをオンにしない場合にのみ表示されます。

[Username] (ユーザー名)

このフィールドにCassandra認証のユーザー名を入力します。

[Password] (パスワード)

このフィールドにCassandra認証のパスワードを入力します。

パスワードを入力するには、パスワードフィールドの横にある[...]ボタンをクリックし、ポップアップダイアログボックスにパスワードを二重引用符の間に入力し、[OK] をクリックして設定を保存します。

[Keyspace]

データを読み取るキースペースの名前を入力します。

[Column family] (カラムファミリー)

データを読み取るカラムファミリーの名前を入力します。

[Schema] (スキーマ)および[Edit Schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを使用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

[Query] (クエリー)

Cassandraデータベースからデータを読み取るために使用するクエリー文を入力します。

デフォルトでは、クエリーの大文字小文字は区別されません。これは、クエリーに含まれるカラム名が実行時は常に小文字で読み取られることを意味しています。クエリーで大文字小文字を区別する必要がある場合は、カラム名を二重引用符で囲みます。

このフィールドの横にある[...]ボタンを使用すると、読み取るデータの定義済み変数とその使用方法を示すサンプルコードを生成できます。

このフィーチャーは、Cassandra 2.0 (非推奨)以降のバージョンの[Datastax]APIでのみ使用できます。

[Column family type] (カラムファミリータイプ)

[Standard] (標準): カラムファミリーは標準タイプです。

[Super] (スーパー): カラムファミリーはスーパータイプです。

[Include key in output columns] (出力カラムにキーを含める)

このチェックボックスをオンにすると、カラムファミリーのキーが出力カラムに含められます。

  • [Key column] (キーカラム): リストからキーカラムを選択します。

[Row key type] (行キータイプ)

リストから、行キーに適切な Talend データタイプを選択します。

[Row key Cassandra type] (行キーCassandraタイプ)

リストから、行キーに対応するCassandraのタイプを選択します。

警告:

[Default] (デフォルト)のオプションの値は、 選択した行キーの種類によって異なります。たとえば、[Row key type] (行キータイプ)リストから [String] (文字列)を選択した場合、[Default] (デフォルト)オプションの値は[UTF8]になり ます。

Cassandraタイプと Talend データタイプの間のマッピングテーブルの詳細は、CassandraタイプおよびTalendデータタイプのマッピング表を参照してください。

[Include super key output columns] (スーパーキー出力カラムを含める

このチェックボックスをオンにすると、カラムファミリーのスーパーキーを出力カラムに含められます。

  • [Super key column] (スーパーキーカラム): リストから目的のスーパーキーカラムを選択します。

このチェックボックスは、[Column family type] (カラムファミリータイプ)ドロップダウンリストから[Super] (スーパー)を選択した場合にのみ表示されます。

[Super column type] (スーパーカラムタイプ)

リストからスーパーカラムのタイプを選択します。

[Super column Cassandra type] (スーパーカラムCassandraタイプ)

リストからスーパーカラムに対応するCassandraタイプを選択します。

CassandraタイプとTalendデータタイプの間のマッピングテーブルの詳細は、CassandraタイプおよびTalendデータタイプのマッピング表を参照してください。

[Specify row keys] (行キーの指定)

このチェックボックスをオンにすると、カラムファミリーの行キーを直接指定できます。

[Row Keys] (行キー)

行キータイプに応じて、カラムファミリーの特定の行キーを正しい形式で入力します。

このフィールドは、[Specify row keys] (行キーの指定)チェックボックスをオンにした場合にのみ表示されます。

[Key start] (キー開始)

正しいデータタイプの開始行キーを入力します。

[Key end] (キー終了)

正しいデータタイプの終了行キーを入力します。

[Key limit] (キー制限)

開始行キーと終了行キーの間で読み取る行の数を入力します。

[Specify columns] (カラムの指定)

このチェックボックスをオンにすると、カラムファミリーのカラム名を直接指定できます。

[Columns] (カラム)

カラムの種類に応じて、カラムファミリーの特定のカラム名を正しい形式で入力します。

このフィールドは、[Specify columns] (カラムの指定)チェックボックスをオンにした場合にのみ表示されます。

[Columns range start] (カラム範囲開始)

正しいデータタイプの開始カラム名を入力します。

[Columns range end] (カラム範囲終了)

正しいデータタイプの終了カラム名を入力します。

[Columns range limit] (カラム範囲制限)

開始カラムと終了カラムの間で読み取るカラムの数を入力します。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントには常に出力リンクが必要です。