tNeo4jOutput標準プロパティ - 7.2

Neo4j

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

これらのプロパティを使用して、標準ジョブフレームワークで実行されているtNeo4jOutputを設定します。

Standard tNeo4jOutputコンポーネントはビッグデータファミリーとデータベースNoSQLファミリーのコンポーネントです。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。

基本設定

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)で該当する接続コンポーネントをクリックします。

[DB version] (DBバージョン)

使用しているNeo4jバージョンを選択します。

このコンポーネントはNeo4jバージョンV3.2.Xをサポートしていません。tNeo4jConnectionコンポーネントで定義したV3.2.Xへの接続を再利用しないでください。

2.X.Xバージョンと3.X.Xバージョンを同じジョブで使用しないでください。使用するとクラスコンフリクトの問題が発生します。

Neo4jバージョン2.X.XはJava 7以降に対してのみ互換性があります。ただし、ノードラベルのような高度な機能をサポートしています。

このリストは、[Use an existing connection] (既存の接続を使用)チェックボックスがオンの場合には表示されません。

データベースバージョンを選択すると、対応するデータベースドライバーJARファイルをインストールするように指示されます(まだインストールしていない場合)。詳細は、外部モジュールのインストールを参照してください。外部モジュールをインストールする方法の詳細は、Talend Help Center (https://help.talend.com)を参照してください。

[Remote server] (リモートサーバー)

Neo4jリモートサーバーを使用する場合は、このチェックボックスをオンにして、[Server URL] (サーバーURL)フィールドでルートURLを指定します。

  • [Set username] (ユーザー名の設定): このチェックボックスは、[Use a remote server] (リモートサーバーの使用)チェックボックスがオンで、使用しているNeo4jバージョンが2.2よりも古い場合に使えます。接続先とするリモートNeo4jサーバーがユーザー認証情報を必要としない場合は、チェックボックスをオフのままにしておきます。

  • [Username] (ユーザー名)[Password] (パスワード): 認証情報を入力し、使用するリモートNeo4jサーバーに接続します。Neo4j 2.2以降、ユーザー認証情報は常に求められます。

このチェックボックスは、[Use an existing] (既存の接続を使用)チェックボックスをオンにしない場合にのみ表示されます。

[Database path] (データベースパス)

Neo4jを埋め込みモードで使用する場合は、データファイルを保存するディレクトリーを指定します。指定のディレクトリーが存在しない場合は、作成されます。

このフィールドは、[Use an existing connection] (既存の接続を使用)チェックボックスまたは[Remote server] (リモートサーバー)チェックボックスがオフの場合にのみ表示されます。

[Shutdown after job] (ジョブ後にシャットダウン)

現在のコンポーネントの後にNeo4jに対して実行するオペレーションがない場合は、このチェックボックスをオンにしてNeo4jデータベース接続をシャットダウンします。

または、tNeo4jCloseを使用してデータベースをシャットダウンします。

こうすることで、Neo4jが関係するジョブを次回実行する時に、[Id file not properly shutdown] (IDファイルが正しくシャットダウンされていません)"のようなエラーを回避できます。

このチェックボックスは、[Use an existing connection] (既存の接続を使用)チェックボックスがオフの場合にのみ使用できます。

Mapping (マッピング)

[...]ボタンをクリックするか、またはデザインワークスペースのコンポーネントをダブルクリックして、インデックスと関係マッピングエディターを開きます。ノードの挿入中にこれを使用して、ノードにインデックスを付けるか、または関係を作成します。

  • このプロパティでノードに自動的にインデックスを付けるには、カラムの[Auto indexed] (自動インデックス付け)チェックボックスをオンにします。
  • [Index creation] (インデックスの作成): カラムを選択した状態で[+]ボタンをクリックして、選択したカラムに対応するプロパティと共に、ノードに必要な数のインデックスを作成します。
    • [Name] (名前): 二重引用符内にインデックス名を指定します。
    • [Key] (キー): 二重引用符内にインデックスキーを指定します。
    • [Value (empty for current row)] (値(現在の行は空に)): 二重引用符内にインデックス値を指定します。このフィールドを空のままにしておくと、各ノードに追加されたインデックスのデフォルト値が、現在のノードのこのプロパティ値になります。
    • [Unique] (ユニーク): 定義したインデックスが、各ノードではなく、グラフ内に一度だけ作成されるようにするには、このチェックボックスをオンにします。
  • [Relationship creation] (関係の作成): カラムを選択した状態で[+]ボタンをクリックして、選択したカラムに対応するプロパティと共に、ノードに必要な数の関係を作成します。
    • [Type] (タイプ): 二重引用符内に関係のタイプを指定します。
    • [Direction] (方向): 関係の方向として、[Outgoing] (出力)[Incoming] (入力)を選択します。
    • [Index name] (インデックス名): 二重引用符内に関係のインデックス名を指定します。
    • [Index key] (インデックスキー): 二重引用符内に関係のインデックスキーを指定します。
    • [Value (empty for current row)] (値(現在の行は空に)): 二重引用符内に関係のインデックス値を指定します。このフィールドを空のままにしておくと、関係に追加されたインデックスのデフォルト値が、現在のノードのこのプロパティ値になります。

[Use label (Neo4j > 2.0)] (ラベルの使用(Neo4j > 2.0))

ノードとラベルを作成するには、このチェックボックスをオンにします。[Label name] (ラベル名)フィールドにラベル名を入力します。

[DB Version] (DBバージョン)リストでNeo4J 1.X.Xを選択しているか、または[Data action] (データのアクション)リストで[Delete] (削除)を選択している場合、このチェックボックスは表示されません。

このオプションは、Neo4j 2.0以降およびJava 7でのみ使用できます。

データのアクション

ノードのデータに対し、次の処理を実行できます。

  • [Insert:] (挿入:)データベースに新しいノードを追加します。
  • [Update:] (更新:)既存のエントリに変更を加えます。
  • [Update or insert:] (更新または挿入:)インデックスでノードを検索し、更新および変更を行います。ノードが存在しない場合は、新しいノードが挿入されます。
  • [Delete:] (削除:)入力フローに従いインデックスによって取得されたノードを削除します。

インデックス名

クエリーするインデックス名を指定します。

このフィールドは、[Data action] (データのアクション)で選択しているアクションが[Insert] (挿入)以外である場合にのみ使用できます。

[Index key] (インデックスキー)

クエリーするインデックスキーを指定します。

このフィールドは、[Data action] (データのアクション)で選択しているアクションが[Insert] (挿入)以外である場合にのみ使用できます。

[Index value] (インデックス値)

クエリーするインデックス値を選択します。

このフィールドは、[Data action] (データのアクション)で選択しているアクションが[Insert] (挿入)以外である場合にのみ使用できます。

[Schema] (スキーマ)および[Edit schema] (スキーマを編集)

スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。

スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを使用できます。

  • [View schema] (スキーマの表示): スキーマのみを表示する場合は、このオプションを選択します。

  • [Change to built-in property] (組み込みのプロパティに変更): ローカルで変更を行うためにスキーマを組み込みに変更する場合は、このオプションを選択します。

  • [Update repository connection] (リポジトリー接続を更新): リポジトリーに保存されているスキーマに変更を加え、変更後にそのコンテンツをすべてのジョブにプロパゲートするかどうかを決める場合は、このオプションを選択します。変更を現在のジョブにのみ反映する場合は、変更後、[No] (いいえ)を選択し、[Repository Content] (リポジトリーのコンテンツ)ウィンドウで再びこのスキーマのメタデータを選択します。

 

[Built-in] (組み込み): そのコンポーネントのみのスキーマを作成して、ローカルに保存します。

 

[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。

再使用するスキーマに整数またはファンクションのデフォルト値が指定されている場合は、これらのデフォルト値を引用符で囲まないようにご注意ください。引用符で囲まれている場合は手動で削除します。

詳細は、Talend Studioユーザーガイドでテーブルスキーマに関連する説明を参照してください。

詳細設定

[Commit every] (コミット間隔)

ノードのバッチがDBにコミットされるまでに完了しているべき行数を入力します。このオプションにより、トランザクションの質(ただしロールバックは含まない)、特に実行時のパフォーマンスの向上が保証されます。

警告: このオプションは、データベースの埋め込みモードでのみサポートされています。RESTモードでトランザクションを行うことはできません。

[Batch import] (バッチインポート)

バッチモードを有効にするには、このチェックボックスをオンにします。

警告:
  • このオプションは、データベースの埋め込みモードでのみサポートされています。
  • データの破損を避けるには、ジョブを実行する前にバックアップオペレーションを実行することをお勧めします。
注: 複数カラムに対するインデックスの作成を[Mapping]テーブルで設定した場合は、不要な冗長インデックスが作成されることを避けるために、最後のカラムのインデックス設定で[Unique] (ユニーク)チェックボックスをオンにすることをお勧めします。不要な冗長インデックスは、バッチロードの問題が発生する原因となります。

バッチインポートのメモリマッピング設定に関する説明が必要な場合は、http://neo4j.com/docs/stable/batchinsert-examples.htmlでNeo4jのドキュメンテーションを参照してください。

[Node store mapped memory] (ノード格納のmapped memory)

ノードに割り当てられているメモリサイズをMBで入力します。

[Relationship store mapped memory] (関係格納mapped memory)

関係に割り当てられているメモリサイズをMBで入力します。

[Property store mapped memory] (プロパティ格納mapped memory)

プロパティに割り当てられているメモリサイズをMBで入力します。

[String store mapped memory] (文字列格納mapped memory)

文字列に割り当てられているメモリサイズをMBで入力します。

[Array store mapped memory] (配列格納mapped memory)

配列に割り当てられているメモリサイズをMBで入力します。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントは出力コンポーネントとして使用され、常に着信リンクが必要です。
制限事項 N/A