tNeo4jBatchOutput標準プロパティ - 7.2

Neo4j

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

このプロパティはStandardジョブフレームワークで実行されているtNeo4jBatchOutputを設定するために使います。

Standard tNeo4jBatchOutputコンポーネントはビッグデータファミリーとデータベースNoSQLファミリーのコンポーネントです。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。

基本設定

[Use an existing connection] (既存の接続を使用)

定義済みの接続の詳細を再利用するには、このチェックボックスをオンにして、[Component List] (コンポーネントリスト)で該当する接続コンポーネントをクリックします。

このコンポーネントはNeo4jバージョンV3.2.Xのみをサポートしており、リモートモードはサポートしていません。したがって、tNeo4jConnectionコンポーネントで定義したV3.2.X以外のバージョンへの接続を再利用しないでください。また、tNeo4jConnection[Remote server] (リモートサーバー)チェックボックスをオンにしないでください。

2.X.Xバージョンと3.X.Xバージョンを同じジョブで使用しないでください。使用するとクラスコンフリクトの問題が発生します。

[Database path] (データベースパス)

データファイルを保存するディレクトリーを指定します。指定のディレクトリーが存在しない場合は、作成されます。

このフィールドは、[Use an existing] (既存の接続を使用)チェックボックスがオフの場合にのみ表示されます。

[Shutdown after job] (ジョブ後にシャットダウン)

現在のコンポーネントの後にNeo4jに対して実行するオペレーションがない場合は、このチェックボックスをオンにしてNeo4jデータベース接続をシャットダウンします。

または、tNeo4jCloseを使用してデータベースをシャットダウンします。

こうすることで、Neo4jが関係するジョブを次回実行する時に、[Id file not properly shutdown] (IDファイルが正しくシャットダウンされていません)"のようなエラーを回避できます。

このチェックボックスは、[Use an existing connection] (既存の接続を使用)チェックボックスがオフの場合にのみ使用できます。

[Field that contains the label list] (ラベルリストを含むフィールド)

前のコンポーネントで定義した入力スキーマからカラムを選択して、作成するノードにラベルを付けます。

入力データがノードに複数のラベルを提供する場合は、前のコンポーネントでラベルをセミコロン(;)で区切ります。

[Index name] (インデックス名)

ノード用に作成するインデックスの名前を二重引用符で囲んで入力します。このインデックスは、ノードの識別子の保管に使われ、関係の作成に役立ちます。

[Import identifier] (識別子をインポート)

前のコンポーネントで定義した入力スキーマからカラムを選択して、作成するノードに識別子を付けます。識別子は、作成するインデックスに保管され、インデックス全体で一意である必要があります。

したがって、使うカラムには一意の値のみが含まれていることをご確認ください。

[Save the identifier] (識別子を保存する)

技術識別子(ネイティブグラフID)を保存するには、このチェックボックスをオンにします。

Neo4jエンティティ識別子のさまざまなタイプの詳細は、Neo4jのドキュメント: エンティティ識別子を参照してください。

[Number of index elements in memory] (メモリ内のインデックスエレメントの数)

インデックスエレメントをメモリに保持するために使うキャッシュサイズを、二重引用符なしで入力します。この値は、すべてのインデックスエレメントをメモリに保持するのに十分なサイズである必要があります。

詳細は、Neo4jのドキュメント: Memory tuningを参照してください。

詳細設定

[Neo4j configuration] (Neo4j設定)

テーブルにパラメーターを追加して、作成するデータベースを設定します。

詳細は、Neo4jのドキュメンテーション: Configuration settingsを参照してください。

値を入力する時に、この[Nodes files] (ノードファイル)テーブルのカラム名と共に示したサンプルの構文を使用します。

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

グローバル変数

[Global Variables] (グローバル変数)

NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、Die on error (エラー時強制終了)がオフになっている場合にのみ機能します。

Flow変数はコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入れるには、Ctrl + Spaceを押して変数リストにアクセスし、リストから使用する変数を選択します。

変数の詳細は、『 Talend Studio ユーザーガイド』を参照してください。

使用方法

使用ルール

このコンポーネントは出力コンポーネントとして使用され、常に着信リンクが必要です。