tNeo4jv4ImportToolの標準プロパティ - Cloud - 8.0

Neo4j

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

これらのプロパティは、標準ジョブのフレームワークで実行されているtNeo4jv4ImportToolを設定するために使われます。

標準tNeo4jv4ImportToolコンポーネントは、ビッグデータファミリーとデータベースNoSQLファミリーに属しています。

このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで利用できます。

基本設定

[Property Type] (プロパティタイプ)

[Built-in] (組み込み)[Repository] (リポジトリー)のいずれかです。

  • [Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。
  • [Repository] (リポジトリー): プロパティが保管されるリポジトリーファイルを選択します。続くデータベース接続関連フィールドは、取得されたデータを使用して自動的に入力されます。

[Neo4j Home] (Neo4jホーム)

Neo4jのインストールパスを入力します。

データベース名

作成するデータベースの名前を入力します。

[Nodes] (ノード)

ノードにインポートするデータが含まれているCSVファイルを指定し、ノードにラベルを割り当てます。

  • [Path to file] (ファイルへのパス): 読み取るCSVファイルへのパスを二重引用符で囲んで入力します。複数のCSVファイルからデータをインポートする場合は、CSVファイルごとに行を追加してください。
  • [Label(s) for nodes] (ノードのラベル) (オプション): ノードのラベルを二重引用符で囲んで入力します。表示されるとおり、ノードのラベルはオプションです。

有効なCSVファイルには、少なくともIDカラムとLABELカラムが含まれているヘッダーがあります。関連情報は、CSV header formatをご覧ください。

[Skip duplicate nodes] (重複ノードをスキップ)

このオプションを選択すると、同じレコードIDを持つレコードがCSVファイルにある場合に最初のレコードだけがインポートされます。

このオプションが選択されなければ、同じIDのレコードがCSVファイルに含まれている場合はインポート操作が失敗します。

[Relations] (関係)

関係ファイルへのパスをこのテーブルの行に入力します。関係ファイルには、インポートするノードエンティティ関係の情報が含まれています。複数の関係ファイルを入力する場合は、各関係ファイルの行をテーブルに追加します。

有効な関係ファイルには、START_IDEND_IDTYPEという3つのフィールドが含まれているヘッダーがあります。関連情報は、CSV header formatをご覧ください。

[Skip bad relationship] (不正な関係をスキップ)

このオプションを選択すると、[Relation] (関係)テーブルで指定された関係CSVファイルにある無効な関係項目がスキップされます。

START_IDフィールドやEND_IDフィールドが既存のノードに存在しなければ、その関係項目は無効です。

詳細設定

[tStatCatcher Statistics] (tStatCatcher統計)

このチェックボックスをオンにすると、ジョブレベルおよび各コンポーネントレベルでジョブ処理メタデータが収集されます。

[Force overwrite database content] (データベースコンテンツの上書きを強制)

データベースが既に存在する場合は、このオプションを選択するとデータベースが上書きされます。

[Custom CSV Format] (カスタムCSV形式)

CSVファイル形式をカスタマイズする場合は、このオプションを選択します。
  • [Delimiter] (区切り): フィールドで区切りとして使用する文字を入力します。
  • [Array delimiter] (配列区切り): フィールドで配列区切りとして使用する文字を入力します。
  • [Quotation character] (引用符): フィールドで引用符として使用する文字を入力します。
  • [Encoding] (エンコーディング): フィールドで使用するエンコーディングの名前を入力します。

[Verbose] (詳細)

このオプションを選択すると、インポート情報がさらに表示されます。

グローバル変数

グローバル変数

ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。

Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。

フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。

変数の詳細は、Talend Studioユーザーガイドをご覧ください。

使用方法

使用ルール

このコンポーネントは、特定の構造で作成された特定のCSVファイルからデータを一括ロードするために、サブジョブでスタンドアロンで使います。

Neo4j Import Toolに必要なCSV構造の詳細は、インポートをご覧ください。

tFileOutputDelimitedを使って、使用するCSVファイルを作成できます。