Neo4jでアクターデータを一括書き込み - 7.2

Neo4j

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

手順

  1. tFileInputDelimitedコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  2. [File name/Stream] (ファイル 名/ストリーム)フィールドにパスを入力するか、Neo4jで使用されるアクターのID、名前、およびラベルを記述したCSVファイルを参照します。

    このサンプルに使用している入力CSVファイルは、次のとおりです。

    keanu,"Keanu Reeves",Actor
    laurence,"Laurence Fishburne",Actor
    carrieanne,"Carrie-Anne Moss",Actor

    アクター名の二重引用符は必須ではありません。

  3. [Edit schema] (スキーマを編集) の横にある [...]ボタンをクリックしてスキーマエディタを開き、入力ファイルの構造をベースに入力スキーマを定義します。

    この例では、カラムはid, nameおよびlabel、すべてString型です。

  4. [OK]をクリックしてこのエディターを閉じ、スキーマの伝播を受け入れます。
  5. [Field separator] (フィールド区切り)には、デフォルトのセミコロン(;)の代わりにカンマ(,)を入力します。
  6. tNeo4jBatchOutputコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  7. [Use an existing connection] (既存の接続を使用)チェックボックスをオンにして、tNeo4jConnectionコンポーネントによって開かれたNeo4j接続を再利用します。
  8. [Shutdown after Job] (ジョブの後のシャットダウン)チェックボックスがオフになっていることを確認します。
  9. [Field that contains the label list] (ラベルリストを含むフィールド)ドロップダウンリストで、ラベルを提供するカラムを選択します。
  10. [Index name] (インデックス名)フィールドに、ノード用に作成するインデックスの名前を入力します。
  11. [Import identifier] (識別子のインポート)ドロップダウンリストから、IDを提供するカラムを選択します。