Neo4jでアクターデータを一括書き込み - 7.3

Neo4j

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > NoSQL Components > Neo4j
データガバナンス > サードパーティーシステム > NoSQL Components > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQL Components > Neo4j

手順

  1. tFileInputDelimitedコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  2. [File name/Stream] (ファイル 名/ストリーム)フィールドにパスを入力するか、Neo4jで使用されるアクターのID、名前、およびラベルを記述したCSVファイルを参照します。

    このサンプルに使用している入力CSVファイルは、次のとおりです。

    keanu,"Keanu Reeves",Actor
    laurence,"Laurence Fishburne",Actor
    carrieanne,"Carrie-Anne Moss",Actor

    アクター名の二重引用符は必須ではありません。

  3. [Edit schema] (スキーマの編集) の横にある [...]ボタンをクリックしてスキーマエディタを開き、入力ファイルの構造をベースに入力スキーマを定義します。

    この例では、カラムはid, nameおよびlabel、すべてString型です。

  4. [OK]をクリックしてこのエディタを閉じ、スキーマの伝播を受け入れます。
  5. [Field separator] (フィールド区切り)には、デフォルトのセミコロン(;)の代わりにカンマ(,)を入力します。
  6. tNeo4jBatchOutputコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  7. [Use an existing connection] (既存の接続を使用する)チェックボックスを選択して、tNeo4jConnectionコンポーネントによって開かれたNeo4j接続を再利用します。
  8. [Shutdown after Job] (ジョブの後のシャットダウン)チェックボックスがオフになっていることを確認します。
  9. [Field that contains the label list] (ラベルリストを含むフィールド)ドロップダウンリストで、ラベルを提供するカラムを選択します。
  10. [Index name] (インデックス名)フィールドに、ノード用に作成するインデックスの名前を入力します。
  11. [Import identifier] (識別子のインポート)ドロップダウンリストから、IDを提供するカラムを選択します。