動画データをNeo4jに一括書き込み - 7.2

Neo4j

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

手順

  1. 2番目のtFileInputDelimitedコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  2. [File name/Stream] (ファイル 名/ストリーム)フィールドにパスを入力するか、Neo4jで使用する動画のID、名前、リリース、およびそれらのラベルを記述したCSVファイルを参照します。

    このサンプルに使用している入力CSVファイルは、次のとおりです。

    tt0133093,"The Matrix",1999,Movie
    tt0234215,"The Matrix Reloaded",2003,Movie;Sequel
    tt0242653,"The Matrix Revolutions",2003,Movie;Sequel

    動画名の二重引用符は必須ではありません。

  3. [Edit schema] (スキーマを編集) の横にある [...]ボタンをクリックしてスキーマエディターを開き、入力ファイルの構造をベースに入力スキーマを定義します。

    この例では、カラムは[ID][title] (タイトル)[released] (リリース)[label] (ラベル)です。

  4. [OK]をクリックしてこのエディターを閉じ、スキーマの伝播を受け入れます。
  5. [Field separator] (フィールド区切り)には、デフォルトのセミコロン(;)の代わりにカンマ(,)を入力します。
  6. 2番目のtNeo4jBatchOutputコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  7. [Use an existing connection] (既存の接続を使用)チェックボックスをオンにして、tNeo4jConnectionコンポーネントによって開かれたNeo4j接続を再利用します。
  8. [Shutdown after Job] (ジョブの後のシャットダウン)チェックボックスがオフになっていることを確認します。
  9. [Field that contains the label list] (ラベルリストを含むフィールド)ドロップダウンリストで、ラベルを提供するカラムを選択します。
  10. [Index name] (インデックス名)フィールドに、ノード用に作成するインデックスの名前を入力します。
  11. [Import identifier] (識別子のインポート)ドロップダウンリストから、IDを提供するカラムを選択します。