動画データをNeo4jに一括書き込み - 7.3

Neo4j

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

手順

  1. 2番目のtFileInputDelimitedコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  2. [File name/Stream] (ファイル 名/ストリーム)フィールドにパスを入力するか、Neo4jで使用する動画のID、名前、リリース、およびそれらのラベルを記述したCSVファイルを参照します。

    このサンプルに使用している入力CSVファイルは、次のとおりです。

    tt0133093,"The Matrix",1999,Movie
    tt0234215,"The Matrix Reloaded",2003,Movie;Sequel
    tt0242653,"The Matrix Revolutions",2003,Movie;Sequel

    動画名の二重引用符は必須ではありません。

  3. [Edit schema] (スキーマを編集) の横にある [...]ボタンをクリックしてスキーマエディターを開き、入力ファイルの構造をベースに入力スキーマを定義します。

    この例では、カラムは[ID][title] (タイトル)[released] (リリース)[label] (ラベル)です。

  4. [OK]をクリックしてこのエディターを閉じ、スキーマの伝播を受け入れます。
  5. [Field separator] (フィールド区切り)には、デフォルトのセミコロン(;)の代わりにカンマ(,)を入力します。
  6. 2番目のtNeo4jBatchOutputコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  7. [Use an existing connection] (既存の接続を使用)チェックボックスをオンにして、tNeo4jConnectionコンポーネントによって開かれたNeo4j接続を再利用します。
  8. [Shutdown after Job] (ジョブの後のシャットダウン)チェックボックスがオフになっていることを確認します。
  9. [Field that contains the label list] (ラベルリストを含むフィールド)ドロップダウンリストで、ラベルを提供するカラムを選択します。
  10. [Index name] (インデックス名)フィールドに、ノード用に作成するインデックスの名前を入力します。
  11. [Import identifier] (識別子のインポート)ドロップダウンリストから、IDを提供するカラムを選択します。