動画のデータをNeo4jにインポートする - 7.2

Neo4j

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

手順

  1. 2番目のtFileInputDelimitedコンポーネントをダブルクリックして、[Component] (コンポーネント)タブで[Basic settings] (基本設定)ビューを開きます。
  2. [File name/Stream] (ファイル名/ストリーム)フィールドで、動画の情報が保存されているCSVファイルへのパスを指定します。
    このサンプルに使用している入力CSVファイルは、次のとおりです。
    Title;Released;Tagline
    The Matrix;03-31-1999;Welcome to the Real World
    The Matrix Reloaded;05-07-2003;Free Your Mind
    The Matrix Revolutions;10-27-2003;Everything that has a Beginning has an End
  3. [Header] (ヘッダー)フィールドで、ヘッダー行としてスキップする行数を指定します。このサンプルでは、CSVファイルの最初の行がヘッダー行です。
  4. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして[Schema] (スキーマ)ダイアログボックスを開き、入力ファイルの構造をベースに入力スキーマを定義します。このサンプルでは、入力スキーマは、title (String型)、released (Date型)、tagline (String型)という3つのカラムで構成されています。
    終了したら[OK]をクリックして[Schema] (スキーマ)ダイアログボックスを閉じ、スキーマを次のコンポーネントにプロパゲートします。
  5. 2番目のtNeo4jOutputコンポーネントをクリックし、[Component] (コンポーネント)タブを選択して、[Basic settings] (基本設定)ビューを開きます。
  6. [Use an existing connection] (既存の接続を使用)チェックボックスをオンにし、tNeo4jConnectionコンポーネントによって開かれたNeo4jデータベース接続を再利用します。このコンポーネントは、このサンプルで使用している唯一の接続コンポーネントです。
  7. tNeo4jOutputコンポーネントをダブルクリックするか、またはコンポーネントの[Basic settings] (基本設定)ビューにある[Mapping]ボタンをクリックして、インデックスおよび関係のマッピングエディターを開きます。
  8. スキーマパネルでtitleカラムを選択し、[Index creation] (インデックスの作成)タブをクリックし、[+]ボタンをクリックしてテーブルに行を追加し、このカラムにtitleという名前のインデックスを作成します。
    • [Name] (名前)フィールドに、titleを二重引用符で囲んで入力します。

    • [Key] (キー)フィールドに、titleを二重引用符で囲んで入力し、インデックスにキーを与えます。

    スキーマパネルをクリックしてインデックスの作成を確定し、[OK]をクリックしてマッピングエディターを閉じます。
  9. [Use label (Neo4j > 2.0)] (ラベルの使用(Neo4j > 2.0))チェックボックスをオンにして、[Label name] (ラベル名)フィールドに、Moviesを二重引用符で囲んで入力します。その結果、作成されるノードはMoviesとラベル付けされます。