Neo4jデータベースにデータをインポートする - 7.2

Neo4j

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

手順

  1. tFileInputDelimitedコンポーネントをダブルクリックして、[Components] (コンポーネント)タブで[Basic settings] (基本設定)ビューを開きます。
  2. [File name/Stream] (ファイル名/ストリーム)フィールドで、読み込む従業員データが保存されているCSVファイルへのパスを指定します。
    このサンプルに使用している入力CSVファイルは、次のとおりです。
    employeeID;employeeName;age;hireDate;salary;managerID
    1;Rutherford Roosevelt;38;06-10-2008;13336.58;m5
    2;Warren Adams;43;05-22-2008;11626.68;m6
    3;Andrew Roosevelt;55;04-01-2007;10052.95;m4
    4;Herbert Quincy;54;06-14-2007;10694.71;m6
    5;Woodrow Polk;33;08-14-2007;13751.50;m4
    6;Theodore Johnson;47;01-26-2008;12426.87;m6
    7;Benjamin Adams;32;02-25-2008;10438.65;m4
    8;Woodrow Harrison;51;10-11-2008;11188.27;m5
    9;George Truman;40;04-28-2008;14254.49;m5
    10;Harry Jackson;38;04-01-2008;12798.78;m6
  3. [Header] (ヘッダー)フィールドで、ヘッダー行としてスキップする行数を指定します。このサンプルでは、CSVファイルの最初の行がヘッダー行です。
  4. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして[Schema] (スキーマ)ダイアログボックスを開き、入力ファイルの構造をベースに入力スキーマを定義します。このサンプルでは、入力スキーマは次の6つのカラムで構成されています: employeeID (整数)、employeeName (文字列)、age (整数)、hireDate (日付)、salary (Float)、およびmanagerID (文字列)。
    終了したら[OK]をクリックして[Schema] (スキーマ)ダイアログボックスを閉じ、スキーマを次のコンポーネントにプロパゲートします。
  5. tNeo4jOutputコンポーネントをクリックし、[Component] (コンポーネント)タブを選択して、[Basic settings] (基本設定)ビューをクリックします。
  6. Neo4jデータベース接続を定義します。このサンプルでは、Neo4jデータベースはRESTモードでアクセス可能です。そこで、[Remote server] (リモートサーバー)チェックボックスをオンにして、[Server URL] (サーバーURL)フィールドでNeo4jサーバーのURL(このサンプルでは"http://localhost:7474/db/data")を指定します。
  7. 必要に応じて、[Sync columns] (カラムの同期)ボタンをクリックして、コンポーネントのスキーマが前のコンポーネントのスキーマと同じになるようにします。
    残りのパラメーターはそのままにしておきます。