俳優のデータをNeo4jにインポートする - 7.2

Neo4j

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

手順

  1. 最初のtFileInputDelimitedコンポーネントをダブルクリックして、[Component] (コンポーネント)タブで[Basic settings] (基本設定)ビューを開きます。
  2. [File name/Stream] (ファイル名/ストリーム)フィールドで、俳優の名前、生まれた年、および映画での役を説明するCSVファイルへのパスを指定します。
    このサンプルに使用している入力CSVファイルは、次のとおりです。
    Name;Born
    Keanu Reeves;1964
    Laurence Fishburne;1961
    Carrie-Anne Moss;1967
  3. [Header] (ヘッダー)フィールドで、ヘッダー行としてスキップする行数を指定します。このサンプルでは、CSVファイルの最初の行がヘッダー行です。
  4. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして[Schema] (スキーマ)ダイアログボックスを開き、入力ファイルの構造をベースに入力スキーマを定義します。このサンプルでは、入力スキーマは2つのカラム、namebornで構成されています。どちらも[String] (文字列)型です。
    終了したら[OK]をクリックして[Schema] (スキーマ)ダイアログボックスを閉じ、スキーマを次のコンポーネントにプロパゲートします。
  5. 最初のtNeo4jOutputコンポーネントをクリックし、[Component] (コンポーネント)タブを選択して、[Basic settings] (基本設定)ビューをクリックします。
  6. [Use an existing connection] (既存の接続を使用)チェックボックスをオンにし、tNeo4jConnectionコンポーネントによって開かれたNeo4jデータベース接続を再利用します。このコンポーネントは、このサンプルで使用している唯一の接続コンポーネントです。
  7. tNeo4jOutputコンポーネントをダブルクリックするか、またはコンポーネントの[Basic settings] (基本設定)ビューにある[Mapping]ボタンをクリックして、インデックスおよび関係のマッピングエディターを開きます。
  8. スキーマパネルでnameカラムを選択し、[Index creation] (インデックスの作成)タブをクリックし、[+]ボタンをクリックしてテーブルに行を追加し、このカラムにnameという名前のインデックスを作成します。
    • [Name] (名前)フィールドに、nameを二重引用符で囲んで入力します。

    • [Key] (キー)フィールドに、nameを二重引用符で囲んで入力し、インデックスにキーnameを与えます。

    スキーマパネルをクリックしてインデックスの作成を確定し、[OK]をクリックしてマッピングエディターを閉じます。
  9. [Use label (Neo4j > 2.0)] (ラベルの使用(Neo4j > 2.0))チェックボックスをオンにして、[Label name] (ラベル名)フィールドに、Actorsを二重引用符で囲んで入力します。その結果、作成されるノードはActorsとラベル付けされます。