俳優のデータをNeo4jにインポートする - 7.3

Neo4j

Version
7.3
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

手順

  1. 最初のtFileInputDelimitedコンポーネントをダブルクリックして、[Component] (コンポーネント)タブで[Basic settings] (基本設定)ビューを開きます。
  2. [File name/Stream] (ファイル名/ストリーム)フィールドで、俳優の名前、生まれた年、および映画での役を説明するCSVファイルへのパスを指定します。
    このサンプルに使用している入力CSVファイルは、次のとおりです。
    Name;Born
    Keanu Reeves;1964
    Laurence Fishburne;1961
    Carrie-Anne Moss;1967
  3. [Header] (ヘッダー)フィールドで、ヘッダー行としてスキップする行数を指定します。このサンプルでは、CSVファイルの最初の行がヘッダー行です。
  4. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして[Schema] (スキーマ)ダイアログボックスを開き、入力ファイルの構造をベースに入力スキーマを定義します。このサンプルでは、入力スキーマは2つのカラム、namebornで構成されています。どちらも[String] (文字列)型です。
    終了したら[OK]をクリックして[Schema] (スキーマ)ダイアログボックスを閉じ、スキーマを次のコンポーネントにプロパゲートします。
  5. 最初のtNeo4jOutputコンポーネントをクリックし、[Component] (コンポーネント)タブを選択して、[Basic settings] (基本設定)ビューをクリックします。
  6. [Use an existing connection] (既存の接続を使用)チェックボックスをオンにし、tNeo4jConnectionコンポーネントによって開かれたNeo4jデータベース接続を再利用します。このコンポーネントは、このサンプルで使用している唯一の接続コンポーネントです。
  7. tNeo4jOutputコンポーネントをダブルクリックするか、またはコンポーネントの[Basic settings] (基本設定)ビューにある[Mapping]ボタンをクリックして、インデックスおよび関係のマッピングエディターを開きます。
  8. スキーマパネルでnameカラムを選択し、[Index creation] (インデックスの作成)タブをクリックし、[+]ボタンをクリックしてテーブルに行を追加し、このカラムにnameという名前のインデックスを作成します。
    • [Name] (名前)フィールドに、nameを二重引用符で囲んで入力します。

    • [Key] (キー)フィールドに、nameを二重引用符で囲んで入力し、インデックスにキーnameを与えます。

    スキーマパネルをクリックしてインデックスの作成を確定し、[OK]をクリックしてマッピングエディターを閉じます。
  9. [Use label (Neo4j > 2.0)] (ラベルの使用(Neo4j > 2.0))チェックボックスをオンにして、[Label name] (ラベル名)フィールドに、Actorsを二重引用符で囲んで入力します。その結果、作成されるノードはActorsとラベル付けされます。