関係を一括で作成する - 7.2

Neo4j

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データガバナンス > サードパーティーシステム > NoSQLコンポーネント > Neo4j
データクオリティとプレパレーション > サードパーティーシステム > NoSQLコンポーネント > Neo4j

手順

  1. 3番目のtFileInputDelimitedコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
  2. [File name/Stream] (ファイル 名/ストリーム)フィールドにパスを入力するか、俳優と映画の関係を記述したCSVファイルを参照します。

    このサンプルに使用している入力CSVファイルは、次のとおりです。

    keanu,"Neo",tt0133093,ACTED_IN
    keanu,"Neo",tt0234215,ACTED_IN
    keanu,"Neo",tt0242653,ACTED_IN
    laurence,"Morpheus",tt0133093,ACTED_IN
    laurence,"Morpheus",tt0234215,ACTED_IN
    laurence,"Morpheus",tt0242653,ACTED_IN
    carrieanne,"Trinity",tt0133093,ACTED_IN
    carrieanne,"Trinity",tt0234215,ACTED_IN
    carrieanne,"Trinity",tt0242653,ACTED_IN

    ロール名の二重引用符は必須ではありません。値ACTED_INは、俳優と映画の関係を説明するユーザー定義の関係タイプです。

  3. [Edit schema] (スキーマを編集) の横にある [...]ボタンをクリックしてスキーマエディターを開き、入力ファイルの構造をベースに入力スキーマを定義します。

    この例では、カラムはfromroletotypeです。

  4. [OK]をクリックしてこのエディターを閉じ、スキーマの伝播を受け入れます。
  5. [Field separator] (フィールド区切り)には、デフォルトのセミコロン(;)の代わりにカンマ(,)を入力します。
  6. tNeo4jBatchOutputRelationshipコンポーネントをダブルクリックすると、[Component] (コンポーネント)ビューが開きます。
  7. [Use an existing connection] (既存の接続を使用)チェックボックスをオンにして、tNeo4jConnectionコンポーネントによって開かれたNeo4j接続を再利用します。
  8. [Shutdown after Job] (ジョブの後のシャットダウン)チェックボックスがオフになっていることを確認します。
  9. [Field for relationship type] (関係タイプのフィールド)ドロップダウンリストから、関係タイプを提供するカラムを選択します。
  10. [Direction of the relationship] (関係の方向)ドロップダウンリストから[Outgoing] (出力)を選択します。
  11. [Start node of the relationship] (関係の開始ノード)で、開始ノードのインデックスを提供するtNeo4jBatchOutputコンポーネントを選択します。これは、この例では最初のtNeo4jBatchOutputからのasActorsインデックスです。次に、[Field name for the batch index] (バッチインデックスのフィールド名)ドロップダウンリストから、開始ノードとして俳優名を提供するカラムを選択します。
  12. [End node of the relationship] (関係の終端ノード)でこのアクションを繰り返して、2番目のtNeo4jBatchOutputからasMovieインデックスを選択してから、終端ノードとして映画名を提供するカラムを選択します。