手順
-
3番目のtFileInputDelimitedコンポーネントをダブルクリックし、[Component] (コンポーネント)ビューを開きます。
-
[File name/Stream] (ファイル 名/ストリーム)フィールドにパスを入力するか、俳優と映画の関係を記述したCSVファイルを参照します。
この例に使用している入力CSVファイルは、次のとおりです。
keanu,"Neo",tt0133093,ACTED_IN keanu,"Neo",tt0234215,ACTED_IN keanu,"Neo",tt0242653,ACTED_IN laurence,"Morpheus",tt0133093,ACTED_IN laurence,"Morpheus",tt0234215,ACTED_IN laurence,"Morpheus",tt0242653,ACTED_IN carrieanne,"Trinity",tt0133093,ACTED_IN carrieanne,"Trinity",tt0234215,ACTED_IN carrieanne,"Trinity",tt0242653,ACTED_IN
ロール名の二重引用符は必須ではありません。値ACTED_INは、俳優と映画の関係を説明するユーザー定義の関係タイプです。
-
[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックしてスキーマエディターを開き、入力ファイルの構造をベースに入力スキーマを定義します。
この例では、カラムはfrom、role、to、typeです。
- [OK]をクリックしてこのエディターを閉じ、スキーマのプロパゲーションを受け入れます。
- [Field separator] (フィールド区切り)には、デフォルトのセミコロン(;)の代わりにカンマ(,)を入力します。
-
tNeo4jBatchOutputRelationshipコンポーネントをダブルクリックすると、[Component] (コンポーネント)ビューが開きます。
- [Use an existing connection] (既存の接続を使用)チェックボックスをオンにして、tNeo4jConnectionコンポーネントによって開かれたNeo4j接続を再利用します。
- [Shutdown after Job] (ジョブの後のシャットダウン)チェックボックスがオフになっていることを確認します。
- [Field for relationship type] (関係タイプのフィールド)ドロップダウンリストから、関係タイプを提供するカラムを選択します。
- [Direction of the relationship] (関係の方向)ドロップダウンリストから[Outgoing] (出力)を選択します。
- [Start node of the relationship] (関係の開始ノード)で、開始ノードのインデックスを提供するtNeo4jBatchOutputコンポーネントを選択します。これは、この例では最初のtNeo4jBatchOutputからのasActorsインデックスです。次に、[Field name for the batch index] (バッチインデックスのフィールド名)ドロップダウンリストから、開始ノードとして俳優名を提供するカラムを選択します。
- [End node of the relationship] (関係の終端ノード)でこのアクションを繰り返して、2番目のtNeo4jBatchOutputからasMovieインデックスを選択してから、終端ノードとして映画名を提供するカラムを選択します。