Créer des relations en masse - 7.2

Neo4j

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants NoSQL > Composants Neo4j
Gouvernance de données > Systèmes tiers > Composants NoSQL > Composants Neo4j
Qualité et préparation de données > Systèmes tiers > Composants NoSQL > Composants Neo4j
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le troisième tFileInputDelimited pour ouvrir sa vue Component.
  2. Dans le champ File name/Stream, saisissez le chemin d'accès au fichier ou parcourez votre système jusqu'au fichier CSV décrivant les relations acteur-film.

    Le fichier CSV d'entrée utilisé dans cet exemple se présente comme suit :

    keanu,"Neo",tt0133093,ACTED_IN
    keanu,"Neo",tt0234215,ACTED_IN
    keanu,"Neo",tt0242653,ACTED_IN
    laurence,"Morpheus",tt0133093,ACTED_IN
    laurence,"Morpheus",tt0234215,ACTED_IN
    laurence,"Morpheus",tt0242653,ACTED_IN
    carrieanne,"Trinity",tt0133093,ACTED_IN
    carrieanne,"Trinity",tt0234215,ACTED_IN
    carrieanne,"Trinity",tt0242653,ACTED_IN

    Les guillemets doubles entourant les noms de rôles ne sont pas obligatoires. La valeur ACTED_IN est un type de relation personnalisé expliquant la relation entre les acteurs et les films.

  3. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur de schéma et définissez le schéma en vous basant sur la structure du fichier d'entrée.

    Dans cet exemple, les colonnes sont from, role, to et type.

  4. Cliquez sur OK pour fermer cet éditeur et acceptez la propagation du schéma du composant suivant.
  5. Dans le champ Field separator, saisissez une virgule (,) pour remplacer le point-virgule par remplacer le point-virgule (;) par défaut.
  6. Double-cliquez sur le composant tNeo4jBatchOutputRelationship pour ouvrir sa vue Component.
  7. Cochez la case Use an existing connection pour réutiliser la connexion à la base de données Neo4j ouverte par le tNeo4jConnection.
  8. Vérifiez que la case Shutdown after Job est décochée.
  9. Dans la liste déroulante Field for relationship type, sélectionnez la colonne fournissant les types de relations.
  10. Dans la liste déroulante Direction of the relationship, sélectionnez Outgoing.
  11. Dans la zone Start node of the relationship, sélectionnez le composant tNeo4jBatchOutput fournissant l'index des nœuds de début, l'index asActors dans cet exemple, provenant du premier tNeo4jBatchOutput. Dans la liste déroulante Field name for the batch index, sélectionnez la colonne fournissant les noms d'acteurs comme nœuds de début.
  12. Répétez cette action dans la zone End node of the relationship pour sélectionner l'index asMovie provenant du second tNeo4jBatchOutput et sélectionnez la colonne fournissant les noms de films comme nœuds de fin.