Créer des relations en masse - 7.3

Neo4j

Version
7.3
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants NoSQL > Composants Neo4j
Gouvernance de données > Systèmes tiers > Composants NoSQL > Composants Neo4j
Qualité et préparation de données > Systèmes tiers > Composants NoSQL > Composants Neo4j
Last publication date
2024-02-22

Procédure

  1. Double-cliquez sur le troisième tFileInputDelimited pour ouvrir sa vue Component.
  2. Dans le champ File name/Stream, saisissez le chemin d'accès au fichier ou parcourez votre système jusqu'au fichier CSV décrivant les relations acteur-film.

    Le fichier CSV d'entrée utilisé dans cet exemple se présente comme suit :

    keanu,"Neo",tt0133093,ACTED_IN
    keanu,"Neo",tt0234215,ACTED_IN
    keanu,"Neo",tt0242653,ACTED_IN
    laurence,"Morpheus",tt0133093,ACTED_IN
    laurence,"Morpheus",tt0234215,ACTED_IN
    laurence,"Morpheus",tt0242653,ACTED_IN
    carrieanne,"Trinity",tt0133093,ACTED_IN
    carrieanne,"Trinity",tt0234215,ACTED_IN
    carrieanne,"Trinity",tt0242653,ACTED_IN

    Les guillemets doubles entourant les noms de rôles ne sont pas obligatoires. La valeur ACTED_IN est un type de relation personnalisé expliquant la relation entre les acteurs et les films.

  3. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir l'éditeur de schéma et définissez le schéma en vous basant sur la structure du fichier d'entrée.

    Dans cet exemple, les colonnes sont from, role, to et type.

  4. Cliquez sur OK pour fermer cet éditeur et acceptez la propagation du schéma du composant suivant.
  5. Dans le champ Field separator, saisissez une virgule (,) pour remplacer le point-virgule par remplacer le point-virgule (;) par défaut.
  6. Double-cliquez sur le composant tNeo4jBatchOutputRelationship pour ouvrir sa vue Component.
  7. Cochez la case Use an existing connection pour réutiliser la connexion à la base de données Neo4j ouverte par le tNeo4jConnection.
  8. Vérifiez que la case Shutdown after Job est décochée.
  9. Dans la liste déroulante Field for relationship type, sélectionnez la colonne fournissant les types de relations.
  10. Dans la liste déroulante Direction of the relationship, sélectionnez Outgoing.
  11. Dans la zone Start node of the relationship, sélectionnez le composant tNeo4jBatchOutput fournissant l'index des nœuds de début, l'index asActors dans cet exemple, provenant du premier tNeo4jBatchOutput. Dans la liste déroulante Field name for the batch index, sélectionnez la colonne fournissant les noms d'acteurs comme nœuds de début.
  12. Répétez cette action dans la zone End node of the relationship pour sélectionner l'index asMovie provenant du second tNeo4jBatchOutput et sélectionnez la colonne fournissant les noms de films comme nœuds de fin.