Configurer l'import de données - 7.2

Neo4j

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants NoSQL > Composants Neo4j
Gouvernance de données > Systèmes tiers > Composants NoSQL > Composants Neo4j
Qualité et préparation de données > Systèmes tiers > Composants NoSQL > Composants Neo4j
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le composant tFileInputDelimited afin d'ouvrir sa vue Basic settings dans l'onglet Component.
  2. Dans le champ File name/Stream, spécifiez le chemin d'accès au fichier CSV qui contient les données des employés à lire.
    Le fichier CSV d'entrée utilisé dans cet exemple se présente comme suit :
    employeeID;employeeName;age;hireDate;salary;managerID
    1;Rutherford Roosevelt;38;06-10-2008;13336.58;m5
    2;Warren Adams;43;05-22-2008;11626.68;m6
    3;Andrew Roosevelt;55;04-01-2007;10052.95;m4
    4;Herbert Quincy;54;06-14-2007;10694.71;m6
    5;Woodrow Polk;33;08-14-2007;13751.50;m4
    6;Theodore Johnson;47;01-26-2008;12426.87;m6
    7;Benjamin Adams;32;02-25-2008;10438.65;m4
    8;Woodrow Harrison;51;10-11-2008;11188.27;m5
    9;George Truman;40;04-28-2008;14254.49;m5
    10;Harry Jackson;38;04-01-2008;12798.78;m6
  3. Dans le champ Header, spécifiez le nombre de lignes d'en-tête à ignorer. Dans cet exemple, l'en-tête est la première ligne du fichier CSV.
  4. Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la boîte de dialogue Schema et définissez le schéma d'entrée selon la structure du fichier d'entrée. Dans cet exemple, le schéma d'entrée est composé de six colonnes : employeeID (Entier), employeeName (Chaîne de caractères), age (Entier), hireDate (Date), salary (Double), and managerID (Chaîne de caractères).
    Lorsque vous avez terminé, cliquez sur OK pour fermer la boîte de dialogue Schema et propager le schéma au composant suivant.
  5. Double-cliquez sur le composant tNeo4jRow pour ouvrir sa vue Basic settings dans l'onglet Component.
  6. Cochez la case Use an existing connection afin de réutiliser la connexion à la base de données Neo4j ouverte par le composant tNeo4jConnection, seul composant de connexion utilisé dans cet exemple.
  7. Dans le champ Query, saisissez la requête Cypher que le composant doit exécuter.
    Dans cet exemple, renseignez les requêtes suivantes pour créer des nœuds avec le nom Employees et six propriétés afin de contenir les données du flux d'entrée :
    • ID, qui prend la valeur de la variable id,

    • Name, qui prend la valeur de la variable name,

    • Age, qui prend la valeur de la variable age,

    • HireDate, qui prend la valeur de la variable hire_date,

    • Salary, qui prend la valeur de la variable salary et

    • ManagerID, qui prend la valeur de la variable manager_id.

    "CREATE (n:Employees{ID:{id}, Name:{name}, Age:{age}, HireDate:{hire_date}, Salary:{salary}, ManagerID:{manager_id}})"
  8. Dans la table Parameters, renseignez les variables dans le champ Parameter, conformément à votre requête Cypher et mappez chacune d'entre elles avec une colonne du schéma d'entrée en la sélectionnant dans la liste de champs Parameter value.