Configurer l'import de données - 6.4

Neo4j

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants Neo4j
Gouvernance de données > Systèmes tiers > Composants Database > Composants Neo4j
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants Neo4j
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le composant tFileInputDelimited afin d'ouvrir sa vue Basic settings dans la vue Component.
  2. Dans le champ File name/Stream, spécifiez le chemin d'accès au fichier CSV qui contient les données sur les employés à lire.
    Le fichier d'entrée CSV utilisé dans cet exemple se présente de la manière suivante :
    employeeID;employeeName;age;hireDate;salary;managerID
    1;Rutherford Roosevelt;38;06-10-2008;13336.58;m5
    2;Warren Adams;43;05-22-2008;11626.68;m6
    3;Andrew Roosevelt;55;04-01-2007;10052.95;m4
    4;Herbert Quincy;54;06-14-2007;10694.71;m6
    5;Woodrow Polk;33;08-14-2007;13751.50;m4
    6;Theodore Johnson;47;01-26-2008;12426.87;m6
    7;Benjamin Adams;32;02-25-2008;10438.65;m4
    8;Woodrow Harrison;51;10-11-2008;11188.27;m5
    9;George Truman;40;04-28-2008;14254.49;m5
    10;Harry Jackson;38;04-01-2008;12798.78;m6
  3. Dans le champ Header, spécifiez le nombre de lignes considérées comme étant des lignes d'en-tête à sauter. Dans cet exemple, la première ligne du fichier CSV est la ligne d'en-tête.
  4. Cliquez sur le bouton [...] à côté de Edit schema pour ouvrir la boîte de dialogue [Schema] et définissez le schéma d'entrée selon la structure du fichier d'entrée. Dans cet exemple, le schéma d'entrée est composé de six colonnes : employeeID (Entier), employeeName (Chaîne de caractères), age (Entier), hireDate (Date), salary (Double), and managerID (Chaîne de caractères).
    Lorsque vous avez terminé, cliquez sur OK pour fermer la boîte de dialogue [Schema] et propager le schéma au composant suivant.
  5. Double-cliquez sur le composant tNeo4jRow pour ouvrir sa vue Basic settings dans la vue Component.
  6. Cochez la case Use an existing connection pour réutiliser la connexion à la base de données Neo4j ouverte par le composant tNeo4jConnection, qui est le seul composant de connexion utilisé dans cet exemple.
  7. Dans le champ Query, saisissez la requête Cypher que le composant doit exécuter.
    Dans cet exemple, renseignez les requêtes suivantes pour créer des nœuds avec le nom Employees et six propriétés afin de contenir les données du flux d'entrée :
    • ID, qui prend la valeur de la variable id,

    • Name, qui prend la valeur de la variable name,

    • Age, qui prend la valeur de la variable age,

    • HireDate, qui prend la valeur de la variable hire_date,

    • Salary, qui prend la valeur de la variable salary et

    • ManagerID, qui prend la valeur de la variable manager_id.

    "CREATE (n:Employees{ID:{id}, Name:{name}, Age:{age}, HireDate:{hire_date}, Salary:{salary}, ManagerID:{manager_id}})"
  8. Dans la table Parameters, renseignez les variables dans le champ Parameter, conformément à votre requête Cypher et mappez chacune d'entre elle avec une colonne du schéma d'entrée en la sélectionnant dans la liste de champs Parameter value.