Configurer l'import de données

Configurer l'import de données - 7.3

Neo4j

Version

7.3

Language

Français

Product

Talend Big Data

Talend Big Data Platform

Talend Data Fabric

Talend Data Integration

Talend Data Management Platform

Talend Data Services Platform

Talend ESB

Talend MDM Platform

Talend Real-Time Big Data Platform

Module

Studio Talend

Content

Création et développement > Systèmes tiers > Composants NoSQL > Composants Neo4j

Gouvernance de données > Systèmes tiers > Composants NoSQL > Composants Neo4j

Qualité et préparation de données > Systèmes tiers > Composants NoSQL > Composants Neo4j

Last publication date

2024-02-22

Procédure

Double-cliquez sur le composant tFileInputDelimited afin d'ouvrir sa vue Basic settings dans l'onglet Component.

Dans le champ File name/Stream, spécifiez le chemin d'accès au fichier CSV qui contient les données des employés à lire.

Le fichier CSV d'entrée utilisé dans cet exemple se présente comme suit :

employeeID;employeeName;age;hireDate;salary;managerID
1;Rutherford Roosevelt;38;06-10-2008;13336.58;m5
2;Warren Adams;43;05-22-2008;11626.68;m6
3;Andrew Roosevelt;55;04-01-2007;10052.95;m4
4;Herbert Quincy;54;06-14-2007;10694.71;m6
5;Woodrow Polk;33;08-14-2007;13751.50;m4
6;Theodore Johnson;47;01-26-2008;12426.87;m6
7;Benjamin Adams;32;02-25-2008;10438.65;m4
8;Woodrow Harrison;51;10-11-2008;11188.27;m5
9;George Truman;40;04-28-2008;14254.49;m5
10;Harry Jackson;38;04-01-2008;12798.78;m6

Dans le champ Header, spécifiez le nombre de lignes d'en-tête à ignorer. Dans cet exemple, l'en-tête est la première ligne du fichier CSV.
Cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la boîte de dialogue Schema et définissez le schéma d'entrée selon la structure du fichier d'entrée. Dans cet exemple, le schéma d'entrée est composé de six colonnes : employeeID (Entier), employeeName (Chaîne de caractères), age (Entier), hireDate (Date), salary (Double), and managerID (Chaîne de caractères).
Lorsque vous avez terminé, cliquez sur OK pour fermer la boîte de dialogue Schema et propager le schéma au composant suivant.
Double-cliquez sur le composant tNeo4jRow pour ouvrir sa vue Basic settings dans l'onglet Component.
Cochez la case Use an existing connection afin de réutiliser la connexion à la base de données Neo4j ouverte par le composant tNeo4jConnection, seul composant de connexion utilisé dans cet exemple.
Dans le champ Query, saisissez la requête Cypher que le composant doit exécuter.
Dans cet exemple, renseignez les requêtes suivantes pour créer des nœuds avec le nom Employees et six propriétés afin de contenir les données du flux d'entrée :
- ID, qui prend la valeur de la variable id,
- Name, qui prend la valeur de la variable name,
- Age, qui prend la valeur de la variable age,
- HireDate, qui prend la valeur de la variable hire_date,
- Salary, qui prend la valeur de la variable salary et
- ManagerID, qui prend la valeur de la variable manager_id.
```
"CREATE (n:Employees{ID:{id}, Name:{name}, Age:{age}, HireDate:{hire_date}, Salary:{salary}, ManagerID:{manager_id}})"
```
Dans la table Parameters, renseignez les variables dans le champ Parameter, conformément à votre requête Cypher et mappez chacune d'entre elles avec une colonne du schéma d'entrée en la sélectionnant dans la liste de champs Parameter value.