Propriétés du tNeo4jRow Standard - 6.5

Neo4j

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants Neo4j
Gouvernance de données > Systèmes tiers > Composants Database > Composants Neo4j
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants Neo4j
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tNeo4jRow s'exécutant dans le framework de Jobs Standard.

Le composant tNeo4jRow Standard appartient aux familles Big Data et Databases.

Le composant de ce framework est disponible dans tous les produits Big Data de Talend.

Basic settings

Use an existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

DB version

Sélectionnez la version de Neo4j que vous utilisez.

Lorsque vous utilisez une version 3.2.X de Neo4j, ce composant fonctionne en mode distant uniquement. Si vous souhaitez réutiliser une connexion à Neo4j V3.2.X depuis un tNeo4jConnection, assurez-vous d'avoir coché la case Remote server et configuré correctement la connexion.

N'utilisez pas de version 2.X.X et 3.X.X dans un même Job. Sinon, des conflits de classes peuvent survenir.

La version 2.X.X de Neo4j est compatible uniquement avec les versions 7 et supérieures de Java mais supporte des fonctionnalités avancées, comme les libellés de nœuds.

Cette liste n'est pas affichée lorsque la case Use an existing connection est cochée.

Après avoir sélectionné la version de la base de données, il vous est demandé d'installer les fichiers Jar contenant les pilotes correspondant à la base de données. Pour plus d'informations concernant l'installation des modules externes, consultez la page Installer des modules externes.

Remote server

Cochez cette case si vous utilisez un serveur distant Neo4j et spécifiez l'URL racine dans le champ Server URL.

  • Set username : cette case est disponible lorsque vous avez coché la case Use a remote server et que la version de Neo4j que vous utilisez est antérieure à 2.2. Si le serveur Neo4j distant auquel vous souhaitez vous connecter ne nécessite pas l'utilisation d'un identifiant et d'un mot de passe, laissez la case décochée.

  • Username et Password : saisissez les informations d'authentification pour vous connecter au serveur Neo4j distant à utiliser. Depuis la version 2.2 de Neo4j, l'identifiant et le mot de passe sont toujours requis.

Cette case s'affiche uniquement lorsque vous ne cochez pas la case Use an existing connection et que vous n'utilisez pas Neo4j V3.2.X. Avec une version V3.2.X, ce composant supporte uniquement le mode distant.

Database path

Si vous utilisez Neo4j en mode embarqué, spécifiez le répertoire qui contiendra vos fichiers de données. Le répertoire spécifié sera créé s'il n'existe pas déjà.

Cette case apparaît uniquement si la case Use an existing connection ou la case Remote Server n'est pas cochée.

Shutdown after job

Cochez cette case pour arrêter la connexion à la base de données Neo4j lorsqu'aucune opération sur Neo4j n'est effectuée après le composant courant.

D'une manière alternative, vous pouvez utiliser le tNeo4jClose pour arrêter la base de données.

Cela permet d'éviter des erreurs comme "Id file not properly shutdown" lors de la prochaine exécution de Jobs impliquant Neo4j.

Cette case est disponible uniquement lorsque la case Use an existing connection est cochée.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) dans le Repository. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Lorsque le schéma à réutiliser contient des valeurs par défaut de type Integer ou Function, assurez-vous que ces valeurs par défaut ne sont pas entourées de guillemets. Si elles le sont, supprimez manuellement les guillemets.

Pour plus d'informations, consultez Vérification des valeurs par défaut dans un schéma récupéré.

Query

Saisissez votre requête Cypher entre guillemets doubles. Si vous avez des paramètres correspondant aux colonnes du schéma d'entrée, déclarez-les entre accolades ({}) et mappez-les dans la table Parameters.

Parameters

Cliquez sur le bouton [+] pour ajouter des paramètres correspondant à votre requête Cypher et mappez-les avec les colonnes du schéma d'entrée.

  • Parameter name : Saisissez le nom de votre paramètre entre guillemets doubles.

  • Parameter value : Sélectionnez la colonne de schéma avec laquelle vous souhaitez mapper votre paramètre.

Die on error

Cette case est cochée par défaut. Décochez-la pour ignorer les lignes en erreur et terminer le processus avec les lignes sans erreur.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du Job ainsi qu'au niveau de chaque composant.

Commit every

Saisissez le nombre de lignes à compléter avant de commiter les lots de nœuds dans la base de données. Cette options assure la qualité de la transaction (mais pas le rollback) et permet une meilleure performance lors de l'exécution.

Cette option est supportée uniquement par le mode embarqué de la base de données. Vous ne pouvez pas effectuer de transactions en mode REST, c'est-à-dire pas sur un serveur distant dans les versions dépréciées 2.X.X.

Variables globales

Variables globales

NB_NODE_INSERTED : nombre de nœuds insérés. Cette variable est une variable After et retourne un long.

NB_RELATIONSHIP_INSERTED : nombre de relations insérées. Cette variable est une variable After et retourne un long.

NB_PROPERTY_UPDATED : nombre de propriétés mises à jour. Cette variable est une variable After et retourne un long.

NB_NODE_DELETED : nombre de nœuds supprimés. Cette variable est une variable After et retourne un long.

NB_RELATIONSHIP_DELETED : nombre de relations supprimées. Cette variable est une variable After et retourne un long.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend .

Utilisation

Règle d'utilisation

Ce composant peut être utilisé en standalone ou tant que composant de sortie dans un Job.