Propriétés du tNeo4jOutput Standard - 6.4

Neo4j

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants Neo4j
Gouvernance de données > Systèmes tiers > Composants Database > Composants Neo4j
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants Neo4j
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tNeo4jOutput s'exécutant dans le framework de Jobs Standard.

Le composant tNeo4jOutput Standard appartient aux familles Big Data et Databases.

Le composant de ce framework est disponible dans tous les produits Big Data de Talend.

Basic settings

Use an existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

DB version

Sélectionnez la version de Neo4j que vous utilisez, Neo4J 1.X.X ou Neo4J 2.X.X.

Notez que la version 2.X.X de Neo4j est compatible uniquement avec la version 7 ou supérieure de Java mais supporte les fonctionnalités avancées, comme les libellés des nœuds.

Cette liste n'est pas affichée lorsque la case Use an existing connection est cochée.

Après avoir sélectionné la version de la base de données, il vous est demandé d'installer les fichiers Jar contenant les pilotes correspondant à la base de données. Pour plus d'informations concernant l'installation des modules externes, consultez la page Installation de modules externes.

Remote server

Cochez cette case si vous utilisez un serveur REST Neo4j et spécifiez l'URL racine dans le champ Server URL.
  • Set username : cette case est disponible lorsque vous avez coché la case Use a remote server et que la version de Neo4j que vous utilisez est antérieure à 2.2. Si le serveur Neo4j distant auquel vous souhaitez vous connecter ne nécessite pas l'utilisation d'un identifiant et d'un mot de passe, laissez la case décochée.

  • Username et Password : saisissez les informations d'authentification pour vous connecter au serveur Neo4j distant à utiliser. Depuis la version 2.2 de Neo4j, l'identifiant et le mot de passe sont toujours requis.

Cette case apparaît uniquement si la case Use an existing connection n'est pas cochée.

Database path

Si vous utilisez Neo4j en mode embarqué, spécifiez le répertoire qui contiendra vos fichiers de données. Le répertoire spécifié sera créé s'il n'existe pas déjà.

Cette case apparaît uniquement si la case Use an existing connection ou la case Remote Server n'est pas cochée.

Shutdown after job (Only embedded database)

Cochez cette case si vous souhaitez arrêter la connexion à la base de données Neo4j à la fin du Job.

Cette case est disponible uniquement lorsque la case Use an existing connection est cochée.

Mapping

Cliquez sur le bouton [...] ou double-cliquez sur le composant dans l'espace de modélisation graphique pour ouvrir l'éditeur de mapping des index et des relations. Utilisez cet éditeur pour indexer un nœud ou créer des relations durant l'insertion d'un nœud.

  • Cochez la case Auto indexed pour qu'une colonne indexe automatiquement des nœuds avec cette propriété.

  • Index creation : Après avoir sélectionné une colonne, cliquez sur le bouton [+] pour créer sur les nœuds autant d'index que vous le souhaitez, avec la propriété correspondant à la colonne sélectionnée.

    • Name : Spécifiez un nom d'index entre guillemets doubles.

    • Key : Spécifiez une clé d'index entre guillemets doubles.

    • Value (empty for current row) : Spécifiez une valeur d'index entre guillemets doubles. Si vous laissez ce champ vide, la valeur par défaut de l'index ajouté sur chaque nœud deviendra la valeur de la propriété du nœud actuel.

    • Unique : Cochez cette case si vous souhaitez que l'index défini ne soit créé qu'une seule fois dans le graphique plutôt que sur chaque nœud.

  • Relationship creation : Après avoir sélectionné une colonne, cliquez sur le bouton [+] pour créer autant de relations que vous le souhaitez pour les nœuds, avec la propriété correspondant à la colonne sélectionnée.

    • Type : Spécifiez un type de relation entre guillemets doubles.

    • Direction : Sélectionnez une direction de relation : Outgoing ou Incoming.

    • Index name : Spécifiez un nom d'index pour la relation entre guillemets doubles.

    • Index key : Spécifiez une clé d'index pour la relation entre guillemets doubles.

    • Value (empty for current row) : Spécifiez une valeur d'index pour la relation entre guillemets doubles. Si vous laissez ce champ vide, la valeur par défaut de l'index ajouté sur la relation deviendra la valeur de la propriété du nœud actuel.

Use label (Neo4j > 2.0)

Cochez cette case afin de créer des nœuds ayant un libellé. Saisissez le nom de votre libellé dans le champ Label name.

Cette case n'est pas affichée si l'option Neo4J 1.X.X est sélectionnée dans la liste DB Version ou si l'option Delete est sélectionnée dans la liste Data action.

Notez que cette option fonctionne uniquement à partir de la version 2.0 de Neo4j 2.0 et avec Java 7.

Data action

Sur les données du nœud, vous pouvez effectuer les actions suivantes :

  • Insert : ajouter un nouveau nœud à la base de données.

  • Update : effectuer des modifications sur les entrées existantes.

  • Update or insert : recherche le nœud via un index pour le mettre à jour ou le modifier. Si le nœud n'existe pas, un nouveau nœud est inséré

  • Delete : supprime les nœuds récupérés par l'index en fonction du flux d'entrée.

Index name

Spécifiez le nom de l'index à interroger.

Ce champ est disponible uniquement si l'action sélectionnée dans la liste Data action est autre que Insert.

Index key

Spécifiez la clé d'index à interroger.

Ce champ est disponible uniquement si l'action sélectionnée dans la liste Data action est autre que Insert.

Index value

Sélectionnez la valeur d'index à interroger.

Ce champ est disponible uniquement si l'action sélectionnée dans la liste Data action est autre que Insert.

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

Lorsque le schéma à réutiliser contient des valeurs par défaut, qui sont des entiers (integer) ou des fonctions (function), assurez-vous que les valeurs par défaut ne sont pas entourées de guillemets. Si c'est le cas, vous devez supprimer manuellement les guillemets.

Pour plus d'informations, consultez Vérification des valeurs par défaut dans un schéma récupéré.

Advanced settings

Commit every

Saisissez le nombre de lignes à compléter avant de commiter les lots de nœuds dans la base de données. Cette options assure la qualité de la transaction (mais pas le rollback) et permet une meilleure performance lors de l'exécution.

Avertissement :

Cette option est supportée uniquement par le mode embarqué de la base de données. Vous ne pouvez pas effectuer de transactions en mode REST.

Batch import

Cochez cette case pour activer le mode batch (par lots).

Avertissement :

Cette option est supportée uniquement par le mode embarqué de la base de données. Il est recommandé d'effectuer une sauvegarde avant d'exécuter le Job, afin d'éviter la corruption des données.

Remarque :

Si vous avez configuré la création d'index sur plusieurs colonnes dans la table Mapping, il est recommandé de cocher la case Unique dans les paramètres d'index pour la dernière colonne afin d'éviter de créer des doublons d'index non désirés susceptibles de causer des problèmes de chargement de batch.

Pour plus d'informations concernant la configuration du mapping de la mémoire, consultez la documentation Neo4j à l'adresse suivante : http://neo4j.com/docs/stable/batchinsert-examples.html (en anglais).

Node store mapped memory

Saisissez la taille de la mémoire allouées aux nœuds, en Mo.

Relationship store mapped memory

Saisissez la taille de la mémoire allouée aux relations, en Mo.

Property store mapped memory

Saisissez la taille de la mémoire allouée à la propriété, en Mo.

String store mapped memory

Saisissez la taille de la mémoire allouée aux chaînes de caractères, en Mo.

Array store mapped memory

Saisissez la taille de la mémoire allouée aux tableaux, en Mo.

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du Job ainsi qu'au niveau de chaque composant.

Global Variables

Global Variables

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Règle d'utilisation

Ce composant est utilisé en tant que composant de sortie et nécessite un lien d'entrée.