Propriétés du tMapROjaiOutput Standard - 7.2

MapRDB

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants MapRDB
Gouvernance de données > Systèmes tiers > Composants Database > Composants MapRDB
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants MapRDB
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tMapROjaiOutput s'exécutant dans le framework de Jobs Standard.

Le composant tMapROjaiOutput Standard appartient à la famille Bases de données NoSQL.

Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.

Basic settings

Distribution et Version

Sélectionnez la version du cluster MapR. Pour être utilisé, le cluster doit héberger une base de données MapR-DB.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema.
Remarque : Si vous effectuez des modifications, le schéma passe automatiquement en type built-in.
  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Ce composant supporte le type Document. Si un champ concerne les documents entiers, sélectionnez Document dans la colonne Type pour ce champ dans l'éditeur de schéma.

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

Use kerberos authentication

Si vous accédez à une base de données MapR-DB de type OJAI s'exécutant avec une sécurité Kerberos, cochez cette case, saisissez le nom et le mot de passe du Principal, dans les champs qui s'affichent.

À chaque démarrage du Job, le composant envoie ses informations d'authentification à Kerberos pour un nouveau ticket kinit.

  • Si le mécanisme de sécurité par ticket MapR est également configuré avec Kerberos, ce composant émet une commande mapr login pour obtenir un ticket MapR en même temps.

  • Si le mécanisme de sécurité par ticket MapR est configuré pour votre cluster alors que Kerberos ne l'est pas, laissez cette case décochée. Le composant obtient un ticket MapR via votre client MapR Client.

Use a keytab to authenticate

Cochez la case Use a keytab to authenticate pour vous connecter à un système utilisant Kerberos à l'aide d'un fichier keytab. Un fichier Keytab contient les paires des Principaux et clés cryptées Kerberos. Vous devez saisir le principal à utiliser dans le champ Principal et le chemin d'accès au fichier keytab dans le champ Keytab. Ce fichier keytab doit être stocké sur la machine où s'exécute votre Job, par exemple, sur un serveur de Jobs Talend.

L'utilisateur exécutant un Job utilisant un fichier Keytab n'est pas nécessairement celui désigné par un Principal mais doit avoir le droit de lire le fichier Keytab utilisé. Par exemple, le nom d'utilisateur que vous utilisez pour exécuter le Job est user1 et le principal à utiliser est guest. Dans cette situation, assurez-vous que user1 a les droits de lecture pour le fichier keytab à utiliser.

Table

Saisissez le nom de table à traiter.

Action on table

Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :

  • None : n'effectuer aucune opération de table.

  • Drop and create table : la table est supprimée et de nouveau créée.

  • Create table : la table n'existe pas et est créée.

  • Create table if does not exist : créer la table si elle n'existe pas encore.

  • Drop table if exists and create : supprimer la table si elle existe déjà, puis en créer une nouvelle.

  • Truncate table : supprimer le contenu de la table.

Action on data

Select an action to be performed on data of the table defined.

  • Insert: Add new entries to the table. If duplicates are found, job stops.

  • Replace: if the table already contains data, delete all the existing data and insert the new data. If the table is empty, insert the new data.

  • Insert or Replace: it looks at the document IDs, replaces the documents whose IDs exist in both the database and the data to be written, and inserts the documents whose IDs do not exist in the database.

  • Delete: Remove entries corresponding to the input flow.

Bulk write

Cochez cette case pour insérer, mettre à jour ou supprimer des données en masse.

Dans le champ Bulk write size, saisissez la taille de chaque groupe de requêtes à traiter avec MapR-DB.

Mapping

Chaque colonne du schéma défini pour ce composant représente un champ des documents à lire. Dans cette table, vous devez spécifier les nœuds parents de ces champs, s'il y en a.

Par exemple, dans le document se présentant comme suit :
{
               _id: ObjectId("5099803df3f4948bd2f98391"),
               person: { first: "Joe", last: "Walker" }
            }
Les champs first et last ont un nœud père person mais le champ _id ne contient aucun nœud père. Cela fait, la table Mapping doit ressembler à ceci :
Column     Parent node path
_id
first       "person"
last        "person"

Die on error

Cette case est décochée par défaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et d'ignorer les lignes en erreur.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Variables globales

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

NB_LINE_REJECTED : nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend .

Utilisation

Règle d'utilisation

Le tMapROjaiOutput exécute l'action définie sur les documents dans une base de données MapR-DB, en se basant sur le flux entrant provenant du composant précédent dans votre Job.