Propriétés du tMapROjaiOutput Standard - 7.0

MapRDB

Version
7.0
Language
Français (France)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants NoSQL > Composants MapRDB
Gouvernance de données > Systèmes tiers > Composants NoSQL > Composants MapRDB
Qualité et préparation de données > Systèmes tiers > Composants NoSQL > Composants MapRDB

Ces propriétés sont utilisées pour configurer le tMapROjaiOutput s'exécutant dans le framework de Jobs Standard.

Le composant tMapROjaiOutput Standard appartient à la famille Databases.

Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.

Basic settings

Property type

Peut être Built-In ou Repository.

Built-In : aucune propriété n'est stockée de manière centrale.

Repository : Sélectionnez le fichier dans lequel sont stockées les propriétés du composant.

Table

Nom de la table à traiter.

DB versions

Sélectionnez la version de votre base de données.

Use kerberos authentication

Si vous accédez à une base de données MapR-DB de type OJAI s'exécutant avec une sécurité Kerberos, cochez cette case, saisissez le nom et le mot de passe du Principal, dans les champs qui s'affichent.

À chaque démarrage du Job, le composant envoie ses informations d'authentification à Kerberos pour un nouveau ticket kinit.

  • Si le mécanisme de sécurité par ticket MapR est également configuré avec Kerberos, ce composant émet une commande mapr login pour obtenir un ticket MapR en même temps.

  • Si le mécanisme de sécurité par ticket MapR est configuré pour votre cluster alors que Kerberos ne l'est pas, laissez cette case décochée. Le composant obtient un ticket MapR via votre client MapR Client.

Use a keytab to authenticate

Cochez la case Use a keytab to authenticate pour vous connecter à un système utilisant Kerberos à l'aide d'un fichier keytab. Un fichier Keytab contient les paires des Principaux et clés cryptées Kerberos. Vous devez saisir le principal à utiliser dans le champ Principal et le chemin d'accès au fichier keytab dans le champ Keytab. Ce fichier keytab doit être stocké sur la machine où s'exécute votre Job, par exemple, sur un serveur de Jobs Talend.

l'utilisateur ou l'utilisatrice exécutant un Job utilisant un fichier Keytab n'est pas nécessairement celui désigné par un Principal mais doit avoir le droit de lire le fichier Keytab utilisé. Par exemple, le nom d'utilisateur ou d'utilisatrice que vous utilisez pour exécuter le Job est user1 et le principal à utiliser est guest. Dans cette situation, assurez-vous que user1 a les droits de lecture pour le fichier keytab à utiliser.

Action on table

Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :

  • None : aucune opération n'est effectuée.

  • Drop and create table : la table est supprimée et créée à nouveau.

  • Create table : la table n'existe pas et est créée.

  • Create table if does not exist : la table est créée si elle n'existe pas.

  • Drop table if exist and create : la table est supprimée si elle existe déjà et créée à nouveau.

  • Truncate : le contenu de la table est supprimé.

Action on data

Sélectionnez une action à effectuer sur les données de la table définie.

  • Insert : ajoute de nouvelles entrées à la table. Le Job s'arrête lorsqu'il détecte des doublons.

  • Replace : si la table contient déjà des données, supprime toutes les données existantes et insère les nouvelles données. Si la table est vide, insère les nouvelles données.

  • Insert or Replace : regarde les ID des documents, remplace les documents dont l'ID existe dans la base de données et dans les données à écrire et insère les documents dont l'ID n'existe pas dans la base de données.

  • Update or insert : met à jour l'enregistrement avec la référence donnée. Si l'enregistrement n'existe pas dans le pool d'index, un nouvel enregistrement est inséré.

  • Delete : supprime les entrées correspondantes au flux d'entrée.

Schema et Edit Schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Modifiez le schéma en cliquant sur Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

 

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Job Designs et projets.

Lorsque le schéma à réutiliser contient des valeurs par défaut de type Integer ou Function, assurez-vous que ces valeurs par défaut ne sont pas entourées de guillemets. Si elles le sont, supprimez manuellement les guillemets.

Pour plus d'informations, consultez la description relative à la récupération des schémas de tables dans le Guide utilisateur du Studio Talend.

Bulk write

Cochez cette case pour insérer, mettre à jour ou supprimer des données en masse.

Dans le champ Bulk write size, saisissez la taille de chaque groupe de requêtes à traiter avec MapR-DB.

Mapping

Chaque colonne du schéma défini pour ce composant représente un champ des documents à lire. Dans cette table, vous devez spécifier les nœuds parents de ces champs, s'il y en a.

Par exemple, dans le document se présentant comme suit :
{
               _id: ObjectId("5099803df3f4948bd2f98391"),
               person: { first: "Joe", last: "Walker" }
            }
Les champs first et last ont un nœud père person mais le champ _id ne contient aucun nœud père. Cela fait, la table Mapping doit ressembler à ceci :
Column     Parent node path
_id
first       "person"
last        "person"

Die on error

Cette case est décochée par défaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et d'ignorer les lignes en erreur.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Variables globales

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

NB_LINE_REJECTED : nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend .

Utilisation

Règle d'utilisation

Le tMapROjaiOutput exécute l'action définie sur les documents dans une base de données MapR-DB, en se basant sur le flux entrant provenant du composant précédent dans votre Job.