Propriétés du tMapROjaiOutput Standard - Cloud - 8.0

MapRDB

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants NoSQL > Composants MapRDB
Gouvernance de données > Systèmes tiers > Composants NoSQL > Composants MapRDB
Qualité et préparation de données > Systèmes tiers > Composants NoSQL > Composants MapRDB
Last publication date
2024-02-21

Ces propriétés sont utilisées pour configurer le tMapROjaiOutput s'exécutant dans le framework de Jobs Standard.

Le composant tMapROjaiOutput Standard appartient à la famille Bases de données NoSQL.

Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.

Basic settings

Distribution et Version

Sélectionnez la version du cluster MapR. Pour être utilisé, le cluster doit héberger une base de données MapR-DB.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema. Si vous effectuez des modifications, le schéma passe automatiquement en type built-in.

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

    Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Ce composant supporte le type Document. Si un champ concerne les documents entiers, sélectionnez Document dans la colonne Type pour ce champ dans l'éditeur de schéma.

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

Use kerberos authentication

Si vous accédez à une base de données MapR-DB de type OJAI s'exécutant avec une sécurité Kerberos, cochez cette case, saisissez le nom et le mot de passe du Principal, dans les champs qui s'affichent.

À chaque démarrage du Job, le composant envoie ses informations d'authentification à Kerberos pour un nouveau ticket kinit.

Use a keytab to authenticate

Cochez la case Use a keytab to authenticate pour vous connecter à un système utilisant Kerberos à l'aide d'un fichier keytab. Un fichier Keytab contient les paires des Principaux et clés cryptées Kerberos. Vous devez saisir le principal à utiliser dans le champ Principal et le chemin d'accès au fichier keytab dans le champ Keytab. Ce fichier keytab doit être stocké sur la machine où s'exécute votre Job, par exemple, sur un Talend JobServer.

l'utilisateur ou l'utilisatrice exécutant un Job utilisant un fichier Keytab n'est pas nécessairement celui désigné par un Principal mais doit avoir le droit de lire le fichier Keytab utilisé. Par exemple, le nom d'utilisateur ou d'utilisatrice que vous utilisez pour exécuter le Job est user1 et le principal à utiliser est guest. Dans cette situation, assurez-vous que user1 a les droits de lecture pour le fichier Keytab à utiliser.

Table

Saisissez le nom de table à traiter.

Action on table

Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :

  • None : n'effectuer aucune opération de table.

  • Drop and create table : la table est supprimée et de nouveau créée.

  • Create table : la table n'existe pas et est créée.

  • Create table if does not exist : créer la table si elle n'existe pas encore.

  • Drop table if exists and create : supprimer la table si elle existe déjà, puis en créer une nouvelle.

  • Truncate table : supprimer le contenu de la table.

Action on data

Sélectionnez une action à effectuer sur les données de la table définie.

  • Insert : ajoute de nouvelles entrées à la table. Le Job s'arrête lorsqu'il détecte des doublons.

  • Replace : si la table contient déjà des données, supprime toutes les données existantes et insère les nouvelles données. Si la table est vide, insère les nouvelles données.

  • Insert or Replace : regarde les ID des documents, remplace les documents dont l'ID existe dans la base de données et dans les données à écrire et insère les documents dont l'ID n'existe pas dans la base de données.

  • Delete : supprime les entrées correspondant au flux d'entrée.

Bulk write

Cochez cette case pour insérer, mettre à jour ou supprimer des données en masse.

Dans le champ Bulk write size, saisissez la taille de chaque groupe de requêtes à traiter avec MapR-DB.

Mapping

Chaque colonne du schéma défini pour ce composant représente un champ des documents à lire. Dans cette table, vous devez spécifier les nœuds parents de ces champs, s'il y en a.

Par exemple, dans le document se présentant comme suit :
{
               _id: ObjectId("5099803df3f4948bd2f98391"),
               person: { first: "Joe", last: "Walker" }
            }
Les champs first et last ont un nœud parent person mais le champ _id ne contient aucun nœud parent. Cela fait, la table Mapping doit ressembler à ceci :
Column     Parent node path
_id
first       "person"
last        "person"

Die on error

Cette case est décochée par défaut, ce qui vous permet de terminer le traitement avec les lignes sans erreur, et d'ignorer les lignes en erreur.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Variables globales

Variables globales

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

NB_LINE_REJECTED : nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables.

Utilisation

Règle d'utilisation

Le tMapROjaiOutput exécute l'action définie sur les documents dans une base de données MapR-DB, en se basant sur le flux entrant provenant du composant précédent dans votre Job.