Propriétés du tMapROjaiInput Standard - 7.2

MapRDB

author
Talend Documentation Team
EnrichVersion
7.2
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants MapRDB
Gouvernance de données > Systèmes tiers > Composants Database > Composants MapRDB
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants MapRDB
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tMapROjaiInput s'exécutant dans le framework de Job Standard.

Le composant tMapROjaiInput Standard appartient à la famille Bases de données NoSQL.

Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.

Basic settings

Distribution et Version

Sélectionnez la version du cluster MapR. Pour être utilisé, le cluster doit héberger une base de données MapR-DB.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema.
Remarque : Si vous effectuez des modifications, le schéma passe automatiquement en type built-in.
  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Ce composant supporte le type Document. Si un champ concerne les documents entiers, sélectionnez Document dans la colonne Type pour ce champ dans l'éditeur de schéma.

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

Use kerberos authentication

Si vous accédez à une base de données MapR-DB de type OJAI s'exécutant avec une sécurité Kerberos, cochez cette case, saisissez le nom et le mot de passe du Principal, dans les champs qui s'affichent.

À chaque démarrage du Job, le composant envoie ses informations d'authentification à Kerberos pour un nouveau ticket kinit.

  • Si le mécanisme de sécurité par ticket MapR est également configuré avec Kerberos, ce composant émet une commande mapr login pour obtenir un ticket MapR en même temps.

  • Si le mécanisme de sécurité par ticket MapR est configuré pour votre cluster alors que Kerberos ne l'est pas, laissez cette case décochée. Le composant obtient un ticket MapR via votre client MapR Client.

Use a keytab to authenticate

Cochez la case Use a keytab to authenticate pour vous connecter à un système utilisant Kerberos à l'aide d'un fichier keytab. Un fichier Keytab contient les paires des Principaux et clés cryptées Kerberos. Vous devez saisir le principal à utiliser dans le champ Principal et le chemin d'accès au fichier keytab dans le champ Keytab. Ce fichier keytab doit être stocké sur la machine où s'exécute votre Job, par exemple, sur un serveur de Jobs Talend.

L'utilisateur exécutant un Job utilisant un fichier Keytab n'est pas nécessairement celui désigné par un Principal mais doit avoir le droit de lire le fichier Keytab utilisé. Par exemple, le nom d'utilisateur que vous utilisez pour exécuter le Job est user1 et le principal à utiliser est guest. Dans cette situation, assurez-vous que user1 a les droits de lecture pour le fichier keytab à utiliser.

Restrict partial sorts with Secondary Indexes

Cochez cette case pour forcer la requête à trier explicitement les données. Ainsi, vous évitez dans votre requête les tris partiels pouvant survenir à cause d'index secondaires asynchrones.

Pour plus d'informations relatives aux problèmes de tri partiel dans MapR OJAI, consultez Asynchronous Secondary Index Updates dans la documentation MapR (en anglais).

Ne cochez pas cette case si vous n'attendez pas de latence dans les index asynchrones ou si vous savez que l'impact de la latence est minime. En laissant cette case décochée, votre requête bénéficie des avantages de tri fournis pas les index secondaires des tables JSON MapR-DB.

Table name

Saisissez le nom de table à traiter.

Query

Spécifiez la clause WHERE de la requête à effectuer par le tMapROjaiInput.

Par exemple, saisissez "{id:{$eq: 4}}" ou "{id:4}}"pour récupérer l'enregistrement dans lequel id est 4.

Puisqu'OJAI utilise le format de requêtes MongoDB pour les requêtes, consultez Query Operators dans la documentation MongoDB, pour en savoir plus sur les opérateurs disponibles.

Mapping

Chaque colonne du schéma défini pour ce composant représente un champ des documents à lire. Dans cette table, vous devez spécifier les nœuds parents de ces champs, s'il y en a.

Par exemple, dans le document se présentant comme suit :
{
               _id: ObjectId("5099803df3f4948bd2f98391"),
               person: { first: "Joe", last: "Walker" }
            }
Les champs first et last ont un nœud père person mais le champ _id ne contient aucun nœud père. Cela fait, la table Mapping doit ressembler à ceci :
Column     Parent node path
_id
first       "person"
last        "person"

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Variables globales

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend .

Utilisation

Règle d'utilisation

Le tMapROjaiInput exécute des requêtes pour lire des données d'une base de données MapR-DB. Ce composant est un composant de début dans un Job et nécessite un lien de sortie pour envoyer les données au composant suivant.