Propriétés du tCosmosDBBulkLoad Standard - 6.5

CosmosDB

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Open Studio for Big Data
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Database > Composants CosmosDB
Gouvernance de données > Systèmes tiers > Composants Database > Composants CosmosDB
Qualité et préparation de données > Systèmes tiers > Composants Database > Composants CosmosDB
EnrichPlatform
Studio Talend

Ces propriétés sont utilisées pour configurer le tCosmosDBBulkLoad s'exécutant dans le framework de Jobs Standard.

Le composant tCosmosDBBulkLoad Standard appartient aux familles Cloud et Databases.

Le composant de ce framework est disponible dans tous les produits Big Data de Talend.

Basic settings

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) dans le Repository. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

MongoDB directory

Saisissez dans ce champ le répertoire d'installation de MongoDB.

Use replica set address or multiple query routers

Cochez cette case pour afficher la table Server addresses.

Dans la table Server addresses, définissez les bases de données MongoDB shardées ou les ensembles de répliques MongoDB auxquel(le)s vous souhaitez vous connecter.

Server et Port

Saisissez l'adresse IP et le numéro du port d'écoute du serveur de la base de données.

Disponible lorsque la case Use replica set address or multiple query routers n'est pas cochée.

Database

Saisissez le nom de la base de données MongoDB à laquelle vous connecter.

Collection

Saisissez le nom de la collection dans laquelle importer les données.

Drop collection if exist

Cochez cette case afin de supprimer la collection si elle existe déjà.

Authentication mechanism

Parmi les mécanismes listés dans la liste déroulante Authentication mechanism, le mécanisme NEGOTIATE est recommandé si vous n'utilisez pas Kerberos, car il sélectionne automatiquement le mécanisme d'authentification le plus adapté à la version de MongoDB que vous utilisez.

Pour plus d'informations sur les autres mécanismes de la liste, consultez MongoDB Authentication (en anglais) dans la documentation MongoDB.

Set Authentication database

Si le nom d'utilisateur à utiliser pour se connecter à MongoDB a été créé dans une base de données d'authentification MongoDB spécifique, cochez cette case pour saisir le nom de la base de données en question dans le champ Authentication database qui s'affiche.

Pour plus d'informations sur la base de données d'authentification MongoDB, consultez User Authentication database (en anglais).

Username et Password

Saisissez les informations d'authentification de l'utilisateur de la base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Ces champs sont disponibles lorsque la case Use authentication est cochée.

Si le système de sécurité sélectionné dans la liste Authentication mechanism est Kerberos, saisissez les informations dans les champs suivants User principal, Realm et KDC server et non dans les champs Username et Password.

Data file

Saisissez le chemin d'accès complet au fichier duquel importer les données, ou cliquez sur le bouton [...] afin de parcourir votre système jusqu'au fichier de données.

Assurez-vous que le fichier de données est bien dans un format standard. Par exemple, les champs des fichiers CSV doivent être séparés par une virgule.

File type

Sélectionnez le type de fichier dans la liste. Les formats CSV, TSV et JSON sont supportés.

The JSON file starts with an array

Cochez cette case pour permettre au tCosmosDBBulkload de lire les fichiers JSON commençant par un tableau.

Cette case est disponible lorsque vous avez sélectionné JSON dans la liste File type.

Action on data

Sélectionnez l'action à effectuer sur les données.

  • Insert : insérer des données dans la base de données.

    Lorsque vous insérez des données depuis des fichiers CSV ou TSV dans la base de données MongoDB, vous devez spécifier les champs, en cochant la case First line is header ou en les définissant dans le schéma.

  • Upsert : insérer les données si elles n'existent pas ou les mettre à jour si elles existent.

    Lors d'une opération d'upsert de données dans la base de données MongoDB, vous devez spécifier une liste de champs, pour la partie requête de l'opération.

Upsert fields

Personnalisez les champs sur lesquels effectuer un upsert.

Cette table est disponible lorsque vous sélectionnez Upsert dans la liste Action on data.

First line is header

Cochez cette case pour utiliser la première ligne d'un fichier CSV ou TSV en tant qu'en-tête.

Cette case est disponible uniquement lorsque vous sélectionnez CSV ou TSV dans la liste File type.

Ignore blanks

Cochez cette case pour ignorer les champs vides dans les fichiers CSV ou TSV.

Cette case est disponible uniquement lorsque vous sélectionnez CSV ou TSV dans la liste File type.

Print log

Cochez cette case pour afficher les logs.

Advanced settings

Additional arguments

Renseignez cette table afin d'utiliser des arguments supplémentaires selon vos besoins.

Par exemple, vous pouvez utiliser l'argument "--jsonArray" pour accepter l'import de données de différents documents MongoDB dans un seul tableau JSON. Pour plus d'informations concernant les arguments supplémentaires, consultez le site http://docs.mongodb.org/manual/reference/program/mongoimport/ (en anglais) et lisez la description des options.

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau des composants.

Usage

Règle d'utilisation

Ce composant est généralement utilisé avec un tCosmosDBInput afin de vérifier si les données sont bien importées.

Limitation

L'outil client MongoDB doit être installé sur la machine où les Jobs contenant ce composant sont exécutés.