Centraliser les métadonnées de MongoDB

Talend Real-time Big Data Platform Studio Guide utilisateur

EnrichVersion
6.4
EnrichProdName
Talend Real-Time Big Data Platform
task
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Si vous avez souvent besoin de manipuler des données d'une base de données MongoDB, alors il peut être intéressant pour vous de centraliser la connexion à une base de données MongoDB et les détails de schémas dans le dossier Metadata, dans la vue Repository.

La procédure d'installation des métadonnées de MongoDB est constituée de deux tâches majeures différentes mais liées :

  1. Créer une connexion à une base de données MongoDB.

  2. Récupérer les schémas MongoDB qui vous intéressent.

Prérequis :

  • Tous les modules externes requis manquant dans le Studio Talend en raison des restrictions de licence doivent être installés. Pour plus d'informations, consultez le Guide d'installation Talend.

Créer une connexion à une base de données MongoDB

  1. Dans la vue Repository, développez le nœud Metadata, cliquez-droit sur NoSQL Connection et sélectionnez Create Connection dans le menu contextuel. L'assistant de connexion s'ouvre.

  2. Dans l'assistant de connexion, renseignez les propriétés générales de la connexion que vous avez besoin de créer, telles que le nom (Name), le but (Purpose) et la description (Description).

    Les informations que vous renseignez dans le champ Description apparaissent dans une info-bulle lorsque vous bougez le pointeur de votre souris au-dessus de la connexion.

    Lorsque vous avez terminé, cliquez sur Next pour passer à l'étape suivante.

  3. Sélectionnez MongoDB dans la liste DB Type ainsi que la version de la base de données MongoDB à laquelle vous vous connectez dans la liste DB Version, puis spécifiez les détails suivants :

    • Saisissez le nom d'hôte ou l'adresse IP ainsi que le numéro de port du serveur MongoDB dans les champs correspondants.

      Si la base de données à laquelle vous vous connectez est répliquée sur différents serveurs d'un replica set, cochez la case Use replica set address et spécifiez les noms d'hôtes ou les adresses IP ainsi que les ports respectifs dans la table Replica set address. Cela peut améliorer la fiabilité et les performances de la manipulation de données.

    • Si vous souhaitez restreindre votre connexion MongoDB à une seule base de données en particulier, saisissez le nom de cette base de données dans le champ Database.

      Si vous laissez ce champ vide, l'assistant listera les collections de toutes les bases de données existantes sur le serveur connecté lors de la récupération des schémas.

    • Si votre serveur MongoDB requiert des informations d'authentification pour accéder à la base de données, cochez la case Require authentication et renseignez vos nom d'utilisateur et mot de passe dans les champs correspondants.

  4. Cliquez sur le bouton Check afin de vous assurer que la connexion fonctionne.

  5. Cliquez sur Finish pour valider les paramètres.

    La connexion à la base de données MongoDB nouvellement créée apparaît sous le nœud NoSQL Connection dans la vue Repository. Vous pouvez maintenant la déposer dans votre espace de modélisation graphique en tant que composant MongoDB, mais vous devez tout de même définir les informations de schéma là où cela est nécessaire.

    Vous devez ensuite récupérer un ou plusieurs schéma(s) qui vous intéresse(nt) pour votre connexion.

Récupérer les schémas

Dans cette étape, vous allez récupérer les schémas qui vous intéressent de la base de données connectée MongoDB.

  1. Dans la vue Repository, cliquez-droit sur la connexion nouvellement créée et sélectionnez Retrieve Schema dans le menu contextuel.

    L'assistant ouvre une nouvelle vue qui liste toutes les collections disponibles de la base de données spécifiée, ou toutes les bases de données disponibles si vous n'en avez spécifié aucune lors de l'étape précédente.

  2. Développez la base de données, ou alors les bases de données qui vous intéressent si vous n'avez pas spécifié de base de données lors de l'étape précédente, comme c'est le cas dans cet exemple, puis sélectionnez la ou les collection(s) qui vous intéresse(nt).

  3. Cliquez sur Next pour passer à l'étape suivante de l'assistant dans laquelle vous pouvez éditer le ou les schéma(s) généré(s).

    Par défaut, chaque schéma généré prend le nom de la colonne sur laquelle il est basé.

    Sélectionnez un schéma dans le panneau Schema pour afficher ses détails sur le côté droit et modifiez le schéma si nécessaire. Vous pouvez renommer n'importe quel schéma et personnaliser la structure d'un schéma selon vos besoins dans la zone Schema.

    La barre d'outils vous permet d'ajouter, de supprimer ou de déplacer des colonnes dans votre schéma, ou encore de remplacer le schéma avec le schéma défini dans un fichier XML.

    Pour baser un schéma sur une autre collection, sélectionnez le nom du schéma dans le panneau Schema et sélectionnez une nouvelle collection dans la liste Based on Collection. Cliquez ensuite sur le bouton Guess Schema pour écraser le schéma avec celui de la collection sélectionnée. Vous pouvez cliquer sur le bouton de rafraîchissement pour rafraîchir la liste des collections.

    Pour ajouter un nouveau schéma, cliquez sur le bouton Add Schema dans le panneau Schema pour créer un schéma vide que vous devez définir.

    Pour supprimer un schéma, sélectionnez le nom du schéma dans le panneau Schema et cliquez sur le bouton Remove Schema.

    Pour écraser les modifications que vous avez effectuées sur le schéma sélectionné par son schéma par défaut, cliquez sur le bouton Guess schema. Notez que toutes les modifications que vous avez apportées au schéma seront perdues si vous cliquez sur ce bouton.

  4. Cliquez sur Finish pour terminer la création du schéma. Les schémas créés apparaissent sous votre connexion MongoDB dans la vue Repository. Vous pouvez désormais déposer la connexion ou n'importe quel nœud sous cette connexion dans votre espace graphique de modélisation en tant que composant MongoDB. Toutes les informations sur les métadonnées seront automatiquement renseignées.

    Si vous avez besoin de continuer à éditer un schéma, cliquez-droit sur ce schéma et sélectionnez Edit Schema dans le menu contextuel pour ouvrir de nouveau cet assistant et effectuer vos modifications.

    Avertissement

    Si vous modifiez les schémas, assurez-vous que le type de données dans la colonne Type est correctement défini.