tMysqlOutputBulkExec

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Data Quality
Talend Open Studio for Big Data
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Open Studio for Data Integration
task
Gouvernance de données
Qualité et préparation de données
Création et développement
EnrichPlatform
Studio Talend

Les composants tMysqlOutputBulk et tMysqlBulkExec sont généralement utilisés ensemble comme deux parties d'un processus en deux étapes. Dans la première étape, un fichier de sortie est généré. Dans la deuxième étape, ce fichier est utilisé lors de l'opération d'INSERT afin de peupler une base de données. Cette exécution en deux étapes est unifiée dans le composant tMysqlOutputBulkExec.

Fonction

Le tMysqlOutputBulkExec effectue une action d'Insert sur les données fournies.

Objectif

Le tMysqlOutputBulkExec est un composant dédié qui permet un gain de performance pendant les opérations d'Insert dans une base de données MySQL.

Propriétés du tMysqlOutputBulkExec

Famille du composant

Databases/MySQL

 

Basic settings

Property type

Peut être Built-in ou Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

 

 

Built-in : Propriétés utilisées ponctuellement.

 

 

Repository : Sélectionnez le fichier de propriétés du composant. Les champs suivants sont alors pré-remplis à l'aide des données collectées.

 

DB Version

Sélectionnez la version de MySQL que vous utilisez.

 

Host

Adresse IP du serveur de base de données.

 

Port

Numéro du port d'écoute du serveur de base de données.

 

Database

Nom de la base de données.

 

Username et Password

Informations d'authentification de l'utilisateur de base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

 

Action on table

Vous pouvez effectuer l'une des opérations suivantes sur les données de la table sélectionnée :

None : n'effectue aucune action sur la table.

Drop and create table : supprime la table puis en créer une nouvelle.

Create table : crée une table qui n'existe pas encore.

Create table if not exists : crée la table si nécessaire.

Drop table if exists and create : supprimer la table si elle existe déjà, puis en créer une nouvelle.

Clear table : supprime le contenu de la table.

 

Table

Nom de la table à écrire.

Note

Une seule table peut être écrite à la fois et cette table doit déjà exister pour que l'opération d'Insert soit autorisée.

 

Local FileName

Nom du fichier à générer et à traiter.

Ce fichier est généré sur la même machine que le Studio Talend ou que le Job contenant un tMysqlOutputBulkExec, puis chargé dans la base de données spécifiée dans le champ Host.

 

Append

Cochez cette option pour ajouter de nouvelles lignes à la fin du fichier.

 

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs qui sont traités et passés au composant suivant. Le schéma peut être Built-in ou distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

 

 

Built-In : Le schéma est créé et conservé ponctuellement pour ce composant seulement. Voir également le Guide utilisateur du Studio Talend.

 

 

Repository : Le schéma existe déjà et il est stocké dans le Repository. Ainsi, il peut être réutilisé. Voir également le Guide utilisateur du Studio Talend.

Lorsque le schéma à réutiliser contient des valeurs par défaut, qui sont des entiers (integer) ou des fonctions (function), assurez-vous que les valeurs par défaut ne sont pas entourées de guillemets. Si c'est le cas, vous devez supprimer manuellement les guillemets.

Pour plus d'informations, consultez l'article Vérification des valeurs par défaut dans un schéma récupéré sur Talend Help Center (https://help.talend.com).

Advanced settings

Additional JDBC Parameters

Ajoutez des informations de connexion supplémentaires nécessaires à la connexion à la base de données.

Note

Vous pouvez appuyer sur Ctrl+Espace afin d'accéder à une liste de variables globales prédéfinies.

 

Row separator

Chaîne (ex : "\n" sous Unix) séparant les lignes.

 

Field separator

Caractère, chaîne ou expression régulière séparant les champs.

 

Text enclosure

Caractères entourant les données.

 

Create directory if not exists

Cette case est cochée par défaut. Cette option permet de créer le dossier contenant le fichier de sortie s'il n'existe pas déjà.

 

Custom the flush buffer size

Cochez cette case pour personnaliser la taille de la mémoire utilisée pour stocker temporairement les données, et dans le champ Row number, saisissez le nombre de lignes après lesquelles la mémoire est à nouveau libérée.

 

Action on data

Vous pouvez effectuer les opérations suivantes sur les données de la table sélectionnée :

Insert records in table : Insère de nouveaux enregistrements dans une table.

Replace records in table : Remplace les enregistrements existants par de nouveaux.

Update records in table : Modifie les enregistrements existants.

Ignore records in table : Ignore les enregistrements existants ou insère les nouveaux.

 

Records contain NULL value

Cette case est cochée par défaut. Elle permet de prendre les champs de valeur NULL en compte. Si vous la décochez, les valeurs NULL seront remplacées par des valeurs vides.

 

Encoding

Sélectionnez l'encodage à partir de la liste ou sélectionnez Custom et définissez-le manuellement. Ce champ est obligatoire pour la manipulation des données de base de données.

 

tStatCatcher Statistics

Cochez cette case pour collecter les données de log au niveau du composant.

Utilisation

Ce composant est principalement utilisé lorsqu'aucune transformation particulière n'est requise sur les données à charger dans la base de données.

Scénario : Insérer des données dans une base MySQL

Ce scénario est un Job à deux composants qui effectue le même type d'opération d'alimentation que les composants tMysqlOutputBulk (consultez tMysqlOutputBulk) et tMysqlBulkExec (consultez tMysqlBulkExec), mais sans transformation de données.

  • Cliquez et déposez les composants suivants : tRowGenerator et tMysqlOutputBulkExec.

  • Connectez les composants via un lien de type Row > Main.

  • Paramétrez le tRowGenerator de la même manière que dans Scénario : Insérer des données transformées dans une base MySQL. Le schéma est constitué de plusieurs colonnes notamment : ID, First Name, Last Name, Address et City.

  • A partir de l'espace de modélisation, double-cliquez sur le composant tMysqlOutputBulkExec pour afficher la vue Component et paramétrer ses propriétés.

  • Paramétrez la connexion à la base de données si nécessaire, en suivant les recommandations dans Scénario : Insérer des données transformées dans une base MySQL, concernant la conservation des informations de connexion dans la partie Metadata du Repository. Pour cela, sélectionnez Repository dans le champ Property Type et sélectionnez la connexion adéquate dans le champ adjacent. Les champs suivants seront renseignés automatiquement.

Pour plus d'informations, consultez le Guide utilisateur du Studio Talend.

  • Dans le champ Action on table, sélectionnez l'option None puisque vous souhaitez insérer les données dans une table déjà existante.

  • Dans le champ Table, saisissez le nom de la table à alimenter, ici, clients.

  • Dans le champ Local filename, indiquez le chemin d'accès et le nom du fichier contenant les données à charger dans la table, ici, clients.txt.

  • Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.

  • Cliquez sur l'onglet Advanced settings pour paramétrer les propriétés avancées du composant.

  • Dans la liste Action on data, sélectionnez l'option Insert records in table pour insérer ces nouvelles données dans la table.

  • Appuyez sur F6 pour exécuter le Job

Le résultat devrait être relativement identique à celui obtenu dans Scénario : Insérer des données transformées dans une base MySQL. Cependant les données elles-mêmes peuvent différer légèrement puisque les données sont regénérées de façon aléatoire à chaque exécution.