tSalesforceOutputBulkExec - 6.3

Composants Talend Open Studio Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Les composants tSalesforceOutputBulk et tSalesforceBulkExec sont utilisés ensemble dans un processus de deux étapes. Dans la première étape, un fichier de sortie est généré. Dans la seconde, ce fichier est utilisé pour alimenter la base de données Salesforce. Ces deux étapes sont fusionnées dans le composant tSalesforceOutputBulkExec. L'avantage d'utiliser deux étapes séparées réside dans le faut que les données peuvent être transformées avant chargement dans la base de données.

Fonction

Le composant tSalesforceOutputBulkExec exécute les actions définies sur les données .csv pour Salesforce.com.

Objectif

En tant que composant dédié, le tSalesforceOutpuBulkExec permet d'optimiser les performances lors des opérations définies sur les données, dans votre Salesforce.com.

Propriétés du tSalesforceOutputBulkExec

Famille du composant

Business/Cloud

Basic settings

Property Type

Peut être Built-In ou Repository.

  • - Built-In : Propriétés utilisées ponctuellement.

  • - Repository : Sélectionnez le fichier dans lequel sont stockées les propriétés du composant.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Connection

Sélectionnez le composant dont vous souhaitez utiliser les informations de connexion afin de configurer la connexion.

Connection type

Sélectionnez dans la liste le type de connexion, Basic ou OAuth.

  • Basic : sélectionnez cette option pour accéder à Salesforce.com en saisissant votre identifiant et votre mot de passe. Lorsque cette option est sélectionnée, vous devez spécifier les propriétés suivantes :

    • User Id : identifiant de l'utilisateur de Salesforce.

    • Password : mot de passe associé à l'identifiant.

    • Security Key : jeton de sécurité.

  • OAuth : sélectionnez cette option pour accéder à Salesforce.com en saisissant votre Consumer key/Consumer Secret. Ainsi, votre identifiant et votre mot de passe ne seront pas exposés, mais un effort supplémentaire est requis :

    • Définissez une application connectée (Connected App) sur Salesforce.com pour obtenir votre Consumer key/Consumer Secret. Pour plus d'informations concernant les applications connectées, consultez Connected Apps (en anglais). Pour plus d'informations concernant la création d'une application connectée, consultez Defining Remote Access Applications (en anglais).

    • Lorsque le Job est exécuté, la console du Studio affiche l'URL à partir de laquelle procéder à l'authentification OAuth. Pour plus d'informations, consultez Scénario : Utiliser OAuth2 pour vous connecter à Salesforce.com.

    Lorsque cette option est sélectionnée, vous devez spécifier les propriétés suivantes :

    • Client Id et Client Secret : Consumer key/Consumer Secret OAuth, disponibles dans la zone OAuth Settings de l'application connectée créée sur Salesforce.com.

    • Callback Host et Callback Port : URL de votre fonction de rappel pour l'authentification OAuth. Cette URL (l'hôte et le port) est définie durant la création d'une application connectée et sera affichée dans la zone OAuth Settings de l'application connectée.

    • Token File : chemin d'accès au fichier de jeton stockant le jeton de rafraîchissement utilisé pour obtenir le jeton d'accès sans autorisation.

 

Module Name

Cliquez sur le bouton [...] à côté du champ et, dans la boîte de dialogue qui s'ouvre, sélectionnez le module à utiliser, ou cochez la case Use custom object et spécifiez le nom du module dans le champ Object Name.

 

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.

 

Output Action

Sélectionnez dans la liste l'une des opérations suivantes à effectuer.

  • INSERT : insérer un ou plusieurs enregistrements dans Salesforce.

  • UPDATE : mettre à jour un ou plusieurs enregistrements existants dans Salesforce.

  • UPSERT : créer de nouveaux enregistrements et mettre à jour des enregistrements existants. Dans le champ Upsert Key Column affiché, spécifiez la colonne clé pour l'opération d'upsert.

  • DELETE : supprimer ou un plusieurs enregistrements dans Salesforce.

 

Bulk File Path

Spécifiez le chemin d'accès au fichier stockant les données à traiter.

 

Append

Cochez cette case pour écrire à la suite les nouvelles données à la fin du fichier s'il existe déjà, plutôt que d'écraser les données existantes.

 

Ignore Null

Cochez cette case pour ignorer les valeurs NULL.

Advanced settings

Salesforce URL

Saisissez l'URL du Service Web requise pour vous connecter à la base de données Salesforce.

 

Need compression

Cochez cette case pour activer la compression des messages SOAP, ce qui augmente les niveaux de performance.

 

Trace HTTP message

Cochez cette case pour écrire en sortie les interactions HTTP dans la console.

 

Client Id

Saisissez l'ID d'un utilisateur réel afin de différencier les utilisateurs d'un même compte et mot de passe pour accéder au site Web de Salesforce.

Ce champ est disponible lorsque l'option Query est sélectionnée dans la liste Query Mode.

 

Timeout (milliseconds)

Saisissez la période de délai avant suspension sur Salesforce.com.

 

Use Proxy

Cochez cette case pour utiliser un serveur proxy et, dans les champs Host, Port, User Id et Password affichés, spécifiez les paramètres de connexion du serveur proxy.

 

Relationship mapping for upsert

Cliquez sur le bouton [+] pour ajouter des lignes et spécifiez les champs d'ID externes du flux d'entrée, les champs de relations lookup dans le module d'upsert, le module de lookup ainsi que les champs d'ID externes dans le module de lookup.

  • Column name of Talend Schema : nom du champ d'ID externe dans le flux d'entrée. Cela fait référence aux champs du schéma du composant précédent. Ces colonnes sont mises en correspondance par rapport aux champs d'ID externes spécifiés dans la colonne External id name. Ces champs sont ceux spécifiés dans la colonne Module name du module de lookup.

  • Lookup relationship field name : nom du champ de relations lookup. Cela fait référence aux champs de relations lookup spécifiés dans le champ Module Name de la vue Basic settings. Ils servent à établir les relations avec le module de lookup spécifié dans la colonne Module name de cette table. Pour plus d'informations concernant la définition des champs de relations lookup et comment saisir le bon nom dans le champ Lookup field name, rendez-vous sur le site Web de Salesforce et lancez l'application Salesforce Data Loader.

  • Module name : nom du module de lookup.

  • Polymorphic : cochez cette case uniquement lorsque les champs polymorphiques sont utilisés pour le mapping de relations. Vous pouvez obtenir une erreur si vous ne cochez pas cette case pour un champ polymorphique. Vous pouvez également obtenir une erreur si vous la sélectionnez pour un champ qui n'est pas polymorphique. Pour plus d'informations concernant les champs polymorphiques, recherchez polymorphic à l'adresse suivante http://www.salesforce.com/us/developer/docs/api_asynch/ (en anglais).

  • External id name : nom du champ d'ID externe dans le module de lookup spécifié dans la colonne Module name.

Cette table est uniquement disponible lorsque l'option UPSERT est sélectionnée dans la liste déroulante Output Action.

 

Concurrency Mode

Sélectionnez le mode de simultanéité du Job.

  • Parallel : Traite les lots en mode parallèle.

  • Serial : Traite les lots en mode séquentiel.

 

Rows to Commit

Spécifiez le nombre de lignes par lot de données à traiter.

 

Bytes to Commit

Spécifiez le nombre d'octets par lot de données à traiter.

 

Wait Time Check Batch State (milliseconds)

Saisissez l'intervalle de temps entre les vérifications de traitement des lots de données d'un Job jusqu'à ce que tous les lots soient traités.

 

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est généralement utilisé lorsqu'aucune transformation particulière n'est requise sur les données à charger dans Salesforce.com.

Limitation

Les données de masse à traiter dans Salesforce.com doivent être au format .csv.

Scénario : Insérer des données de masse dans votre Salesforce.com

Ce scénario décrit un Job à quatre composants soumettant des données de masse dans le fichier SalesforceAccount.txt utilisé dans Scénario 2 : Rassembler des données erronées en insérant des données dans un objet Salesforce dans Salesforce, exécutant vos actions sur les données et affichant les résultats d'exécution du Job pour référence.

Configurer le Job

  1. Créez un nouveau Job et ajoutez un tFileInputDelimited, un tSalesforceOutputBulkExec et deux tLogRow en saisissant leur nom dans l'espace de modélisation graphique ou en les déposant depuis la Palette.

  2. Reliez le tFileInputDelimited au tSalesforceOutputBulkExec à l'aide d'un lien Row > Main.

  3. Reliez le tSalesforceOutputBulkExec au premier tLogRow à l'aide d'un lien Row > Main.

    Reliez le tSalesforceOutputBulkExec au second tLogRow à l'aide d'un lien Row > Reject.

Configurer les composants

  1. Double-cliquez sur le tFileInputDelimited pour ouvrir sa vue Basic settings.

  2. Dans le champ File name/Stream, parcourez votre système ou saisissez le chemin d'accès au fichier de données d'entrée. Dans cet exemple, saisissez D:/SalesforceAccount.txt.

  3. Cliquez sur le bouton [...] à côté du champ Edit schema et dans l'éditeur, définissez le schéma en ajoutant quatre colonnes Name, ParentId, Phone et Fax de type String.

    Cliquez sur OK pour sauvegarder les modifications et fermer la boîte de dialogue.

Configurer la connexion à Salesforce

  1. Double-cliquez sur le composant tSalesforceOutputBulkExec pour ouvrir sa vue Basic settings.

  2. Dans les champs User Id, Password et Security Key, saisissez les informations d'authentification de l'utilisateur pour accéder à Salesforce.

  3. Cliquez sur le bouton [...] à côté du champ Module Name et, dans la boîte de dialogue, sélectionnez l'objet auquel accéder, ici Account.

  4. Dans le champ Bulk File Path, parcourez votre système ou saisissez le chemin d'accès au fichier CSV stockant les données pour traitement de masse.

    Notez que le fichier de masse à traiter ici doit être au format .csv.

  5. Double-cliquez sur le premier tLogRow pour ouvrir sa vue Basic settings.

  6. Dans la zone Mode, sélectionnez Table (print values in cells of a table) pour une lisibilité optimale des résultats.

  7. Répétez l'opération pour configurer le second tLogRow.

Exécuter le Job

  1. Appuyez sur les touches Ctrl + S pour sauvegarder le Job.

  2. Appuyez sur F6 pour l'exécuter.

    Dans la console de la vue Run, vous pouvez examiner les résultats d'exécution.

    Dans la table tLogRow_1, vous pouvez voir que les données ont bien été insérées dans Salesforce.

    Dans la table tLogRow_2, vous pouvez voir les données rejetées à cause d'incompatibilité avec les objets Account auxquels vous avez accédé.

    Notez que si vous souhaitez transformer les données d'entrée avant de les charger dans Salesforce, vous devez utiliser les composants tSalesforceOutputBulk et tSalesforceBulkExec ensemble. Pour plus d'informations concernant l'utilisation de ces deux composants, consultez Scénario : Insérer des données transformées dans Salesforce en masse.