tSalesforceOutputBulk - 6.3

Composants Talend Guide de référence

EnrichVersion
6.3
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Les composants tSalesforceOutputBulk et tSalesforceBulkExec sont utilisés ensemble dans un processus de deux étapes. Dans la première étape, un fichier de sortie est généré. Dans la seconde, ce fichier est utilisé pour alimenter la base de données Salesforce. Ces deux étapes sont fusionnées dans le composant tSalesforceOutputBulkExec. L'avantage d'utiliser deux étapes séparées réside dans le faut que les données peuvent être transformées avant chargement dans la base de données.

Fonction

Le composant tSalesforceOutputBulk génère des fichiers dans un format approprié au traitement de masse.

Objectif

Ce composant prépare le fichier devant être traité par le tSalesForceBulkExec afin d'exécuter des actions sur Salesforce.com.

Propriétés du tSalesforceOutputBulk

Famille du composant

Business/Cloud

Basic settings

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Le schéma est soit local (Built-In), soit distant dans le Repository.

Depuis la version 5.6, les modes Built-In et Repository sont disponibles dans toutes les solutions de Talend.

Cliquez sur Edit schema pour modifier le schéma. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir le schéma.

  • Change to Built-In property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre [Repository Content].

Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.

Ce composant offre la fonction de schéma dynamique. Cela vous permet de récupérer des colonnes inconnues à partir de fichiers source ou de copier des lots de colonnes d'une source sans avoir à mapper individuellement ces colonnes. Pour plus d'informations concernant les schémas dynamiques, consultez le Guide utilisateur de Studio Talend.

Cette fonctionnalité de schéma dynamique est conçue pour permettre de récupérer des colonnes inconnues d'une table. Il est recommandé de l'utiliser uniquement à cet effet et non pour créer des tables.

 

Bulk File Path

Spécifiez l'emplacement du fichier à générer.

 

Append

Cochez cette case pour écrire à la suite les nouvelles données à la fin du fichier s'il existe déjà, plutôt que d'écraser les données existantes.

 

Ignore Null

Cochez cette case pour ignorer les valeurs NULL.

Advanced settings

Relationship mapping for upsert

Cliquez sur le bouton [+] pour ajouter des lignes et spécifiez les champs d'ID externes du flux d'entrée, les champs de relations lookup dans le module d'upsert, le module de lookup ainsi que les champs d'ID externes dans le module de lookup.

  • Column name of Talend Schema : nom du champ d'ID externe dans le flux d'entrée. Cela fait référence aux champs du schéma du composant précédent. Ces colonnes sont mises en correspondance par rapport aux champs d'ID externes spécifiés dans la colonne External id name. Ces champs sont ceux spécifiés dans la colonne Module name du module de lookup.

  • Lookup relationship field name : nom du champ de relations lookup. Cela fait référence aux champs de relations lookup spécifiés dans le champ Module Name de la vue Basic settings du composant tSalesforceBulkExec. Ils servent à établir les relations avec le module de lookup spécifié dans la colonne Module name de cette table. Pour plus d'informations concernant la définition des champs de relations lookup et comment saisir le bon nom dans le champ Lookup field name, rendez-vous sur le site Web de Salesforce et lancez l'application Salesforce Data Loader.

  • Module name : nom du module de lookup.

  • Polymorphic : cochez cette case uniquement lorsque les champs polymorphiques sont utilisés pour le mapping de relations. Vous pouvez obtenir une erreur si vous ne cochez pas cette case pour un champ polymorphique. Vous pouvez également obtenir une erreur si vous la sélectionnez pour un champ qui n'est pas polymorphique. Pour plus d'informations concernant les champs polymorphiques, recherchez polymorphic à l'adresse suivante http://www.salesforce.com/us/developer/docs/api_asynch/ (en anglais).

  • External id name : nom du champ d'ID externe dans le module de lookup spécifié dans la colonne Module name.

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Global Variables

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, si le composant a cette option.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. A partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide utilisateur du Studio Talend.

Utilisation

Ce composant est généralement utilisé avec le tSalesforceBulkExec. Utilisés ensemble, ils permettent un gain de performance lors de l'alimentation ou de la modification d'informations sur Salesforce.com.

Log4j

Si vous utilisez une solution Talend soumise à souscription, l'activité de ce composant peut être journalisée avec la fonctionnalité log4j. Pour plus d'informations sur cette fonctionnalité, consultez le Guide utilisateur du Studio Talend.

Pour plus d'informations sur les niveaux de logs du log4j, consultez la documentation d'Apache : http://logging.apache.org/log4j/1.2/apidocs/org/apache/log4j/Level.html (en anglais).

Limitation

Du fait d'une incompatibilité de licence, un ou plusieurs Jar requis pour utiliser ce composant ne sont pas fournis. Vous pouvez installer les Jar manquants pour ce composant en cliquant sur le bouton Install dans l'onglet Component. Vous pouvez également trouver les Jar manquants et les ajouter dans l'onglet Modules de la perspective Integration de votre studio. Pour plus d'informations, consultez l'article Installation de modules externes sur Talend Help Center (https://help.talend.com) ou la section décrivant comment configurer le studio, dans le Guide d'installation Talend.

Scénario : Insérer des données transformées dans Salesforce en masse

Ce scénario décrit un Job à six composants transformant les données du fichier SalesforceAccount.txt utilisé dans Scénario 2 : Rassembler des données erronées en insérant des données dans un objet Salesforce, stockant les données transformées dans un fichier CSV convenant au traitement de masse, puis chargeant les données traitées dans Salesforce à partir du fichier CSV, en terminant par afficher les résultats d'exécution du Job dans la console.

Configurer le Job

  1. Créez un nouveau Job et ajoutez un tFileInputDelimited, un tMap, un tSalesforceOutputBulk, un tSalesforceBulkExec et deux tLogRow en saisissant leur nom dans l'espace de modélisation grapqhieu ou en les déposant depuis la Palette.

  2. Reliez le tFileInputDelimited au tMap à l'aide d'un lien Row > Main.

  3. Reliez le tMap au tSalesforceOutputBulk à l'aide d'un lien Row > *New Output* (Main). Dans la boîte de dialogue qui s'ouvre, saisissez le nom du lien de sortie, ici out.

  4. Reliez le tSalesforceBulkExec au premier tLogRow à l'aide d'un lien Row > Main.

  5. Reliez le tSalesforceBulkExec au second tLogRow à l'aide d'un lien Row > Reject.

  6. Reliez le composant tFileInputDelimited au tSalesforceBulkExec à l'aide d'un lien Trigger > OnSubjobOk.

Configurer les composants

Préparer le fichier de chargement de masse

  1. Double-cliquez sur le tFileInputDelimited pour ouvrir sa vue Basic settings.

  2. Dans le champ File name/Stream, parcourez votre système ou saisissez le chemin d'accès au fichier d'entrée. Dans cet exemple, saisissez D:/SalesforceAccount.txt.

    Dans le champ Header, saisissez 1 pour ignorer la ligne d'en-tête au début du fichier.

  3. Cliquez sur le bouton [...] à côté du champ Edit schema et dans la boîte de dialogue, définissez le schéma en ajoutant quatre colonnes Name, ParentId, Phone et Fax de type String.

    Cliquez sur OK afin de sauvegarder les modifications et fermer la boîte de dialogue.

  4. Double-cliquez sur le composant tMap pour ouvrir son éditeur de mapping et paramétrer la transformation.

  5. Sélectionnez toutes les colonnes de la table d'entrée row1 et déposez-les dans la table de sortie out.

    Saisissez .toUpperCase() à la suite du texte dans la cellule Expression de la colonne Name, dans la table de sortie out.

    Cliquez sur OK afin de valider la transformation et fermer l'éditeur de mapping.

  6. Double-cliquez sur le composant tSalesforceOutputBulk pour ouvrir sa vue Basic settings.

  7. Dans le champ Bulk File Path, parcourez votre système ou saisissez le chemin d'accès au fichier CSV qui va stocker les données transformées pour le traitement de masse.

Charger les données dans Salesforce à partir du fichier

  1. Double-cliquez sur le composant tSalesforceBulkExec pour ouvrir sa vue Basic settings.

  2. Dans les champs User Id, Password et Security Key, saisissez les informations d'authentification de l'utilisateur pour accéder à Salesforce.

  3. Cliquez sur le bouton [...] à côté du champ Module Name et, dans la boîte de dialogue, sélectionnez l'objet auquel vous souhaitez accéder, ici Account.

  4. Cliquez sur le bouton [...] à côté du champ Edit schema. Dans l'éditeur du schéma, supprimez toutes les colonnes, sauf Name, ParentId, Phone et Fax.

    Cliquez sur OK pour sauvegarder les modifications et acceptez la propagation proposée par la boîte de dialogue.

  5. Dans le champ Bulk File Path, parcourez votre système ou saisissez le chemin d'accès au fichier CSV stockant les données transformées pour le traitement de masse.

  6. Double-cliquez sur le premier tLogRow pour ouvrir sa vue Basic settings.

  7. Dans la zone Mode, sélectionnez Table (print values in cells of a table) pour une lisibilité optimale des résultats.

  8. Répétez l'opération pour configurer le second tLogRow.

Exécuter le Job

  1. Appuyez sur les touches Ctrl + S pour sauvegarder le Job.

  2. Appuyez sur F6 pour exécuter le Job.

    Vous pouvez vérifier les résultats d'exécution dans la console de la vue Run.