Scénario 2 : Vider la mémoire avant d'y charger les données si une boucle existe dans le même sous-job - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario montre l'utilisation de l'option Append du composant tHashOutput, qui permet de supprimer des données répétitives ou indésirables s'il y a une boucle dans le sous-job du tHashOutput.

Pour construire le Job, procédez comme suit :

Déposer et relier les composants

  1. Glissez-déposez les composants suivants de la Palette dans l'espace de modélisation graphique : tLoop, tFixedFlowInput, tHashOutput, tHashInput et tLogRow.

  2. Reliez le tLoop autFixedFlowInput à l'aide d'un lien Row > Iterate.

  3. Connectez le composant tFixedFlowInput au tHashOutput à l'aide d'un lien Row > Main.

  4. Reliez le tHashInput au tLogRow à l'aide d'un lien Row > Main.

  5. Connectez le tLoop au tHashInput à l'aide d'un lien OnSubjobOk.

Configurer les composants

Configurer les données d'entrée et le cache
  1. Double-cliquez sur le tLoop pour afficher sa vue Basic settings.

  2. Dans la zone Loop Type, sélectionnez For comme type de boucle. Saisissez respectivement 1, 2 et 1 dans les champs From, To et Step. Laissez cochée la case Values are increasing.

  3. Double-cliquez sur le composant tFixedFlowInput pour afficher sa vue Basic settings.

  4. Dans la liste Schema, sélectionnez Built-In.

    Note

    Vous pouvez sélectionner Repository dans la liste Schema afin de renseigner automatiquement tous les champs si la métadonnée correspondante est stockée dans le Repository. Pour plus d'informations concernant la centralisation des métadonnées sous le nœud Metadata, consultez le Guide utilisateur du Studio Talend.

  5. Cliquez sur Edit schema pour définir la structure des données du flux d'entrée. Dans ce scénario, le schéma contient une colonne Name.

  6. Cliquez sur OK pour fermer la boîte de dialogue.

  7. Renseignez le champ Number of rows afin de spécifier les entrées à écrire, par exemple 1.

  8. Cochez la case Use Single Table. Dans la table Values, assignez une valeur au champ Name, par exemple Marx.

  9. Double-cliquez sur le tHashOutput pour affiche sa vue Basic settings.

  10. Dans la liste Schema, sélectionnez Built-In et cliquez sur Sync columns pour récupérer le schéma du composant précédent. Sélectionnez Keep all dans la liste Keys management et décochez la case Append.

Configurer la récupération des données du cache et la sortie des données
  1. Double-cliquez sur le tHashInput pour afficher sa vue Basic settings.

  2. Sélectionnez Built-In dans la liste Schema. Cliquez sur Edit schema afin de définir la même structure des données que dans le schéma du tHashOutput.

  3. Sélectionnez tHashOutput_2 dans la liste Component list.

  4. Double-cliquez sur le tLogRow pour afficher sa vue Basic settings.

  5. Sélectionnez Built-In dans la liste Schema et cliquez sur Sync columns pour récupérer le schéma du composant précédent. Dans la zone Mode, sélectionnez Table (print values in cells of a table).

Sauvegarder et exécuter le Job

  1. Appuyez sur les touches Ctrl+S afin de sauvegarder votre Job.

  2. Appuyez sur F6 pour exécuter le Job, ou cliquez sur le bouton Run, dans l'onglet Run.

    Vous pouvez constater qu'une seule ligne a été écrite alors que deux ont été générées par le tFixedFlowInput.