Scénario : Exécution d'un processus dans DQ Batch Suite - 6.1

Composants Talend Open Studio Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Ce scénario décrit un processus dont les résultats de l'exécution sont traités dans Data Quality Service Hub Studio. La source d'entrée du processus est fournie par Data Quality Service Hub Studio.

Le processus a été totalement défini dans DQ Batch Suite et sauvegardé sous le nom "BTGeneric_Sample". Dans la fonction Input, le fichier "btinput.csv" a été spécifié comme fichier d'entrée sauvegardé dans le répertoire du Job et tous ses champs ont été renseignés. Le fichier n'est pas encore créé, car il sera fourni par Data Quality Service Hub Studio. Le processus n'est donc pas encore exécutable.

Dans Data Quality Service Hub Studio, la source d'entrée (dans cet exemple une table d'une base de données Oracle) de ce scénario est déjà enregistrée dans le Repository, de manière à ce que tous les schémas de métadonnées soient disponibles.

  1. Dans la vue Repository, développez le nœud Metadata et le répertoire dans lequel vous avez sauvegardé la source. Glissez-la ensuite dans l'espace de modélisation graphique.

    La boîte de dialogue ci-dessous apparaît.

  2. Sélectionnez tOracleInput et cliquez sur OK pour fermer la boîte de dialogue.

    Le composant s'affiche dans l'espace de modélisation graphique. La table utilisée dans ce scénario s'appelle LOCATIONS.

  3. Glissez les composants suivants de la Palette dans l'espace de modélisation graphique : deux tMap, un tOracleOutput et un tUniservBTGeneric.

  4. Connectez le tMap au tUniservBTGeneric à l'aide d'un lien Row > Main.

    Acceptez le schéma du tUniservBTGeneric en cliquant sur Yes dans la fenêtre de propagation.

  5. Connectez les autres composants à l'aide de liens Row > Main.

  6. Double-cliquez sur le tUniservBTGeneric pour afficher sa vue Basic settings.

  7. Saisissez les informations de connexion. Assurez-vous que le chemin d'accès que vous saisissez dans le champ Job File Path est absolu.

  8. Cliquez sur Retrieve Schema pour créer automatiquement un schéma pour le tUniservBTGeneric à partir des définitions d'entrée et de sortie du processus et de renseigner automatiquement les champs de la vue Advanced settings.

  9. Vérifiez que les informations de la vue Advanced settings soient correctes. Les définitions d'entrée et de sortie doivent être exactement identiques à celles du processus DQ Batch Suite. Si nécessaire, adaptez le chemin d'accès aux fichiers temporaires.

  10. Double-cliquez sur le tMap_1 pour ouvrir la fenêtre de mapping du schéma. À gauche se trouve la structure de la source d'entrée et à droite se trouve le schéma du tUniservBTGeneric (et donc l'entrée du processus). En bas se trouve le Schema editor, où vous pouvez trouver et éditer les attributs de chaque colonne.

  11. Mappez les colonnes de la source d'entrée à leurs colonnes du tUnivservBTGeneric respectives. Pour ce faire, sélectionnez une colonne de la source d'entrée et glissez-la dans la colonne du même nom du côté droit.

    Cliquez sur OK pour fermer la boîte de dialogue.

  12. Définissez comment traiter les résultats d'exécution du processus et quels composants vont être utilisés.

  13. Avant d'exécuter le processus, assurez-vous que les chemins d'accès sont corrects, que le serveur de DQ Batch Suite fonctionne et que vous pouvez accéder au processus.