Scénario : Gérer des fichiers avant et après l'exécution d'un Job - 6.1

Composants Talend Guide de référence

EnrichVersion
6.1
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for Data Quality
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement
Gouvernance de données
Qualité et préparation de données
EnrichPlatform
Studio Talend

Dans ce scénario, un pré-Job et un post-Job sont ajoutés dans le Job décrit dans Scénario 2 : Trouver des fichiers dupliqués entre deux dossiers afin de gérer les fichiers avant et après l'exécution du Job principal.

Comme décrit dans le scénario mentionné précédemment, lorsque le Job principal démarre, il crée un fichier texte temporaire afin de stocker les noms des fichiers récupérés. Si le fichier temporaire spécifié existe déjà, il est écrasé.

Afin de prévenir toute perte de données, le pré-Job enregistre une copie de sauvegarde du fichier spécifié en le renommant avant que le Job principal s'exécute.

Après l'exécution du Job principal, le post-Job supprime le fichier temporaire créé par le Job et restaure le fichier de sauvegarde, s'il existe.

Ajouter et relier les composants

  1. Ouvrez le Job principal dans l'espace de modélisation graphique puis ajoutez-y un tPrejob, un tPostjob, un tFileDelete et deux tFileCopy.

  2. Reliez le tPrejob au premier tFileCopy à l'aide d'un lien Trigger > On Component Ok afin de créer le pré-Job.

  3. Reliez le tPostjob au tFileDelete à l'aide d'un lien Trigger > On Component Ok et reliez l'autre tFileDelete à l'autre tFileCopy afin de créer le post-Job.

  4. Nommez les composants afin d'identifier plus facilement leur rôle.

Configurer les composants

Configurer le pré-Job

Dans le pré-Job, le tPrejob n'a aucun paramètre ou propriété à définir. Il déclenche seulement le tFileCopy avant l'exécution du Job principal afin de renommer le fichier spécifié. Tous les paramètres nécessaires sont donc définis dans le tFileCopy.

  1. Double-cliquez sur le tFileCopy afin d'ouvrir sa vue Basic settings.

  2. Dans le champ File Name, saisissez le chemin ainsi que le nom du fichier temporaire à renommer, D:/temp/tempdata.csv dans ce scénario.

  3. Dans le champ Destination directory, spécifiez le chemin ou parcourez votre système vers le dossier cible. Dans cet exemple, la copie de sauvegarde est enregistrée dans le même dossier, D:/temp/.

  4. Cochez la case Rename et spécifiez le nouveau nom du fichier dans le champ Destination filename, backup-tempdata.csv. Laissez les autres paramètres tels qu'ils sont.

Configurez le post-Job

Dans le post-Job, le tPostjob n'a aucun paramètre ou propriété à définir. Il déclenche seulement le tFileDelete après l'exécution du Job principal afin de supprimer le fichier temporaire utilisé pour stocker les noms des fichier récupérés. Il déclenche ensuite le tFileCopy afin renommer le fichier de sauvegarde avec son nom d'origine.

  1. Dans le champ File Name de la vue Basic settings du tFileDelete, saisissez le chemin et le nom du fichier temporaire à supprimer, D:/temp/tempdata.csv dans ce scénario. Laissez les autres champs tels qu'ils sont.

  2. Double-cliquez sur le tFileCopy afin d'ouvrir sa vue Basic settings.

  3. Dans le champ File Name, saisissez le chemin et le nom du fichier de sauvegarde, D:/temp/backup-tempdata.csv dans ce scénario.

  4. Dans le champ Destination directory, spécifiez le chemin ou parcourez votre système vers le dossier cible, D:/temp/ dans ce scénario.

  5. Cochez la case Rename et spécifiez le nom original du fichier temporaire dans le champ Destination filename, tempdata.csv.

  6. Cochez la case Remove source file afin de supprimer le fichier de sauvegarde après l'action de renommage. Laissez les autres champs tels qu'ils sont.

Résultat d'exécution attendu

Si le fichier temporaire spécifié existe, ses données sont conservées dans une copie de sauvegarde avant l'exécution du Job principal et restaurées par la suite.

Si le fichier temporaire n'existe pas, les deux tFileCopy génèrent une erreur mais n'empêchent pas l'exécution du Job principal.

Pour le résultat de l'exécution du Job principal, consultez Scénario 2 : Trouver des fichiers dupliqués entre deux dossiers.