Récupérer les lignes valides/invalides dans une analyse de colonne(s) - 7.0

Guide utilisateur de Talend Data Management Platform Studio

author
Talend Documentation Team
EnrichVersion
7.0
EnrichProdName
Talend Data Management Platform
task
Création et développement
EnrichPlatform
Studio Talend

Pourquoi et quand exécuter cette tâche

Vous pouvez générer un Job prêt à l'emploi sur les résultats d'une analyse de colonne(s). Ce Job récupère les lignes valides/invalides ou les deux types de lignes, et les écriront dans des fichiers de sortie ou dans des bases de données.

Prérequis : Une analyse de colonne(s) utilisant des modèles doit avoir été créée et exécutée.

Pour générer un Job qui récupérera les lignes valides/invalides dans la colonne analysée, procédez comme suit :

Procédure

  1. Suivez les étapes décrites dans Définir les colonnes à analyser et Ajouter une expression régulière ou un modèle SQL dans une analyse de colonne(s) pour créer une analyse de colonne(s) utilisant un modèle.
  2. Exécutez l'analyse de colonne(s).
  3. Dans la vue Analysis Results, cliquez sur Pattern Matching sous le nom de la colonne analysée.
    Le graphique généré pour la correspondance de modèles est accompagné d'un tableau détaillant l'affichage des résultats correspondants.
  4. Cliquez-droit sur la ligne du modèle dans le tableau Pattern Matching et sélectionnez Generate Jobs.
    La boîte de dialogue [Job Selector] s'ouvre.
    Si vous analysez une colonne à l'aide d'un modèle défini pour une base de données spécifique, vous pouvez générer des Jobs ELT.
    Si vous analysez la colonne à l'aide d'un modèle défini pour le langage Java ou Default, vous pouvez générer des Jobs ETL.
    Pour plus d'informations concernant la création et la définition des expressions régulières ou des modèles SQL, consultez Créer une nouvelle expression régulière ou un nouveau modèle SQL.
  5. Dans la boîte de dialogue, sélectionnez :

    Option

    Pour...

    Générer un Job ELT pour obtenir uniquement des lignes valides

    générer un Job qui utilisera le processus Extract Load Transform (Extraire, charger et transformer) pour écrire les lignes valides de la colonne analysée dans un fichier de sortie.

    Cette option n'est pas disponible pour la base de données Amazon Redshift.

    Générer un Job ELT pour obtenir uniquement des lignes invalides

    générer un Job qui utilisera le processus Extract Load Transform (Extraire, charger et transformer) pour écrire les lignes invalides de la colonne analysée dans un fichier de sortie.

    Cette option n'est pas disponible pour la base de données Amazon Redshift.

    générer un Job ETL pour gérer les lignes

    générer un Job qui utilisera le processus Extract Transform Load (Extraire, transformer et charger) pour écrire les lignes valides/invalides de la colonne analysée dans un fichier de sortie.

    Dans cet exemple, choisissez l'option generate an ETL job to handle rows afin de générer un Job qui écrira les lignes d'e-mails valides et invalides dans deux fichiers séparés.
  6. Dans la boîte de dialogue, cliquez sur Finish.
    La perspective Integration s'ouvre sur le Job généré.
  7. Au besoin, utilisez différents composants de sortie pour récupérer les lignes valides/invalides dans différents types de fichiers ou dans des bases de données.
  8. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.
    Les lignes d'e-mails valides et invalides de la colonne analysée sont écrites dans les fichiers de sortie définis.
    Les résultats dans les fichiers récupérés dépendent du mode sélectionné, ELT ou ETL. En mode ETL, les données sont récupérées par rapport à des expressions régulières Java, alors qu'en mode ELT, les données sont récupérées par rapport aux expressions régulières de la base de données correspondante. Les moteurs d'expressions régulières fonctionnent différemment en Java et dans un SGBD, les résultats peuvent donc différer, d'autant plus si vous définissez différentes expressions régulières dans l'éditeur de modèles.