Récupérer les lignes correspondantes/non correspondantes - 6.2

Talend Big Data Platform Studio Guide utilisateur

EnrichVersion
6.2
EnrichProdName
Talend Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Lorsque vous ajoutez des modèles à une analyse d'un ensemble de colonnes, le graphique des résultats affiche le pourcentage des valeurs dans toutes les colonnes correspondant à tous les modèles utilisés et non à un seul d'entre eux. Après l'exécution de l'analyse, vous pouvez générer des Jobs prêts à l'emploi qui récupèrent les lignes correspondantes/non correspondantes et les écrivent dans des fichiers de sortie ou dans des bases de données.

Prérequis : Une analyse d'un ensemble de colonnes utilisant des modèles doit avoir été créée et exécutée dans la perspective Profiling du studio. Pour plus d'informations, consultez Définir l'ensemble de colonnes à analyser, Créer une analyse d'un ensemble de colonnes en utilisant des modèles.

Pour générer un Job qui récupère les lignes correspondantes/non correspondantes dans les colonnes analysées, procédez comme suit :

  1. Suivez les étapes indiquées dans la section Créer une analyse d'un ensemble de colonnes en utilisant des modèles afin de créer une analyse de table simple utilisant différents modèles.

  2. Exécutez l'analyse de colonne.

  3. Dans la vue Analysis Results, cliquez sur All Match afin d'ouvrir la vue correspondante.

    Le graphique généré est un graphique à une seule barre pour la totalité des modèles utilisés. Ce graphique affiche le nombre de lignes correspondant à tous ("all") les indicateurs ainsi qu'un tableau détaillant les détails des résultats des correspondances.

  4. Cliquez-droit sur la ligne du modèle, dans le tableau All Match puis sélectionnez Generate an ETL Job to handle rows. La perspective Integration s'ouvre sur le Job généré.

    Ce Job utilise le processus ETL (Extract Transform Load, soit Extraire Transformer Charger) pour écrire dans deux fichiers de sortie séparés les lignes valides/invalides des colonnes analysées correspondant/ne correspondant pas à tous ("all") les modèles.

  5. Si nécessaire, utilisez différents composants de sortie afin de récupérer les lignes valides/invalides dans différents types de fichiers ou bases de données.

  6. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter. Les lignes valides et invalides des colonnes analysées sont écrites dans les fichiers de sortie définis.