Récupérer les lignes correspondantes/non correspondantes - 6.1

Talend Data Management Platform Studio Guide utilisateur

EnrichVersion
6.1
EnrichProdName
Talend Data Management Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Lorsque vous ajoutez des modèles à une analyse d'un ensemble de colonnes, le graphique des résultats affiche le pourcentage des valeurs dans toutes les colonnes correspondant à tous les modèles utilisés et non à un seul d'entre eux. Après l'exécution de l'analyse, vous pouvez générer des Jobs prêts à l'emploi qui récupèrent les lignes correspondantes/non correspondantes et les écrivent dans des fichiers de sortie ou dans des bases de données.

Prérequis : Une analyse d'un ensemble de colonnes utilisant des modèles doit avoir été créée et exécutée dans la perspective Profiling du studio. Pour plus d'informations, consultez Définir l'ensemble de colonnes à analyser, Ajouter des modèles aux colonnes analysées et Accéder aux résultats de l'analyse et aux données analysées.

Pour générer un Job qui récupère les lignes correspondantes/non correspondantes dans les colonnes analysées, procédez comme suit :

  1. Suivez les étapes indiquées dans la section Créer une analyse d'un ensemble de colonnes en utilisant des modèles afin de créer une analyse de table simple utilisant différents modèles.

  2. Exécutez l'analyse de colonne.

  3. Dans l'éditeur d'analyse, cliquez sur l'onglet Analysis Results au bas de l'éditeur, afin d'ouvrir la vue correspondante.

    Note

    L'affichage de la vue Analysis Results dépend des paramètres définis dans la boîte de dialogue [Preferences]. Pour plus d'informations, consultez  Configurer les préférences des éditeurs et des résultats d'analyse.

  4. Cliquez sur All Match afin d'ouvrir la vue correspondante.

    Le graphique généré est un graphique à une seule barre pour la totalité des modèles utilisés. Ce graphique affiche le nombre de lignes correspondant à tous ("all") les indicateurs ainsi qu'un tableau détaillant les détails des résultats des correspondances.

  5. Cliquez-droit sur la ligne du modèle, dans le tableau All Match puis sélectionnez Generate an ETL Job to handle rows. La perspective Integration s'ouvre sur le Job généré.

    Ce Job utilise le processus ETL (Extract Transform Load, soit Extraire Transformer Charger) pour écrire dans deux fichiers de sortie séparés les lignes valides/invalides des colonnes analysées correspondant/ne correspondant pas à tous ("all") les modèles.

  6. Si nécessaire, utilisez différents composants de sortie afin de récupérer les lignes valides/invalides dans différents types de fichiers ou bases de données.

  7. Sauvegardez votre Job et appuyez sur F6 pour l'exécuter. Les lignes valides et invalides des colonnes analysées sont écrites dans les fichiers de sortie définis.