Jobs dont le nombre de colonnes par schéma figure parmi les 10 plus élevés - 6.4

Talend Project Audit Guide utilisateur

EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Administration et monitoring
EnrichPlatform
Talend Project Audit

Une autre méthode est utilisée dans Talend Project Audit afin d'évaluer la complexité du projet analysé : celle de compter les colonnes des schémas dans tous les Jobs du projet analysé et de regrouper ensuite les Jobs dont les schémas contiennent les 10 plus grands nombres de colonnes.

Conséquemment, cette section du rapport de Talend Project Audit fournira 10 tableaux présentés en ordre ascendant. Chaque tableau regroupe tous les Jobs contenant un même nombre de colonnes dans leurs schémas parmi les 10 plus grands nombres de colonnes par schéma.

Chacun des 10 tableaux est précédé du nombre de colonnes du schéma, utilisé comme facteur de regroupement de tous les Jobs listés dans le tableau. Le nombre de schémas utilisés dans chaque Job listé est donné dans une colonne séparée.

Elément

Description

Job

Nom du Job utilisé dans le projet audité.

Schema count

Nombre de schémas par Job.

Note

Ce rapport est paramétré. Il est possible de définir le nombre utilisé comme facteur de groupement.

Ce type d'analyse permettra de diagnostiquer les problèmes de performance du système, par exemple en identifiant les colonnes présentes dans l'espace de modélisation, mais qui ne sont pas réellement utilisées durant l'exécution du Job.

Un exemple de ceci est l'utilisation d'un flux Lookup (de référence) dans votre Job. Habituellement, un schéma de référence a de nombreuses colonnes, mais vous n'en utilisez qu'un nombre limité dans votre Job.