Présentation des analyses de corrélation de colonnes - 6.3

Talend Big Data Platform Studio Guide utilisateur

EnrichVersion
6.3
EnrichProdName
Talend Big Data Platform
task
Création et développement
Qualité et préparation de données
EnrichPlatform
Studio Talend

Votre studio vous fournit la possibilité d'identifier les relations et les corrélations entre deux colonnes (ou plus), afin d'obtenir une nouvelle interprétation des données, en décrivant comment les valeurs des données sont corrélées sur différentes positions.

Note

Les analyses de corrélation de colonnes sont possibles uniquement sur des colonnes de bases de données Vous ne pouvez utiliser ces analyses sur des connexions aux fichiers.

Il est très important de faire une distinction entre les analyses de corrélation de colonnes et tous les autres types d'analyses de qualité de données. Les analyses de corrélation de colonnes sont généralement utilisées pour identifier les relations et les corrélations dans les données, et non pour fournir des statistiques sur la qualité des données. Il n'est donc pas possible de générer des rapports d'analyses de corrélation de colonnes puisque les rapports sont habituellement utilisés pour déterminer si le niveau de qualité des données s'est amélioré ou dégradé.

Plusieurs types d'analyses de corrélation de colonnes sont disponibles. Pour plus d'informations, consultez Créer une analyse de corrélation numérique, Créer une analyse de corrélation temporelle et Créer une analyse de corrélation nominale.

Pour plus d'informations concernant l'utilisation des types de data mining dans le studio, consultez Types de data mining.