Créer une analyse simple sur une colonne d'une base de données - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

Pourquoi et quand exécuter cette tâche

Vous pouvez construire votre analyse à partir de rien, analyser le contenu d'une ou plusieurs colonnes et d'exécuter les analyses créées à l'aide du moteur Java ou SQL. Ce type d'analyse fournit des statistiques concernant les valeurs dans chaque colonne.

Lorsque vous utilisez le moteur Java pour exécuter une analyse de colonnes, vous pouvez voir les données analysées selon les paramètres que vous avez configurés.

Pour plus d'informations, consultez Utiliser le moteur Java ou SQL.

Remarque : Lorsque vous utilisez le moteur Java pour exécuter une analyse de colonne(s) sur des ensembles de données volumineux ou contenant de nombreux problèmes, il est recommandé de configurer une limite maximale de taille de la mémoire allouée dans Preferences du Studio Talend pour exécuter l'analyse, puisqu'il est possible d'avoir une erreur Java heap space.

Vous pouvez également d'analyser un ensemble de colonnes. Ce type d'analyse fournit des statistiques concernant les valeurs de l'ensemble des données (enregistrements complets).

Pour plus d'informations, consultez Analyser des tables dans des bases de données.

La séquence de création d'une analyse de colonne simple comprend les étapes suivantes :

Procédure

  1. Définissez les colonnes à analyser.
  2. Configuration des indicateurs système prédéfinis ou des indicateurs personnalisés pour la (les) colonne(s).
  3. Ajout des modèles par rapport auxquels définir le contenu, la structure et la qualité des données.