Types de modèles - 8.0

Guide d'utilisation de Talend Big Data Platform Studio

Version
8.0
Language
Français (France)
EnrichDitaval
Big Data Platform
Product
Talend Big Data Platform
Module
Studio Talend
Content
Création et développement

Deux types de modèles sont listés sous le nœud Patterns dans la vue DQ Repository dans la perspective Profiling : expressions régulières et modèles SQL.

Les expressions régulières (regex) sont des modèles prédéfinis que vous pouvez utiliser pour chercher et manipuler du texte dans les bases de données auxquelles vous souhaitez vous connecter. Vous pouvez également créer vos propres expressions régulières et les utiliser pour analyser des colonnes.

Lorsque vous sélectionnez un modèle dans un Job, l'expression régulière correspondant au type de la base de données à laquelle vous êtes connecté sera utilisé :
  • S'il n'y pas d'expression régulière correspondant à ce type de base de données, l'expression régulière par défaut dans le modèle sélectionné sera utilisée.
  • Si vous supprimez l'expression régulière dans correspondant à ce type de base de données dans un modèle utilisée dans des for Jobs, les Jobs sont mis à jour afin d'utiliser l'expression régulière par défaut dans le modèle sélectionné.

Les modèles SQL sont une sorte de modèles personnalisés, utilisés dans les requêtes SQL. Ces modèles contiennent généralement le signe "%". Pour plus d'informations concernant les caractères de remplacement, consultez http://www.w3schools.com/SQL/sql_wildcards.asp (en anglais).

Vous pouvez effectuer des analyses de colonne(s) en utilisant l'un des deux types de modèles ci-dessus. Ces analyses basées sur des modèles indiquent les fréquences des différents modèles de données trouvés dans les valeurs des colonnes analysées. Pour plus d'informations, consultez Créer une analyse simple sur une colonne d'une base de données et Créer une analyse d'un ensemble de colonnes en utilisant des modèles.

Dans le Studio Talend, vous pouvez générer des graphiques représentant les résultats des analyses utilisant des modèles. Vous pouvez également voir les tableaux de la vue Analysis Results, tableaux qui transcrivent en mots les graphiques générés. À partir de ces graphiques et de ces résultats d'analyse, vous pouvez facilement déterminer le pourcentage de valeurs invalides selon les modèles listés.

Les processus de gestion pour les modèles SQL et les expressions régulières sont les mêmes. Pour plus d'informations, consultez Gérer les expressions régulières et les modèles SQL.

Remarque : Certaines bases de données ne supportent pas les expressions régulières. Pour travailler avec de telles bases de données, une certaine configuration est nécessaire avant de pouvoir utiliser les expressions régulières. Pour plus d'informations, consultez Gérer les fonctions personnalisées dans les bases de données.

Le tableau suivant présente les modèles que vous pouvez sélectionner dans n'importe quelle base de données :

Type de données Number Text Date Autres
Type de moteur d'analyse Java SQL Java SQL Java SQL Java SQL
Modèles SQL
Modèles Regex