Pourquoi une erreur survient lorsque j'utilise l'indicateur de statistiques de fréquence Soundex lors du profiling de Teradata ?

author
Talend Documentation Team
EnrichVersion
6.5
EnrichProdName
Talend Real-Time Big Data Platform
Talend Data Fabric
Talend MDM Platform
Talend Data Services Platform
Talend Data Management Platform
Talend Open Studio for Data Quality
Talend Open Studio for MDM
Talend Big Data Platform
task
Qualité et préparation de données > Profiling de données
EnrichPlatform
Studio Talend

Erreur de Teradata : "Invalid Input: only Latin letters allowed"

Un message peut survenir lorsque vous utilisez le Studio Talend pour profiler la base de données Teradata à l'aide de l'indicateur de tables de fréquence Soundex, car votre entrée est invalide.

Dans la perspective Profiling du Studio Talend, essayez de profiler une colonne dans Teradata, first_name par exemple, en utilisant l'indicateur de tables de fréquence Soundex. Exécutez l'analyse de colonnes avec le moteur SQL. L'analyse s'exécute avec succès.

Explorez les données dans la page de résultat : dans une table de fréquence Soundex de la vue Analysis Results, cliquez-droit sur une ligne et sélectionnez View Rows. Une erreur survient dans l'éditeur SQL Editor par rapport à la requête SQL générée.

[Error 5583] Invalid Input: only Latin letters allowed.

L'implémentation Soundex de Teradata est la cause de cette limitation. La base de données Teradata exige qu'une chaîne de caractères ou une expression ayant un surnom soit évaluée en caractères latins simples.

Un caractère latin simple est un caractère ne possédant aucun signe diacritique tel que le tilde (~) ou l'accent aigu (´). Il existe 26 caractères latins simples en majuscules et 26 autres en minuscules. Même un simple appel à SOUNDEX ('Sébastien') ne peut être exécuté dans Teradata. Il est donc impossible d'explorer toutes les lignes qui ressemblent à 'Sébastien'.