tStem - 6.4

Text standardization

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
EnrichPlatform
Studio Talend

Ce composant permet de standardiser des données dans des colonnes avant d'effectuer des correspondances.

Le tStem standardise des données dans des colonnes à travers un processus de normalisation linguistique, dans lequel les variantes d'un mot sont réduites à leur forme commune.

Pour plus d'informations concernant les technologies supportées par Talend, consultez Composants Talend.