Configurer le processus de prétraitement - 6.4

Text standardization

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tNormalize afin d'afficher sa vue Component et définir ses propriétés.
  2. Dans la liste Column to normalize, sélectionnez translation.
    Cela divisera les chaînes de caractères de la colonne translation en mots.
  3. Dans le champ Item separator, saisissez le séparateur qui délimitera les données de la colonne translation, un caractère espace dans cet exemple.
  4. Double-cliquez sur le tFilterRow afin d'afficher sa vue Component et définir ses propriétés.
  5. Sélectionnez l'opérateur logique que vous souhaitez utiliser afin de combiner le filtrage simple et le mode avancé.
  6. Dans la zone Conditions, cliquez sur le bouton [+], afin d'ajouter une ou plusieurs condition(s) au flux de sortie. Ensuite, dans la colonne correspondante :