Configurer le processus de prétraitement - 7.3

Standardisation de texte

Version
7.3
Language
Français
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Last publication date
2024-02-22

Procédure

  1. Double-cliquez sur le tNormalize afin d'afficher sa vue Basic settings et définir ses propriétés.
  2. Dans la liste Column to normalize, sélectionnez translation.
    Cela divisera les chaînes de caractères de la colonne translation en mots.
  3. Dans le champ Item separator, saisissez le séparateur qui délimitera les données de la colonne translation, un caractère espace dans cet exemple.
  4. Double-cliquez sur le tFilterRow afin d'afficher sa vue Basic settings et définir ses propriétés.
  5. Sélectionnez l'opérateur logique que vous souhaitez utiliser afin de combiner le filtrage simple et le mode avancé.
  6. Dans la zone Conditions, cliquez sur le bouton [+], afin d'ajouter une ou plusieurs condition(s) au flux de sortie. Ensuite, dans la colonne correspondante :
    • sélectionnez la colonne d'entrée sur laquelle vous souhaitez effectuer des opérations,

    • sélectionnez dans la liste la fonction dont vous avez besoin,

    • sélectionnez l'opérateur pour lier la colonne d'entrée et la valeur,

    • saisissez la valeur permettant de filtrer le contenu.

      Dans cet exemple, l'objectif est de filtrer tous les mots de la colonne translation ayant moins de trois lettres.