Construire le Job - 6.4

Text standardization

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
EnrichPlatform
Studio Talend

Procédure

  1. Dans la vue Repository, développez les nœuds Metadata - DB Connections où vous avez stocké les schémas d'entrée principaux, et déposez le fichier correspondant dans l'espace de modélisation graphique.
    La boîte de dialogue [Components] s'affiche, avec le composant correspondant sélectionné par défaut.
  2. Cliquez sur OK afin de déposer le composant tMysqlInput dans l'espace de modélisation graphique.
    La table d'entrée utilisée dans ce scénario est appelée translation. Elle se compose de plusieurs colonnes, notamment la colonne translation qui contient les mots anglais dont vous voulez extraire les radicaux.
  3. Glissez un tNormalize, un tFilterRow, un tStem, un tAggregateRow, et un tFileOutputExcel de la Palette dans l'espace de modélisation graphique.
  4. Connectez les composants à l'aide de liens Main, excepté pour la connexion du tFilterRow au tStem, pour laquelle vous utilisez un lien Filter.