Configurer le composant de sortie et exécuter le Job - 7.1

Text standardization

author
Talend Documentation Team
EnrichVersion
7.1
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Gouvernance de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
Qualité et préparation de données > Systèmes tiers > Composants Data Quality > Composants de standardisation > Composants de standardisation de texte
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le tLogRow pour ouvrir sa vue Basic settings dans l'onglet Component.
  2. Cliquez sur Sync columns pour récupérer le schéma du composant précédent.
  3. Sélectionnez l'option Table (print values in cells of a table) dans la zone Mode.
  4. Appuyez sur la touche F6 pour exécuter le Job.

Résultats

Les nombres normalisés sont écrits dans la vue Run :

.-----------------+---------------------.
|               tLogRow_1               |
|=----------------+--------------------=|
|kansuji          |normalized_arabic_num|
|=----------------+--------------------=|
|〇〇七              |7                    |
|一〇〇〇             |1000                 |
|三千2百2十三          |3223                 |
|15,7             |157                  |
|一万               |10000                |
|負一千一百五十八         |-1158                |
|1.2万345.67       |12345.67             |
|1.2万345.6三       |12345.63             |
|4,647.100        |4647.1               |
|七十五點四零二五         |75.4025              |
|万                |10000                |
|億                |100000000            |
|兆                |1000000000000        |
|京                |10000000000000000    |
|垓                |100000000000000000000|
|九百八十三万 六千七百三     |9836703              |
|二十億 三千六百五十二万 千八百一|2036521801           |
|¥百二十三            |¥123                 |
|百二十三円            |123円                 |
'-----------------+---------------------'

Le tJapaneseNumberNormalize supporte les nombres japonais écrits avec des nombres kanji : 〇〇七 est converti en 7.

Le tJapaneseNumberNormalize supporte les nombres japonais écrits avec une combinaison de nombres kanji et arabes : 三千2百2十三 est converti en 3223.

La virgule n'est pas conservée dans les nombres normalisés retournés par le composant tJapaneseNumberNormalize. Par conséquent, 4,647.100 est converti en 4647.1 et 15,7 est converti en 157. Si les nombres dans les données d'entrée utilisent une virgule comme séparateur décimal, vous devez remplacer la virgule par un point.

Les nombres en entrée peuvent utiliser une virgule comme séparateur des milliers : 4,647.100 est converti en 4647.1. Le composant tJapaneseNumberNormalize supprime également les zéros après le séparateur décimal.

Le tJapaneseNumberNormalize supporte les grands nombres kanji : 兆六百万五千一 est converti en 1000006005001.