メイン コンテンツをスキップする

tJapaneseNumberNormalize

日本語の数字(漢数字)をアラビア数字に正規化します。

日本語の数字は、漢字とアラビア数字と句読点を組み合わせて書かれていることがよくあります。日本語の番号を正規化すると、それらの番号をより容易に検索できるようになり、照合精度が向上します。

たとえば、tJapaneseNumberNormalizeは3.2千を3200に正規化します。これにより、日本語の数字「3.2千」とアラビア数字の対応語「3200」を一致させることができます。

ローカルモードでは、Apache Spark 2.4.0以降のバージョンがサポートされています。

デフォルトで、このコンポーネントはStudio Talendと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。