tTransliterate - 7.2

Text standardization

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 標準化 > テキスト標準化コンポーネント

文字列を世界の多数の言語の標準文字セット UCS (Universal Coded Character Set)に変換します。

tTransliterateコンポーネントでは、文字列が表す音声に基づき、元の文字列と同等の文字列をUCSで作成を試行します。

tTransliterateは、世界の多数の言語体系によるテキストを、Unicode標準のレパートリーに基づいて判読可能な文字にエンコーディングします。これにより、元のスクリプトで文字が残されている場合よりも、異なる言語の単語を認識して解釈しやすくなります。UnicodeおよびUnicode標準の詳細は、UnicodeおよびUnicode標準をご確認ください。

ローカルモードでは、Apache Spark 2.0.0、2.3.0、2.4.0がサポートされています。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

使用しているTalend製品に応じて、このコンポーネントは次のジョブフレームワークの1つ、一部、またはすべてで使用できます。