メイン コンテンツをスキップする

特定のDBカラムからの英単語の語幹の抽出

このシナリオはTalend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend MDM PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

このシナリオでは、[translation] (変換)カラムのデータに対して言語的な正規化を実行し、すべての英単語の基本部分(単語の語幹)を抽出する6つのコンポーネントのジョブについて説明しています。

このジョブの目的は、[translation] (変換)カラムにリスト表示される英単語の語幹についての一種のディクショナリーを作成することです。このディクショナリーは後の段階で、選択したテーブルに入力される新しい単語をチェックする目的で使用される場合があります。抽出された英語の語幹は、出現数と共に出力ファイルの[translation] (変換)カラムに書き込まれます。

このシナリオでは、既にメインの入力スキーマがリポジトリーに保管されています。リポジトリーにスキーマメタデータを保管する方法は、Talend Studioでメタデータを管理をご覧ください。

メイン入力テーブルにはid_keyid_langtranslationid_statusid_user_transid_user_validateid_editorおよびdateという8つのカラムがあります。[translation] (変換)カラムで英単語の語幹を抽出します。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。