メイン コンテンツをスキップする

tMapを使って人物名のシノニムインデックスを作成する

このシナリオはTalend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend MDM PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

このシナリオでは、4つのコンポーネントからなるジョブが、人物の名前とその相対的なニックネームを保管するインデックスを作成します。

このシナリオで使うソースデータは.csvファイルに保存されます。その抜粋を以下に示します。

Country;FirstName;Nickname1;Nickname2;Nickname3;Nickname4
France;Anne;Ninon;Annie;Ninette;Ann
France;Bernadette;Nad;Netty;Dadette
France;Albert;Al
France;Alexandre;Alex
France;Alfred-Hubert;Alu
France;Andrew;Andy
France;Anthony;Anton;Tony;Tonio
France;Artus;Artie
France;Benoit;Ben
France;Catherine;Cate;Katherine;Kathryn
France;Charles;Charlie;Charlot;Chuck
France;Christophe;Christian;Chris;Kris;Kristof
France;Christian;Chris

このデータは、人々の母国(インデックスに挿入されない)、名(参照エントリー)、および頻繁に使われるニックネーム(シノニム)を示します。

このジョブで使う4つのコンポーネントは、以下のとおりです。

  • tFileInputDelimited: このコンポーネントは、ソースデータを読み取り、tSynonymOutputに入力します。

  • tMap: このコンポーネントは、元のデータを名とニックネームを表す2つの分離されたカラムに変換するために使います。他方、人々の母国情報は無視されます。

  • tSynonymOutput: このコンポーネントは、このシナリオにおける目的のインデックスを作成し、ソースファイルで指定されたシノニムを使ってそれをフィードします。

  • tLogRow: このコンポーネントは、新しく作成されたインデックスに挿入されたデータをリスト表示します。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。