このシナリオは、Talend Data Management Platform、Talend Big Data Platform、Talend Real Time Big Data Platform、Talend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。
Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。
このシナリオでは、tSurviveFieldsコンポーネントを使用して、異なるランク値で異なるカラムのデータ行の内容をマージし、結果を出力ファイルに書き込む3つのコンポーネントジョブについて説明しています。
このシナリオでは、入力ファイルの入力スキーマがリポジトリーに既に保管されています。リポジトリーにスキーマメタデータを保管する方法の詳細は、 Talend Studioユーザーガイドをご覧ください。
入力ファイルには、[grp] (グループ)、[gender] (性別)、[firstname] (名)、および[count] (件数)の4つのカラムが含まれています。入力ファイルのデータには、重複している、最初の名前のスペルが異なる、または間違っている、同じ顧客の情報が異なるなどの問題があります。