区切り記号付きファイルから、定義されたパターンに対応するデータのみを抽出する - 7.3

Data extraction

EnrichVersion
Cloud
7.3
EnrichProdName
Talend Big Data Platform
Talend Data Fabric
Talend Data Management Platform
Talend Data Services Platform
Talend MDM Platform
Talend Real-Time Big Data Platform
EnrichPlatform
Talend Studio
task
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > データクオリティ
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > データクオリティ
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > データクオリティ

このシナリオは、Talend Data Management PlatformTalend Big Data PlatformTalend Real Time Big Data PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

このシナリオでは、tExtractPatternコンポーネントを使って、さまざまな顧客データを保持する区切り記号付きファイルから顧客のメールアドレス([Email address] (メールアドレス)パターンに一致する)のみを抽出するコンポーネント4つのジョブについて説明します。次に、抽出されたデータが別の区切り記号付きファイルに書き込まれます。出力スキーマを適合させるためにtFilterColumnsコンポーネントが使われます。

このシナリオでは、区切り記号付きファイルには、名前、メールアドレス、電話番号がすべて、Name_Telephone_Addressという1つのカラムに含まれています。以下は入力ファイルからの抽出です。