出力フローに機能キーを生成する - Cloud - 8.0

Identification

Version
Cloud
8.0
Language
日本語
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント
Last publication date
2024-02-28

このシナリオはTalend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend MDM PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。

この3つのコンポーネントのシナリオでは、PostalCodeの入力カラムの1つに1つのアルゴリズムを使用して、各データレコードの機能キーを生成する基本的なジョブについて説明します。

この機能キーは、たとえば、データフィルタリングまたはデータ一致の結果を絞り込むためにさまざまな方法で使用できます。そのため、tGenKeyコンポーネントは、他の多くのデータクオリティやデータ統合コンポーネントと共に使用して、さまざまな有用なユースケースを形成できます。tGenKeyの1つのユースケースの例については、『同じ機能キーを持つ出力フロー重複レコード内でカラムを比較し、グルーピングする』をご覧ください。

このシナリオでは、入力データフローには、[Firstname] (名前)[Lastname] (姓)[DOB] (生年月日)、および[PostalCode] (郵便番号)の4つのカラムがあります。このデータには、重複、異なったスペルまたは間違ったスペルの姓や名、同じ顧客の異なった情報などの問題があります。このシナリオでは、郵便番号の最初の2文字を連結するアルゴリズムを使用して、各データレコードの機能キーを生成します。