出力フローに機能キーを生成する - 7.2

Identification

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント
データガバナンス > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント
データクオリティとプレパレーション > サードパーティーシステム > データクオリティコンポーネント > 識別コンポーネント

このシナリオは、Talend Data Management PlatformTalend Big Data PlatformTalend Real Time Big Data PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

この3つのコンポーネントのシナリオでは、PostalCodeの入力カラムの1つに1つのアルゴリズムを使用して、各データレコードの機能キーを生成する基本的なジョブについて説明します。

この機能キーは、たとえば、データフィルタリングまたはデータ一致の結果を絞り込むためにさまざまな方法で使用できます。そのため、tGenKeyコンポーネントは他の多くのデータクオリティやデータ統合コンポーネントと共に使用して、さまざまな有用なユースケースを形成できます。tGenKeyの1つのユースケースの例については、『同じ機能キーを持つ出力フロー重複レコード内でカラムを比較し、グループ化する』を参照してください。

このシナリオでは、入力データフローには、[Firstname] (名前)[Lastname] (姓)[DOB] (生年月日)、および[PostalCode] (郵便番号)の4つのカラムがあります。このデータには、重複、異なったスペルまたは間違ったスペルの姓や名、同じ顧客の異なった情報などの問題があります。このシナリオでは、郵便番号の最初の2文字を連結するアルゴリズムを使用して、各データレコードの機能キーを生成します。