このシナリオはTalend Data Management Platform、Talend Big Data PlatformTalend Real-Time Big Data Platform、Talend MDM PlatformTalend Data Services Platform、Talend MDM PlatformおよびTalend Data Fabricにのみ適用されます。
このシナリオのジョブは、後続する2つのマッチングパス(tMatchGroupコンポーネント)を実行して同種の顧客レコードをグルーピングし、マッチングする計算結果をグループ単位で出力します。パスではそれぞれ後続のパスにマッチング内容を提供し、新しいルールとブロッキングキーで識別されるマッチング内容を追加できるようにします。
このジョブでは以下のようになります:
-
tMysqlInputコンポーネントは、処理される顧客レコードに接続します。
-
tGenKeyコンポーネントはそれぞれ、データレコードを分割する方法を定義します。最初のキーはデータを多数のグループに分割し、2番目のキーはブロッキングキーの定義に基づいて前のブロックと重複するグループを減らします。
-
tMapコンポーネントは、2番目のtGenKeyコンポーネントによって生成されたキーの名前を変更します。
-
最初のtMatchGroupは最初のtGenKeyで定義されたパーティションを処理し、2番目のtMatchGroupは2番目のtGenKeyで定義されたパーティションを処理します。重要: 2つのtMatchGroupコンポーネントには同じスキーマが必要です。
-
tLogRowコンポーネントは、2つのパスの後にマッチングする結果を表示します。