緩やかに変化するディメンション(タイプ0からタイプ3)を使用したデータ変化をトラッキング - 7.2

SCDELT

Version
7.2
Language
日本語 (日本)
Product
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Real-Time Big Data Platform
Module
Talend Studio
Content
ジョブデザインと開発 > サードパーティーシステム > ビジネスインテリジェンスコンポーネント > SCDELT
データガバナンス > サードパーティーシステム > ビジネスインテリジェンスコンポーネント > SCDELT
データクオリティとプレパレーション > サードパーティーシステム > ビジネスインテリジェンスコンポーネント > SCDELT

このシナリオでは、SCD(Slowly Changes Dimensions)を使用して、現在の従業員データと過去の従業員データの両方をMySQLテーブルに格納および管理するジョブについて説明します。

Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。

入力データには、[name] (名前)[age] (年齢)[role] (役割)[salary] (給与)などのさまざまな従業員の詳細が含まれており、入力データの統一性を確保するために別の[ID]カラム追加されています。

最初に、SCDを使って新しいMySQLテーブルに以下のような社員データを挿入します:

id;name;age;role;salary
1;Mark Smith;30;tester;11000.00
2;Thomas Johnson;32;developer;12000.00
3;Teddy Brown;33;tester;13000.00

そして、以下のように更新された従業員データを用いて、SCDを用いてテーブルを更新します。

id;name;age;role;salary
1;Mark Smith;31;tester;11000.00
2;Thomas Johnson;32;developer;12000.00
3;Teddy Brown;33;writer;13500.00

[Mark Smith] (マークスミス)の年齢が30歳から31歳に変更され、[Teddy Brown] (テディブラウン)の役割が[tester] (テスター)から[writer] (ライター)に変更され、給料が13000.00から13500.00に増額されていることがわかります。このシナリオでは、以下が行われます。

  • [name] (名前) フィールドのデータ変更を追跡したくないので、タイプ0SCDを実行します。

  • 新しい [age] (年齢)データで既存のデータを上書きする必要があるため、タイプ1SCDを実行します。

  • [role] (役割)データの完全な履歴が保持され、データが変更された新しいレコードが常に作成され、前のレコードは閉じたいので、それに対してSCDタイプ2メソッドが実行されます。

  • [salary] (給与)フィールドの現在および以前のディメンション値を保持する必要があるため、タイプ3SCDを実行します。

SCDタイプの詳細は、SCD管理方法論を参照してください。