Suivre les modifications des données insérées et écrire les modifications dans une table de dimension SCD - 6.4

SCDELT

author
Talend Documentation Team
EnrichVersion
6.4
EnrichProdName
Talend Big Data
Talend Big Data Platform
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Open Studio for Big Data
Talend Open Studio for Data Integration
Talend Open Studio for ESB
Talend Open Studio for MDM
Talend Real-Time Big Data Platform
task
Création et développement > Systèmes tiers > Composants Business Intelligence > Composants SCDELT
Gouvernance de données > Systèmes tiers > Composants Business Intelligence > Composants SCDELT
Qualité et préparation de données > Systèmes tiers > Composants Business Intelligence > Composants SCDELT
EnrichPlatform
Studio Talend

Procédure

  1. Double-cliquez sur le premier tPostgreSQLSCDELT pour ouvrir la vue Basic settings.
  2. Cochez la case Use an existing connection et, dans la liste Component List qui s'affiche, sélectionnez le composant de connexion duquel vous souhaitez réutiliser la connexion créée, le tPostgreSQLConnection_1 dans cet exemple.
  3. Dans le champ Source table, saisissez le nom de la table de laquelle capturer les modification des données, employee dans cet exemple.
  4. Dans le champ Table, saisissez le nom de la table de dimension SCD qui va stocker les données actuelles et historiques des employés, employee_scd dans cet exemple.
  5. Sélectionnez Create table dans la liste Action on table afin de créer la table de dimension SCD.
  6. Cliquez sur le bouton [...] à côté de Edit schema et, dans la boîte de dialogue qui s'ouvre, définissez le schéma en ajoutant neuf colonnes : sk (clé primaire) et id, de type Integer, name et role de type String, salary de type Double, start_date et end_date de type Date, avec le modèle de date dd-MM-yyyy, active_status et version de type Integer. Cela fait, cliquez sur OK afin de sauvegarder vos modifications et fermer la boîte de dialogue.
  7. Dans la liste Surrogate key, sélectionnez le nom de la colonne à utiliser comme clé primaire de la table de dimension SCD, sk dans cet exemple.
  8. Sélectionnez DB sequence dans la liste Creation et, dans le champ Sequence qui s'affiche, saisissez le nom de la séquence PostgreSQL utilisée pour générer la clé de substitution pour la méthode SCD de Type 2, employee_sequence dans cet exemple.
  9. Cliquez sur le bouton [+] sous la table Source keys pour ajouter une ligne, puis cliquez dans la cellule Name et sélectionnez la colonne clé de la table source, dans la liste déroulante, id dans cet exemple.
  10. Cochez la case Use SCD type 1 fields, cliquez deux fois sur le bouton [+] sous la table SCD type 1 fields pour ajouter deux lignes. Ensuite, cliquez dans chaque cellule et, dans la liste déroulante, sélectionnez la colonne sur laquelle exécuter la méthode SCD de Type 1. Dans cet exemple, name et role.
  11. Cochez la case Use SCD type 2 fields, cliquez sur le bouton [+] sous la table SCD type 2 fields pour ajouter une ligne. Cliquez dans la cellule et sélectionnez la colonne sur laquelle exécuter la méthode SCD de Type 2. Dans cet exemple, salary.
  12. Dans les listes Start date et End date, sélectionnez les colonnes contenant les valeurs de date de début et de date de fin pour la méthode SCD de Type 2, respectivement start_date et end_date dans cet exemple.
  13. Cochez la case Log active status et, dans la liste Active field qui s'affiche, sélectionnez la colonne contenant la valeur du statut actif pour la méthode SCD de Type 2, ce qui permet d'identifier les enregistrements actifs, active_status dans cet exemple.
  14. Cochez la case Log versions et, dans la liste Version field, sélectionnez la colonne contenant le numéro de version des enregistrements pour la méthode SCD de Type 2, version dans cet exemple.