Configurer des règles et des valeurs pour les enregistrements maître - Cloud

Guide de prise en main de Talend Cloud Data Stewardship

Version
Cloud
Language
Français
Product
Talend Cloud
Module
Talend Data Stewardship
Content
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Dédoublonnage de données
Qualité et préparation de données > Gestion des tâches
Last publication date
2024-03-06
Lorsque des enregistrements clients en doublon proviennent de différentes sources, Talend Cloud Data Stewardship détermine initialement les attributs des enregistrements rapprochés à utiliser pour créer des enregistrements maître, par rapport aux règles de consolidation définies dans la campagne.

Pourquoi et quand exécuter cette tâche

Les data stewards peuvent vérifier les tâches et modifier manuellement les règles de consolidation par attribut d'enregistrement ou saisir de nouvelles valeurs pour obtenir les enregistrements maître les plus précis et fiables.

Procédure

  1. Connectez-vous en tant qu'arbitre de données.
  2. Dans la page Tasks (Tâches), cliquez sur la campagne Reconciling client data pour ouvrir la liste des tâches qui vous sont attribuées.
    La barre de statistiques en haut de la liste utilise des couleurs pour vous donner une vision claire de la qualité des données dans chacune des colonnes. Placer votre curseur sur une couleur vous donne plus de détails concernant les valeurs de données dans la colonne sélectionnée.
    Liste des tâches attribuées à l'utilisateur·trice dans la campagne Reconciling client data.
  3. Cliquez sur une couleur dans la barre de statistiques pour filtrer les données sur lesquelles vous souhaitez travailler et lister les tâches correspondant à l'indication de la couleur :
    • Vert : représente les données valides correspondant aux types de colonnes.
    • Gris : représente les champs vides. Cependant, un champ obligatoire contenant une valeur vide est marqué en rouge et non en blanc.
    • Rouge : représente les données invalides ne correspondant pas au type de colonne ou au paramètre configuré dans le modèle de données.
  4. Cliquez sur la flèche pointant vers le bas, dans le coin supérieur gauche de la liste des tâches pour développer toutes les tâches, ou cliquez sur la flèche pointant vers le bas d'une tâche spécifique pour la développer.
  5. Configurez les règles de consolidation pour sélectionner les attributs des enregistrements clients et utilisez-les pour construire les enregistrements maître. Plusieurs approches sont possibles :
    • Configurer manuellement une règle de consolidation pour un attribut de plusieurs enregistrements.

      1. Cliquez sur l'en-tête d'une colonne, Last_Name par exemple et, dans le panneau à droite, naviguez jusqu'à la zone Survivorship.
      2. Développez la liste Survivorship rule et sélectionnez Most common comme règle de consolidation à appliquer sur l'attribut de nom, sur toutes les tâches de la liste.
      3. Si vous souhaitez appliquer la règle à toutes les valeurs de noms, même les nulles, décochez la case Avoid null values. Sinon, laissez-la cochée.
      4. Cliquez sur Submit afin de sélectionner les valeurs de noms les plus communes et les ajouter aux enregistrements maître de toutes les tâches.
    • Configurer manuellement une règle de consolidation pour un attribut de plusieurs enregistrements maître.

      1. Sélectionnez les tâches sur lesquelles appliquer la règle et, sous Task (Tâche) dans le panneau de droite, cliquez sur Apply survivorship rule (Appliquer la règle de consolidation).
      2. Dans la liste Selection, cliquez sur Selected tasks.

        Vous pouvez appliquer la règle à toutes les tâches ou uniquement aux tâches filtrées, si vous avez défini un filtre sur la liste.

      3. Dans la liste Rule, sélectionnez Most trusted par exemple pour appliquer la règle au groupe des tâches sélectionnées.

        Si vous avez défini dans la campagne Merging les sources des données en doublon, les noms des sources sont inclus dans la liste et peuvent être sélectionnés comme règle de consolidation pour appliquer aux valeurs des colonnes.

      4. Si vous souhaitez appliquer la règle à toutes les valeurs, même les nulles, décochez la case Avoid null values. Sinon, laissez-la cochée.
      5. Cliquez sur Submit (Soumettre) pour ajouter les valeurs des noms avec le plus haut score aux enregistrements maître sélectionnés.
    • Configurer manuellement une règle de consolidation pour un ou plusieurs attribut·s d'un enregistrement : placez votre curseur sur un attribut de l'enregistrement maître d'une tâche et, parmi les icônes qui s'affichent, sélectionnez la règle de consolidation à appliquer.

      • Icône Select first valid (Sélectionner la première valide) : sélectionne la première valeur d'attribut valide parmi les doublons. "First" (première valeur) est défini par l'ordre des enregistrements lors de la création de la tâche.
      • Icône Select most common (Sélectionner la plus fréquente) : sélectionne la valeur d'attribut la plus fréquente parmi les doublons.
      • Icône Select most recent (Sélectionner la plus récente) : sélectionne la valeur d'attribut la plus récente parmi les doublons.
      • Icône Select most trusted (Sélectionner la plus fiable) : sélectionne la valeur d'attribut la plus fiable parmi les doublons.

        Une icône de consolidation est grisée lorsque la règle n'est pas applicable à l'enregistrement sélectionné.

    • Sélectionner la valeur d'un attribut source donné pour en faire la valeur de l'enregistrement maître : placez votre curseur sur un attribut source et cliquez sur la flèche vers le haut pour définir la valeur sélectionnée dans l'enregistrement maître.
  6. Vous pouvez également double-cliquer sur la valeur dans l'enregistrement maître et configurer une valeur de votre choix, différente de celles présentes dans les sources.
  7. Cliquez sur l'icône Lock (Verrouiller) à côté de l'enregistrement de données modifié afin de marquer la tâche comme prête à être validée.
    Le premier champ a un fond vert et un pourcentage de complétude de vos tâches est calculé et affiché dans le coin supérieur droit.

    Vous pouvez à nouveau modifier les enregistrements prêts à être validés, mais cela replace la tâche dans son état initial, avec un fond gris foncé. Vous devez à nouveau cliquer sur l'icône représentant un cadenas pour marquer les tâches comme prêtes à la validation.

  8. Si l'icône représentant un cadenas a un fond rouge, corrigez la valeur invalide dans la tâche avant de pouvoir la marquer comme prête à être valider.
  9. Répétez l'étape ci-dessus pour créer les enregistrements maître pour toutes les tâches qui vous sont assignées.
  10. Cliquez sur Validate dans le coin supérieur droit afin de valider les modifications et déplacer la tâche hors de votre liste.

Résultats

Les enregistrements maître sont créés et les enregistrements validés sont déplacés vers la liste du participant ayant le rôle ACCOUNT VALIDATOR, dans cet exemple.