Configurer des règles et des valeurs pour les enregistrements maître - Cloud

Guide de prise en main de Talend Cloud Data Stewardship

EnrichVersion
Cloud
EnrichProdName
Talend Cloud
EnrichPlatform
Talend Data Stewardship
task
Gouvernance de données > Gestion des campagnes
Gouvernance de données > Gestion des modèles de données
Qualité et préparation de données > Dédoublonnage de données
Qualité et préparation de données > Gestion des tâches
Lorsque des enregistrements clients en doublon proviennent de différentes sources, Talend Cloud Data Stewardship détermine initialement les attributs des enregistrements rapprochés à utiliser pour créer des enregistrements maître, par rapport aux règles de consolidation définies dans la campagne.

Pourquoi et quand exécuter cette tâche

Les data stewards peuvent vérifier les tâches et modifier manuellement les règles de consolidation par attribut d'enregistrement ou saisir de nouvelles valeurs pour obtenir les enregistrements maître les plus précis et fiables.

Procédure

  1. Connectez-vous en tant qu'arbitre de données.
  2. Dans la page TASKS, cliquez sur le nom de la campagne, Reconciling client data dans cet exemple, pour ouvrir la liste des tâches qui vous sont assignées.
    La barre de statistiques en haut de la liste utilise des couleurs pour vous donner une vision claire de la qualité des données dans chacune des colonnes. Placer votre curseur sur une couleur vous donne plus de détails concernant les valeurs de données dans la colonne sélectionnée.
  3. Pour filtrer les données sur lesquelles travailler, cliquez sur une couleur dans la barre de statistiques en haut d'une colonne, pour lister les tâches correspondant à l'indication de la couleur :
    Option Description
    Vert représente les données valides correspondant aux types de colonnes.
    Gris représente les champs vides. Cependant, un champ obligatoire contenant une valeur vide est marqué en rouge et non en blanc.
    Rouge représente les données invalides ne correspondant pas au type de colonne ou au paramètre configuré dans le modèle de données.
  4. Cliquez sur la flèche pointant vers le bas, dans le coin supérieur gauche de la liste des tâches pour développer toutes les tâches, ou cliquez sur la flèche pointant vers le bas d'une tâche spécifique pour la développer.
  5. Configurez les règles de consolidation pour sélectionner les attributs des enregistrements clients et utilisez-les pour construire les enregistrements maître. Plusieurs approches sont possibles :
    • Configurer manuellement une règle de consolidation pour un attribut de plusieurs enregistrements.

      1. Cliquez sur l'en-tête d'une colonne, Last_Name par exemple et, dans le panneau à droite, naviguez jusqu'à la zone Survivorship.
      2. Développez la liste Survivorship rule et sélectionnez Most common comme règle de consolidation à appliquer sur l'attribut de nom, sur toutes les tâches de la liste.
      3. Si vous souhaitez appliquer la règle à toutes les valeurs de noms, même les nulles, décochez la case Avoid null values. Sinon, laissez-la cochée.
      4. Cliquez sur Submit afin de sélectionner les valeurs de noms les plus communes et les ajouter aux enregistrements maître de toutes les tâches.
    • Configurer manuellement une règle de consolidation pour un attribut de plusieurs enregistrements maître.

      1. Sélectionnez les tâches sur lesquelles appliquer la règle et, sous TASK dans le panneau de droite, cliquez sur Apply survivorship rule.
      2. Dans la liste Selection, cliquez sur Selected tasks.

        Vous pouvez appliquer la règle à toutes les tâches ou aux tâches filtrées uniquement si vous avez défini un filtre sur la liste.

      3. Dans la liste Rule, sélectionnez Most trusted par exemple pour appliquer la règle au groupe des tâches sélectionnées.

        Si vous avez défini, dans la campagne Merging les sources des données en doublon, les noms des sources sont inclus dans la liste et peuvent être sélectionnés comme règle de consolidation pour appliquer aux valeurs des colonnes.

      4. Si vous souhaitez appliquer la règle à toutes les valeurs, même les nulles, décochez la case Avoid null values. Sinon, laissez-la cochée.
      5. Cliquez sur SUBMIT pour ajouter les valeurs des noms avec le plus haut score aux enregistrements maître sélectionnés.
    • Configurer manuellement une règle de consolidation pour un attribut de plusieurs enregistrements : placez votre curseur sur un attribut de l'enregistrement maître d'une tâche et, parmi les icônes qui s'affichent, sélectionnez la règle de consolidation à appliquer.

      • : sélectionne la première valeur d'attribut valide parmi les doublons. "First" (première valeur) est défini par l'ordre des enregistrements lors de la création de la tâche.

      • : sélectionne la valeur la plus fréquente d'attribut parmi les doublons.

      • : sélectionne la valeur d'attribut la plus récente parmi les doublons.

      • : sélectionne la valeur d'attribut la plus fiable parmi les doublons.

        Une icône de consolidation est grisée lorsque la règle n'est pas applicable à l'enregistrement sélectionné.

    • Sélectionner la valeur d'un attribut source donné pour en faire la valeur de l'enregistrement maître : placez votre curseur sur un attribut source et cliquez sur la flèche vers le haut pour définir la valeur sélectionnée dans l'enregistrement maître.
  6. Vous pouvez également double-cliquer sur la valeur dans l'enregistrement maître et configurer une valeur de votre choix, différente de celles présentes dans les sources.
  7. Cliquez sur l'icône à côté de l'enregistrement de données modifié afin de marquer la tâche comme prête à être validée.
    Le premier champ a un fond vert. Un pourcentage de complétion de vos tâches est calculé et s'affiche dans le coin supérieur droit.

    Vous pouvez à nouveau modifier les enregistrements prêts à être validés, mais cela remet la tâche à son état initial, avec un fond gris foncé. Vous devez à nouveau cliquer sur l'icône représentant un cadenas pour marquer les tâches comme prêtes à la validation.

  8. Si l'icône représentant un cadenas a un fond rouge, corrigez la valeur invalide dans la tâche avant de pouvoir la marquer comme prête à être valider.
  9. Répétez l'étape ci-dessus pour créer les enregistrements maître pour toutes les tâches qui vous sont assignées.
  10. Cliquez sur VALIDATE CHOICES dans le coin supérieur droit afin de valider les modifications et déplacer la tâche hors de votre liste.

Résultats

Les enregistrements maître sont créés et les enregistrements validés sont déplacés vers la liste du participant ayant le rôle ACCOUNT VALIDATOR, dans cet exemple.