Résolution des conflits de données maître résultant de la mise en correspondance - 6.5

Talend Data Stewardship Console Guide utilisateur

EnrichVersion
6.5
EnrichProdName
Talend Data Fabric
Talend MDM Platform
EnrichPlatform
Talend MDM Web UI
task
Gouvernance de données
Qualité et préparation de données

Talend Data Stewardship Console fournit la possibilité de résolution des conflits de données, dans un enregistrement de données, résultants de processus de mise en correspondance effectués sur les données. Ces processus peuvent être effectués à l'aide d'une règle de rapprochement attachée à un modèle de données, ou à l'aide du composant de qualité de données Talend tMatchGroup.

Les résultats des processus de mise en correspondance vont indiquer tout conflit de données parmi les éléments mis en correspondance à travers des sources hétérogènes. Les enregistrements en conflit seront listés dans la console d'arbitrage dans Talend MDM Web User Interface sous forme de tâches.

Des contrôles de validité sont maintenant nécessaires dans la console d'arbitrage afin d'améliorer la qualité des données. Un arbitre autorisé doit définir et fusionner manuellement les données dans les tâches listées.

Prérequis : Vous devez être connecté à Talend MDM Web User Interface et avoir accédé à la console d'arbitrage. Au moins une tâche de résolution des données doit vous avoir été assignée par l'administrateur. Pour plus d'informations, consultez Assignation d'une tâche.

Pour résoudre des problèmes de correspondance de données liés aux multiples sources de données, procédez comme suit :

  1. Dans le panneau Task Navigator, développez Common et cliquez sur New pour afficher toutes les nouvelles tâches.

    Vous pouvez également développer Types puis cliquer sur Resolution afin d'afficher toutes les tâches de résolution, qu'elles soient new ou resolved.

    Note

    Votre liste n'affichera que les tâches vous ayant été assignées par l'administrateur. Pour plus d'informations, consultez Assignation d'une tâche.

  2. Double-cliquez sur la tâche de résolution de données contenant l'enregistrement de données que vous souhaitez résoudre.

    La vue détaillée de la tâche sélectionnée s'affiche dans la console.

    Note

    Vous pouvez utiliser les boutons et dans le coin supérieur droit de la vue afin d'ouvrir la vue détaillée de la tâche précédente ou suivante dans la liste. Pour fermer la vue détaillée, cliquez sur pour revenir à la liste des tâches.

    Dans la vue détaillée des tâches, tous les éléments de données de l'enregistrement sélectionné, provenant de sources, s'affichent dans une table pouvant être partiellement renseignée grâce à la fonctionnalité de suggestion automatique. Afin d'utiliser cette fonctionnalité de la manière la plus appropriée, il est conseillé de ne pas donner le même noms à différentes sources. Pour plus d'informations concernant la fonctionnalité de suggestion automatique, reportez-vous au tableau présenté plus bas.

    Dans la table, les lignes sont les enregistrements source groupés avec l'enregistrement maître, affiché en haut. Les colonnes sont les champs des enregistrements de données.

    Note

    Les boutons Use Auto Suggest , Use Common Value et Use Trusted Score sont actifs par défaut. Ils utilisent les valeurs communes ou de confiance, s'il y en a, des enregistrements SOURCE, afin de pré-renseigner GOLDEN RECORD.

  3. Si nécessaire, vous pouvez glisser-déposer les lignes ou colonnes à la position exacte où vous souhaitez les placer dans la table.

    Pour ce faire, passez votre curseur à gauche d'une ligne ou colonne, jusqu'à ce que le curseur prenne la forme de deux flèches croisées, puis glissez la ligne ou colonne jusqu'à la position souhaitée et maintenant le curseur jusqu'à ce que la position souhaitée devienne totalement blanche et relâchez la ligne ou colonne.

    Note

    Si vous modifiez la position des lignes ou colonnes dans une table, cette modification est maintenue et sera appliquée aux autres tâches existantes contenant les mêmes lignes (enregistrements source) et colonnes (champs).

    Dans cet exemple, l'enregistrement maître provient de cinq sources différentes. Les résultats des processus de rapprochement et consolidation sont représentés par l'enregistrement maître et révèlent que les valeurs contenues dans l'enregistrement diffèrent d'une source à l'autre.

    Note

    A la différence des scores de correspondances représentant une distance entre un enregistrement et un enregistrement maître, un score de confiance indique combien la source est fiable : elle obtient un point à chaque fois que l'arbitre la sélectionne comme valeur cible.

  4. Si nécessaire, cliquez sur l'onglet Underline Equal en haut de la page pour souligner toutes les valeurs similaires dans les lignes des différentes sources.

  5. Vous devez coordonner manuellement les données pour l'enregistrement maître : cliquez sur la valeur, dans la source, que vous souhaitez utiliser pour créer l'enregistrement maître.

    La valeur sélectionnée dans l'enregistrement source s'affiche dans le champ correspondant de la ligne de l'enregistrement maître.

    Note

    Si l'une des valeurs dans la ligne de l'enregistrement source contient une marque rouge, placez votre souris sur cette marque pour afficher les informations attachée à cette tâche. Une telle information peut permettre à l'arbitre de résoudre l'enregistrement de données. Pour plus d'informations concernant l'ajout d'informations à la tâche, consultez tStewardshipTaskOutput dans le Guide de référence des Composants Talend.

  6. Pour écrire toutes les valeurs d'une ligne SOURCE dans la ligne GOLDEN RECORD, cliquez sur dans la ligne correspondante de l'enregistrement source.

  7. Si nécessaire, saisissez une nouvelle valeur dans le champ correspondant de la ligne GOLDEN RECORD et considérez cette valeur comme la valeur correcte pour l'enregistrement de données maître.