Accéder au contenu principal Passer au contenu complémentaire

Qu'est-ce que le rapprochement de données ?

Le rapprochement de données est un processus qui vous permet de trouver des enregistrements représentant la même entité dans un jeu de données.

Définition générale

Le rapprochement de données vous permet :
  • de chercher des doublons, des paires suspectes et des enregistrements uniques dans une source de données,
  • d'analyser des données et de retourner des probabilités pondérées de correspondance,
  • de fusionner les entrées identiques ou similaires en une seule entrée et
  • de réduire les disparités entres les différentes sources de données.

Rapprochement d'enregistrements

Le rapprochement consiste en une identification des enregistrements faisant référence à une même entité dans un jeu de données.

Deux types de rapprochements d'enregistrements existent :
  • le rapprochement des enregistrements déterministe, basé sur des identifiants qui entrent en correspondance et
  • le rapprochement des enregistrements probabiliste, basé sur la probabilité que deux identifiants correspondent.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – dites-nous comment nous améliorer !