Détection de la fraude - Cloud - 8.0

Guide d'utilisation du Studio Talend

Version
Cloud
8.0
Language
Français
Product
Talend Big Data
Talend Big Data Platform
Talend Cloud
Talend Data Fabric
Talend Data Integration
Talend Data Management Platform
Talend Data Services Platform
Talend ESB
Talend MDM Platform
Talend Real-Time Big Data Platform
Module
Studio Talend
Content
Création et développement
Last publication date
2024-03-06
Disponible dans...

Big Data Platform

Cloud API Services Platform

Cloud Big Data Platform

Cloud Data Fabric

Cloud Data Management Platform

Data Fabric

Data Management Platform

Data Services Platform

MDM Platform

Real-Time Big Data Platform

L'indicateur Benford Law (loi des nombres anormaux) se base sur l'examen de la fréquence des chiffres 1 à 9 dans des données numériques. Il est généralement utilisé en tant qu'indicateur dans des listes ou tables afin de détecter la fraude en comptabilité ou dans des dépenses.

La loi de Benford établit que, dans des listes et des tables, le chiffre 1 apparaît comme chiffre de début environ 30% du temps. Par exemple le chiffre 2 apparaît en premier dans 17% des cas et le chiffre 3 dans environ 12% des cas, etc. Des données valides et non altérées suivent cette fréquence. Des données valides et non altérées suivent cette fréquence. Une simple comparaison de la fréquence de distribution des premiers chiffres dans les données analysées et de la distribution attendue selon la loi de Benford doit mettre en relief tout résultat anormal.

Par exemple un employé qui fraude en créant et en envoyant des paiements à un vendeur fictif. Puisque les sommes de ces paiements fictifs sont imaginées et n'arrivent pas naturellement, la distribution du premier chiffre de toutes les transactions fictives et valides (mélangées) ne suit pas la loi de Benford. Imaginez également que de nombreux paiements frauduleux commencent par 2, par exemple 29, 232 or 2187. En utilisant l'indicateur de la loi de Benford pour analyser les données, vous pouvez constater que les sommes commençant par 2 sont plus fréquentes que l'occurrence habituelle de 17%.

Lorsque vous utilisez l'indicateur Benford Law (Loi de Benford), il est recommandé de vérifier que les données numériques que vous analysez ne commencent pas par 0, car la loi de Benford attend un premier chiffre entre 1 et 9. Cela peut être vérifié en utilisant le modèle number > Integer values sur la colonne que vous analysez.

Dans le diagramme des résultats de l'indicateur Benford Law, les chiffres 1 à 9 sont représentés par des barres. Les points sur les barres représentent la fréquence de distribution attendue du premier chiffre, selon la loi de Benford.

Voici un exemple de résultats d'une analyse, après utilisation de l'indicateur Benford Law sur une colonne.

Exemple de résultats d'analyse par rapport à l'indicateur Benford Law (Loi de Benford).

Le diagramme montre que la distribution des données (hauteur des barres) ne respecte pas la loi de Benford (valeur des points). Les différences sont particulièrement grandes entre la fréquence de distribution des chiffres des ventes et la distribution attendue par la loi de Benford. Par exemple, le modèle le plus fréquent pour les chiffres des ventes commençant par 1 est 30 %. Ces chiffres, dans les données analysées, représentent seulement 25 %. Une fraude peut être suspectée ici, les chiffres des ventes ont pu être modifiés, ou des données peuvent être manquantes.

La barre orange nommée invalid présente le pourcentage des données analysées ne commençant pas par un chiffre. Ce cas n'est pas attendu lors d'analyse de colonnes à l'aide de l'indicateur Benford Law, c'est pour cette raison que la couleur orange est utilisée.

Le tableau suivant présente les indicateurs que vous pouvez sélectionner dans n'importe quelle base de données :

Indicateur Types de données supportés par le moteur d'analyse Java Types de données supportés par le moteur d'analyse SQL
Fréquence de la loi de Benford
  • Number
  • Text
  • Number
  • Text