Der Begriff wird im Bereich der Statistik und Wahrscheinlichkeiten verwendet und auf diejenigen Daten oder Zahlen angewendet, die gleich sein sollten, dies aber nicht sind. Sie erhalten diesen Namen, weil sie denselben Namen haben und auf dieselbe Weise interpretiert werden müssen, aber mit unterschiedlichen Methoden berechnet werden oder nicht aus derselben Quelle stammen und mit unterschiedlichen Sammeltechniken erstellt wurden.
Diese Bezeichnung bezieht sich auf Daten, im Allgemeinen Indikatoren oder Indizes, die aus der Berechnung mit statistischen Methoden unter Verwendung einer großen Anzahl von Stichproben stammen. Diese Daten stellen das gleiche Phänomen dar, für das sie berechnet werden, jedoch ist die für ihre Bestimmung verwendete Methode unterschiedlich, solange sie gültig sind, dh auf beide Arten ist es möglich, zu diesen Daten zu gelangen.
Eine andere Möglichkeit, die zu einer statistischen Diskrepanz zwischen zwei Zahlen oder Daten führt, besteht darin, dass die Informationsquellen oder Datenerfassungstechniken unterschiedlich sind oder Variationen darstellen. Es sollte beachtet werden, dass Statistik eine Wissenschaft ist, die es ermöglicht, Rückschlüsse auf ganze Datenpopulationen zu ziehen, basierend auf einer repräsentativen Stichprobe, aber sie ist nicht präzise, daher wird in dieser Wissenschaft auch ein Begriff verwendet, der als Fehler- oder Durchhangbereich bezeichnet wird.
Basierend auf dem Vorgenannten kann gesagt werden, dass eine statistische Diskrepanz technisch akzeptabel ist, wenn die Werte innerhalb des Fehlerbereichs liegen.
Einer der häufigsten Fälle, in denen die statistische Diskrepanz auftritt, ist die Wirtschaft, in der bei der Berechnung des Bruttoinlandsprodukts eines Landes Datenwolken verwendet werden, die unabhängig nach Industrie- oder Verbrauchskriterien erhoben werden.