Download Presentación

Document related concepts

Ley de Benford wikipedia , lookup

Transcript
La ley de Benford para el
segundo dígito y los
resultados electorales
en México
Luis Horacio Gutiérrez
UAM-Iztapalapa
Emiliano Calderón
Facultad de Ciencias, UNAM
Ley de Benford
• Prueba estadística que permite descubrir números fabricados
• Utilizada por administraciones tributarias para revisar declaraciones
de impuestos
• Recientemente se ha extendido su aplicación al análisis de
resultados electorales
• Se basa en un análisis de la frecuencia de utilización de cada dígito,
del 0 al 9
• Todos suponemos que, en cualquier conjunto de números, cada
dígito aparece con la misma frecuencia. Sin embargo, esto no es
así
Ley de Benford
Distribución logarítmica del primer dígito de
varias cantidades que ocurren naturalmente y
que son resultado de operaciones aritméticas
Hill, 1995
Ley de Benford
Distribución logarítmica del segundo dígito de
varias cantidades que ocurren naturalmente y
que son resultado de operaciones aritméticas
Hill, 1995
Distribución generalizada
Hill, 1995
Probabilidades predichas por la ley de Benford para
dígitos hasta de cuarto orden
Diekmann, 2004
Distribución del primer dígito para datos no fabricados
Diekmann, 2004
Distribución del segundo dígito para datos no fabricados
Diekmann, 2004
Para resultados electorales:
• La distribución del primer dígito no cumple con la ley de
Benford. Esto se debe a que el número de candidatos es
limitado y mucho menor que el número de votantes
• La distribución de los dígitos de orden superior
(segundo, tercero, etc.) sí tiene que cumplir con la ley de
Benford. Estos números sólo se derivan de operaciones
aritméticas comunes
• El conteo del segundo dígito a nivel sección debe
ajustarse a la distribución de Benford
• La bondad del ajuste de los datos observados con
respecto a la distribución esperada se determina
mediante la función
(ji^2, ji cuadrada)
• Los valores observados serán confiables si ji cuadrada
es menor que el valor crítico 16.91
Valores de ji^2 para el
conteo de votos en
las elecciones
mexicanas de 2006
(Conteo de dígitos a
nivel sección.)
Los valores de ji^2
superiores a 16.91
son preocupantes
Mebane, 2006a
Valores de ji^2 para el
conteo de votos en
las elecciones
mexicanas de 2006
(Conteo de dígitos a
nivel casilla.)
Los valores de ji^2
superiores a 16.91
son preocupantes
Mebane, 2006a
Valores de ji^2 para
el conteo de votos
por distrito
Los valores de ji^2
superiores a 16.91
son preocupantes
Distritos con alteraciones graves
Distribución de dígitos para el distrito 2 de Chihuahua
8_2; N=895; chiB=39.32
200
180
160
Frecuencia
140
120
100
80
60
40
20
0
0
1
2
3
4
5
Segundo dígito
IFE
Benford
6
7
8
9
Distribución de dígitos para el distrito 2 de Chihuahua
PAN;8_2; N=252, chiB=13.49
Frecuencia
50
40
30
20
10
0
0
1
2
3
4
5
Segundo dígito
IFE Benford
6
7
8
9
Distribución de dígitos para el distrito 2 de Chihuahua
APM; 8_2; N=251; chiB=18.68
Frecuencia
50
40
30
20
10
0
0
1
2
3
4
5
Segundo dígito
IFE
Benford
6
7
8
9
Distribución de dígitos para el distrito 2 de Chihuahua
PBT; 8_2; N=252; chiB=4.94
50
Frecuencia
40
30
20
10
0
0
1
2
3
4
5
Segundo dígito
IFE
Benford
6
7
8
9
Distribución de dígitos para el distrito 2 de Chihuahua
NA; 8_2; N=40; chiB=26.11
Frecuencia
50
40
30
20
10
0
0
1
2
3
4
5
Segundo dígito
IFE
Benford
6
7
8
9
Distribución de dígitos para el distrito 2 de Chihuahua
ASCD; 8_2; N= 100; chiB=22.87
Frecuencia
50
40
30
20
10
0
0
1
2
3
4
5
Segundo dígito
IFE
Benford
6
7
8
9
La distribución del segundo dígito en numerosos
distritos no se ajusta a la ley de Benford
Número de anomalías
Número de distritos
0
90
1
111
2
52
3
34
4
8
5
4
6
1
Total de distritos con anomalías
210
Diferencia porcentual Calderón-AMLO contra porcentaje
de votos anulados
Chihuahua
0.5
-0.5
0.0
P_P_per[state == "CHIHUAHUA"]
0.6
0.4
0.2
0.0
-0.2
P_P_per[state == "AGUASCALIENTES"]
0.8
Aguascalientes
0.00
0.05
0.10
0.15
Nulo[state == "AGUASCALIENTES"]
0.20
0.00
0.05
0.10
0.15
0.20
Nulo[state == "CHIHUAHUA"]
Takahashi, 2006
0.5
-0.5
0.0
0.0
P_P_per[state == "GUANAJUATO"]
0.5
Guanajuato
-0.5
P_P_per[state == "DISTRITO FEDERAL"]
Distrito Federal
0.00
0.05
0.10
0.15
Nulo[state == "DISTRITO FEDERAL"]
0.20
0.00
0.05
0.10
0.15
0.20
Nulo[state == "GUANAJUATO"]
Takahashi, 2006
Nuevo León
0.6
0.4
0.2
0.0
-0.4
-0.2
P_P_per[state == "NUEVO LEON"]
0.2
0.0
-0.2
-0.4
-0.6
-0.8
P_P_per[state == "MORELOS"]
0.4
0.8
Morelos
0.00
0.05
0.10
0.15
Nulo[state == "MORELOS"]
0.20
0.00
0.05
0.10
0.15
0.20
Nulo[state == "NUEVO LEON"]
Takahashi, 2006
• En estados como Chihuahua, Guanajuato y Nuevo
León, el porcentaje de votos nulos es mayor cuando la
diferencia Calderón-AMLO es menor
• El porcentaje de representantes de casillas de la
coalición PBT era muy baja en los estados arriba
mencionados
• Es posible que en esos estados se haya anulado un
porcentaje
inusualmente
elevado
de
votos
correspondientes a PBT
Agradecimientos
• Universidad de Cornell:
W. R. Mebane
Y. Takahashi
• Universidad de Berkeley:
J. Sekhon
Referencias
• Diekmann, A. (2004) Not the First Digit! Using Benford’s
Law to Detect Fraudulent Scientific Data
• Hill, T. P. (1995) A Statistical Derivation of the SignificantDigit Law. Statistical Science 10 (4), 354-363
• Mebane, W. R. (2006a) Election Forensics: Vote Count
and Benford’s Law. 2006 Summer Meeting of the
Political Methodology Society
• Mebane, W. R. (2006b) Comunicación personal
• Takahashi, Y. (2006) Comunicación personal