Download El pueblo contra Collins

Document related concepts
no text concepts found
Transcript
El pueblo contra Collins
La falacia del fiscal
THE PEOPLE, Plaintiff and Respondent
v.
MALCOLM RICARDO COLLINS, Defendant and Appellant
Docket No. Crim. 11176
Supreme Court of California
In Bank
March 11, 1968
68 Cal. 2d 319, 438 P.2d 33, 66 Cal.Rptr. 497 (1968)
APPEAL from a judgment of the Superior Court of Los Angeles
County. Maurice C. Sparling, Judge. Reversed.
Rex K. DeGeorge, under appointment by the Supreme Court, for
Defendant and Appellant.
Thomas C. Lynch, Attorney General, William E. James, Assistant
Attorney General, and Nicholas C. Yost, Deputy Attorney General,
for Plaintiff and Respondent.
En 1964, se produjo en Los Ángeles un asalto con robo a una
mujer; la ladrona, una joven rubia con coleta, fue vista huir, a bordo
de un coche amarillo, en compañía de un varón negro con barba y
bigote.
Unos días después, es detenida una tal Janet Collins, rubia, con
coleta, que al parecer anda en tratos con un hombre negro con
barga y bigote, y que posee un coche amarillo.
El fiscal estima las probabilidades de cada una de esas
características y, suponiendo independencia entre ellas, llega la
conclusión de que la probabilidad de reunir todas ellas es de una
entre 12 millones. El veredicto parece claro.
La Corte Superior del Condado de Los Ángeles declara a Janet
Collins culpable.
El caso fue recurrido y la Corte Suprema de California, cuatro
años después, anuló la sentencia de culpabilidad, con un
razonamiento matemático por parte de la defensa que arrojó unas
conclusiones tajantes. Razonemos, por nuestra cuenta, el susodicho
problema.
Probabilidades consideradas
A. Partly yellow automobile 1/10
B. Man with mustache 1/4
C. Girl with ponytail 1/10
D. Girl with blond hair 1/3
E. Negro man with beard 1/10
F. Interracial couple in car 1/1000
Producto p(i): 1/12 000 000 ~ 0!!!
Universo de nuestro problema
En adelante, llamaremos N al número de parejas de nuestro
universo (nº de parejas residentes en LA Ciudad, en el Condado, o
en el Área Metropolitana). Consultando los datos, conocemos el
número de habitantes, pero no el número de parejas (pues aunque
el número de matrimonios se encuentre registrado, ni todos los
matrimonios siguen siendo pareja, ni todas las parejas están
casadas, ¡alíviense ustedes!). Así, introducimos el factor R, definido
como el número de parejas por cada habitante, de modo que
N = 3 800 000 * R (ciudad), 9 800 000 * R (condado) ó 21 000 000 *
R (área metropolitana), siendo los números que anteceden a R las
poblaciones de las regiones especificadas.
Universo de nuestro problema
La probabilidad de que una persona tenga pareja (nótese que en la
estimación se están considerando también niños y ancianos viudos)
anda en torno al 56%. Supongamos la existencia exclusiva de
parejas heterosexuales monógamas (y supongamos que no es
mucho suponer...). Entonces, si un 50% de la población es varón, el
número de parejas coincide con el número de varones
emparentados: nº habitantes x 0,5 x 0,56 = 0,28 x nº habitantes
(luego es R=0,28).
Número de parejas
nº
habitantes
N (nº
parejas)
ciudad
3800000
1064000
condado
9800000
2744000
21000000
5880000
área metropolitana
¡A la cárcel esa rubia!
Sabemos que la ladrona ha de residir en la ciudad de LA. Dado que
allí sólo viven algo más de 1 millón de parejas y la probabilidad de
que una pareja cumpla con los datos conocidos de la culpable (es
decir, que sea sospechosa) es de 1 entre 12 millones, parecería que
no vamos a encontrar ninguna pareja tal en LA; sin embargo,
sabemos que la culpable cumple esas características, luego sí que
existirá al menos una.
Aun así, la probabilidad de que existieran dos parejas sospechosas
puede seguir pareciendo prácticamente nula (¡LA ciudad habría de
tener 12 millones de habitantes para que le correspondiera, en
promedio, una pareja tan singular, y 24 millones para que le
correspondieran dos!).
¿Dónde está entonces la falacia?


Primero, en que no es en realidad tan insospechado encontrar
entre 1 millón de parejas a dos que sean sospechosas (lo
veremos a continuación mediante cálculos)
segundo, en que de existir dos parejas sospechosas, si
consideramos a una de las dos culpable, correremos un 50% de
posibilidades de equivocarnos, y ese es un riesgo muy alto;
análogamente, si existieran 3 parejas sospechosas, lo cual sería
aún más raro, tendríamos un 66% de posibilidades de condenar a
un inocente, etc. (no obstante, adelantamos ya que el caso
realmente notorio es el de que existan 2 parejas sospechosas, ya
que las probabilidades de encontrar a más de 2 parejas
sospechosas en LA se reducen drásticamente).
Resolución del problema
Si no se hubiera cometido ningún robo, para estimar la
probabilidad de que en LA hubiese x sospechosos, podríamos
utilizar una distribución binomial: el éxito es que una pareja
cumpla las condiciones del culpable (esto es, sea
sospechosa); n=N, p=1/12 000 000 y q = 1 - p. Además, por
ser n » 1 y p « 1, la distribución tenderá a una de Poisson, con
λ = n · p = 1 064 000 · 1/12 000 000; λ = 0.0887. A
continuación se muestran la distribución binomial y la de
Poisson para distintos valores de x (podemos comprobar, en
efecto, la clara validez de la distribución de Poisson en nuestro
caso):
Tabla de valores
x
Binomial
Poisson
P( x | >0 )
P equivocación
producto
0
0,91515057
0,91515057
1
0,08114336
0,08114335
0,95632173
0
0
2
0,00359735
0,00359736
0,04239693
0,5
0,02119846
3
0,00010632
0,00010632
0,00125306
0,666666667
0,00083538
4
2,3568E-06
2,3568E-06
2,7776E-05
0,75
2,0832E-05
5
4,1794E-08
4,1794E-08
4,9257E-07
0,8
3,9405E-07
6
6,1761E-10
6,1762E-10
7,279E-09
0,833333333
6,0659E-09
7
7,8231E-12
7,8232E-12
9,2201E-11
0,857142857
7,9029E-11
8
8,6705E-14
8,6707E-14
1,0219E-12
0,875
8,9416E-13
9
8,542E-16
8,5423E-16
1,0068E-14
0,888888889
8,9489E-15
10
7,5738E-18
7,5741E-18
8,9266E-17
0,9
8,0339E-17
SUMA:
0,02205507
%P(acus. inoc.):
2,20550739
¡Es un problema condicionado!
Al principio del trabajo, ya advertimos sobre el hecho clave de
que se trataba de un problema de probabilidad condicionada. Así
es que, si bien la probabilidad de encontrar a dos parejas
sospechosas en LA (sin ningún dato previo) es de sólo
0,00359736, la probabilidad de encontrar a dos parejas
sospechosas, sabiendo que existe al menos una (probabilidad
condicionada, ¡pues ha habido un robo!) es ya del 0,04239693,
que es muchísimo mayor que la anterior.
La columna P ( x | >0)
En particular, la columna P( x | >0 ) se ha calculado
mediante el Teorema de Bayes
haciendo,
P(x | >0) = P(x ∩ >0) / P(>0) = P(x) / P(>0) para todo x>0.
P(B  Ai )
P(Ai|B) 
P(B)
La columna P(equivocación)
Por otra parte, la columna probabilidad de equivocación (P
equivocación) se ha calculado haciendo (x – 1) / x, en tanto que
la columna ‘producto’ es la multiplicación de las dos anteriores
columnas, de suerte que la suma de todas las filas de ‘producto’
nos da la probabilidad total de juzgar a un inocente (o lo que es
lo mismo, la probabilidad de que el sospechoso al que estamos
defendiendo no sea en realidad culpable).
Un riesgo demasiado alto...
En otras palabras, la Corte Superior del Condado de LA declaró a
Janet Collins ‘culpable’ corriendo un riesgo del 2,21% de estar llevando a la
cárcel a una inocente, riesgo inadmisible en un país donde existe la
presunción de inocencia. Conviene destacar una vez más que el bajísimo
valor de p = 1/12 000 000 = 8,33·10–8 nos lleva a una P(condenar a un
inocente) = 0,022, valor seis órdenes de magnitud mayor, insospechado
inicialmente.
Repitiendo los cálculos para el Condado y el Área Metropolitana,
obtenemos:
nº habitantes
nº parejas
P(condenar inocente)
ciudad
3800000
1064000
0,02205507
condado
9800000
2744000
0,05639979
21000000
5880000
0,1187763
área metropolitana
Razonamiento alternativo I
X
x
Binomial
Poisson
P equivocación
producto
0
1
0,91515057
0,91515057
0
0
1
2
0,08114336
0,08114335
0,5
0,04057168
2
3
0,00359735
0,00359736
0,666666667
0,00239824
3
4
0,00010632
0,00010632
0,75
7,9741E-05
4
5
2,3568E-06
2,3568E-06
0,8
1,8854E-06
5
6
4,1794E-08
4,1794E-08
0,833333333
3,4828E-08
6
7
6,1761E-10
6,1762E-10
0,857142857
5,2939E-10
7
8
7,8231E-12
7,8232E-12
0,875
6,8453E-12
8
9
8,6705E-14
8,6707E-14
0,888888889
7,7073E-14
9
10
8,542E-16
8,5423E-16
0,9
7,688E-16
SUMA:
0,04305157
%P(acus. inoc.):
4,30515744
Razonamiento alternativo I
nº
habitantes
nº
parejas
P(condenar
inocente)
ciudad
3800000
1064000
0,04305157
condado
9800000
2744000
0,10609484
21000000
5880000
0,20944162
área metropolitana
Razonamiento alternativo II
Sea ‘+’ el suceso: reunir todas las características del culpable (ser sospechoso).
Sea X la probabilidad de que una pareja cualquiera (tomada pues
aleatoriamente de entre el universo concerniente) reúna todas las
características que sin ninguna duda posee la culpable (en nuestro caso, 1
entre 12 millones). Es decir, P(+)=X. Sea N el número de parejas de nuestro
universo.
Es importante reseñar que en la determinación de X no se está
teniendo en cuenta que existe un culpable, y por ende al menos un individuo en
nuestro universo que cumpla + (en nuestro caso, lo más probable es que entre
las N parejas, ninguna de ellas cumpla +, ya que la probabilidad es de X=1/12
000 000). Por lo tanto X, la probabilidad de que una persona cualquiera reúna
las características del culpable, es en realidad la probabilidad de que uno de los
(N – 1) inocentes reúna las características del culpable, pues no hemos tenido
en cuenta al determinar X que existe al menos un culpable. Esto es, X es en
realidad: P(+|inocente)=X.
Razonamiento alternativo II
Razonamiento alternativo II
P(culpable | +) = P(culpable ∩ +) / P(+) =
(1/N) / (1/N + (1 – 1/N)·X) =
1/(1 + X·(N–1)).
Esto es, la probabilidad de que un sospechoso sea realmente
culpable es de:
1/(1 + X·(N–1))
Razonamiento alternativo II
nº
habitantes
N (nº
parejas)
P (culpable |+)
P (condenar
inocente)
ciudad
3800000
1064000
0,918554877
0,081445123
condado
9800000
2744000
0,813890451
0,186109549
21000000
5880000
0,671140977
0,328859023
área
metropolitana
X=
8,33333E-08
Conclusiones
En cualquier caso, la conclusión evidente del presente estudio es
que, en temas tan sensibles como el judicial, donde probabilidades de
culpar a un inocente del entorno del 1% ya han de ser consideradas
como muy altas, la mera coincidencia de características entre el
sospechoso y el presunto criminal, no podrá justificar nunca, y por sí
sola, la culpabilidad del acusado. Hemos visto, en este caso, como
aun siendo no raras, sino rarísimas (1/12 000 000), las confluencias
de caracteres en nuestra criminal, emprender el rastreo por todo LA y
culpar a las parejas encontradas sería poco menos que una caza de
brujas. Si a esto le añadimos la posibilidad de que quizás el coche no
fuera amarillo, o la mujer no llevara coleta, o el hombre fuese latino y
no negro, o no llevase bigote, etc. el procedimiento se convierte
definitivamente en una búsqueda a ciegas.
Conclusiones
Pero es que aún en el caso de utilizar análisis genéticos en un
caso judicial (donde se identifican caracteres que sólo poseen uno de
cada millón de individuos), aún así, donde está claro que esa
genética pertenece al verdadero culpable, de nada serviría encontrar
en la región a un hombre poseedor de ellos en su genoma, pues
posiblemente se trataría de un inocente.
Sólo reduciendo el universo de los potenciales culpables (N), el
método de búsqueda de caracteres comunes puede resultar seguro,
escapando así de lo que ya se conoce, desde el caso Collins, como
la ‘falacia del fiscal’.
The END
Carlos B.
1
2
3
4