Download Decisiones salomónicas

Document related concepts
no text concepts found
Transcript
Decisiones salomónicas
¡Cuánto no habría dado el rey Salomón por saber algo más sobre cálculo
de probabilidades!. Y eso que ya era bastante sabio. Pero no cabe duda, si
hubiese tenido unas mínimas nociones de estadística, sus decisiones habrían
sido mucho más fáciles. Y, desde luego, casi seguro que no habría tenido
que partir niños por la mitad. Claro que entonces no sería famoso. A los
personajes históricos les pasa como a las fiestas populares: cuanto más
salvaje, más gustan.
Y para demostraros de qué estoy hablando os voy a poner, como es
habitual, un ejemplo tan estúpido que se os van a acabar las ganas de
seguir leyendo.
Supongamos por un delirante momento que soy un vigilante de seguridad en
una tienda de caramelos gigante. Me avisan porque han pillado a un niño con
una bolsa de caramelos que, presuntamente, ha robado del barril gigante de
caramelos de la tienda. El pobre crío dice que él no ha hecho nada malo y
que los caramelos son de otra tienda pero, claro, ¿qué va a decir?. ¿Qué
podemos hacer?. Ya sé… partir al niño por la mitad, como haría el rey
Salomón.
Pero cualquiera se da cuenta en seguida que esa solución no es muy
buena. ¿Quién sabe si el pobre es inocente, como él dice?. Así que vamos a
pensar un poco cómo podemos averiguar si los caramelos de la bolsa son de
nuestra tienda o de la otra que nos hace la competencia.
Nos dice el encargado de nuestra tienda que en el barril el 25% de los
caramelos son de naranja, el 20% de fresa, el 20% de menta, el 25% de café
y el 10% de chocolate. Así que miramos en la bolsa del niño y vemos que
tiene 100 caramelos de los siguientes sabores: 27 de naranja, 18 de fresa,
20 de menta, 22 de café y 13 de chocolate.
Si los caramelos procediesen de nuestro barril la proporción de los
sabores sería la misma en el barril y en la bolsa ya que, a efectos
prácticos, podríamos asumir que el ladrón metió la mano y sacó al azar 100
caramelos del barril (este método no nos vale si ha seleccionado los
caramelos por su sabor).
Así que la pregunta es sencilla: ¿el reparto de los caramelos del niño
es compatible con que los caramelos provengan de una muestra aleatoria de
nuestros caramelos?. Las pequeñas diferencias se deberían al error de
muestreo, así que planteamos nuestra hipótesis nula de que el niño nos ha
robado los caramelos.
En primer lugar planteamos la distribución teórica que tendrían que
tener los caramelos y la que tienen en realidad, siempre asumiendo que la
hipótesis nula es cierta.
A
nosotros nos interesa saber si la diferencia entre el reparto teórico y el
observado puede explicarse por el azar. Pero si sumamos las diferencias se
anulan una con otras y el resultado final es cero. Como sabemos que esto
siempre nos va a ocurrir, lo que hacemos es elevar las diferencias al
cuadrado (para eliminar los negativos) antes de sumarlas. El problema es
que no es lo mismo esperar 2 y obtener 7 que esperar 35 y obtener 40.
Aunque en ambos ejemplos la diferencia sea de cinco, parece evidente que el
margen de error es mayor en el primer ejemplo. Por eso estandarizamos la
diferencia entre observado y esperado dividiéndola por el valor esperado. Y
ahora sí, sumamos estos resultados para obtener un valor determinado, que
en nuestro caso es de 1,08.
Y 1,08, ¿es mucho o es poco?. Pues depende, unas veces será mucho y
otras poco. Lo que sí sabemos que es este valor sigue, aproximadamente, una
distribución de probabilidad de chi-cuadrado con un número de grados de
libertad igual al número de categorías (sabores en nuestro ejemplo) menos
una.
Así que si buscamos la probabilidad de un valor de chi de 1,08 con 4
grados de libertad, para lo que podemos usar un programa informático, una
tabla de probabilidades o una de las calculadoras disponibles en Internet.
Obtenemos de esta forma una p = 0.89 (89%). Como es mayor del 5% no podemos
rechazar la hipótesis nula, así que llegamos a la conclusión de que el niño
es, además de ladrón, bastante mentiroso. Su bolsa de caramelos es
representativa de una muestra aleatoria obtenida de nuestro barril.
Ya veis qué fácil es comprobar la procedencia de una muestra aplicando
la prueba de la chi-cuadrado. Pero esta prueba no solo sirve para estudiar
la procedencia de muestras aleatorias, sino que también puede utilizarse
para comprobar si existe alguna relación de dependencia entre variables
cualitativas. Pero esa es otra historia…