Download desviación estándar normal
Document related concepts
Transcript
DISTRIBUCION NORMAL Mario Briones L. MV, MSc 2005 Características de la distribución normal Es simétrica en torno a la media m La media (promedio), mediana y moda son iguales. El área total bajo la curva y sobre el eje X es una UNIDAD DE AREA Características de la distribución normal La distribución normal es una función que tiene sólo dos parámetros, la media poblacional (m) y la varianza (s2). La densidad normal alcanza un máximo cuando la variable tiene un valor igual a m y disminuye continua y simétricamente en ambas direcciones en la medida que la variable se desvía de m. Una variable con distribución normal m y varianza s2 se denota por z ~ N(m, s2) donde ~ significa “se distribuye”. Algunas propiedades La distribución de muchas variables biológicas es aproximadamente normal. Toda variable cuya expresión sea el resultado de contribuciones aditivas de pequeño efecto tenderán a distribuirse normalmente. “NORMALIDAD” Algunas propiedades Mediciones que no son normales pueden volverse aproximadamente normales con una simple transformación de escala. Ej. raíz cuadrada, logaritmo. El recuento de unidades formadoras de colonias o el recuento de células somáticas deben ser transformados a logaritmo para ser analizados estadísticamente. Algunas propiedades La distribución normal es relativamente fácil de trabajar matemáticamente. Muchos resultados útiles en estadística pueden ser derivados si la distribución es normal. Incluso cuando las muestras provienen de distribuciones no normales. Algunas propiedades Incluso si la distribución original de la población no es normal, la distribución de las medias de repetidos muestreos tenderán a ser normales, con muestreo aleatorio y en la medida que el tamaño de la muestra aumenta Algunas propiedades Si, al observar los estimadores de una muestra obtenida al azar desde una población, y la MEDIA, la MEDIANA y la MODA tienen valores parecidos, y si observamos un histograma y vemos que la mayor frecuencia de observaciones se agrupa en torno a la media, con colas hacia los extremos de la distribución, podemos asumir que: Algunas propiedades LOS DATOS PROVIENEN DE UNA POBLACIÓN CON DISTRIBUCIÓN NORMAL Si esto sucede, podemos aplicar las propiedades de la distribución normal a las inferencias que hagamos a partir de los datos de la muestra: por ejemplo, podemos decir que por encima del promedio obtenido en la muestra, se debería ubicar el 50% de la población. Algunas propiedades Cuando la distribución normal tiene media igual a cero y desviación estándar igual a 1, se trata de una distribución normal estandarizada. Existen tablas de área bajo la curva y altura de la ordenada para la distribución normal estandarizada en todos los libros de estadística “Deformaciones” o “desviaciones” de la distribución normal. CURTOSIS g2 = 0 g2 > 0 g2< 0 Coeficiente de curtosis n g 2 (curtosis ) s= desviación estándar (X i 1 i X) (n 1) s 4 4 “Deformaciones” o “desviaciones” de la distribución normal. Error estándar de la curtosis 24 EEC n Curtosis 2 Si , entonces la distribución EEC no es normal. “Deformaciones” o “desviaciones” de la distribución normal. COEFICIENTE DE ASIMETRIA: g1 = 0 g1 > 0 g1 < 0 Coeficiente de asimetría: n g1 (asimetría ) (X i 1 i X) (n 1) s 3 3 “Deformaciones” o “desviaciones” de la distribución normal. Coeficiente de asimetría: Error estándar del coeficiente de asimetría: 6 EECA n Coef. asimetría 2 EECA Si es normal. , la distribución no DISTRIBUCION NORMAL ACUMULATIVA (fragmento, obtenido con la función DISTRIBUCION NORMAL ESTANDARIZADA de Excel) SEGUNDO DECIMAL DE Z Z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0000 0.0398 0.0793 0.1179 0.1554 0.1915 0.2257 0.2580 0.2881 0.3159 0.3413 0.3643 0.3849 0.4032 0.4192 0.0040 0.0438 0.0832 0.1217 0.1591 0.1950 0.2291 0.2611 0.2910 0.3186 0.3438 0.3665 0.3869 0.4049 0.4207 0.0080 0.0478 0.0871 0.1255 0.1628 0.1985 0.2324 0.2642 0.2939 0.3212 0.3461 0.3686 0.3888 0.4066 0.4222 0.0120 0.0517 0.0910 0.1293 0.1664 0.2019 0.2357 0.2673 0.2967 0.3238 0.3485 0.3708 0.3907 0.4082 0.4236 0.0160 0.0557 0.0948 0.1331 0.1700 0.2054 0.2389 0.2704 0.2995 0.3264 0.3508 0.3729 0.3925 0.4099 0.4251 0.0199 0.0596 0.0987 0.1368 0.1736 0.2088 0.2422 0.2734 0.3023 0.3289 0.3531 0.3749 0.3944 0.4115 0.4265 0.0239 0.0636 0.1026 0.1406 0.1772 0.2123 0.2454 0.2764 0.3051 0.3315 0.3554 0.3770 0.3962 0.4131 0.4279 0.0279 0.0675 0.1064 0.1443 0.1808 0.2157 0.2486 0.2794 0.3078 0.3340 0.3577 0.3790 0.3980 0.4147 0.4292 0.0319 0.0714 0.1103 0.1480 0.1844 0.2190 0.2517 0.2823 0.3106 0.3365 0.3599 0.3810 0.3997 0.4162 0.4306 0.0359 0.0753 0.1141 0.1517 0.1879 0.2224 0.2549 0.2852 0.3133 0.3389 0.3621 0.3830 0.4015 0.4177 0.4319 A 0.68 m= 0 s= 1 68% 1s m +1s m= 0 s= 1 A 0.95 95% 2s 1s m +1s +2s m= 0 s= 1 A 0.99 99% 3s 2s 1s m +1s +2s +3s ejemplo: Cuál es la probabilidad de que una desviación normal caiga entre -1.62 y +0.28? A2 -1.62 0.28 A1 -3 -2 -1 0 1 2 3 Se divide el intervalo en dos partes: 1. 2. de -1.62 a 0 de 0 a 0.28 A1= 0.4474 A2= 0.1103 Probabilidad total= 0.5577 TABLA DE DISTRIBUCION ACUMULADA Esta tabla se utiliza con mayor frecuencia. Entrega el área bajo la curv desde cero hasta Z. Probabilidad de un valor 1. 2. 3. 4. 5. 6. 7. Entre Entre Fuera Menor Menor Mayor Mayor 0 y Z -Z y Z del intervalo -Z, Z que Z (Z positivo) que Z (Z negativo) que Z (Z positivo) que Z (Z negativo) Fórmula A 2A 1 - 2A 0.5 + A 0.5 - A 0.5 - A 0.5 +A Estandarización de una distribución normal CUALQUIER VALOR xi EN UNA DISTRIBUCIÓN PUEDE SER ESTANDARIZADO SOBRE LA BASE DE SU DISTANCIA DESDE LA MEDIA, MEDIDA EN UNIDADES DE DESVIACIÓN ESTANDAR. AL HACER ESTO, LA MEDIA DE LA DISTRIBUCION SE HACE CERO Y LA DESVIACIÓN ESTANDAR ES LA UNIDAD DE LA ESCALA. TABLAS DE DISTRIBUCION NORMAL TODAS LAS TABLAS ESTANDARES DE DISTRIBUCION NORMAL TIENEN MEDIA CERO Y DESVIACION ESTANDAR 1 Existe una medición X con media m y desviación estándar s y se desea utilizar la curva normal. Se debe transformar la escala de X de tal manera que la med hace cero y la desviación estándar 1. Este re escalamiento está dado por la relación: Z X m s X m + sZ “desviación estándar normal” obtención del valor X a partir de Z VARIABLE X: Peso de nacimiento de terneros de carne, machos y hembras, de las razas Hereford, Angus e Híbridos ¿Cuál es el valor estandarizado (media cero y desviación estándar igual a 1) para un peso de nacimiento de 50 kilos? n= 531 Rango= 64-16= 48 kilos Media= 39.4 kilos Mediana= 39.5 kilos X m Z Moda= 40 kilos s Varianza= 37.9 Desviación típica= 6.15 kilos 50 39.4 10.6 CV= 15.6% Z 1.72 6.15 6.15 Con los mismos datos anteriores: ¿Cuál es la probabilidad de un peso de ternero al nacimiento entre 50 y 55 kilos, ambos incluidos? ¿Cuál es la probabilidad de que un ternero pese 30 kilos o menos? Respuestas: Límite inferior: 50 kilos……… Z= (50 – 39.4)/6.15= 1.72 Límite superior: 55 kilos………Z= (55 – 39.4)/6.15= 2.53 Area= 0.4943-0.4573 = 0.037 Escala normalizada Escala real 0 39.40 1.72 2.53 50 55 Area= 0.4943 Area= 0.4573 z kilos La pregunta en sentido inverso: Entre que pesos, por sobre y bajo el promedio, se ubica el 50% de los datos de peso de nacimiento en la población de terneros a la cual pertenece la muestra? A partir de un área bajo la curva, determinar el valor z 0.25 0.25 z m z En este caso se busca en el cuerpo de la tabla un valor de área lo más parecido a 0.25 y en los márgenes se determina a que valor de z corresponde, en este caso es +0.675 y -0.675 A partir del valor z, determinar el valor en kilos o la variable correspondiente Entre +0.675 y -0.675 unidades estandarizadas de la curva normal (desviaciones estándares) se ubica el 50% de probabilidades de valores de peso. Si en el caso de la variable peso la desviación estándar es de 6.15 kilos, entonces la distancia en el eje medida en kilos es de ±6.15 x 0.675 = ±4.15 kilos Respuesta: m ±4.15 kilos