Download desviación estándar normal

Document related concepts

Asimetría estadística wikipedia , lookup

Curtosis wikipedia , lookup

Distribución t de Student wikipedia , lookup

Distribución log wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Transcript
DISTRIBUCION NORMAL
Mario Briones L.
MV, MSc
2005
Características de la
distribución normal
Es simétrica en torno a la media m
 La media (promedio), mediana y
moda son iguales.
 El área total bajo la curva y sobre el
eje X es una UNIDAD DE AREA

Características de la
distribución normal



La distribución normal es una función que
tiene sólo dos parámetros, la media
poblacional (m) y la varianza (s2).
La densidad normal alcanza un máximo
cuando la variable tiene un valor igual a m
y disminuye continua y simétricamente
en ambas direcciones en la medida que la
variable se desvía de m.
Una variable con distribución normal m y
varianza s2 se denota por z ~ N(m, s2)
donde ~ significa “se distribuye”.
Algunas propiedades

La distribución de muchas variables
biológicas es aproximadamente
normal. Toda variable cuya
expresión sea el resultado de
contribuciones aditivas de pequeño
efecto tenderán a distribuirse
normalmente.
“NORMALIDAD”
Algunas propiedades


Mediciones que no son normales pueden
volverse aproximadamente normales con
una simple transformación de escala. Ej.
raíz cuadrada, logaritmo.
El recuento de unidades formadoras de
colonias o el recuento de células
somáticas deben ser transformados a
logaritmo para ser analizados
estadísticamente.
Algunas propiedades

La distribución normal es
relativamente fácil de trabajar
matemáticamente. Muchos
resultados útiles en estadística
pueden ser derivados si la
distribución es normal. Incluso
cuando las muestras provienen de
distribuciones no normales.
Algunas propiedades

Incluso si la distribución original de
la población no es normal, la
distribución de las medias de
repetidos muestreos tenderán a ser
normales, con muestreo aleatorio y
en la medida que el tamaño de la
muestra aumenta
Algunas propiedades

Si, al observar los estimadores de una
muestra obtenida al azar desde una
población, y la MEDIA, la MEDIANA y la
MODA tienen valores parecidos, y si
observamos un histograma y vemos que
la mayor frecuencia de observaciones se
agrupa en torno a la media, con colas
hacia los extremos de la distribución,
podemos asumir que:
Algunas propiedades

LOS DATOS PROVIENEN DE UNA
POBLACIÓN CON DISTRIBUCIÓN NORMAL

Si esto sucede, podemos aplicar las
propiedades de la distribución normal a
las inferencias que hagamos a partir de
los datos de la muestra: por ejemplo,
podemos decir que por encima del
promedio obtenido en la muestra, se
debería ubicar el 50% de la población.
Algunas propiedades
Cuando la distribución normal tiene
media igual a cero y desviación
estándar igual a 1, se trata de una
distribución normal estandarizada.
 Existen tablas de área bajo la curva
y altura de la ordenada para la
distribución normal estandarizada en
todos los libros de estadística

“Deformaciones” o “desviaciones”
de la distribución normal.

CURTOSIS
g2 = 0
g2 > 0
g2< 0
Coeficiente de curtosis
n
g 2 (curtosis ) 
s= desviación estándar
(X
i 1
i
 X)
(n  1) s
4
4
“Deformaciones” o “desviaciones”
de la distribución normal.

Error estándar de la curtosis
24
EEC 
n
Curtosis
2
 Si
, entonces la distribución
EEC
no es normal.
“Deformaciones” o “desviaciones”
de la distribución normal.

COEFICIENTE DE ASIMETRIA:
g1 = 0
g1 > 0
g1 < 0
Coeficiente de asimetría:
n
g1 (asimetría ) 
(X
i 1
i
 X)
(n  1) s
3
3
“Deformaciones” o “desviaciones”
de la distribución normal.

Coeficiente de asimetría:

Error estándar del coeficiente de
asimetría:
6
EECA 
n


Coef. asimetría
2
EECA
Si
es normal.
, la distribución no
DISTRIBUCION NORMAL ACUMULATIVA
(fragmento, obtenido con la función DISTRIBUCION NORMAL
ESTANDARIZADA de Excel)
SEGUNDO DECIMAL DE Z
Z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.0040
0.0438
0.0832
0.1217
0.1591
0.1950
0.2291
0.2611
0.2910
0.3186
0.3438
0.3665
0.3869
0.4049
0.4207
0.0080
0.0478
0.0871
0.1255
0.1628
0.1985
0.2324
0.2642
0.2939
0.3212
0.3461
0.3686
0.3888
0.4066
0.4222
0.0120
0.0517
0.0910
0.1293
0.1664
0.2019
0.2357
0.2673
0.2967
0.3238
0.3485
0.3708
0.3907
0.4082
0.4236
0.0160
0.0557
0.0948
0.1331
0.1700
0.2054
0.2389
0.2704
0.2995
0.3264
0.3508
0.3729
0.3925
0.4099
0.4251
0.0199
0.0596
0.0987
0.1368
0.1736
0.2088
0.2422
0.2734
0.3023
0.3289
0.3531
0.3749
0.3944
0.4115
0.4265
0.0239
0.0636
0.1026
0.1406
0.1772
0.2123
0.2454
0.2764
0.3051
0.3315
0.3554
0.3770
0.3962
0.4131
0.4279
0.0279
0.0675
0.1064
0.1443
0.1808
0.2157
0.2486
0.2794
0.3078
0.3340
0.3577
0.3790
0.3980
0.4147
0.4292
0.0319
0.0714
0.1103
0.1480
0.1844
0.2190
0.2517
0.2823
0.3106
0.3365
0.3599
0.3810
0.3997
0.4162
0.4306
0.0359
0.0753
0.1141
0.1517
0.1879
0.2224
0.2549
0.2852
0.3133
0.3389
0.3621
0.3830
0.4015
0.4177
0.4319
A 0.68
m= 0
s= 1
68%
1s m +1s
m= 0
s= 1
A 0.95
95%
2s 1s m +1s +2s
m= 0
s= 1
A 0.99
99%
3s 2s 1s m +1s +2s +3s
ejemplo:
Cuál es la probabilidad de que una desviación normal caiga entre
-1.62 y +0.28?
A2
-1.62
0.28
A1
-3
-2 -1
0 1
2
3
Se divide el intervalo en dos partes:
1.
2.
de -1.62 a 0
de 0 a 0.28
A1= 0.4474
A2= 0.1103
Probabilidad total= 0.5577
TABLA DE DISTRIBUCION ACUMULADA
Esta tabla se utiliza con mayor frecuencia. Entrega el área bajo la curv
desde cero hasta Z.
Probabilidad de un valor
1.
2.
3.
4.
5.
6.
7.
Entre
Entre
Fuera
Menor
Menor
Mayor
Mayor
0 y Z
-Z y Z
del intervalo -Z, Z
que Z (Z positivo)
que Z (Z negativo)
que Z (Z positivo)
que Z (Z negativo)
Fórmula
A
2A
1 - 2A
0.5 + A
0.5 - A
0.5 - A
0.5 +A
Estandarización de una
distribución normal


CUALQUIER VALOR xi EN UNA
DISTRIBUCIÓN PUEDE SER
ESTANDARIZADO SOBRE LA BASE DE SU
DISTANCIA DESDE LA MEDIA, MEDIDA
EN UNIDADES DE DESVIACIÓN
ESTANDAR.
AL HACER ESTO, LA MEDIA DE LA
DISTRIBUCION SE HACE CERO Y LA
DESVIACIÓN ESTANDAR ES LA UNIDAD
DE LA ESCALA.
TABLAS DE DISTRIBUCION NORMAL
TODAS LAS TABLAS ESTANDARES DE DISTRIBUCION NORMAL
TIENEN MEDIA CERO Y DESVIACION ESTANDAR 1
Existe una medición X con media m y desviación estándar s
y se desea utilizar la curva normal.
Se debe transformar la escala de X de tal manera que la med
hace cero y la desviación estándar 1.
Este re escalamiento está dado por la relación:
Z
X m
s
X  m + sZ
“desviación estándar normal”
obtención del valor X a partir de Z
VARIABLE X: Peso de nacimiento de terneros de carne,
machos y hembras, de las razas Hereford, Angus e Híbridos








¿Cuál es el valor estandarizado
(media cero y desviación
estándar igual a 1) para un peso
de nacimiento de 50 kilos?
n= 531
Rango= 64-16= 48 kilos
Media= 39.4 kilos
Mediana= 39.5 kilos
X m
Z
Moda= 40 kilos
s
Varianza= 37.9
Desviación típica= 6.15 kilos
50  39.4 10.6
CV= 15.6%
Z

 1.72
6.15
6.15
Con los mismos datos anteriores:
¿Cuál es la probabilidad de un peso de ternero al nacimiento entre
50 y 55 kilos, ambos incluidos?
¿Cuál es la probabilidad de que un ternero pese 30 kilos o menos?
Respuestas:
Límite inferior: 50 kilos……… Z= (50 – 39.4)/6.15= 1.72
Límite superior: 55 kilos………Z= (55 – 39.4)/6.15= 2.53
Area= 0.4943-0.4573
= 0.037
Escala normalizada
Escala real
0
39.40
1.72 2.53
50 55
Area= 0.4943
Area= 0.4573
z
kilos
La pregunta en sentido
inverso:

Entre que pesos, por sobre y bajo el
promedio, se ubica el 50% de los
datos de peso de nacimiento en la
población de terneros a la cual
pertenece la muestra?
A partir de un área bajo la
curva, determinar el valor z
0.25
0.25
z
m
z
En este caso se busca en el cuerpo de la tabla un
valor de área lo más parecido a 0.25 y en los
márgenes se determina a que valor de z corresponde,
en este caso es +0.675 y -0.675
A partir del valor z, determinar el
valor en kilos o la variable
correspondiente



Entre +0.675 y -0.675 unidades
estandarizadas de la curva normal
(desviaciones estándares) se ubica el
50% de probabilidades de valores de
peso.
Si en el caso de la variable peso la
desviación estándar es de 6.15 kilos,
entonces la distancia en el eje medida en
kilos es de ±6.15 x 0.675 = ±4.15 kilos
Respuesta:
m ±4.15 kilos