Download Estadistica Basica Sesion 4

Document related concepts

Asimetría estadística wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Error estándar wikipedia , lookup

Desviación típica wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Transcript
Curso de Estadística Básica
SESION 4
MEDIA Y DESVIACIÓN ESTÁNDAR DE
DISTRIBUCIONES DE FRECUENCIA,
MEDIDAS DE POSICIÓN
MCC. Manuel Uribe Saldaña
MCC. José Gonzalo Lugo Pérez
Estadística Básica
Objetivo
Calcular la media y desviación estándar de
diagramas de frecuencia. Conocer las medidas de
posición y su interpretación.
Estadística Básica
Agenda Sesión 4
•
•
•
Revisión del examen
de la sesión 1 y 2
Media y desviación
estándar en diagramas
de frecuencia
Medidas de Posición
– Cuartil
– Percentil
– Puntaje estándar
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
• Calcular la media, varianza
y desviación estándar para
el siguiente conjunto de
datos:
3
3
2
1
1
2
3
4
3
4
2
1
1
2
3
4
3
4
2
1
2
4
2
3
4
3
2
2
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
• Del ejemplo anterior se
obtiene una distribución de
frecuencias:
x
1
2
3
4
Suma
f
5
9
8
6
28
• Para calcular la media y la
varianza de la muestra, es
necesaria la suma de los 28
valores x y la suma de los
28 valores de x al cuadrado,
así:
x=
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Σx = 1 + 1 +…+ 1 + 2 + 2 +…+ 2 + 3 + 3 +…+ 3 + 4 + 4 +…+ 4
5 sumandos
8 sumandos
9 sumandos
6 sumandos
Σx = (5)(1) + (9)(2) + (8)(3) + (6)(4)
Σx = 5 + 18 + 24 + 24 = 71
Σx2 = 12 +…+ 12 + 22 +…+ 22 + 32 +…+ 32 + 42 +…+ 42
5 sumandos
9 sumandos
8 sumandos
6 sumandos
Σx2 = (5)(1) + (9)(4) + (8)(9) + (6)(16)
Σx2 = 5 + 36 + 72 + 96 = 209
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Se utilizará la distribución de frecuencias para determinar las
sumatorias, obteniendo una tabla de extensiones:
x
1
2
3
4
Suma
f
5
9
8
6
28
Número de
datos
xf
5
18
24
24
71
Suma de x, Σxf,
usando las
frecuencias.
x2f
5
36
72
96
209
Suma de x2, Σx2f,
usando las
frecuencias.
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
•
Para encontrar la media
de una distribución de
frecuencias se tiene:
x barra =
x=
suma de x, usando frecuencias
número
x=
Σxf
Σf
Σxf
Σf
=
En la fórmula para la media se utiliza n,
71
7  2.536
28
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estandar de
distribuciones de frecuencia
• Para encontrar la varianza de
la distribución de frecuencias
se tiene:
(suma de x2, usando frecuencias) – (suma de x, usando frecuencias)2
s cuadrada =
número
número - 1
 xf 
x
f


f

 f 1
2
2
s2

2

71
209 
28  28.964  1.073
28  1
27
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
•
Para encontrar la
Desviación estándar de la
distribución de
frecuencias se tiene:
s
s2 
1.073  1.036
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Media y Desviación estándar de
distribuciones de frecuencia
Estadística Básica
Ejercicios
1. Encontrar la media, la varianza y la desviación
estándar de la muestra de 50 puntajes de examen,
usando la distribución de frecuencias agrupadas:
Numero de clases
1
2
3
4
5
6
7
Marca de clase, x
40
50
60
70
80
90
100
f
2
2
7
13
11
11
4
Media:
75.6
Varianza:
221.1
Desviación Estándar: 14.9
Estadística Básica
Ejercicios
2. Una empresa productora de láminas metálicas utiliza varios reparadores de
problemas para hacer composturas de emergencia en los hornos. Por lo común, este
personal realiza varios viajes cortos. Para efectos de estimar los gastos por viajes
del año próximo, la empresa tomó una muestra de 20 cupones de gastos de viaje
relacionados con la reparación de dichos problemas. Se obtuvo la siguiente
información:
Cantidad de dólares en cupones
$0.00 - 10.00
$10.00 - 20.00
$20.00 - 30.00
$30.00 - 40.00
$40.00 - 50.00
Total de la muestra
Número de cupones
2
8
7
2
1
20
Media:
21.00
Desviación Estándar: 9.95
Calcule la media y la desviación estándar de estas cantidades de gastos por viaje en
dólares.
Estadística Básica
Estadística descriptiva
Medidas de
tendencia
central
Medidas de
dispersión
Medidas de
posición
Tipos de
distribución
Estadística Básica
Cuartiles
Son los valores de la variable que dividen en cuartos a los datos
ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil,
Q1,es el número tal que cuando mucho el 25% de los datos es menor en
valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1. El
segundo cuartil es la media. El tercer cuartil, Q3 , es un número tal que
cuando mucho el 75% de los datos es menor en valor que Q3 y cuando
mucho el 25% de los datos es mayor que Q3
25%
Mín
25%
Q1
25%
Q2
25%
Q3
Máx
Datos clasificados en orden creciente
Estadística Básica
Percentiles
Son los valores de la variable que dividen a un conjunto de datos
ordenados en 100 subconjuntos iguales; cada conjunto de datos tiene 99
percentiles. El k-ésimo percentil, Pk, es un valor tal que cuando mucho k%
de los datos son más pequeños en valor que Pk y cuando mucho (100-k)%
de los datos es mayor.
1%
Mín
1%
P1
1%
P2
1%
1%
P3
P5
1%
P97
1%
P98
1%
P99
Máx
Datos clasificados en orden creciente
A lo más k
Mín
A lo más (100 – k)%
Pk
Máx
Estadística Básica
Percentiles
Notas:
1.
El primer cuartil y el 25avo percentil son iguales; es decir, Q1 = P25.
También, Q3 = P75.
2.
La mediana, el segundo cuartil, y el 50avo percentil son iguales.
~
x  Q2  P50
De esta forma, cuando se pida encontrar P50 o Q2, se puede aplicar el
procedimiento para encontrar la mediana.
Estadística Básica
Procedimiento para determinar el valor de
cualquier k-ésimo percentil o cuartil
Paso 1
Ordenar los datos, del más chico al
más grande
nk
100
Paso 2
Calcular
Paso 3
Se obtiene un entero A
d ( Pk )  A.5
Paso 4
Pk está a la mitad entre
el valor del dato en la
A-ésima posición y el
valor del siguiente dato.
Se obtiene un número
con una fracción
d ( Pk ) B
Pk, es el valor del dato
en la B-ésima posición
Estadística Básica
Ejemplo
• Con la muestra de 50 puntajes del examen final del
curso de estadística elemental que se observa en la
tabla, determinar el primer cuartil, Q1, el 58avo percentil,
P58, y el tercer cuartil, Q3.
60
90
77
58
72
47
77
39
78
86
82
86
90
89
50
95
58
63
44
94
88
64
68
55
92
72
95
97
85
80
67
74
70
82
91
66
72
64
83
75
68
88
70
72
76
98
74
70
77
78
Estadística Básica
Ejemplo
• Paso 1
– Ordenar los datos
Datos ordenados: puntajes del examen de estadística
39
64
72
78
89
44
66
72
80
90
47
67
74
82
90
50
68
74
82
91
55
68
75
83
92
58
70
76
85
94
58
70
77
86
95
60
70
77
86
95
63
72
77
88
97
64
72
78
88
98
Estadística Básica
Ejemplo
Paso 2
Encontrar
nk (50)( 25)

 12.5
100
100
n = 50 y k = 25, ya que Q1 = P25
Paso 3
Encontrar la profundidad de Q1; d(Q1)=13 (Debido a que 12.5
contiene una fracción, B está más próximo al siguiente entero
más grande, 13)
Paso 4
Encontrar Q1: Q1 es el 13avo valor contando a partir del
Mínimo. Q1 = 67
Estadística Básica
P58
Paso 2
Encontrar
nk (50)(58)

 29
100
100
n = 50 y k = 58, debido a P58
Paso 3
Encontrar la profundidad de P58; d(P58) = 29.5 (Como A = 29
(un entero), se suma .5 y se usa 29.5)
Paso 4
Encontrar P58: P58 es el valor que está a la mitad entre los
valores de las porciones de datos 29ava y 30ava, contando a
partir del Mínimo.
P58 = (77 + 78)/2 = 77.5
Estadística Básica
Q3
Estadística Básica
Puntaje estándar (puntaje z)
•
Posición que tiene un
valor particular de x con
respecto a la media,
medida en desviaciones
estándar. El puntaje z se
calcula con la fórmula:
xx
z
s
Estadística Básica
Ejemplo
•
Encontrar los puntajes estándar para a) 92 y b) 72 con respecto a una
muestra de puntajes de un examen que tiene como media de 74.9 y una
desviación estándar de 14.19
x  x 92  74.9

 1.20
s
14.19
x  x 72  74.9
x  72, x  74.9; s  14.19. Así , z 

 0.20
s
14.19
x  92, x  74.9; s  14.19. Así , z 
Lo anterior significa que el puntaje 92 está a 1.2 desviaciones estándar
por arriba de la media, mientras que el puntaje 72 está a 0.2
desviaciones estándar por debajo de la media.
Estadística Básica
Notas
1. Normalmente, el valor calculado de z se redondea
al centésimo más próximo
2. El intervalo de variación aproximado del valor de
los puntajes z suele ir de -3.00 a +3.00
Estadística Básica
Ejercicios
1. Una muestra tiene una media de 50 y una
desviación estándar de 4. Encuentre el puntaje z
para cada valor de x.
•
X=54
•
X=50
•
X=59
•
X=45
Estadística Básica
Ejercicios
2. Un examen que se administró a nivel nacional tuvo
una media de 500 y una desviación estándar de
100. Si el puntaje z normal de un estudiante en
este examen fue de 1.8, ¿cuál es su calificación en
el examen?
Estadística Básica
Ejercicios
3. ¿Qué valor x tiene el mayor valor con respecto al
conjunto de datos del que proviene?
•
X=85, donde la media = 72 y la desviación
estándar = 8
•
X=93, donde la media = 87 y la desviación
estándar = 5
Estadística Básica
Ejercicios
4. Considere el siguiente conjunto de tiempos de
ignición que fueron registrados para una tela
sintética
30,1
31,5
34,0
37,5
30,1
31,6
34,5
37,5
30,2
31,6
34,5
37,6
30,5
32,0
35,0
38,0
31,0
32,4
35,0
39,5
31,1
32,5
35,6
31,2
33,0
36,5
31,3
33,0
36,9
31,4
33,5
37,0
Encuentre: a) La mediana, b) El rango medio, c) El
cuartil medio, c) Q2
Estadística Básica
Ejercicios
5. ¿Qué valor x tiene la menor posición relativa con
respecto al conjunto de datos del que proviene?
•
X=28, donde la media = 25.7 y la desviación
estándar = 1.8
•
X=39.2, donde la media = 34.1 y la desviación
estándar = 4.3
Estadística Básica
Teorema de Chebyshev
La proporción de cualquier distribución que esté a
menos de k desviaciones estándar de la media es
por lo menos
1
1 2
k
Donde k es cualquier número positivo mayor que 1.
Este teorema es válido para todas las distribuciones
de datos.
Estadística Básica
Teorema de Chebyshev
Este teorema establece que a menos de dos
desviaciones estándar de la media (k = 2) siempre
se encontrará por lo menos el 75% (o más) de los
datos.
Por lo menos el 75%
s
X-2s
x
X+2s
Estadística Básica