Download 385080965.TP01-Estadística Descriptiva

Document related concepts

Parámetro estadístico wikipedia , lookup

Mediana (estadística) wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Cuantil wikipedia , lookup

Varianza wikipedia , lookup

Transcript
ESTADÍSTICA I
Práctico: Unidad 1 – Estadística Descriptiva
Mariano Lanza y Carlos Maggi
1. En los siguientes ejemplos, determinar:
a) Cuál es la/s variable/s en estudio y de qué tipo son cada una de ellas (discreta,
continua, cualitativa, cuantitativa).
b) Cuál es la muestra y cuál es la población de la que proviene.
1.1 En el boletín del Instituto de Oceanografía se publicó un trabajo sobre el
crecimiento de la dorada en el Mar Menor. El mismo estaba basado en la
observación de 135 ejemplares de dicha especie.
1.2 En el vivero se midió la altura de ocho abedules a las tres semanas de darle un
determinado fertilizante.
1.3 Se capturaron 30 truchas hembras y se las pesó, luego se determinó el número de
huevos que contenían.
1.4 Se realizo una muestra de 30 cerdos tomados de diferentes establecimientos
elegidos al azar para determinar la presencia de Triquinosis.
1.5 Se telefoneó a 10 localidades de la comarca andina para informarse sobre el
número de enfermos de Hepatitis.
1.6 Se analizaron los saldos de 200 cuentas corrientes de empresas en el Banco R.
1.7 Se realizó un estudio del nivel de ingresos de la población de Bariloche en base
a una muestra aleatoria de 5000 residentes.
2. En cada uno de los siguientes estudios decir cuál es la variable en estudio, clasificarla y
dar una idea posible de tabulación de la información obtenida
2.1 Se comparó la ganancia de peso de cuatro grupos de cerdos sometidos a tres
dietas diferentes y a una dieta normal (control).
2.2 Determinación del número de infectados por muestra. Cada muestra tiene 5
individuos y en total se tienen 100 muestras.
2.3 Relación entre la cantidad de inscriptos y egresados por año en los últimos diez
años en una determinada Universidad Nacional.
2.4 Determinación de la fecundidad diaria de dos muestras de 25 hembras de
Desophila Melanogaster cada una, estando dada la fecundidad por el número de
huevos depositados por hembra y por día durante los primeros 14 días de vida.
Cada una de las muestras pertenece a las cepas SS y NS respectivamente.
2.5 Relación entre el ancho y el largo del caparazón de una muestra de tortugas.
3. Una empresa dedicada a la actividad turística está planeando realizar un proyecto de
inversión en San Carlos de Bariloche y solicita su asesoramiento para obtener
información sobre la situación hotelera de dicho municipio en el año 2009 (Tabla eoh2009_Bariloche.xls).
Para ello desea saber:
a) El valor medio mensual y la varianza de establecimientos hoteleros de 1 y 2
estrellas.
b) El valor medio mensual y la varianza de establecimientos “para-hoteleros”.
-1-
Para las categorías anteriores (“establecimientos hoteleros de 1 y 2 estrellas” y “parahoteleros”):
c) Determinar el valor medio mensual de plazas disponibles por establecimiento.
d) Determinar el valor medio mensual de plazas ocupadas por establecimiento.
e) A su vez, la empresa interesada desea saber los siguientes datos:
Porcentaje de Ocupación
de las Habitaciones o
Unidades en
Establecimientos
Hoteleros de 1 y 2
Estrellas
[0 – 25)
[25 – 50)
[50 – 75)
[75 -100)
Cantidad de Meses
(frecuencia absoluta)
Frecuencia Relativa
En base a la tabla anterior:
f) Realizar el histograma y el polígono de frecuencias.
g) Calcular la media, mediana, modo y desvío.
h) Determinar el intervalo de las categorías
i) Dado que es un/a excelente conocedor/a de la materia, particularmente de “estadística
descriptiva” ¿cómo sugeriría agrupar los datos de la tabla anterior? Represente dicha
tabla teniendo en cuenta que deseamos presentar los datos en 3 clases.
En base a la tabla del acápite (i):
j) Realizar el histograma, el polígono de frecuencias y la ojiva.
k) Calcular la media, mediana, modo y desvío.
l) Determinar la amplitud de variación de la distribución
m) Definir el tipo de asimetría que presenta la distribución.
n) Definir el tipo de Curtosis que presenta la distribución.
o) Calcular el valor del percentil 60.
p) Calcular el valor del decil 8.
q) Calcular el valor del 1º cuartil.
4.
Una consultoría ha realizado una pequeña encuesta acerca del tipo de conexión a
Internet que posee un grupo de 100 personas, cuyas respuestas han sido las siguientes:
Adsl
42
Inalámbrica
30
Telefónica
16
Cable modem
12
a) Realice el histograma de frecuencias absolutas simples y relativas.
b) ¿Qué proporción de usuarios utiliza Adsl o Inalámbrica?
5. En una empresa de Servicios Informáticos se obtuvieron los siguientes valores, que
representan las edades de 10 empleados de la misma:
29
56
34
27
32
26
31
32
28
58
a) Calcular las medidas de centralización (media aritmética, mediana y moda)
b) ¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?
c) Calcular el desvío típico (o estándar) y la varianza
-2-
d) Interpretar el significado del desvío en el problema.
6. Los datos siguientes corresponden al número de ordenadores portátiles vendidos
trimestralmente por distintas tiendas informáticas de una franquicia:
12
38
18
39
35
39
35
39
36
39
36
40
37
40
37
41
38
41
38
42
38
42
38
47
a) Realice una tabla simple de frecuencias
b) Determine el numero medio, modal y mediano del numero de portátiles vendidos
trimestralmente por una tienda de esta franquicia. Interprete cada una.
c) La franquicia quiere premiar al 25% de las tiendas que mas ventas tengan en
portátiles. ¿Cuál será el número de portátiles a vender por una tienda para
beneficiarse de este premio?
d) Calcule el coeficiente de variación e interprete el resultado.
7. Se ha controlado la capacidad en Gb. de 50 PCs, obteniéndose los siguientes resultados:
Capacidad (Gb)
De 1 a 20
De 21 a 40
De 41 a 60
De 61 a 80
De 81 a 100
Número
6
10
20
9
5
a) Hallar la media aritmética.
NOTA: Al cargar la planilla, emplear una columna para los límites inferiores y otra
para los superiores, a fin de poder usarlos para los cálculos necesarios.
b) Hallar el desvío y la varianza.
c) Construir el histograma de frecuencias.
d) ¿Qué porcentaje de PC’s tienen una capacidad inferior a 61 Gb?
e) ¿Qué porcentaje de PC’s tienen una capacidad superior a 40 Gb?
f) ¿Qué porcentaje de PC’s tienen una capacidad entre 41 y 80 Gb?
8. Las siguientes medidas corresponden a los tiempos de respuesta en un sistema
Cliente/Servidor para 50 peticiones de datos:
1,56
1,61
1,53
1,59
1,55
1,59
1,59
1,49
1,58
1,59
Tiempo (segundos)
1,63 1,62 1,47 1,57
1,51 1,62 1,50 1,62
1,57 1,54 1,68 1,52
1,57 1,47 1,65 1,53
1,53 1,56 1,58 1,52
1,60
1,59
1,62
1,59
1,63
1,54
1,62
1,59
1,56
1,56
1,56
1,54
1,49
1,54
1,62
1,65
1,62
1,53
1,64
1,53
a) Confeccionar la tabla de frecuencias absolutas, relativas, acumuladas y relativas
acumuladas.
b) Calcular la media, mediana y moda.
c) Histograma de frecuencias.
d) Histograma de frecuencias relativas.
e) Ojiva creciente.
-3-
f) Ojiva decreciente.
g) Ojiva creciente porcentual.
h) Ojiva decreciente porcentual.
9. La siguiente información corresponde a la cantidad de infracciones de tránsito diarias
durante 30 días en S. C. de Bariloche.
7, 5, 8, 6, 7, 4, 3, 6, 7, 9, 10, 6, 7, 5, 9, 4, 7, 5, 8, 9, 7, 6, 8, 5, 8, 7, 7, 8, 8, 6
a) Indique unidad estadística. Defina la variable en estudio, tipo y campo de
variación.
b) Construya la tabla de frecuencia.
c) Grafique las distribuciones halladas.
d) Calcule analíticamente la media, modo y mediana. Interprete.
e) Calcule e interprete el intervalo x  S (x) ; x  S (x) . Donde s(x) es el desvío
típico.
f) Calcule e interprete el Q1
10. La fabricación de arandelas de distinto diámetro presenta la siguiente distribución
diaria:
Diámetro en mm
[5;10)
[10;15)
[15; 20)
[20;25)
[25;30)
[30;35)
[35;40)
Cantidad de Arandelas
500
1200
1500
2000
1800
600
400
a) Calcular la media aritmética.
b) Calcular la mediana y el modo.
c) Calcular la varianza y desviación típica.
11. Los siguientes datos corresponden al salario mensual (en $) de un grupo de 50 obreros:
153
123
131
132
141
134
131
142
134
148
146
148
135
152
128
138
122
146
137
151
132
138
137
142
138
137
120
126
117
136
143
144
138
137
138
125
139
136
144
140
145
138
141
128
133
145
124
143
137
132
Calcular las medidas de centralización.
¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?
Calcular el desvío estándar y la varianza.
Calcule Q1 y Q3. Interprete el intervalo [Q1 ; Q3]
Calcule el salario promedio mensual de los trabajadores suponiendo un aumento
de $30 en el sueldo de cada uno de ellos.
f) Ídem al punto anterior suponiendo un aumento del 25% sobre los sueldos
originales.
a)
b)
c)
d)
e)
-4-
Si otro grupo de obreros tiene un sueldo mensual promedio de 120$ y un desvío
típico de 9$. Cuál de los dos grupos es más homogéneo. ¿Por qué?
h) Realice el cuadro de frecuencias, pero agrupando los datos según los criterios
vistos.
i) Para los datos agrupados, calcular la media, mediana y moda.
j) Grafique el Histograma para las frecuencias simples de los datos agrupados.
g)
12. Un odontólogo atendió la siguiente cantidad de pacientes diarios durante los últimos 10
días:
18 11 15 14
9 20 17 14 12
16
a) Definir unidad estadística y la variable en estudio.
b) Calcular e interpretar: el modo, la mediana y la media.
c) Calcular: la variancia y el desvío estándar.
13. Los siguientes datos representan el número de bovinos que nacieron vivos en 30
estancias de Chubut:
20 21 22 23 21 24 23 24 22 22 22 23 21 23 22
23 23 22 24 24 25 25 23 21 25 20 20 24 22 23
a)
b)
c)
d)
e)
Indique unidad estadística. Defina la variable en estudio, tipo y campo de variación.
Construir la tabla de frecuencias. Representar.
Calcular e interpretar: el modo, la mediana, la media.
Calcular: la variancia y el desvío estándar.
Determine el tipo de asimetría de la distribución.
14. Una empresa de taxis registró los siguientes kilometrajes recorridos por sus 8
automóviles para cubrir viajes, en la sucursal de la zona A, durante el último mes:
5516
7820 3010 8294
5232
5780 6548 4500
El titular de la empresa opina que el rendimiento de dicha sucursal es algo irregular y
que podría ser optimizado lanzando una campaña publicitaria en dicha zona. Para
comparar se basa en los registros de la sucursal B, que el mes pasado arrojó un
promedio de 7600 km y un desvío estándar de 1200 km.
a) Indique cuál de las dos sucursales tiene kilometraje más homogéneos y si la opinión
del titular es aceptable.
15. En un estudio realizado en una colonia de vacaciones se registró el ingreso diario de
turistas en un período. Los datos fueron ordenados en la siguiente tabla:
N0 turistas
N0 de días
a)
b)
c)
d)
50-55
4
55-60
6
60-65
18
65-70
13
70-75
8
75-80
6
80-85
5
En cuántos días se registró un ingreso de cómo máximo 75 turistas?
En qué porcentaje de días se registró un ingreso superior a 65 turistas?
Calcule el promedio y el desvío estándar.
Calcule la mediana. Interprete.
-5-
e)
f)
g)
h)
Calcule el intervalo [Q1; Q3]. Interprete.
Calcule el modo. Interprete.
Cuál es el valor de la variable superado por el 20% de las observaciones.
Determine el tipo de asimetría de la distribución.
16. - De una muestra hecha a 50 familias, se sabe que 5 de ellas tiene un solo hijo, que 8 de
ellas tiene a lo sumo un hijo, que 8 de ellas tiene por lo menos 5 hijos, que ninguna de
ellas tiene m ás de 6 hijos, que el 12% de ellas tiene 5 hijos, que 33 familias tiene menos
de 4 hijos, que el 38% tiene no más de 2hijos, Construya la tabla de frecuencia.
17. Representar mediante un diagrama de caja la siguiente información que corresponde a
pulsaciones cardíacas de 42 personas participantes de un programa de entrenamiento:
52
69
64
64
66
72
72
56
60
64
64
66
72
72
60
60
64
66
66
72
72
60
60
64
66
72
72
78
92
76
78
80
88
78
80
78
76
78
84
78
84
80
18. Analice, en los siguientes casos, la variación conjunta de las componentes de las
variables bidimensionales a través del coeficiente “covarianza” y correlación.
Espesor de la cáscara de naranjas y contenido de jugo de las mismas (en cm3)
Orden observ.(i)
Espesor (X en mm)
Jugo ( Y en cm3)
a)
b)
c)
d)
1
7
2
2
6
3
3
5
4
4
6
5
5
5
5
6
6
5
7
4
6
8
3
6
9
2
7
10
2
9
Construya la tabla de desvíos y productos de desvíos
Calcule la covarianza por definición. Interprete.
Grafique los datos en un diagrama de dispersión.
Confeccione la tabla de contingencia para los datos
19. La siguiente tabla corresponde al salario de los empleados de una agencia de viajes y la
cantidad de años que lleva en servicio.
a) Defina la unidad estadística, la variable en studio y el tipo y campo de variación.
b) Confecciner la tabala de contingencia
c) Calcular la covarianza.
Salario \ Antigüedad
[0 – 5)
[5 – 10)
[10 – 15)
[15 – 20) [20 o más
[300 – 400)
10
9
3
2
1
[400 – 500)
6
12
13
6
2
[500 – 600)
1
5
12
5
3
[600 o más
2
3
2
2
1
-6-
20. Los siguientes diagramas de caja corresponden la resistencia a la compresión de cuatro
diferentes técnicas de mezclado en la elaboración de hormigón.
a) Analice el diagrama de cada técnica y describa cada una de ellas. Tenga en cuenta:
posición, dispersión y simetría. Utilice los diagramas para comparar las técnicas
entre sí
b) Indique las similitudes y diferencias que observa en las diferentes técnicas de
mezclado. Los siguientes diagramas de caja corresponden el efecto de las burbujas
de aire sobre la resistencia del asfalto. Las burbujas se controlan en tres niveles:
bajo, medio y alto. a) Ídem inciso a) del ejercicio anterior. b) Ídem inciso b) del
ejercicio anterior.
-7-
EJERCICIOS OPCIONALES
1.
Se desea saber sobre la intensidad con que trabaja una estación de comunicación.
Para ello se realizó una muestra aleatoria, donde se obtuvieron los siguientes datos
expresados como bytes/minuto :
56
47
51
44
58
40
67
49
53
101
31
27
74
57
52
63
27
72
21
43
En función de ello se dese saber:
a) El valor medio de bytes/minuto. b) La mediana
c) El rango de variabilidad d) La varianza y coeficiente de variación
2.
De los datos del ejercicio anterior:
a) confeccione la siguiente tabla de frecuencias
Frecuencia
Absoluta
fi
Intervalos
[
[
[
[
[
[
20
35
50
65
80
95
- 34
- 49
- 64
- 79
- 94
- 109
Frecuencia
Absoluta
acumulada
fac
Frecuencia
relativa
Acumulada
fac en %
Frecuencia
Relativa
fi en %
]
]
]
]
]
]
b) Realice el Histograma y el polígono de frecuencias para los datos agrupados.
c) Completar el siguiente cuadro:
Valor medio del
intervalo
(xmi)
Intervalos
[
[
[
[
[
[
d)
e)
f)
g)
h)
i)
j)
k)
l)
20
35
50
65
80
95
- 34
- 49
- 64
- 79
- 94
- 109
Frecuencia
Absoluta
fi
(xmi)* fi
Frecuencia
relativa
Acumulada
fac en %
]
]
]
]
]
]
Obtener la media muestral para los daos agrupados:
Calcular la varianza muestral para datos agrupados
Determinar el intervalo que contiene la mediana:
Obtener la Mediana para los datos agrupados:
Determinar el intervalo modal (aquel que contiene el modo):
Obtener el modo:
¿Cuál es el valor del tercer cuartil?
¿Cuál es el valor del séptimo decil?
¿Cuál es el valor del percentil 60?
-8-
3.
Una empresa desea analizar el amperaje máximo que soporta un tipo de resistencia
que es suministrada por un proveedor. Para ello se sometieron a prueba diez
unidades cuyos resultados arrojaron lo siguiente:
1,87 A
1,71 A
1,52 A
1,68 A
2A
1,78 A
1,55 A
1,56 A
1,85 A
1,6 A
Obtener:
a) Calcular la media muestral
b) Calcular la mediana
c) Obtener la varianza
d) Calcular el coeficiente de variación.
4.
De los datos del ejercicio anterior,
a) completar el siguiente cuadro:
Frecuencia
Absoluta
fi
Intervalos
[
[
[
[
[
[
1,5A
1,6A
1,7A
1,8A
1,9A
2A
-
1,6A
1,7A
1,8A
1,9A
2A
2,1A
Frecuencia
Absoluta
acumulada
fac
Frecuencia
Relativa
fi en %
Frecuencia
Acumulada
Relativa
fac en %
)
)
)
)
)
)
Para los datos agrupados, obtener:
b) La media muestral:
c) La varianza muestral:
d) Determinar el intervalo que contiene la mediana:
e) Obtener la Mediana.
5.
Se realizó un examen parcial a 44 alumnos cuyos resultados se exponen en el
siguiente cuadro de frecuencias.
a) Rellenar las columnas vacías
b) Calcular la media, mediana y modo
Nota
(X)
1
2
3
4
5
6
7
8
9
Cantidad
de
alumnos
(fi)
2
5
7
14
6
5
2
0
2
xi * f i
( xi  x) 2 * f i
-9-
10
Suma
1
Donde: x = Nota de Examen;
fi = frecuencia absoluta
x = media poblacional
c)
d)
e)
f)
g)
6.
Calcular la varianza, el desvío y el coeficiente de variación.
Calcular la asimetría mediante el coeficiente Pearson y tipificar la misma
¿Cuál es el valor del segundo cuartil?
¿Cuál es el valor del sexto decil?
¿Cuál es el valor del percentil 75?
Se desea comparar el impacto en la emisión de dióxido de azufre (SO2) entre dos
procesos productivos. Para ello se realizaron muestras de aire en cada proceso,
obteniéndose los siguientes datos (en ppm):
Proceso A Proceso B
12,88
13,87
10,99
11,72
14,75
12,67
8,23
10,67
10,57
6,18
10,11
3,22
13,15
5,82
12,91
24,74
11,34
6,24
15,97
18,33
Los resúmenes estadísticos en ambos proceso son los siguientes:
Proceso A
Proceso B
Media
12,09 Media
11,35
Error típico
0,73 Error típico
2,07
Mediana
12,11 Mediana
11,20
Desviación estándar
2,30 Desviación estándar
6,55
Varianza de la muestra
5,28 Varianza de la muestra
42,92
Curtosis
-0,23 Curtosis
0,55
Coeficiente de asimetría
0,10 Coeficiente de asimetría
0,88
Rango
7,75 Rango
21,52
Mínimo
8,23 Mínimo
3,22
Máximo
15,97 Máximo
24,74
Suma
120,90 Suma
113,47
Cuenta
10,00 Cuenta
10,00
Cuartil 1
10,67 Cuartil 1
6,20
Cuartil 3
13,09 Cuartil 3
13,57
En base a la información disponible realizar los diagrama de caja de cada proceso.
- 10 -
7.
Una empresa de colectivos urbanos registró la cantidad de pasajeros transportados
durante 50 viajes; con el siguiente resultado:
55
54
52
54
53
a)
b)
c)
d)
e)
f)
g)
54
52
55
54
55
55
55
53
54
53
55
57
58
56
53
54
55
56
55
54
53
56
59
54
56
55
56
55
55
57
52
56
55
54
53
53
55
53
53
54
53
56
55
54
55
Calcular las medidas de centralización (media, mediana y moda).
¿Cuál de las tres medidas es la menos representativa de los datos? ¿Por qué?
Calcular el desvío estándar y la varianza.
Interpretar el significado del desvío en el problema.
Calcular las frecuencias simples y relativas
Calcular las frecuencias acumuladas simples y relativas
Realizar el histograma y polígono de frecuencias para las frecuencias relativas.
8.
Un avión realiza un viaje entre dos ciudades en un tiempo promedio de 3 hs con un
desvío estándar de 0.5 hs. Un tren realiza el mismo trayecto con un promedio de 24
hs. con un desvío estándar de 1.2 hs. ¿Cuál de los dos medios de transporte es más
puntual?.
9.
La tabla siguiente muestra el gasto semanal en fotocopias (en centavos) de 70
secundarios del mismo colegio.
15
115
245
280
300
210
215
455
500
520
350 525 50 210 360 550 100 215 370 550 110 215 380 575
400 600 115 220 410 600 115 220 410 650 120 225 430 700 125
700 140 250 475 730 140 250 480 760 150 275 500 800 150
900 165 280 500 1000 175 285 510 1000 185 300 510 1190 200
200 325 520
a) Calcular media, desvío estándar, cuartiles y el rango intercuartílico.
b) Construir un diagrama de cajas.
c) Hacer un histograma de los datos.
10.
Una empresa fracciona azúcar en bolsas y sachets. Las bolsas tienen un peso
promedio de 50 Kg. con un desvío estándar de 0.5 kg.; y los sachets tiene un peso
promedio de 5 gs. con un desvío de 0.9 gs. Cuál de los dos procesos es más variable?.
11.
Los datos de una muestra de sueldos anuales de profesores y médicos de cierta ciudad
dan los siguientes resultados: para los profesores un promedio de 1600$ y un desvío
estándar de 200$; y para los médicos un promedio de 2300$ y un desvío estándar de
400$. Cuales son los sueldos que tienen más variabilidad.?
12.
Si la media y la desviación estándar calculadas de una muestra grande cuya
distribución es aproximadamente simétrica son 10 y 3 respectivamente; use la regla
empírica para responder lo siguiente:
a) ¿Qué porcentaje de las mediciones se encuentran entre 7 y 10 inclusive?
b) ¿Qué porcentaje de las mediciones son mayores que 16?
c) ¿Y menores que cuatro?
- 11 -