Download GUIA ESPECIAL PSU ESTADISTICAS

Document related concepts
no text concepts found
Transcript
GUIA ESPECIAL PSU ESTADISTICAS
NOMBRE______________________________________________________________________
1. El rango en el conjunto de datos {3, 7, 8, 11, 1, 10, 15, 20, 21, 22, 24, 23} es
A) 12 B) 20 C) 21 D) 22 E) 23
2. ¿Cuál(es) de las siguientes proposiciones es (son) SIEMPRE verdadera(s)?
I) La desviación estándar es un número real no negativo.
II) La diferencia entre un dato y el promedio de la muestra puede ser positiva o negativa.
III) El rango es una medida de dispersión que puede ser negativa.
A) Solo I B) Solo I y II C) Solo II y III D) I, II y III
E) Ninguna de ellas
3. Con respecto a la tabla de frecuencias adjunta, ¿cuál(es) de la siguientes proposiciones es (son)
verdadera(s)?
I) El promedio es 6.
II) El total de datos es 5.
III) La desviación estándar es 6 .
A) Solo I
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III
4. En una familia las edades de sus hijos son 3, 4, 7, 9 y 12 años. ¿Cuál(es) de las siguientes
afirmaciones es (son) verdadera(s)?
I) Si todos aumentaran un año, entonces la media sería 5 unidades mayor.
II) La muestra es amodal.
III) La desviación estándar es de 10, 8 años.
A) Solo II B) Solo III C) Solo I y II
D) Solo I y III
E) Solo II y III.
5. Se tiene un conjunto de 4 números enteros cuya desviación estándar es p. Si a cada valor
se agregan 3 unidades. Entonces, la nueva desviación estándar es
A) p + 3
B) 4p
C) p
D) p + 12
E) 12p.
6. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?
I) La varianza puede ser igual a la desviación estándar.
II) Si sumamos a todos los valores de la variable una constante, la varianza no cambia.
III) La varianza es la raíz cuadrada de la desviación estándar.
A) Solo I
B) Solo II
C) Solo III
D) Solo I y II
E) I, II y III
1
7. Al analizar los puntajes de los 4 controles realizados por Juan y Pedro, se obtuvieron los
siguientes resultados:
Juan Pedro
Promedio 613
613
Desviación 54,47 168,74
estándar
De acuerdo con esta información, ¿cuál(es) de las siguientes afirmaciones es (son) siempre
verdadera(s)?
I) Juan tiene puntajes más cercanos a su promedio.
II) Ambos han obtenido los mismos puntajes en los controles.
III) Existe un error en el cálculo de las desviaciones estándar de Pedro o de Juan, porque
ambos tienen el mismo promedio.
A) Solo I
B) Solo I y II C) Solo I y III D) Solo II y III
E) I, II y III
8. Se tienen cuatro números x, y, z, w cuya varianza es , entonces la varianza de kx, ky, kz, kw,
con k un número natural, es
A) 4k 
B) k4
C) k2
D) k 
E) 4(k + )
9. Sea una desviación estándar , tal que 0 <  < 1, ¿cuál(es) de las siguientes afirmaciones son
siempre verdadera(s)?
I) La varianza es mayor que la desviación estándar.
II) La media aritmética esta entre cero y uno.
III) La mediana esta entre cero y uno.
A) Solo I
B) Solo II
C) Solo II y III
D) I, II y III
E) Ninguna de ellas
10. De acuerdo a la tabla adjunta, ¿cuál(es) de las siguientes proposiciones es (son)
verdadera(s)?
xi
I) A + B = 5
II) La desviación estándar es 2
III) La varianza es 2.
A) Solo I
B) Solo II
C) Solo II y III
D) I, II y III
E) Ninguna de ellas
4
5
6
7
8
(xi – x )2
B
1
0
A
4
11. En una muestra de 10 datos se obtiene una desviación estándar igual a 1,5. Si a cada
elemento de la muestra se agregan 10 unidades, entonces, la nueva desviación estándar
y varianza son, respectivamente
A) 101,5 y 102,25
D) 1,5 y 102,25
B) 101,5 y 12,25
E) 1,5 y 2,25
C) 11,5 y 12,25
2
12. Se lanza dos veces un dado y se define la variable aleatoria X, como el valor absoluto de
la diferencia de los puntos. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?
I) X es una variable aleatoria discreta.
II) El recorrido de la variable tiene 6 elementos.
III) El conjunto de valores posibles de variable aleatoria X son {0, 1, 2, 3, 4, 5}.
A) Solo I B) Solo III
C) Solo I y III
D) Solo II y III
E) I, II y III
13. Una bolsa contiene 4 cubos azules y 3 verdes, el experimento consiste en sacar dos cubos uno
tras otro sin reposición. Si se define la variable aleatoria X: número de cubos azules obtenidos,
¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?
I) Los valores de la variable aleatoria son {0, 1, 2}
II) El máximo de cubos azules que se pueden obtener en el experimento es cuatro.
III) P(1) = 4/ 7
A) Solo II
B) Solo I y II
C) Solo II y III
D) Solo I y III
E) I , II y III
14. Una bolsa contiene 3 pañuelos de seda en buen estado y 2 pañuelos con algunas fallas.
Se extraen dos pañuelos sin devolución. Se define la variable aleatoria X de la siguiente forma
1, si son dos con fallas

x   0, si uno es bueno y el otro fallado
 1 si son dos en buen estado

¿Cuál de las alternativas corresponde a la función de probabilidad de la variable aleatoria?
15. En una urna hay 4 fichas marcadas con el número 2; 4 fichas con el 0 y 4 fichas con el -2.
El experimento consiste en sacar dos fichas sin reposición, y se define la variable aleatoria
X como el producto de los números que tienen las fichas que se sacan.
¿Cuál(es) de las siguientes proposiciones es (son) verdadera(s)?
I) Los posibles valores de variable aleatoria X son {4, 0, -4}.
II) P(x = -4) > P(x = 4)
III) P(x = 0) = 8/ 33
A) Solo I
D) Solo I y III
B) Solo II
E) I , II y III
C) Solo I y II
3
16. La tabla adjunta, muestra la función de probabilidades de una variable aleatoria X
Entonces, ¿cuál(es) de las siguientes proposiciones es (son) verdadera(s)?
I) P(20  x < 40) = 0,85
II) P(x  5) = 0
III) P(x ≥ 30) = 1 – P(x  30)
A) Solo II
B) Solo III
C) Solo I y II
D) Solo I y III
E) Solo II y III
17) ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?
I) La varianza puede ser igual a la desviación estándar.
II) Si sumamos a todos los valores de la variable una constante, la varianza no cambia.
III) La varianza es la raíz cuadrada de la desviación estándar.
A) Solo I
B) Solo II
C) Solo III
D) Solo I y II
E) I, II y III
18. La tabla adjunta muestra la función de probabilidad de la variable aleatoria X
¿Cuál(es) de las siguientes proposiciones es (son) verdadera(s)?
I) El valor de m = 0,26.
II) P(x ≥ 1) = 0,74
III) P(x ≥ 0) = 1 – P(x = -1)
A) Solo I
B) Solo II
C) Solo III
D) Solo I y II
E) I, II y III
19. Si la función de distribución de una variable aleatoria X está dada en la tabla adjunta,
entonces, el valor de P(X = 3) es
A) 0,30
B) 0,45
C) 0,50
D) 0,20
E) 1,00
4
20. La tabla adjunta muestra la función de probabilidad de una variable aleatoria W:
W
[1, 2[
[2, 3[
[3, 4[
[4, 5[
P(W=wi 0,1
0,3
0,2
0,4
¿Cuál es el gráfico de la función de distribución de probabilidad de la variable aleatoria W?
21. Se define la función de distribución de la variable aleatoria X como: f(x) = 1
entonces P(2 < x  4) es
A) 3/ 8
B) 1/ 3
C) 1/ 4
D) 1/ 2
1
donde x ≥ 1,
x
E) 1/ 12
DISTRIBUCIÓN NORMAL
Para variables aleatorias continuas X, la función de
probabilidad es denominada Función de
densidad de probabilidad, es una función continua y la
probabilidad de que la variable esté
comprendida en el intervalo [a, b] está dada por el área bajo
la curva de la función entre los puntos a y b.
P(a < x < b)
La distribución más importante dentro de las distribuciones
continuas es la Distribución Normal.
Es un modelo matemático, que recibe su nombre debido a que en cierto momento se pensó
que la mayoría de los fenómenos estaban distribuidos de dicha manera. Esta distribución
permite representar fenómenos estadísticos de manera probabilística.
El gráfico de la función de densidad de una variable
aleatoria con distribución normal es similar al
mostrado en la figura, es decir tiene una forma
5
conocida como Campana de Gauss, y es simétrico
con respecto a la media, . Esta distribución queda
definida por dos parámetros: la media () y la
desviación estándar (), y se denota X ~ N( ; ).
CARACTERÍSTICAS
1. El área bajo la curva es igual a la unidad
2. Es simétrica con respecto a x =  , y deja un área igual a 0,5 a la izquierda y otra de 0,5 a la
derecha, es decir, hay una probabilidad del 50% de observar un dato mayor a la media y un
50% de observar un dato menor a la media.
3. Es asintótica al eje de las abscisas, es decir, la curva se acerca lo más posible al eje de las
X sin llegar a tocarlo.
4. La media, moda y mediana coinciden.
5. La probabilidad equivale al área encerrada bajo la curva.
Además, se sabe que si una población tiene media  y desviación típica σ, se cumple lo siguiente:
a. El 68,3% de los individuos
se encuentran en el intervalo
[μ –σ, μ + σ]
b. El 95,5% de los individuos
se encuentran en el intervalo
[μ–2σ, μ+2σ]
c. El 99,7% de los individuos
se encuentran en el intervalo
[μ–3σ, μ + 3σ]
La
distribución normal describe la distribución de datos, que en general se relacionan con
mediciones relacionadas con variables, tales como, el tamaño de las especies, rendimiento
intelectual, variables sociales, etc.
Se puede demostrar que si x es una variable que se distribuye N (μ, σ)
Utilizando la variable z 
x 
, distribuirá N(0, 1).

A este procedimiento se le conoce como Tipificación o Estandarización
La ventaja de la variable Z es que existen valores tabulados para ella, de modo que se pueden
hacer cálculos de probabilidades y tamaños de grupos de población con solo usar correctamente
la tabla, y luego hacer los cálculos correspondientes.
Tabla que esta como anexo al final de este documento
22. La longitud, en cm, de los palillos que fabrica una empresa, tiene una distribución
N(10 ; 0,3). ¿Cuál es la probabilidad de que un palillo mida menos de 10 cm?
A) 1
B) 0,7
C) 0,5
D) 0,4
E) 0,3
6
23. En una distribución normal estándar si P(X  a) = m; entonces P(X > a) =
A) -m
B) m
C) m – 1
D) 1 – m
E) no se puede determinar.
24. Si X ~ N(0, 1) , entonces ¿cuál(es) de las siguientes afirmaciones es (son) verdaderas?
I) La probabilidad P(X < 0) es 50%.
II) P(X > 2,1) = 1 – P(X < 2,1).
III) P(X = 0,5) = 0.
A) Solo I
C) Solo I y II
E) I, II y III
B) Solo II
D) Solo I y III
25. En una distribución normal N(90, 15), ¿cuál(es) de las siguientes proposiciones es (son)
verdadera(s)?
I) P(90 < x < 105) = 0,3413
II) P(60 < x < 90 ) = 0,4772
III) P(105 < x < 120) = 0,1359
A) Solo I
B) Solo I y II
C) Solo II y III
D) I , II y III
E) Ninguna de ellas
26. En una distribución normal estándar X ~ N(0, 1), ¿Cuál de las alternativas NO es la correcta?
A) P( x  2) = 0,9773
B) P( x  -2) = 0,025
C) P( x ≥ 2) = 0,025
D) P( x ≥ -2) = 0,9773
E) P(-2  x  2) = 0,0456
27. El tiempo de duración que tienen los focos fabricados por una empresa, se distribuye en
forma normal con media 1.020 horas y desviación estándar 51 horas. ¿Cuál es la probabilidad
en porcentaje de que dure más de 1.173 horas?
A) 0,27%
B) 2,7 %
C) 0,027%
D) 0,15%
E) 13,5%
28. Los promedios obtenidos por los alumnos de un colegio, en su último semestre de cuarto
medio, tiene una distribución N(5,0 ; 0,8). ¿Cuál(es) de las siguientes afirmaciones es (son)
verdadera(s)?
I)
II)
III)
a) Solo I
b) Solo II
Aproximadamente, el 68% de los alumnos tiene promedio entre 4,2 y 5,8.
Aproximadamente, el 2,3% de los alumnos tiene promedio menor a 3,4.
Un 13,6%, aproximadamente, tiene promedio entre 5,8 y 6,6.
c) Solo I y III
d) Solo II y III
e) I, II y III
7
29. ¿Cuál de los siguientes gráficos representa a tres distribuciones de probabilidad normal
con la misma media y diferentes desviaciones estándar?
30. Sea una distribución normal N (18,6 ; 2,6), entonces ¿Cuál(es) de las siguientes afirmaciones
es FALSA?
a)
b)
c)
d)
e)
La desviación estándar es igual a 2,6
El promedio de la muestra es 18,6
P(X > 18,6 ) = 0,5
P (X < 2,6 ) = 0,5
P( 16,0  X  21,2 ) = 68%
31. Sea F(x) una función de distribución de probabilidad de una variable aleatoria discreta de
valores { 0, 1, 2, 3 }, equiprobable, entonces los valores de z e y, respectivamente son:
1
y1
1
2
 si 0  x  1
4
1 1
b)
y

2 2
F(x)  P(X  x) 1 si 1  x  2
2
3
c)
y1
 z si 2  x  3
4

 y si 3  x
1
d) 1 y
2
3
e) 1 y
4
32. Si la función de distribución de una variable aleatoria x está dada en la tabla adjunta, entonces
el valor de P(2  x  4) es
a)
a) 30%
b) 45%
c) 50%
d) 60%
e) 20%
8
33. La tabla adjunta muestra la función de probabilidad de variable aleatoria x
X
P( X = xi )
-1
0,04
0
0,22
1
0,30
2
w
3
0,10
¿Cuál(es) de las siguientes proposiciones es (son) verdadera (s)?
I. P(0  x  2)  0,64
II.
P(x  0)  0,96
III. P(x  1)  63%
a) Solo I
b) Solo II
c) Solo III
d) Solo I y II
34. Sabiendo que en una función de
probabilidad p(X ≤ 2) = 0,7 y
0,75. Hallar
p(X > 2)
a)
1
4
b)
3
10
9
20
3
d)
4
c)
X
P( X = xi )
e) I, II y III
1
0,1
2
0,30
3
0,60
e)
4
0,8
5
1
p(X ≥ 2) =
4
5
35. Sea X una variable con distribución normal. Se puede conocer cuántos elementos están en el
intervalo del promedio menos una desviación estándar y el promedio más una desviación
estándar, si se conoce que:
(1)
Un 68,3% de la muestra se encuentra en ese intervalo.
(2)
Todos los elementos de la muestra.
a) (1) por si sola
b) (2) por si sola
c) Ambas juntas (1) y (2)
d) Cada una por sí sola, (1) ó (2)
e) Se requiere información adicional
36. Sea X una variable aleatoria discreta y F(x) la función distribución de probabilidad. Se puede
conocer la probabilidad de P(xi) si se conoce:
(1) F(x i 1)
(2) F(xi )
a)
b)
c)
d)
e)
(1) por si sola
(2) por si sola
Ambas juntas (1) y (2)
Cada una por sí sola, (1) ó (2)
Se requiere información adicional.
9
Consideremos ahora que la tabla que entrega el DEMRE para la PSU es la
siguiente, que tiene solo valores positivos para z (ésta podría estar más
ampliada)
Si Z es una variable aleatoria
continua, tal que Z  N(0, 1) y donde
la parte sombreada de la figura
representa a P(Z  z), entonces se
verifica que:
(z representa la cantidad de
desviaciones estándar, P(Z  z)
representa la probabilidad de
obtener una variable de esa área
sombreada)
En distribuciones normales
La tabla nos da las probabilidades de P(Z ≤ z) , siendo z la variable tipificada.
Estas probabilidades nos dan la función de distribución
Búsqueda en la tabla de valor de z
Usar en forma correcta la simetría de la campana de gauss
P(Z ≤ z)
P(Z > z) = 1 - P(Z ≤ z)
P(Z ≤ −z) = 1 − P(Z ≤ z)
P(Z > −z) = P(Z ≤ z)
P(a< Z ≤ b)= P(Z ≤
b)−P(Z ≤ a)
P(−b < Z ≤ −a ) = P(a < Z
≤b)
10
P(−a < Z ≤ b ) = P(Z ≤ b) + P(Z
≤a) -1
Obs P(−a < Z ≤ b ) = P(Z ≤ b) − [1 − P( Z ≤ a )]
Ejercicios distribución Normal
Solamente con z se entra a la tabla 
z
xx

1. En una ciudad se estima que la temperatura máxima en el mes de junio con una
distribución normal, tiene media 23° y desviación típica 5°.
Calcular el número de días del mes en los que se espera alcanzar máximas entre
21° y 27°.
Solución
p[21  x  27] ahora tipificar
27  23 
 21 23
 p
Z
5 
 5
 p  0,4  Z  0,8 
 p(Z  0,8)  p(Z  0,4)1
=0,7881+ 0,6554-1=0,4435
Ahora 0,4435· 30 días = 13 días
2. La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación
típica 3 kg. Suponiendo que los pesos se distribuyen normalmente , hallar cuántos
estudiantes pesan:
Solución
a. Entre 60 kg y 75 kg.
 p 60  Z  75 ahora tipificar
75  70 
 60  70
 p
Z
3 
 3
 p  3,33  Z  1,67
11
 p(Z  3,33)  p(Z  1,67)  1
= 0,99957+0,95254 -1
= 0,95211
Ahora 0,9521· 500 estudiantes = 476 estudiantes
b. Más de 90 kg.
Solución
90  70 

p(x  90)  p  Z 
 p( Z  6,67 ) = 1 – 1 = 0
3 

Ahora 0· 500 = 0 estudiantes
c. Menos de 64 kg.
 p Z  64
64  70 

 p Z 
3 

 p( Z   2 )
 1 p(Z  2 ) = 1 0, 9772=
=0,02128
Ahora 0,02128 · 500 estudiantes = 11 estudiantes
d. 64 kg.
64  70 

p(x  64) p  z 
 p(z  2)  0 · 500  0
3 

Obs. El área bajo la curva de un punto es cero, ya que la variable es continua
3. Se supone que los resultados de un examen siguen una distribución normal c on
media 78 y desviación típica 36. Se pide:
a. ¿Cuál es la probabilidad de que una
persona que se presenta en el examen
obtenga una calificación superior a 72?
 72  78 
p  x  72   p 
  p(z  0,16 )  p(z  0,16 )  0,56356
 36 
b. Calcular la proporción de estudiantes que tienen puntuaciones que exceden por
lo menos en cinco puntos de la puntuación que marca la frontera entre el Apto y
12
el No-Apto (son declarados No -Aptos el 25% de los estudiantes que obtuvieron
las puntuaciones más bajas).
Solución
N  78 

N  78
p[x  N]  0,25  p  Z 
=0,25  recodemos que
<0

36 
36

N  78 

N  78
1 p  Z 
 0,25 
 0,68 despejando N=54 

36 
36

59  78 

p(x  54  5)  p(x  59)  p  z 
 p(z  0,53)  _____________________________  70,19%
36 

4. Tras un test de cultura general se observa que las puntuaciones obtenidas
siguen una distribución normal N(65, 18). Se desea clasificar a los examinados en
tres grupos (de baja cultura general, de cultura general aceptable, de excelente
cultura general) de modo que hay en el primero un 20% la población, un 65% el
segundo y un 15% en el tercero. ¿Cuáles han de ser las puntuaciones que marcan
el paso de un grupo al otro?
P(Z  z1)  0,2
z1  0,84
x1  65
 0,84
18
x1  49,88
P(Z  z 2 )  0,85
z 2  1,04
x 2  65
 1,04
18
x 2  83,72
Baja cultura hasta 49 puntos. Cultura aceptable entre 50 y 83.
Excelente cultura a partir de 84 puntos.
13
5. Varios test de inteligencia dieron una puntuación que sigue una ley normal con
media 100 y desviación típica 15.
a. Determinar el porcentaje de población que obtendría un coeficiente entre 95 y
110.
110  100 
 95  100
p( 95  x  110 )  p 
z
  p   0,33  z  0,67  
15
15


 ___________________________________________________________  el 37,79%
b. ¿Qué intervalo centrado en 100 contiene al 50% de la población?
x  100
 0,675  x  110 Entonces
15
100, 10 para cada lado [90, 100]
p  0,75  z  0,675 
como el promedio es
c. En una población de 2500 individuos ¿cuántos individuos se esperan que
tengan un coeficiente su perior a 125?
Solución
125  100 

p(x  125) p  z 
  p(z  1,67)  1 p(z  1,67)  1 0,9525  0,0475
15


Ahora 0,0475· 2.500  119
14
Ahora usaremos la tabla ampliada de la distribución Normal
EJERCICIOS:
1. Alejandro usa todos los días el colectivo de su barrio para llegar al colegio. La
frecuencia con la que pasa uno de ellos con pasaje disponible tiene una
distribución normal con un tiempo promedio de 15 minutos y desviación estándar
de 3,5 minutos. ¿Cuá l es la probabilidad de que espere como máximo 12 minutos
por un colectivo con disponibilidad? 0,2
¿Qué porcentaje de colectivos suele demorarse más de 20 minutos en pasar? 7,6%
2. El tiempo que demora el vuelo de un avión directo desde la ciudad de Arica a
Santiago tiene una distribución normal, con media de 3,5 horas y una desviación
estándar de 0,4 horas. En un vuelo cualquiera, ¿cuál es la probabilidad de que
demore más de 3,3 horas y menos de 3,6 horas? 0,29
3. En algunos test, los puntajes asociados al coeficiente intelectual de una
persona se distribuyen en forma normal con media 100 y desviación estándar
igual a 16. Si se escoge al azar a una persona, determina la probabilidad de que su
coeficiente intelectual:
a) sea mayor que 120. 0,1055
b) se encuentre entre 90 y 110. 0,468
4. El tiempo que se demoran los postulantes, año a año, en contestar un test de
ingreso a una escuela de idiomas se modela por una distribución normal con
media de 80 minutos y desviación estándar de 10 minutos. ¿Qué porcenta je de
postulantes, se estima, terminará el test antes de los 65 minutos? 0,066
5. La vida media de una pila (en horas) tiene una distribución N (150, 50). ¿Cuál
es la probabilidad aproximada de que dure menos de 50 horas? 0,022
6. En un colegio de 4000 est udiantes, las notas en Matemática tienen una
distribución N(5,2 ; 0,6). ¿Alrededor de cuántos estudiantes tienen promedio
sobre 6,0? 360
7. ¿Cuáles son los valores respectivos de la media y la desviación estándar de una
variable aleatoria con distribución normal estándar? Media= 0; =1
15