Download tema 1º.- iniciación a la estadística

Document related concepts

Medidas de tendencia central wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Mediana (estadística) wikipedia , lookup

Desviación típica wikipedia , lookup

Transcript
TEMA 1º.- INICIACIÓN A LA ESTADÍSTICA
1º.- INTRODUCCIÓN
Parece ser que la palabra estadística se utilizó por primera vez en Alemania a
mediados del siglo XVII y se refería a la recolección de datos y documentos del Estado.
Aunque el término estadística sea relativamente moderno, usado como
recolección de datos referentes a la población y riqueza de los pueblos, parece ser
anterior a la salida de los hebreos del territorio de Egipto (siglo VI a. C.).
El primer censo fue realizado por el Emperador Servio Tulio (578 – 535 a.C.).
Tácito, historiador latino, refiere que Cesar Augusto ordenó registrar el número de
soldados, el de barcos, las riquezas y el número de habitantes de su imperio, datos estos,
que están descritos en el evangelio de S. Lucas.
Todo esto prueba que la estadística lleva muchos años de existencia; pero su
evolución y desarrollo como ciencia empezó a mediados del siglo XVI gracias a los
grandes genios de la época (Pascal, John Graunt, C. Huygens, Fermat, etc.).
Hoy, la estadística es, sobre todo, un instrumento de decisión, una ciencia que
usa los números para tener más conocimiento de la naturaleza y la experiencia.
DEFINICIÓN 1ª.- La estadística es un conjunto de métodos que nos ayudan a tomar
decisiones razonables, incluso en casos de incertidumbre.
DEFINICIÓN 2ª.- La estadística también se entiende como una ciencia que trata los
fenómenos de la vida, los estudia, analiza e interpreta los resultados.
1
2º.- DEFINICIONES.
A)
ESTADÍSTICA.- Si tomamos como definición de estadística la 2ª, en
ella se distinguen tres partes claramente diferenciadas
a) Descripción del fenómeno.- Es cuando se anotan o recopilan los
datos o fenómenos que se quieren estudiar. Al conjunto de datos se le
llama conjunto referencial, población o universo.
b) Análisis de los datos.- Se trata de ver la frecuencia con la que se
repiten los datos, analizar las causas que dan lugar a la reproducción
de los fenómenos, ver si hay alguna explicación teórica que justifique
los mismos, etc.
c) Predicción de los resultados.- Analizadas las causas por las que se
rigen los fenómenos y la regularidad de los mismos, se pueden hacer
la predicciones oportunas.
B)
POBLACIÓN.- Es el conjunto de todos los elementos que cumplen
una determinada característica, también se le llama conjunto
referencial. Ej.- Los alumnos de 2º de Bachillerato de España, el
censo de Andalucía, etc.
C)
MUESTRA.- Es cualquier subconjunto de la población. A la muestra
se la considera una representación de la población; por ello hay que
cuidar su elección. Los procesos mediante los cuales se extrae una
muestra de una población son diversos, cuando cada individuo de la
población tiene la misma posibilidad de pertenecer a la muestra se
denomina muestreo aleatorio.
Características de la muestra.- Para seleccionar una muestra adecuada
han de respetarse criterios de dos tipos: De carácter cuantitativo, es decir,
¿Cuál es el tamaño adecuado de la muestra? y de carácter cualitativo, o,
lo que es lo mismo ¿Cómo ha de elegirse la muestra?
De los criterios cualitativos diremos que, básicamente, podemos
considerar cuatro posibilidades:
a) Muestra aleatoria simple.- Consiste en extraer, mediante un sorteo
riguroso, una serie de individuos de una población. Todos los
2
individuos han de tener la misma posibilidad de ser elegidos. Es el
método más puro, pero, sin embargo no se utiliza siempre. La razón
estriba, esencialmente en el alto costo que supone en ocasiones.
b) Muestra aleatoria sistemática.- Se numeran los individuos y, a, partir
de uno de ellos elegido al azar se toman los siguientes mediante
saltos numéricos iguales. Ej.- Si tenemos una población de N
individuos y queremos tomar una muestra de “n” individuos, el salto
será “h” siendo h =
N
. Para elegir la muestra elegimos al azar un
n
individuo entre los “h” primeros, a1 . Los siguientes serán:
a 2 = a1 + h; a 3 = a 2 + h ; ………….. a n = a n −1 + h . Esta forma de
muestreo sólo es válida si el criterio por el que se han enumerado los
individuos de la población no tiene nada que ver con la característica
que se quiere estudiar a partir de la muestra.
c) Muestra aleatoria estratificada.- Se eligen a los individuos según al
estrato al que pertenezcan. Ej.- En un instituto hay 350 alumnos de
primero de la ESO, 200 de segundo, 150 de tercero y 100de cuarto. Si
queremos elegir una muestra de 80 alumnos ¿cuántos debemos de
elegir de cada curso?
d) Muestra no aleatoria.- Cuando se hace la elección de los individuos
de forma deliberada, aunque no se les conozca. Este tipo de muestras
puede dar errores graves, pues el que elige la muestra puede
introducir un criterio de selección sin pretenderlo. Un error de este
tipo cometió en 1936 la revista norteamericana Literary Digest ya que
la fuente de la encuesta fue la lista de sus suscriptores y el listín
telefónico.
D)
CARACTERES ESTADÍSTICOS.- Es una propiedad que permite
clasificar a los individuos de la población. Estos pueden ser:
cualitativos y cuantitativos. Son caracteres estadísticos cualitativos los
3
que no se pueden medir. Ej.- El color de los ojos, La carrera que
pensáis estudiar, El idioma que has elegido, etc.
Son caracteres estadísticos cuantitativos los que se pueden medir. Ej.La talla de un individuo, El coeficiente intelectual de un alumno, El nº
de granos que tiene una espiga, etc.
E)
VARIABLES ESTADÍSTICAS.- Se llaman variables estadísticas a
las diversas modalidades de un carácter cuantitativo. Una variable que
puede tomar, teóricamente, cualquier valor comprendido entre dos
valores dados se le llama variable continua. Si no puede ocurrir esto,
se llama variable discreta.
Ej.- La altura de un individuo (Continua)
Ej.- El número de hijos de una familia (Discreta)
El valor de la variable se suele notar por xi
4
TEMA 2º.- TABLAS Y GRÁFICOS ESTADÍSTICOS
1º.- FRECUENCIAS
A) FRECUENCIA ABSOLUTA.- Se llama frecuencia absoluta
del valor xi y la representaremos por f i , al número de veces
que se repite dicho valor.
B) FRECUENCIA ABSOLUTA ACUMULADA.-Se llama
frecuencia absoluta acumulada del valor xi y lo
representaremos por Fi , a la suma de las frecuencias
absolutas de todos los valores anteriores a xi más la
frecuencia absoluta de xi . Fi = f1 + f 2 + .... + f i .
C) FRECUENCIA RELATIVA.- Se llama frecuencia relativa
de un valor xi y la representaremos por hi , al cociente entre
la frecuencia absoluta de xi y el número total de datos que
intervienen en la distribución. hi =
fi
=
N
fi
; Siendo
n
∑f
i =1
i
n
N = f 1 + f 2 + ....... + f n = ∑ f i
i =1
D) FRECUENCIA RELATIVA ACUMULADA.- Es el
cociente entre la frecuencia absoluta acumulada y el nº total
de datos y la representaremos por H i ;
Hi =
Fi
F
= n i
N
∑f
i =1
= h1 + h2 + ..... + hi
i
E) FRECUENCIAS EN %.- Todas las frecuencias anteriores
pueden se expresadas en %.
Ejemplo 1º.- Las notas de matemáticas en una clase de 30 alumnos han sido las
siguientes: 1, 0, 1, 2, 3, 0, 1, 4, 6, 5, 5, 6, 7, 8, 8, 8, 7, 7, 9, 9, 5, 8, 7, 8, 9, 9, 8, 9, 8, 7,
agrupemos estos datos y construyamos una tabla estadística
5
xi
fi
0
2
1
3
2
1
3
1
4
1
5
3
6
2
7
5
8
7
9
5
Fi
hi
Hi
fi %
Fi %
hi %
Hi %
N=30
En el caso de que la variable sea continua o bien discreta, pero con un nº de
datos muy grande, resulta aconsejable agrupar los datos por intervalos que llamaremos
clases. Es aconsejable elegir los extremos del intervalo nº enteros y las clases con la
misma amplitud. A los puntos medios de cada clase se les llama marca de clase. Los
intervalos se deben construir de forma que el extremo inferior de una clase coincida con
el superior de la clase anterior.
Ejemplo 2º.- La altura de 46 individuos es la siguiente: 1.64, 1.60, 1.56, 1.60,
1.63, 1.51, 1.57, 1.54, 1.53, 1.40, 1.53, 1.57, 1.44, 1.45, 1.54, 1.59, 1.52, 1.60,
1.50, 1.52, 1.55, 1.65, 1.61, 1.51, 1.55, 1.66, 1.53, 1.57, 1.56, 1.57, 1.58, 1.61,
1.70, 1.41, 1.47, 1.52, 1.44, 1.66, 1.64, 1.51, 1.58, 1.69, 1.52, 1.68, 1.68, 1.75
formemos una tabla con intervalos de clase y calcula las respectivas frecuencias
6
Intervalo
Marca clase
fi
Fi
hi
Hi
xi
[1.40 − 1.45[
[1.45 − 1.50[
[1.50 − 1.55[
[1.55 − 1.60[
[1.60 − 1.65[
[1.65 − 1.70[
[1.70 − 1.75[
1.425
1.475
1.525
1.575
1.625
1.675
1.725
A estas tablas se denominan TABLAS ESTADÍSTICAS
2º GRÁFICOS ESTADÍSTICOS
Aun cuando las tablas estadísticas contienen toda la información, a veces es
conveniente expresar esta información mediante un gráfico con el fin de hacerla más
clara y evidente.
Otras veces, a partir de un gráfico construimos la correspondiente tabla
estadística. Los gráficos estadísticos más usuales son:
•
Diagrama de barras.
•
Histograma.
•
Diagrama de sectores.
•
Pictogramas.
•
Cartogramas
•
Diagramas lineales
2.1.- DIAGRAMAS DE BARRAS.- Para trazarlos se representan sobre el eje de
abscisas los valores de la variable xi y sobre el eje de ordenadas las respectivas
frecuencias, f i , Fi , hi , H i …. Según proceda. A continuación por los puntos
7
marcados en el eje de abscisas se levantan trazos gruesos o barras, de longitud igual a la
frecuencia correspondiente
2.2.- POLÍGONO DE FRECUENCIAS.- Los polígonos de frecuencias se
forman uniendo los extremos de las barras mediante una línea quebrada.
2.3.- HISTOGRAMAS.- Se utilizan para variables estadísticas continuas, o
discretas con un nº de datos elevado. Para construir un histograma se representan sobre
el eje de abscisas los límites de las clases. Sobre dicho eje se construyen unos
rectángulos que tienen por base la amplitud de los intervalos y por altura la frecuencia
de cada intervalo, siempre que todos los intervalos tengan la misma amplitud. En caso
contrario las alturas de los rectángulos han de ser calculadas teniendo en cuenta que sus
áreas deben de ser proporcionales a las frecuencias de cada intervalo. En este caso el
polígono de frecuencias se forma uniendo el punto medio del lado superior de los
rectángulos dibujados, salvo para las frecuencias acumuladas que lo que se tiene que
unir son los vértices superiores derechos de cada uno de los rectángulos.
2.4.- DIAGRAMAS DE SECTORES.- Representa las distintas modalidades de
un carácter mediante sectores circulares. El ángulo central de cada sector ha de ser
proporcional a la frecuencia absoluta correspondiente.
2.5.- PICTOGRAMAS.- Son dibujos alusivos a la distribución y que mediante
su forma, tamaño, etc. Ofrecen una descripción lo más expresiva posible de la
distribución estadística.
2.6.- CARTOGRAMAS.- Son los gráficos que se realizan sobre un mapa,
señalando sobre determinadas zonas con distintos colores o rayados lo que se trate de
poner de manifiesto.
Se suelen utiliza restos diagramas para representar la densidad demográfica de
una nación, la renta percápita, los índices de lluvia, etc.
2.7.- DIAGRAMAS LINEALES.- Son utilizados para mostrar las fluctuaciones
de un determinado carácter estadístico con el paso del tiempo.
Ejemplo 3º.- Considera la tabla del ejercicio 1 y dibuja el diagrama de barras y
polígono de frecuencia de todas las frecuencias.
Ejemplo 4º.- Considera la tabla del ejercicio 2 y dibuja el histograma y polígono
de frecuencias de cada una de las frecuencias.
8
RELACIÓN DE EJERCICIOS TEMA 2
1º.- En el estudio de una variable X se obtuvo la siguiente distribución de frecuencias:
xi
5
7
9
10
13
14
fi
8
12
17
20
26
30
a) Construye la tabla de frecuencias
b) Representa la distribución mediante un diagrama de barras
2º.- Las puntuaciones obtenidas en un test de razonamiento por 20 alumnos son las
siguientes: 16, 22, 21, 20, 23, 22, 17, 15, 13, 22, 17, 18, 20, 17, 22, 16, 23, 21, 22, 18
3º.- Se ha controlado el peso de 50 recién nacidos, obteniéndose los siguientes
resultados:
Peso en Kg.
Nº de niños
[ 2,5 − 3)
[3 − 3,5)
[3,5 − 4 )
[ 4 − 4,5)
6
a) Forma la tabla de frecuencias
b) Representa gráficamente la
23
distribución
12
9
4º.- Los jugadores de un equipo de baloncesto se clasifican por alturas, según la
siguiente tabla
Altura
Nº de jugadores
[1, 70 − 1,80 )
[1,80 − 1,90 )
[1,90 − 2, 00 )
[ 2, 00 − 2,10 )
3
c) Forma la tabla de
frecuencias
4
d) Representa gráficamente
5
la distribución
3
5º.- Según informa el Anuario El País, los cambios medios anuales para el dólar, la
libra esterlina y el marchen el periodo 1980 – 1985, viene expresado por la siguiente
tabla
Moneda
1980
1981
1982
1983
1985
1985
Dólar
72
93
110
142
161
170
Libra
167
186
192
217
214
219
Marco
39
41
45
56
57
58
Representa esta distribución mediante tres diagramas lineales en el mismo gráfico.
9
TEMA 3º.- MEDIDAS DE CENTRALIZACIÓN Y DE
DISPERSIÓN
A) MEDIDAS DE CENTRALIZACIÓN
1º.- INTRODUCCIÓN
Se llaman medidas de centralización a las medidas o parámetros estadísticos que
tienden a situarse hacia el centro del conjunto de datos ordenados. A las medidas de
centralización también se las llama medidas de tendencia central o promedios.
Las medidas de centralización más importantes son:
•
Media aritmética
•
Moda
•
Mediana.
•
Cuantiles (Cuartiles, Deciles y Percentiles)
También existe otras medidas de centralización menos usuales tales como:
•
Media geométrica.
•
Media armónica
2º.- MEDIA ARITMÉTICA.
Se llama media aritmética de una variable estadística a la suma de todos los
valores de dicha variable divididos por el número total de valores.
Si llamamos X a la variable estadística, la media aritmética se representa por
x y se calcula de la siguiente forma:
Sea X una variable estadística que toma los valores x1 , x 2 , x3 ,.....x n con
frecuencias absolutas f 1 , f 2 , f 3 ,...... f n respectivamente. La media aritmética de la
variable viene dada por la expresión
n
x f + x 2 f 2 + .......x n f n
=
x= 1 1
f 1 + f 2 + ...... f n
∑x
i =1
n
∑f
i =1
10
i
fi
i
Si los datos son simples, se tiene que todas las frecuencias son iguales a 1 y la
media aritmética quedaría:
n
x=
∑x
i =1
i
N
Si la variable X es continua, o aun siendo discreta, y por tratarse de muchos
datos se encuentran agrupados en clases, se toman como valores x1 , x 2 , x3 ,.....x n las
marcas de clase.
Propiedades de la media aritmética
1ª) Si se suma una constante “k” a todos los valores xi , la media aumenta en el
mismo número.
Demostración
2ª) Si se multiplican todos los valores de la variable X por un mismo número
“p”, la media queda multiplicada por dicho número
Demostración
En definitiva, la media es alterada en la misma medida que son alterados los
valores de la variable X. Así si xi´ = pxi + k entonces x´= p x + k . De esta forma cuando
los valores de la X sean muy complicados podemos hacer una transformación para
obtener una tabla mucho más fácil de operar.
11
Ejemplo.- Calcula la media con los datos de la siguiente tabla. A continuación
haz el cambio de variable xi ´= 20 xi − 34´5 y vuelve a calcular la media.
xi
fi
1´575
4
1´625
11
1´675
21
1´725
19
1´775
12
1´825
6
1´875
4
1´925
3
xi ´
fi
xi f i
xi ´ f i
12
Observaciones sobre la media:
•
Es el parámetro que más se utiliza.
•
Tiene en cuenta todos los datos de la distribución y es fácil de
calcular
•
Tiene el inconveniente de que cuándo la variable tiene valores
extremos, excepcionalmente raros y poco significativos, estos
producen una distorsión sobre la media.
•
No siempre es posible realizar el cálculo de la media. Por ejemplo
-
Si los datos son cualitativos
-
Si los datos se encuentran agrupados en clases, estando
algunas de ellas abiertas.
En estos casos en los que no se puede calcular la media se utilizan otros
parámetros como son la moda y la mediana.
3º.- MODA
Se llama moda de una variable estadística al valor de dicha variable que presenta
mayor frecuencia absoluta. La moda la representamos por M 0 .
La moda no tiene por qué ser única, según el número de modas la distribución la
llamaremos bimodal, trimodal, etc.
El cálculo de la moda resulta muy fácil en el caso de que los datos no estén
agrupados. En el caso de que estén agrupados por intervalos debemos seguir el siguiente
proceso:
a) Determinar la clase con mayor frecuencia absoluta(Llamada clase modal)
b) Aplicar la fórmula M 0 = Li +
D1
× C . Siendo
D1 + D2
- Li → Límite inferior de la clase modal.
- D1 → Diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase anterior.
13
- D2 → Diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase siguiente.
- C → Amplitud de los intervalos
Ejemplo 1º.- Calcula la moda en la siguiente distribución
xi
1 2 3 4
5
6
fi
6 7 14 10 14 9
Ejemplo 2º.- Calcula la moda en la siguiente distribución
xi
fi
38 – 44
7
44 – 50
8
50 – 56
15
56 – 62
25
62 – 68
18
68 – 74
9
74 - 80
6
4º MEDIANA
Si se considera la serie íntegra de datos ordenados, poniendo tantas copias del
dato como nos indica su frecuencia, la mediana, que anotaremos M e es el valor de la
variable que está en la posición central en esa observación. La mediana es el valor que
divide a la serie de datos en dos partes exactamente iguales. Veamos cómo se calcula:
4.1.- Variable estadística discreta.- Se ordenan los datos de menor a mayor,
siendo la mediana el valor central si el número de datos es impar y la media aritmética
de los dos valores centrales si el número de datos es par.
14
Ejemplo 1º.- Las notas de un alumno han sido 2, 4, 4, 5, 6, 7, 7. Calcula la
mediana
Ejemplo 2º.- Las notas de un alumno han sido 2, 4, 4, 5, 6, 7, 7, 8. Calcula la
mediana.
¿Cómo calcularíamos la mediana cuando el número de datos fuese muy elevado?
Calculamos N/2, siendo N el número total de datos. La mediana viene dada por
el primer valor de la variable cuya frecuencia acumulada excede a la mitad del número
de datos (N/2).
Ejemplo.- Calcula la mediana en la siguiente tabla
xi
fi
1
2
2
2
3
4
4
5
5
8
6
9
7
3
8
4
9
3
En el caso de que N/2 coincida con una frecuencia acumulada entonces la
mediana es la semisuma entre ese valor y el siguiente
15
Ejemplo.- Calcula la mediana en la siguiente tabla estadística
xi
fi
3
15
6
20
7
15
8
40
9
10
4.2.- Variable estadística continua.- En este caso procedemos de forma
análogas a como acabamos de hacer y así detectamos cual es la clase mediana y a
continuación aplicamos la fórmula
N
− Fi −1
2
M e = Li +
×C
fi
- Li → Límite inferior de la clase mediana
- N → Número total de datos
- Fi −1 → Frecuencia acumulada anterior a la clase mediana
- f i → Frecuencia absoluta de la clase mediana
- C → Amplitud del intervalo
Ejemplo.- Se ha aplicado un test sobre satisfacción en el trabajo a 88 empleados,
obteniéndose los siguientes resultados
Puntuaciones Nº de trabajadores f i
38 – 44
7
44 – 50
8
50 – 56
15
56 – 62
25
62 – 68
18
68 – 74
9
74 - 80
6
Calcula la mediana
16
Observaciones sobre la Mediana
•
La mediana es particularmente útil en los siguientes casos:
-
Cuando entre los datos existen alguno ostensiblemente
extremo que, como vimos afectaba a la media
-
Cuando los datos están agrupados en clases y alguna de ellas
es abierta.
•
Geométricamente, y para distribuciones que se pueden representar
mediante un histograma de frecuencias, la mediana es el valor de la
variable, tal que la vertical levantada sobre el mismo divide al
histograma en dos partes de igual área. Para calcular la mediana de
esta forma, representamos el polígono de frecuencias acumuladas en
% y el valor de la abscisa que le corresponda el 50% en el eje de
ordenadas esa es la mediana
Ejemplo.- Calcula la mediana gráficamente en el ejemplo anterior
5º.- CUANTILES
Al estudiar la mediana hemos visto que, al ordenar de menor a mayor los datos
de una distribución, la mediana divide a estos en dos partes iguales.
Análogamente tiene interés estudiar otros parámetros que dividen a los datos de
la distribución en función de otras cuantías. Los más importantes son los Cuartiles,
Deciles y Percentiles
5.1.- Cuartiles.- Se llaman cuartiles a tres valores Q1 , Q2 , Q3 que dividen a la
serie de datos en cuatro partes iguales. Se calcula de forma análoga a la mediana.
Para el caso discreto, se hace igual que la mediana pero en N/4, N/2 y 3N/4.
En el caso de continua o discreta con muchos valores tenemos
17
N
− Fi −1
Q1 = Li + 4
×C
fi
N
− Fi −1
Q2 = Li + 2
×C
fi
3N
− Fi −1
Q3 = Li + 4
×C
fi
5.2.- Deciles.- Se llaman deciles a nueve valores que dividen a la serie de datos
en 10 partes iguales lo anotaremos D1 , D2 ,........D9 . Su cálculo, en una distribución
discreta, se efectúa igual que la mediana y cuartiles pero en
N N
N
N
, × 2, × 3............... × 9 . En el caso de que la distribución sea continua o
10 10
10
10
discreta con muchos valores aplicaremos la siguiente fórmula
N
× n − Fi −1
10
Dn = Li +
×C
fi
Siendo:
- Li → Límite inferior de la clase que corresponda a
N
×n
10
- N → Número total de datos
- n → Número de decil que vamos a calcular
- Fi −1 → Frecuencia acumulada anterior a la clase correspondiente
- f i → Frecuencia absoluta de la clase correspondiente
- C → Amplitud del intervalo.
5.3 Percentiles.- Se llaman percentiles a 99 valores que dividen a la serie de
datos en 100 partes iguales y lo anotaremos por P1 , P2 ,.......P99 . Para calcularlos se sigue
el mismo proceso de los casos anteriores
18
Ejercicio.- Enuncia una fórmula que podamos calcular cualquier percentil
Como se puede observar se verifica que M e = Q2 = D5 = P50
Ejemplo 1º.- Calcula Q1 , Q3 , D5 , D8 , P30, P70 en las calificaciones en matemáticas de 40
alumnos que vienen dadas por la siguiente tabla
xi
fi
1
2
2
2
3
4
4
5
5
8
6
9
7
3
8
4
9
3
Ejemplo 2º.- Se ha aplicado un test sobre satisfacción en el trabajo a 88
empleados obteniéndose la siguiente tabla. Calcula: Q3 , D4 , D5 , P40 , P90
19
Puntuaciones Nº de trabajadores f i
38 – 44
7
44 – 50
8
50 – 56
15
56 – 62
25
62 – 68
18
68 – 74
9
74 - 80
6
Observaciones sobre los cuantiles
•
A los cuantiles se les suele llamar parámetros de posición.
•
Aunque incluimos los cuantiles como medidas de centralización por
su analogía con la mediana, se comprende, por su naturaleza, que no
tienen que estar situados hacia el centro de la distribución. Pensemos
por ejemplo en el P90 .
•
Los cuantiles también se pueden calcular de forma gráfica, vasta con
representar el polígono de frecuencias acumuladas en %, es decir,
Fi × 100
N
6º.- MEDIA GEOMÉTRICA
Si tenemos una variable estadística X que toma los valores x1 , x 2 , x3 ,.....x n .
Llamaremos media geométrica de la variable X y la anotaremos por MG a la
expresión:
MG = n x1 .x 2 .......x n
Si los valores x1 , x 2 , x3 ,.....x n se presentan con frecuencia f 1 , f 2 , f 3 ,...... f n
respectivamente entonces
MG = ∑ i x1 1 .x 2 2 .......x n
f
f
f
fn
20
7º.- MEDIA ARMÓNICA
Es la inversa de la media aritmética del inverso de los valores. Si la variable X
toma los valores x1 , x 2 , x3 ,.....x n . Entonces la media armónica MA valdrá:
MA =
1
1
1
1
+
+ ...... +
x1 x 2
xn
N
=
N
1
1
1
+
+ ........ +
x1 x 2
xn
=
N
n
1
∑x
i =1
i
Si los valores x1 , x 2 , x3 ,.....x n se presentan con frecuencia f 1 , f 2 , f 3 ,...... f n
respectivamente. Entonces
MA =
21
B) MEDIDAS DE DISPERSIÓN
1º.- INTRODUCCIÓN
La investigación acerca de una distribución queda incompleta si sólo se estudian
las medidas de centralización, siendo imprescindible conocer si los datos numéricos
están agrupados o no alrededor de los valores centrales. A esto es a lo que se llama
dispersión, y a los parámetros que miden estas desviaciones respecto a la media se
llaman aparatos o medidas de dispersión.
Los más importantes son:
•
El rango o recorrido.
•
La varianza.
•
Desviación típica
Otros menos frecuentes como
•
La desviación media
•
Rango intercuartílico.
2º.- RANGO O RECORRIDO
Se llama Rango o Recorrido de una distribución a la diferencia entre el mayor y
el menor valor que toma la variable estadística.
Observaciones
•
Cuanto menor es el recorrido mayor es el grado de representatividad de los
valores centrales.
•
Presenta el inconveniente que sólo depende de los valores extremos y basta
que uno de ellos se separe mucho, para que el recorrido se vea sensiblemente
afectado.
•
Para paliar en alguna medida este inconveniente se utilizan en ocasiones
otros dos rangos:
* Rango intercuartílico:
Q = Q3 − Q1
* Rango entre percentiles:
P = P90 − P10
22
3º.- VARIANZA
Se llama varianza de una variable a la media aritmética de los cuadrados de las
desviaciones respecto a la media (Se llaman desviaciones respecto a la media a las
diferencias entre cada valor de la variable y la media). Si la variable X toma los valores
x1 , x 2 , x3 ,.....x n . Entonces las desviaciones respecto a la media son
( x1 − x), ( x 2 − x),........( x n − x) .
La Varianza se representa por S 2 y vale:
n
S =
2
∑ (x
i =1
i
− x) 2 f i
n
∑f
i =1
∑x
2
i
fi
2
=
− x . Demostrar que esta igualdad es cierta
n
∑f
i
i =1
i
4º.- DESVIACIÓN TÍPICA
Se llama Desviación Típica de una variable X a la raíz cuadrada de la Varianza y
se representa por S.
S=
∑ ( x − x)
∑f
i
2
fi
o también S =
∑x f
∑f
2
i
i
−x
2
i
i
Observaciones sobre la varianza y la desviación típica
•
La S es un término del que se pueden sacar conclusiones erróneas sobre la
dispersión de la muestra. Por ejemplo, de dos muestras, la 1ª con x = 30 y S
= 4 y la segunda con x = 60 y S = 6. ¿Cuál es la que aparece más dispersa?.
Considerando sólo las desviaciones típicas diríamos que es la segunda. Sin
23
embargo reduciendo los datos a una misma escala, ocurre justamente lo
contrario. Por ello se recurre al cociente
S
, llamado Cociente de variación de
x
Pearson. Que en los casos anteriores valdría 4/30 = 0´13 para el primer caso
y 6/60 = 0´1 para el segundo por lo que los datos del primer caso están más
dispersos que los del segundo.
5º DESVIACIÓN MEDIA
Llamamos Desviación Media a la media aritmética de las desviaciones respecto
a la media, así es que si los datos son simples entonces
DesviaciónMedia =
DesviaciónMedia =
∑ (x
i
− x)
N
∑ ( x − x) f
∑f
i
y si los datos se presentan con frecuencias la
i
i
Ejercicio 1º.- Calcula todas las medidas de centralización: Media, Moda,
Mediana, Q1 , Q3 , P10 , P90 , MG y MA y de dispersión: Varianza, Desviación típica
y rango con los datos de la siguiente tabla
xi
fi
1
2
2
2
3
4
4
5
5
8
6
9
7
3
8
4
9
3
24
Ejercicio 2º.- a)¿Qué le ocurriría a la desviación típica de una variable
estadística si todos los valores de la variable los aumentamos en un mismo número
“k”?.¿Y si los multiplicamos por un mismo número “p”? Demuéstralo.
25
RELACIÓN DE EJERCICIOS. TEMA 3
1º.- Un inversol ha adquirido 1000 acciones de una determinada sociedad en cinco
sesiones diferentes de Bolsa. Los cambios de adquisición se registran en la tabla
adjunta
Cambios Nº de acciones
900
150
870
300
840
100
800
250
700
200
a)
b)
c)
d)
Halla el cambio medio
Halla la mediana
Halla la moda
Halla la varianza y la desviación típica
2º.- Las puntuaciones obtenidas en un test de razonamiento por 20 alumnos son las
siguientes: 16, 22, 21, 20, 23, 22, 17, 15, 13, 22, 17, 18, 20, 17, 22, 16, 23, 21, 22, 18
Hallar la media, los cuartiles, el rango y la varianza.
3º.- Durante el mes de julio, en una ciudad andaluza, se han registrado las siguientes
temperaturas máximas: 32, 31, 28, 29, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 29, 30, 32,
31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33.
a) Halla la moda, la media y los percentiles de orden 30 y 70.
b) Halla el recorrido y la varianza
4º.- Se ha controlado el peso de 50 recién nacidos, obteniéndose los siguientes
resultados:
Peso en Kg.
Nº de niños
[ 2,5 − 3)
[3 − 3,5)
[3,5 − 4 )
[ 4 − 4,5)
6
Hallar los cuartiles, la desviación
típica y el recorrido intercuartílico
23
12
9
5º.- Los jugadores de un equipo de baloncesto se clasifican por alturas, según la
siguiente tabla
26
Altura
Nº de jugadores
[1, 70 − 1,80 )
[1,80 − 1,90 )
[1,90 − 2, 00 )
[ 2, 00 − 2,10 )
3
Halla la media, la moda, la
mediana y la desviación
4
típica.
5
3
6º.- Si los números 6, 7, 8, 9, 12 los multiplicamos por 2, se obtiene 12, 14, 16, 18, 24.
¿Qué se puede decir de las medias y las desviaciones típicas se ambas series
estadísticas? ¿Y si en vez de multiplicarlos por 2 lo que hacemos es sumarles 6?
7º.- Un profesor ha realizado dos test a un grupo d 40 alumnos, obteniendo que la
media y la desviación típica de los resultados del primer test son 6 y 1,5
respectivamente. La media y la desviación típica de los resultados del segundo test son
4 y 0,5. Un alumno obtuvo un 6 en el primer test y un 5 en el segundo.
Comparativamente con el grupo, ¿en cual obtuvo mejor puntuación?
8º.- Las puntuaciones obtenidas por un grupo de alumnos de una guardería en un test
de habilidad psicomotora han sido las siguientes:
Puntuaciones
Nº de Alumnos
[5,10 )
3
[10,15)
6
[15, 20)
[20, 25)
13
[25, 30)
Halla gráfica y analíticamente la mediana,
los cuartiles y los deciles de orden tres y
siete
7
2
9º.- En un grupo de alumnos de 1º de la ESO se ha aplicado una escala de actitud sobre
el cambio social, obteniéndose los siguientes resultados: 7, 12, 8, 12, 23, 9, 12, 34, 11,
13, 15. Calcula la media, la mediana y la desviación típica.
27
10º.- Se ha aplicado un test de agresividad a 40 alumnos, obteniéndose los siguientes
resultados
Puntuaciones
Nº de alumnos
[15 − 20)
2
[20 − 25)
8
[25 − 30)
13
[30 − 35)
[35 − 40)
7
[40 − 45)
6
[45 − 50)
3
1
a) Halla la agresividad media por persona.
b) ¿A partir de qué puntuación se encontrará el 25% con mayor agresividad de la
clase?
c) Calcula la desviación típica.
28
TEMA 4º.- DISTRIBUCIONES BIDIMENSIONALES
A) CONCEPTOS GENERALES
1.-VARIABLES ESTADÍSTICAS BIDIMENSIONALES.-
Hasta este momento hemos venido estudiando fenómenos en los que para cada
observación se obtenía una medida y en consecuencia una única variable. A estas
variables se les llaman unidimensionales.
A las variables estadísticas en las que se hace la observación de un fenómeno
respecto de dos modalidades se las llama Variables estadísticas bidimensionales.
Ejemplos:
1º.- Ingresos y gastos de cada una de las familias de una empresa.
2º.- Extensión en Km 2 y número de habitantes de los distintos países de Europa.
3º.- Notas de Matemáticas e Historia de una determinada clase.
Las variables estadísticas bidimensionales las representamos por (X, Y), donde
X es una variable unidimensional que toma los valores x1 , x 2 , x3 ,.....x n e Y es otra
variable unidimensional que toma los valores y1 , y 2 , y 3 ,...... y m por lo tanto la variable
estadística bidimensional (X, Y) toma los valores
( x1 , y1 ), ( x1 , y 2 ),....( x1 , y m ), ( x 2 , y1 ), ( x 2 , y 2 ),.....( x 2 , y m ),...............( x n , y1 ), ( x n , y 2 ),.....( x n , y m )
expresión que también se puede escribir: ( xi , y j ) con 1 ≤ i ≤ n y 1 ≤ j ≤ m .
2º.- TABLAS BIDIMENSIONALES
Se pueden presentar mediante una tabla simple o una tabla de doble entrada.
29
f ij
x1
y1
f 11
x1
y2
f 12
...
x1
...
ym
...
f 1m
x2
y1
f 21
x2
y2
f 22
...
x2
...
ym
...
f 2m
...
...
xn
...
...
y1
...
...
f n1
xn
y2
f n2
...
...
xn
ym
...
f nm
SIMPLE
yj
TABLA
xi
Tabla de doble entrada
X
x1
x2
……..….. xi ………….
xn
f11
f 21
………... f i1 ………….
f n1
TOTAL
Y
y1
n
∑f
i =1
y2
f 12
f 22
……….. f i 2 ………….
n
f n2
∑f
i =1
.
.
.
.
.
.
.
.
.
.
yj
f1 j
……….. f ij ………….
f2 j
.
.
.
.
.
.
.
.
.
ym
f1m
………. f im ………….
f 2m
n
∑f
i =1
m
TOTAL
j =1
m
1j
∑f
j =1
m
2j
…….. ∑ f ij …………
j =1
30
ij
.
n
f nm
∑f
i =1
∑f
i2
.
f nj
.
i1
m
∑f
j =1
im
n
nj
m
N = ∑∑ f ij
i =1 j =1
Ejemplo 1º.- Las calificaciones de 40 alumnos en Matemáticas y Lengua han
sido las siguientes:
(M, L) : (3,2), (3,2), (3,2), (3,2), (4,5), (4,5), (4,5), (4,5), (4,5), (4,5), (5,5), (5,5),
(5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (6,6), (6,6), (6,6), (6,6),
(6,7), (6,7), (6,7), (6,7), (6,7), (7,6), (7,6), (7,6), (7,6), (7,7), (7,7), (8,9), (10,10), (10,10)
Con estos datos, construye una tabla de doble entrada y otra simple. Consideremos
como valores de la variable X las notas de Matemáticas y como variable Y las de
Lengua
Tabla de doble entrada
X
3
4
5
6
7
Y
2
5
6
7
9
10
31
8
10
Tabla simple
xi
yi
fi
Así es que, según lo visto, se puede deducir que siempre es posible expresar una
tabla de doble entrada como una tabla simple.
Ejemplo 2º.- Consideremos la distribución dada por la siguiente tabla, donde X
representa la edad e Y el grado de psicomotricidad de un grupo de 44 minusválidos
mentales.
X
[ 5 – 7)
[7 – 9)
[9 – 11)
[11 – 13)
Y
[25 – 30)
4
3
[30 – 35)
2
7
2
[35 – 40)
1
1
11
[40 – 45)
1
2
[45 – 50)
7
13
13
11
1
14
6
8
3
3
11
44
Expresa esta tabla de doble entrada como una tabla simple
32
8
Años
X
Psicomotricidad Y
Nº de personas f i
33
3º.- DIAGRAMAS DE DISPERSIÓN
Acabamos de ver que los valores de una variable estadística bidimensional son
pares de números reales de la forma ( xi , y j ) .
Si representamos estos pares en un sistema de coordenadas, se obtiene un
conjunto de puntos sobre el plano. A este conjunto de puntos se llama Diagrama de
Dispersión o nube de puntos.
Ejemplo.- Representa los dos ejemplos anteriores en un sistema de coordenadas
Ejercicio1º
Y
34
X
Ejercicio 2º
Y
X
35
B.- CÁLCULO DE PARÁMETROS ESTADÍSTICOS
4º.- MEDIAS, VARIANZAS Y COVARIANZA
Consideremos una variable estadística bidimensional (X, Y) cuya distribución
viene dada por la tabla simple siguiente:
xi
yi
fi
x1
y1
f1
x2
y2
f2
x3
y3
f3
.
.
.
.
.
xn
.
.
yn
.
.
fn
n
∑f
i =1
i
Si consideramos las variables X e Y como variables unidimensionales,
sus medias aritméticas, Varianzas y desviaciones típicas son las siguientes:
n
- Media aritmética de X
x=
∑x
i =1
n
fi
i
∑f
i =1
i
n
- Media aritmética de Y
y=
∑y
i =1
n
i
∑f
i =1
fi
i
n
- Varianza de X
Sx =
2
∑ (x
i =1
i
− x) 2 f i
n
∑f
i =1
36
i
∑x
=
2
i
fi
−x
n
∑f
i =1
i
2
n
Sy =
∑(y
i =1
2
- Varianza de Y
i
− y) 2 f i
n
∑f
i =1
i
∑y
=
2
i
fi
−y
n
∑f
i =1
2
i
- Las desviaciones típicas de ambas variables sería la raíz cuadrada de las
varianzas y las representaremos por S x y S y .
Covarianza .- Se llama Covarianza de una variable bidimensional (X, Y) a la
media aritmética de los productos de las desviaciones de cada una de las
variables respecto a sus medias respectivas. La covarianza la vamos a
representar por S xy y su valor es:
n
S xy =
∑ ( xi − x)( yi − y) f i
i =1
n
∑f
i =1
n
=
∑x y
i
i
∑f
i
i =1
i
n
i =1
fi
− x y . Demuestra que esta
igualdad es cierta
Ejercicio1º.- Calcula las medias, varianzas y covarianza en la siguiente tabla que
se refiere a las notas de Matemáticas y Lengua de 40 alumnos.
Notas Mat
Notas Len
xi
yi
Nº alud.
fi
3
2
4
4
5
6
5
5
12
6
6
4
6
7
5
7
6
4
7
7
2
8
9
1
10
10
2
N= 40
37
Ejemplo 2º.- Consideremos la distribución dada por la siguiente tabla, donde X
representa la edad e Y el grado de psicomotricidad de un grupo de 44 minusválidos
mentales. Calcula las medias, varianzas y covarianza.
X
[5 – 7)
[7 – 9)
[9 – 11)
[11 – 13)
Y
[25 – 30)
4
3
[30 – 35)
2
7
2
[35 – 40)
1
1
11
[40 – 45)
1
2
[45 – 50)
7
13
13
38
8
11
1
14
6
8
3
3
11
44
C) CORRELACIÓN
5º.- CONCEPTO GENERAL DE CORRELACIÓN
Si nosotros dibujamos un diagrama de dispersión de una variable bidimensional
(X, Y), este puede adoptar diversas formas: puede ajustarse en mayor o menor medida a
una recta, a una curva o no ajustarse a nada.
Llamaremos Correlación a la teoría que trata de estudiar la relación o
dependencia que existe entre las dos variables que intervienen en la distribución
bidimensional.
Se dice que:
a) La correlación es lineal o curvilínea según que la nube de puntos se condense
entorno a una línea recta o a una curva.
b) La correlación es:
a.
positiva o directa cuando a medida que crece una variable la otra
también crece.
b. negativa o inversa cuando a medida que crece una variable, decrece
la otra.
c. nula cuando no existe relación alguna entre ambas variables. En este
caso, los puntos del diagrama están esparcidos al azar. En este caso,
se dice que las variables están incorreladas.
c) La correlación es de tipo funcional si existe una función tal que todos los
valores de la distribución la satisfacen.
Desde este momento, nos centraremos en el estudio de la correlación lineal.
6º.- COEFICIENTE DE CORRELACIÓN LINEAL
Para medir de forma más objetiva la correlación lineal entre las variables, se
utiliza el coeficiente de correlación lineal de Pearson que se define por la expresión
39
r=
S xy
S x .S y
.
Siendo:
S xy → Covarianza de (X, Y)
S x → Desviación típica de X.
S y → Desviación típica de Y.
Hagamos algunas observaciones al coeficiente que acabamos de definir:
1ª) El signo de r depende de la covarianza, ya que las desviaciones típicas
son siempre positivas, luego r puede ser mayor que cero, menor que cero o igual a cero:
•
Si r > 0 ⇒ La correlación es directa
•
Si r < 0 ⇒ La correlación es inversa
•
Si r = 0 ⇒ No existe correlación
2ª) El coeficiente de correlación verifica − 1 ≤ r ≤ 1 , así es que el grado
de dependencia entre las dos variables depende del valor que toma r:
•
Si r = −1 ⇒ Todos los valores de la variable bidimensional (X, Y) se
encuentran sobre una recta y se dice que existe una dependencia funcional.
•
Si − 1 < r < 0 ⇒ La correlación es negativa y será más fuerte cuanto más se
aproxime a -1 y más débil si se aproxima a cero. Existe una dependencia
aleatoria
•
Si r = 0 ⇒ No existe ningún tipo de relación entre las dos variables. En este
caso se dicen que las variables son aleatoriamente independientes.
•
Si 0 < r < 1 ⇒ La correlación es positiva y será más fuerte cuanto más se
aproxime a 1 y más débil si lo hace a cero. Existe una dependencia aleatoria.
•
Si r = 1 ⇒ Todos los valores de la variable bidimensional (X, Y) se
encuentran sobre una recta y se dice que existe una dependencia funcional.
Una idea de las distintas situaciones se puede obtener a partir de los siguientes
diagramas:
40
Y
Y
.
Y
. ..
.
....
.
. . . .
…. . .
.
. . . ……
…. .
.
.. .. …
…. .
.
.. . . ..
..…
r = −1
−1 < r < 0
X
Dependencia funcional
X
r=0
Dependencia aleatoria
Y
X
Independencia
Y
.
. ..
.
....
.
…. . .
.
…. .
.
…. .
.
..…
r=1
X
Dependencia funcional
0 < r <1
X
Dependencia aleatoria
Ejemplo 1º.- La temperatura media y la latitud de las capitales de algunos países
europeos es la siguiente
Capitales
Temperatura Latitud (º)
Capitales
Temperatura Latitud (º)
Ámsterdam
13
54
Dublín
13
53
Atenas
24
37
Lisboa
19
39
Bonn
13
52
Londres
14
53
Bruselas
14
52
Luxemburgo 14
50
Copenhague
11
54
Madrid
4
41
19
a) Estudiar si existe algún tipo de correlación entre ellas.
b) Analiza de qué tipo es
Ejemplo 2º.- Las calificaciones de 40 alumnos en Matemáticas y Lengua han
sido las siguientes
Notas Mat
Notas Len
Nº alud.
xi
yi
fi
3
2
4
4
5
6
5
5
12
6
6
4
6
7
5
7
6
4
7
7
2
8
9
1
10
10
2
N= 40
a) Estudiar si existe algún tipo de correlación entre ambas variables.
b) Analizar el tipo de dependencia que hay entre ellas.
42
Ejemplo 3º.- Se han clasificado 40 familias con arreglo al número de hijos e
hijas obteniéndose la siguiente tabla
X
0
1
2
3
4
4
3
1
5
6
Y
0
2
1
3
2
3
9
3
6
1
6
1
4
4
2
2
5
1
1
1
a) Estudiar si existe algún tipo de correlación o dependencia entre ambas
variables.
b) Analizar el tipo de dependencia.
43
D) REGRESIÓN
7º.- CONCEPTO GENERAL DE REGRESIÓN
Consideremos una variable estadística bidimensional (X, Y) para la que se ha
comprobado la existencia de una correlación fuerte entre las variables X e Y. En este
caso el análisis de la regresión permite obtener la ecuación de la función matemática
que mejor se ajusta al diagrama de dispersión, es decir, aquella línea que haga que las
sumas de las distancias de los puntos de la nube respecto de los correspondientes de la
línea sean lo menor posible.
A la hora de realizar el ajuste de una línea de regresión a una nube de puntos
existe la posibilidad de aproximar ésta mediante una recta, parábola, cúbica,
exponencial, etc.
En lo sucesivo nos limitaremos al estudio de la regresión lineal, al igual que
hicimos en la correlación.
Y
X
44
8.- ESTUDIO ANALÍTICO DE LA REGRESIÓN LINEAL
Supongamos que una vez estudiada la correlación lineal entre las dos variables,
se observa que están fuertemente correladas, pues se trata de encontrar la recta que más
se ajuste a la nube de puntos.
Consideremos X como variable independiente e Y como variable dependiente de
X, entonces la recta de regresión de Y sobre X (que se escribe Y/X) tiene de ecuación
y−y =
S xy
S x2
( x − x)
A partir de esta ecuación podemos calcular con cierta aproximación los valores
de “y” conociendo los de “x”, sin más que sustituir estos últimos en la ecuación.
Análogamente se puede obtener la recta de regresión de X sobre Y (X/Y). En
este caso la variable independiente es la Y y la dependiente X, siendo la ecuación de la
recta de regresión de X sobre Y
x−x =
S xy
S y2
( y − y)
A partir de esta recta podemos calcular con cierta aproximación los valores de la
x conocidos los de y.
La fiabilidad será mayor cuanto más próximo este “r” de -1 o de 1. Si r es muy
pequeño no tiene sentido hacer ningún tipo de estimación.
Eejmplo1º.- Si nos referimos a la tabla del ejemplo 1º de la pregunta 6ª).
Calcular la recta de regresión de X/Y y calcula la temperatura media esperada para una
ciudad que se encuentra situada a 47º de latitud norte.
45
Ejemplo 2º.-Calcula la recta de regresión de Y/X en el ejemplo 2º de la pregunta
6ª). ¿Cuál será la nota esperada en Lengua sabiendo que en Matemáticas ha obtenido un
4´5?
46
RELACIÓN DE EJERCICIOS. TEMA 4º
En los siguientes ejemplos de variables bidimensionales calcula:
a) Las medias y varianzas de X e Y
b) La covarianza de (X, Y)
c) Coeficiente correlación lineal. Interprétalo.
d) Tipo de dependencia que existe entre ambas variables
e) Si las variables están fuertemente correladas, calcula las ecuaciones de las
rectas de regresión
f) Realizar las estimaciones que se indiquen en cada caso
1º)
xi
2 3 4 5 6
yi
4 2 5 4 6
2º) Los gastos de publicidad de una empresa y sus correspondientes ventas, en miles de
euros, son las registradas en la siguiente tabla
Publicidad 1
Ventas
2
3
4
5
6
7
8
15 16 14 17 20 18 18 19
3º.- El número de bacterias por unidad de volumen, presentes en un cultivo después de
un cierto número de horas, viene expresado en la siguiente tabla
Nº de horas
0
1
2
3
4
5
Nº de bacterias por
12 19 23 34 56 62
unidad de volumen
¿Qué nº de bacterias cabe esperar que habrá, transcurridas 6 h 30 minutos?
4º.- Las tasa brutas de natalidad y mortalidad por cada mil habitantes, durante el año
2005, de algunos países europeos son las siguientes:
47
Países
Tasa de natalidad
Tasa de mortalidad
Alemania
14
13
Checoslovaquia
15
12
Dinamarca
11
10
España
13
7
Francia
14
10
Grecia
14
9
Holanda
12
8
Irlanda
20
9
Italia
11
10
Noruega
12
10
Portugal
15
9
Reino Unido
13
12
5º.- La tabla siguiente registra la altura y el peso de 60 hombres adultos
Talla (en m)
Peso (en Kg)
[1,55 – 1,65)
[1,65 – 1,75)
[1,75 – 1,85)
[55 – 65)
3
2
[65 – 75)
6
10
4
[75 – 85)
4
11
5
[85 – 95)
1
6
8
6º.- Las puntuaciones obtenidas por un grupo en una batería de test, mediante los que
se mide la habilidad verbal y el razonamiento abstracto son las siguientes:
Habil.
verbal
Razona-
[10 – 20)
[20 - 30)
[30 - 40)
[40 – 50)
[15 - 25)
5
3
-
-
[25 – 35)
2
6
1
-
[35 – 45)
-
1
4
2
[45 – 55)
-
-
3
3
[55 – 65)
-
-
1
2
miento abstracto)
48
¿Qué puntuación en razonamiento abstracto es previsible que obtenga un
alumno que obtuvo 45 en habilidad verbal?
7º.- El departamento de personal de una empresa encargó un estudio para conocer la
posible relación existente entre la edad y el absentismo de los trabajadores. Los datos
obtenidos son los de la siguiente tabla
Absentismo
(en días)
[0 – 5)
[5 - 10)
[10 - 15)
[15 – 20)
[15 - 25)
-
3
7
1
[25 – 35)
-
6
2
-
[35 – 45)
1
3
2
-
[45 – 55)
2
5
1
-
[55 – 65)
3
2
-
1
Edad
49
TEMA 5º.- COMBINATORIA. BINOMIO DE NEWTON
1º- INTRODUCCIÓN
La combinatoria se ocupa del estudio y propiedades de los distintos grupos que
pueden formarse con los elementos de un determinado conjunto, diferenciándose entre
si:
- Por el número de elementos que entran en cada grupo.
- Por la clase de elementos.
- Por el orden de colocación.
Se estudian tres clases diferentes de agrupaciones:
•
Las Variaciones Ordinarias y las Variaciones con repetición.
•
Las Permutaciones Ordinarias y las Permutaciones con repetición.
•
Las Combinaciones Ordinarias y las combinaciones con repetición.
2º.- VARIACIONES ORDINARIAS
Llamaremos variaciones ordinarias o sin repetición, de m elementos tomados de
n en n, a los diferentes grupos que se pueden formar, con los m elementos de manera
que:
-
En cada grupo entren n elementos diferentes.
-
Dos grupos son diferentes si se diferencian en el orden de colocación o en
algún elemento nuevo.
(m ≥ n)
Ejemplo1º.- Forma todos los números de dos cifras diferentes que se pueden
formar con los dígitos (1,2,3,4)
12,13,14,21,23,24,31,32,34,41,42,43.
Ejemplo 2º.- Forma ahora los de tres cifras
50
123.124.132.134.142.143.213.214.232.234.241.243.312.314.321.324.341.342.412.413.
421.423.431.432
El número de variaciones ordinarias de m elementos tomados n a n lo
escribiremos V nm y su valor será:
Vmn = m(m − 1)(m − 2).........(m − n + 1)
Ejemplos:
1º.- Calcula V72 ;V64 ;V103 .
2º.- Resuelve la ecuación Vm4 = 12Vm2 .
3º.- ¿De cuántas formas posibles se pueden sentar 12 personas en un banco que
tiene 3 plazas?.
4º.- ¿Cuántas palabras de tres letras diferentes, con significado o sin él, se
pueden formar con las letras del abecedario español?
3º.- VARIACIONES CON REPETICIÓN.
Variaciones con repetición de m elementos tomados n a n son los distintos
grupos que se pueden formar con los m elementos, de manera que:
-
En cada grupo entren n elementos repetidos o no.
-
Dos grupos son diferentes si se diferencian en el orden de colocación o en
algún elemento nuevo.
El número de variaciones con repetición de m elementos tomados n a n se
representa por VRmn o también VRm ,n y su valor es:
VRmn = m n
Ejemplos
51
1º.- Escribe todos los números de dos cifras que se puedan formar con los dígitos
(1, 2, 3, 4 ).
11,12,13,14,21,22,23,24,31,32,33,34,41,42,43,44.
2º.- Calcula VR32 ;VR23 ;VR25 .
3º.- Resuelve la ecuación
VR x2 + 5VR x2− 2 = 244
4º.- Se lanzan tres dados de diferentes colores una vez. ¿Cuántos resultados
distintos se pueden obtener?.
4º.- PERMUTACIONES ORDINARIAS.
Permutaciones ordinarias o sin repetición de n elementos son los distintos
grupos que se pueden formar con los n elementos de manera que:
-
En cada grupo entren los n elementos.
-
Un grupo se diferencie de otro en el orden de colocación.
Cuando en las variaciones m = n, entonces se les llama permutaciones de n y se
representa por
Pn y su valor es:
Pn = n(n − 1)(n − 2)...........2.1
Ejemplos
1º.- Escribe todos los números de tres cifras que podemos formar con los dígitos
(2, 4, 6 )
246, 264, 426, 462, 624, 642.
2º.- ¿De cuántas formas podemos ordenar los 10 alumnos de una clase?
3º.- ¿De cuántas formar se pueden sentar 5 personas en una mesa circular?
52
5º.- FACTORIAL DE UN NÚMERO
Sea “n” un número natural mayor que 1. Se llama factorial de “n” y lo
escribiremos n!, al producto de los n primeros números naturales.
n!= n(n − 1)(n − 2)...........3.2.1 .
Si
n = 1 ⇒ 1!= 1
Por convenio
n = 0 ⇒ 0!= 1
Como podemos observar, Pn = n! y Vmn =
m!
.
(m − n)!
Ejemplos
1º.- Calcula 4!, 6!, 5!.
2º.- Simplifica las siguientes expresiones:
(n + 1)! ( x + 6)!
;
(n − 1)! ( x + 4)!
6. PERMUTACIONES CON REPETICIÓN
Permutaciones con repetición de n elementos donde el primero se repite
a1 − veces , el segundo a 2 − veces , ………..el k-ésimo a k − veces , donde
(a1 + a 2 + .......... + a k = n) , son los distintos grupos que se pueden formar, de manera
que:
-
En cada grupo entren todos los elementos.
-
Un grupo se diferencie de otro sólo en el orden de colocación.
Estas permutaciones se representan y su valor es el siguiente
Pna1 , a2 ,......ak =
n!
a1!a 2 !.........a k !
53
Ejemplos
1º.- Calcula todos los números de 5 cifras que se pueden formar con los dígitos 1
y 2, sabiendo que el 1 entra tres veces y el 2 dos veces.
2º.- ¿De cuántas formas se pueden alinear 8 signos + y 6 signos -,?.
3º.- ¿Cuántas palabras diferentes se pueden formar con las letras de la palabra
CASCADA?.
7.- COMBINACIONES
Combinaciones ordinarias o sin repetición de m elementos tomados n a n
(n ≤ m) son los distintos grupos que se pueden formar con los m elementos, de manera
que:
-
En cada grupo entren n elementos distintos.
-
Dos grupos son diferentes si se diferencian en algún elemento.
El número de combinaciones de m elementos tomados n a n lo escribiremos
C m , n ó C mn y su valor es:
C mn =
Vmn
Pn
Ejemplos
1º.- Calcula y escribe todas las combinaciones de tres elementos que podemos
formar con las letras {a, b, c, d, e}.
V53 5.4.3
C =
=
= 10
P3 3.2.1
3
5
abc, abd, abe, acd, ace, ade, bcd, bce, bde, cde.
2º.- ¿Cuántos triángulos distintos se pueden formar con 8 puntos en el plano si
tres de ellos nunca están alineados?.
54
C83 =
V83 8.7.6
=
= 56
P3 3.2.1
8.- NÚMEROS COMBINATORIOS. PROPIEDADES
8.1.- Números Combinatorios.- El número C mn se llama también número
combinatorio y se representa por
( ) y se lee m sobre n siendo su valor
m
n
( ) = n!(mm−! n)!
m
n
Con estos números combinatorios
Podemos observar que este triángulo
podemos formar el triángulo
coincide con este otro
( )( )
( )( )( )
( )( )( )( )
( )( )( )( )( )
1
0
2
0
2
1
3
0
4
0
1
1
3
1
4
1
2
2
3
2
4
2
1 1
1 2 1
3
3
4
3
1 3 3 1
4
4
1 4 6 4 1
................……....
……………..
…………………..
…………….……..
( )( )( )..............( )
n
0
n
1
n
2
n
n
…………………………
Este triángulo es conocido con el nombre de triángulo de Pascal o triángulo de
Tartaglias.
8.2.- Propiedades de los números combinatorios:
1º)
2º)
( )=1
m
0
( )=1
m
m
Todas las filas son simétricas
55
( )= ( )
m
n
m
m− n
3º)
( )+ ( ) = ( )
m
n −1
m +1
n
m
n
Demuestra estas propiedades.
9º.- RESUMEN DE COMBINATORIA
Para saber distinguir entre variaciones, permutaciones y combinaciones ante un
determinado problema, debemos hacernos las siguientes preguntas
Hay repetición
Influye el orden
NO
Entran todos los
Tipo de
elementos
combinatoria
SI
SI
P
NO
V
NO
C
SI
SI
SI
PR
NO
VR
NO
CR
10.- BINOMIO DE NEWTON
A los números combinatorios se les da gran utilidad para calcular (a ± b )
(a + b )n
=
( )a b + ( )a
n −1 1
( )a
n−2
b 2 + ................... +
( )a b
n
(a + b )n
=
( )a b − ( )a
n −1 1
( )a
n−2
b 2 − ................... ±
( )a b
n
n
0
n
0
n
n
0
0
n
1
n
1
b +
b +
n
2
n
2
n
n
n
n
0
0
Esta expresión es conocida con el nombre de Binomio de Newton
56
n
Ejemplo.- Desarrolla las siguientes expresiones
a) (3 + 2 x ) =
5
b) (1 − x ) =
4
Si quisiéramos calcular un término cualquiera “k” en el desarrollo de (a + b )
Tk =
( )a
n
k −1
n − k +1
b k −1
Si quisiéramos calcularlo en el desarrollo de (a − b ) , tendríamos que
n
Tk = (− 1)
( )a
k −1 n
k −1
n − k +1
b k −1
Ejemplo 1º.- Calcula el término quinto en el desarrollo ( x + 2 )
20
Ejemplo 2º.- Calcula el término sexto en el desarrollo de ( x − 2 )
6
57
n
RELACIÓN DE EJERCICIOS. TEMA 5
1º.- Un estudiante tiene que contestar 8 de las 10 preguntas de un examen. ¿De cuántas
formas diferentes puede contestar? ¿Y si las tres primeras son obligatorias? ¿Y si de
las cinco primeras ha de contestar a cuatro?
2º.- Para jugar al dominó, 7 fichas hacen un juego. Sabiendo que tiene 28 fichas
¿Cuántos juegos diferentes se pueden hacer?
3º.- Hallar el nº mínimo de habitantes que debe tener una ciudad para que sea
inevitable que al menos dos habitantes tengan las mismas iniciales de su nombre y dos
apellidos. (Suponemos que el alfabeto tiene 28letras)
4º.- El séxtuplo del número de combinaciones que se pueden formar con “m” objetos
tomados de tres en tres es igual al número de variaciones que se pueden formar con
m-1 objetos tomados de cuatro en cuatro. Calcula “m”, sabiendo que es mayor que 4.
5º.- La diferencia entre el número de variaciones binarias de “m” objetos y el de
combinaciones binarias de los mismos “m” objetos es 136. Calcula “m”.
6º.- En las variaciones sin repetición que podemos formar con las nueve cifras
significativas tomadas de tres en tres, ¿cuántas veces está la cifra 7?
7º.- ¿Cuántas palabras de 12 letras se pueden formar con la palabra AYUNTAMIENTO
de tal manera que siempre comiencen y terminen por vocal?
8º.- Con una baraja de 52 cartas, ¿cuántos grupos diferentes de cinco cartas se pueden
formar?
9º.- ¿Cuántas apuestas hay que rellenar en las quinielas de fútbol para tener la
seguridad de acertar cinco resultados?
10.- De un grupo de 12 alumnos deben formarse tres equipos de cuatro participantes
para que asistan a tres pruebas diferentes. ¿De cuántas formas diferentes podemos
formarlos?
11.- ¿Cuál de las siguientes expresiones tiene mayor valor?
12º.- ¿Cuántos tetraedros determinan ocho puntos del espacio de forma que cuatro
cualesquiera de ellos no sean coplanarios?
13º.- ¿Cuántas palabras de 10 letras diferentes pueden formarse con cinco vocales y
cinco consonantes dadas, de manera que no haya dos vocales ni dos consonantes juntas
58
14º.- En un departamento de una empresa trabajan 4 hombres y 3 mujeres. Desean que
le hagan una fotografía de forma que estén todos los hombres juntos y las mujeres
también. ¿De cuántas formas deferentes pueden colocarse?
15º.- Cuántos resultados distintos se obtienen al lanzar tres dados iguales al aire? ¿Y si
los dados son diferentes?
16º.- Con los dígitos pares, ¿cuántos números inferiores a 1000 se pueden formar?
17º.- Calcula el número de diagonales que tiene un polígono de 12 lados.¿Y el de n
lados?
18º.- Se disponen ocho monedas en una fila. La mitad de ellas son de euro y la otra
mitad de 50 céntimos. ¿De cuántas formas distintas se pueden ordenar?
19º.- Calcula los siguientes desarrollos
1

a )  2x- 
x

6
b) ( senx + cos x )
4
20º.- Calcula el término que se indica en los siguientes desarrollos
a) El término central de ( 2x + x 2 )
2

b) El término 10 de  a 2 − 
a

20
30
21º.- ¿Existe algún término en el desarrollo ( x 2 − 2 x 3 ) que contenga x115? En caso
40
afirmativo calcúlalo.
59
TEMA 6º.- SUCESOS ALEATORIOS. PROBABILIDAD
A) SUCESOS ALEATORIOS
1º.- EXPERIMENTOS ALEATORIOS
Llamaremos experimento aleatorio aquel que al repetirlo en análogas
condiciones jamás se puede predecir el resultado que se va a obtener.
Cuando se puede predecir el resultado al experimento se le denomina
determinista.
Son ejemplos de experimentos aleatorios:
-
Extraer una carta de una baraja española.
-
Lanzar una moneda y ver la cara que sale
-
Lanzar un dado.
-
Abrir un libro al azar y anotar el número de página, etc.
Son experimentos deterministas:
-
Arrojar una piedra al vacío y medir su aceleración.
-
Medir la longitud de una circunferencia de radio 5 m.
-
Abrir las compuertas de un estanque lleno de agua. Etc.
2º.- ESPACIO MUESTRAL
Llamaremos espacio muestral de un experimento aleatorio al conjunto de todos
los resultados posibles del experimento. A cada elemento del espacio muestral lo
llamaremos punto muestral o suceso simple. Al espacio muestral de un experimento lo
designaremos por la letra E y cada uno de sus elementos los designaremos con letras o
números.
Ejemplo.- Calcula el espacio muestral en los siguientes experimentos
a) Lanzar una moneda
b) Lanzar dos monedas.
c) Lanzar un dado.
d) Lanzar dos dados.
e) Lanzar un dado y una moneda.
60
3º.- SUCESOS ALEATORIOS
Se llama suceso de un experimento aleatorio a cada uno de los subconjuntos del
espacio muestral E.
Al conjunto de todos los sucesos de un experimento aleatorio se denomina
espacio de sucesos y se designa por P(E).
Ejemplo.- Determina el espacio de sucesos en los siguientes casos
a) Lanzar una moneda
b) Lanzar un dado de quinielas.
Como se puede observar existe una relación entre el número de elementos del
espacio muestral y el número de elementos del espacio de sucesos.
Si el número de elementos de E es igual a n, entonces el número de elementos de
P(E) =
Diremos que un suceso A se verifica, se realiza o se presenta, si al efectuar una
prueba del experimento aleatorio obtenemos como resultado uno de los sucesos simples
que componen el suceso A.
4º.- TIPOS DE SUCESOS
A) Sucesos Elementales.- Son los formados por un solo punto muestral.
B) Sucesos Compuestos.- Son los formados por dos o más puntos muestrales.
C) Suceso Cierto o Seguro.- Es el que siempre se verifica, este suceso está
formado por todo el espacio muestral.
D) Suceso Imposible.- Es el que no se verifica nunca, se designa por φ .
5º.- SUCESOS CONTRARIOS
Dado un suceso cualquiera A del espacio de sucesos P(E), llamaremos suceso
contrario del suceso A a un suceso que se verifica cuando no se verifica A, y
recíprocamente.
61
Al suceso contrario de A se representa por A .
El suceso A está formado por los puntos muestrales de E que no están en A.
Se verifica que:
E =φ
y
φ=E
Ejemplo.- Se el experimento aleatorio que consiste en el lanzamiento de un
dado. Calcula los sucesos contrarios de los siguientes sucesos
Sucesos
Sucesos contrarios
A = {1,2,5}
B = {1,3}
C = {4}
D = {1,3,5,6}
E = {1,2,3,4,5,6}
F =φ
6º.- OPERACIONES CON SUCESOS
6.1.- Unión de sucesos.- Dados dos sucesos A y B de un mismo experimento
aleatorio, llamaremos suceso unión de A y B al suceso que se verifica cuando lo hace A
o B.
El suceso A unión B se representa por A ∪ B , o también A ó B.
El suceso A unión B está formado por los puntos muestrales de A o de B.
6.2.- Intersección de sucesos.- Dados dos sucesos A y B de un mismo
experimento aleatorio, llamaremos suceso intersección de A y B al suceso que se
verifica cuando se verifican simultáneamente A y B.
El suceso A intersección B se representa por A ∩ B , o también A y B.
El suceso A intersección B está formado por los puntos muestrales comunes a A
y a B.
Ejemplo 1º.- Consideremos el experimento aleatorio de lanzar un dado. Sean los
sucesos:
A= salir nº par
A = {2,4,6}
B= Salir nº primo
B = {1,2,3,5}
62
Calcula los sucesos:
Salir nº par o nº primo =
Salir nº par y nº primo =
Ejemplo 2º.- Sea el experimento que consiste en la extracción de una carta de
una baraja española. Consideremos los siguientes sucesos:
A = salir oro; B = Salir as; C = Salir rey de copas o as de espadas.
Interpreta los siguientes sucesos: A ∪ B; A ∪ C ; B ∪ C ; A ∩ B; A ∩ C ; B ∩ C .
En el ejemplo anterior hemos visto que en algunas ocasiones la intersección de
dos sucesos es el suceso imposible. Cuando esto ocurre, es decir, cuando es imposible
que dos sucesos se verifiquen simultáneamente, decimos que dichos sucesos son
incompatibles
Si A ∩ B = φ ⇒ A y B son incompatibles.
Si A ∩ B ≠ φ ⇒ A y B son compatibles.
7º.- ÁLGEBRA DE BOOLE DE SUCESOS
Sea E el espacio muestral de un determinado experimento y sea P(E) el espacio
de sucesos asociado. La unión e intersección de sucesos definidas anteriormente,
verifican las siguientes propiedades:
Unión
Intersección
1.- Asociativa
( A ∪ B ) ∪ C = A ∪ (B ∪ C ) ( A ∩ B ) ∩ C = A ∩ (B ∩ C )
2.- Conmutativa
A∪ B = B ∪ A
A∩ B = B ∩ A
3.- Idempotente
A∪ A = A
A∩ A = A
4.- Simplificativa
A ∪ ( B ∩ A) = A ;
5.- Distributiva
A ∪ (B ∩ C ) = ( A ∪ B ) ∩ ( A ∪ C )
A ∩ ( B ∪ A) = A
A ∩ (B ∪ C ) = ( A ∩ B ) ∪ ( A ∩ C )
6.- Todo suceso A del espacio de sucesos tiene otro que llamamos contrario de A, y
representamos por A , que verifica:
7.- Leyes de Morgan:
A∪ A = E
A∪ B = A∩ B
y
63
y
A∩ A =φ
A∩ B = A∪ B
Por verificar las seis primera propiedades, se dice que el conjunto P(E) con las
operaciones de ∪ e ∩ tiene estructura de Álgebra de Boole.
8º.- EXPERIMENTOS COMPUESTOS
A los experimentos formados por varios experimentos simples se les llaman
experimentos compuestos.
Ejemplo.- Consideremos un experimento aleatorio que consiste en el
lanzamiento de un dado y una moneda. El espacio muestral asociado al experimento
compuesto de este ejemplo es:
E = {(1, c), (2, c), (3, c), (4, c), (5, c), (6, c), (1, x), (2, x), (3, x), (4, x), (5, x), (6, x)}
A este espacio muestral se le llama espacio compuesto o espacio producto.
64
B) PROBABILIDAD
9º.- DEFINICIÓN
Laplace definió la probabilidad de la siguiente forma:
La probabilidad de un suceso A es el cociente entre el número de casos
favorables al suceso y el número de casos posibles.
Si indicamos la probabilidad del suceso A por P(A) entonces
Nº de casos favorables
P ( A) = − − − − − − − − − − − − − − −
Nº de casos posibles
A la hora de aplicar esta definición hay que tener en cuenta que los sucesos
elementales tienen que ser igualmente probables (Equiprobables).
Los casos posibles son todos los resultados del experimento, es decir, todos los
elementos del espacio muestral.
Los casos favorables son los elementos que componen el suceso A.
Ejemplo 1º.- Se considera el experimento de lanzar un dado. Calcula la
probabilidad de obtener:
a) Nº impar
b) Nº primo
c) Múltiplo de tres.
d) Múltiplo de cinco.
Ejemplo 2º.- Se lanzan dos monedas. Halla la probabilidad de:
a) Obtener dos caras
b) Obtener dos cruces.
c) Obtener una cara y una cruz
d) Obtener al menos una cruz.
10.- DEFINICIÓN AXIOMÁTICA DE LA PROBABILIDAD.
Se llama probabilidad a una función
65
P : P( E ) → [0,1] que verifica:
a) P ( A) ≥ 0; ∀A ∈ P ( E )
b) P ( E ) = 1 .
c) Si A y B son incompatibles. Entonces P ( A ∪ B ) = P ( A) + P ( B )
De estos axiomas se deducen las siguientes consecuencias:
1ª) P ( A) = 1 − P ( A) . Demostración:
2ª) P (φ ) = 0 . Demostración:
11º.- PROBABILIDAD DE LA UNIÓN DE SUCESOS
Distinguiremos dos casos:
a) Cuando los sucesos son incompatibles P ( A ∪ B ) = P ( A) + P ( B ) . Esto puede
ser ampliable a n-sucesos incompatibles dos a dos de la forma
P( A1 ∪ A2 ∪ ........ ∪ An ) = P( A1 ) + P( A2 ) + ........... + P( An )
b) Cuando los sucesos son compatibles se verifica que
P( A ∪ B) = P( A) + P( B) − P( A ∩ B) . Si son tres sucesos A,B,C entonces
P( A ∪ B ∪ C ) = P( A) + P( B) + P(C ) − P( A ∩ B) − P( A ∩ C ) − P( B ∩ C ) + P( A ∩ B ∩ C )
Ejemplo 1º.- Una bolsa contiene bolas numeradas del uno al ocho. Se realiza un
experimento que consiste en extraer una bola de la bolsa y anotar su número.
Consideremos los siguientes sucesos: A = <salir par>; B = <salir impar>; C = <salir
múltiplo de 4>. Calcular las siguientes probabilidades:
P( A ∪ B) =
P( A ∪ C ) =
P( B ∪ C ) =
Ejemplo 2º.- Se realiza un experimento que consiste en la extracción de una
carta de una baraja española. Consideremos los sucesos A = < obtener un oro >;
B = < obtener un rey >; C = < obtener el as de espadas >. Hallar la probabilidad
de: A ∪ B; A ∪ C ; B ∪ C
66
12.- PROBABILIDAD CONDICIONADA
Se llama probabilidad condicionada del suceso B con respecto al suceso A, y la
denotaremos P(B/A), al cociente siguiente:
P( B / A) =
P( A ∩ B)
si P ( A) ≠ 0 .
P( A)
Análogamente se define la probabilidad condicionada de A respecto de B y se
escribe P(A/B).
P( A / B) =
P ( B ∩ A)
P( B)
De estas dos igualdades se obtiene que
P ( A ∩ B ) = P ( B / A).P ( A)
P ( A ∩ B ) = P ( A / B ).P ( B )
Ejemplo 1º.- Se extraen, sucesivamente, dos cartas de una baraja española. ¿Cuál
es la probabilidad de obtener dos reyes?
Ejemplo 2º.- De una urna que contiene 9 bolas rojas y 5 negras se extraen
sucesivamente dos bolas. Halla la probabilidad de los siguientes sucesos:
a) Que las dos bolas sean negras
b) Que las dos bolas sean rojas
c) Que la primera sea roja y la segunda negra.
d) Que una sea roja y la otra negra.
Cuando ocurre que la P(B/A)=P(B). Entonces los sucesos A y B son
independientes. En este caso se verifica que
P ( A ∩ B ) = P ( A).P ( B / A) = P ( A).P ( B )
P ( A ∩ B ) = P ( A).P ( B )
En el caso contrario los sucesos se dicen que son dependientes.
67
13.- TEOREMA DE LA PROBABILIDAD COMPUESTA
Sean A1 , A2 ,........ An sucesos cualesquiera de un mismo experimento aleatorio.
Entonces se verifica:
a) Si A1 , A2 ,........ An son independientes. Entonces
P( A1 ∩ A2 ∩ ........ ∩ An ) = P( A1 ).P ( A2 )......P( An )
b) Si A1 , A2 ,........ An son dependientes. Entonces
P( A1 ∩ A2 ∩ ........ ∩ An ) = P( A1 ).P( A2 / A1 ).P( A3 / A1 ∩ A2 ).....P( An / A1 ∩ A2 .... ∩ An −1 )
14.- TEOREMA DE LA PROBABILIDAD TOTAL
Sean A1 , A2 ,........ An un conjunto de sucesos incompatibles dos a dos, es decir
Ai ∩ Aj = φ ; ∀i ≠ j y A1 ∪ A2 ∪ ...... ∪ An = E . Sea B un suceso cualquiera, entonces se
verifica:
n
P ( B ) = P ( A1 ).P ( B / A1 ) + P ( A2 ).P ( B / A2 ) + ... + P ( An ).P ( B / An ) = ∑ P ( Ai ) P ( B / Ai )
i =1
Ejemplo 1º.- Una empresa de productos lácteos elabora sus productos en 4
factorías A, B, C y D. Las cuotas de producción de cada factoría y el porcentaje de
productos con envasado incorrecto son los siguientes.
A
B
C
D
Cuotas de producción
0´4
0´3
0´2
0´1
Envasado incorrecto
0´01
0´02
0´07
0´04
Si se toma un producto de esta marca al azar. ¿Cuál es la probabilidad de que
esté defectuosamente envasado?.
68
Ejemplo 2º.- Un encuestador visita una finca que tiene tres patios a una
determinada hora del día. En el primer patio hay 10 pisos, de los que 4 están vacíos a
esa hora. En el segundo patio hay 14 pisos, estando 5 vacíos. En el tercer patio hay 10
pisos, 5 de ellos vacíos. El encuestador elige un patio al azar y, dentro de ese patio, un
piso también al azar.
Si sólo aceptan ser encuestados el 70% de las personas a las que se les pide.
¿Cuál es la probabilidad de que el encuestador consiga una entrevista con sólo llamar a
una puerta?
15.- FÓRMULA DE BAYES
Sean A1 , A2 ,........ An un conjunto de sucesos incompatibles dos a dos y
A1 ∪ A2 ∪ ...... ∪ An = E . Sea B un suceso cualquiera. Entonces se verifica:
P( Ai / B) =
P( Ai ∩ B)
P( B)
P ( B / Ai ) =
y
P ( B ∩ Ai )
P ( Ai )
De ambas igualdades
tenemos que:
P( Ai / B).P( B) = P( B / Ai ).P( Ai ) ⇒ P( Ai / B ) =
P( B / Ai ).P ( Ai )
P( B / Ai ).P( Ai )
= n
.
P( B)
∑ P( Ai ) P( B / Ai )
i =1
P( Ai / B) =
P( B / Ai ).P( Ai )
n
∑ P( A ) P( B / A )
i =1
i
i
69
TEOREMA DE BAYES
Si observamos el numerador es uno de los sumandos del denominador.
Ejemplo.- Supongamos el ejemplo de la empresa láctea. Supongamos que
hemos tomado un producto al azar y ha salido defectuoso. ¿Qué probabilidad hay que
proceda de la factoría A? ¿De qué factoría es más probable que proceda?
Ejercicios:
1º.- Lanzamos una moneda y si sale cara cogemos una bola de una urna que contiene 5
bolas negras y 8 blancas y si sale cruz la cogemos de otra urna que contiene 4 negras y
10 blancas. Calcular la probabilidad de que si hemos elegido una bola al azar y nos ha
salido blanca, esta sea de la primea urna.
2º.- Se lanzan dos monedas al aire. Si salen dos caras se extrae una bola de una urna 1,
que contiene 2 bolas blancas y 3 negras. Si sale cara y cruz, se extrae la bola de una
urna 2, que contiene 4 blancas y 1 negra. Si salen dos cruces, se extrae de una urna 3,
que contiene 1 blanca y 5 negras.
a) ¿Cuál es la probabilidad de obtener bola blanca?
b) Si hemos obtenido bola negra, ¿cuál es la probabilidad de que haya sido
extraída de la urna 2?
70
3º.- En un estudio realizado sobre accidentes de automóviles se sabe que las
probabilidades de tener un accidente debido a fallos mecánicos ( A1 ) es 0´1, a fallos
humanos ( A2 ) 0´5, y a defectos de la carretera ( A3 ) 0´4.
a) Sea B = << U conductor determinado tenga un accidente >>. Calcula la
probabilidad de B sabiendo que la
P( B / A1 ) = 0´25; P( B / A2 ) = 0´35; P( B / A3 ) = 0´05 .
b) Sabiendo que el conductor tuvo un accidente, halla la probabilidad de
que haya sido por fallo humano.
4º.- Una empresa tiene dos factorías. En la factoría uno produce el 65% de sus
productos, siendo del 0´5% la probabilidad de que sean defectuosos y del 1´5% de que
sean defectuosos en la factoría dos. Se observa un artículo en el mercado y resulta
defectuoso. ¿Cuál es la probabilidad de que provenga de la factoría uno? ¿Y de la dos?.
71
RELACIÓN DE EJERCICIOS. TEMA 6
1º.- ¿Cuál es la probabilidad de que al lanzar dos dados salga por suma, o bien tres, o
bien cuatro, o bien cinco?
2º.- Se lanzan al aire tres monedas. Determina la probabilidad de obtener al menos dos
cruces
3º.- Una urna contiene ocho bolas rojas, cinco amarillas y siete verdes. Se extrae una al
azar. Determinar la probabilidad de que:
a) Sea roja o verde
b) No sea roja
4º.- Se lanzan simultáneamente dos dados con las caras numeradas del 1 al 6. Hallar la
probabilidad de que la suma de los puntos obtenidos sea menor que siete
5º.- Se ha trucado una moneda de tal forma que la probabilidad de obtener cara es
triple que la probabilidad de obtener cruz. ¿Cuál es la probabilidad de cada suceso
elemental?
6º.- Un dado está trucado de modo que la probabilidad de obtener las distintas caras es
directamente proporcional a los números de éstas. Se pide:
a) La probabilidad de cada una de las caras
b) La probabilidad de sacar un número par
7º.- Halla la probabilidad de un suceso, sabiendo que la suma de su cuadrado y la del
cuadrado de la probabilidad del suceso contrario es igual a 5/9.
8º.- A un congreso de científicos asisten 100 congresistas, de ellos 80 hablan francés y
40 inglés. ¿Cuál es la probabilidad de que dos congresistas elegidos al azar no puedan
entenderse sin intérprete?
9º.- Se ha comprobado que en una ciudad está, enfermos con diarrea el 60% de los
niños, con sarampión el 50% y el 20% con ambas enfermedades.
a) Calcular la probabilidad de que elegido un niño al azar, esté enfermo con
diarrea o sarampión o ambas enfermedades.
b) En un colegio con 450 niños, ¿cuántos cabe esperar que estén enfermos con
diarrea o sarampión?
10º.- Se lanzan tres dados al aire. Calcular la probabilidad de que se obtenga:
a) Un cuatro en cada uno
b) Suma total de puntos igual a ocho.
72
11º.- Sean A, B y C tres sucesos independientes tales que p(A)=0´2, p(B)=0´8 y
p(C)=0´7. Hallar la probabilidad de los sucesos siguientes: A ∪ B , A ∪ C y
A∪ B ∪C .
12º.- Un producto está formado por tres partes: A, B y C. El proceso de fabricación es
tal que la probabilidad de un defecto en A es 0´03; de un defecto en B es 0´04 y de un
defecto en C es 0´08. ¿Cuál es la probabilidad de que el producto no sea defectuoso?
13º.- La probabilidad de que una bomba haga blanco en el objetivo es 1/3. Hallar la
probabilidad de alcanzar el objetivo si se tiran tres bombas seguidas.
14º.- A un paciente se le aplican tres sueros independientes con probabilidades de éxito
0´9, 0´95 y 0´92. Hallar la probabilidad de que el paciente se cure.
15º.- Se tiene un dado con tres caras y tres caras rojas y otro con dos caras blancas y
cuatro rojas. Se realiza el experimente consistente en lanzar ambos dados y observar
los colores obtenidos. Se pide:
a) Escribir el espacio muestral
b) Hallar la probabilidad de los siguientes sucesos
•
A= ”Obtener dos caras rojas”
•
B= ”Que al menos una cara sea roja”
•
C= “Obtener dos caras del mismo color”
16º.- Una urna contiene tres bolas rojas, dos blancas y una azul y otra urna contiene
dos rojas, dos blancas y una amarilla. Se saca, al azar, una bola de cada urna y se
anota el color. Se pide:
a) Espacio muestral
b) Escribir los sucesos: A= “Las dos bolas son rojas”; B= “Las dos bolas son
del mismo color”.
c) Calcular p(A); p(B); p(A y B); p(A ó B)
17º.- Se lanzan simultáneamente un dado y una moneda. Se pide:
a) Espacio muestral
b) Calcular p(A) y p(B) siendo A= “El número del dado es mayor que 3 y en la
moneda cara” y B= “En la moneda sale cruz”
18º.- Una urna contiene tres bolas rojas y dos verdes y otra contiene dos rojas y tres
verdes. Se toma al azar una bola de cada urna:
a) Escribir el espacio muestral
73
b) Calcular la probabilidad de los sucesos: A= “Ambas bola sean del mismo
color” B= “Ambas bolas sean de distinto color”
19º.- Se lanza una moneda y si sale cara se saca una bola de una urna que contiene 3
bolas rojas y 2 negras y si sale cruz sacamos la bola de otra urna que contiene 5 rojas y
6 negras. Calcular la probabilidad de:
a) Obtener bola roja
b) Obtener bola negra
c) Sabiendo que la
bola obtenida ha sido roja cual es la probabilidad de que sea de la primera urna.
20º.- Con los jugadores de un club de fútbol se forman dos equipos para jugar un partido de
entrenamiento; entre los dos equipos se reúnen 6 defensas, 8 medios, 6 delanteros y 2 porteros.
El entrenador sabe que en estos partidos, la probabilidad de que se lesione un jugador es 0.22
si es delantero, 0.11 si es medio, 0.055 si es defensa y 0 si es portero.
a) Calcula la probabilidad de que se lesionen uno cualquiera de los jugadores en este
partido
b) Si se sabe que un jugador se ha lesionado, determinar la probabilidad de que haya sido
un defensa.
21º.- Tras un estudio estadístico en una ciudad se observa que el 70% de los motoristas son
varones y, de estos, el 60% llevan habitualmente el casco. El porcentaje de mujeres que
conducen habitualmente con casco es del 40%. Se pide:
a) Calcular la probabilidad de que un motorista elegido al azar lleve casco.
b) Se elige un motorista al azar y se observa que lleva casco. ¿Cuál es la probabilidad de
que sea varón?
22º.- En una ciudad, el 35% vota al partido A, el 45% vota al partido B y el resto se abstiene.
Se sabe además que el 20% de los votantes de A, el 30% de los de B y el 15% de los que se
abstienen, son mayores de 60 años. Se pide:
a) Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 años.
b) Hallar la probabilidad de que un ciudadano mayor de 60 años se haya abstenido.
23º.- Los alumnos de 2º de bachillerato tienen que realizar dos pruebas, una teórica y otra
práctica. La probabilidad de que un estudiante apruebe la parte teórica es de 0.6, la
probabilidad de que apruebe la parte práctica es de 0.8 y la probabilidad de que apruebe
ambas pruebas es 0.5.
a) ¿Son independientes los sucesos aprobar la parte teórica y la parte práctica?
b) ¿Cuál es la probabilidad de que un alumno no apruebe ninguno de los dos exámenes?
c) ¿Cuál es la probabilidad de que un alumno apruebe solamente uno de los dos
exámenes?
d) Se sabe que un alumno aprobó la teoría. ¿Cuál es la probabilidad de que apruebe
también la práctica?
74
24º.- En una baraja de 40 cartas.
a) Se toman dos cartas sin reemplazamiento ¿Cuál es la probabilidad de que las dos sean
de distinto número?
b) Y si se toman tres cartas, ¿Cuál es la probabilidad de que los tres números sean
distintos?
25º.- Tenemos un dado con tres “1”, dos “2“ y un “3”. Lo tiramos dos veces consecutivas y
anotamos la suma de los resultados.
a) ¿Cuál es el espacio muestral?
b) ¿Cuál es la probabilidad de que la suma sea 4?
c) ¿Cuál es la suma más probable?
26º.- Tenemos dos dados A y B, ambos trucados. En el dado A hay tres “1” y tres “2” y en el
dado B hay dos “1” y cuatro “2”. Se elige un dado al azar y se tira.
a) ¿Cuál es la probabilidad de obtener un “1”?
b) Sabiendo que se ha obtenido un “2”, ¿Cuál es la probabilidad de que se haya elegido
el dado B?
27º.- En una caja hay x bolas blancas y 1 una bola roja. Al extraer de la caja dos bolas al azar
sin reemplazamiento, la probabilidad de que sean blancas es ½. Calcula el número de bolas
blancas que debe tener la caja.
28º.- El 35% de los créditos de un banco es para vivienda, el 50% para industria y el 15% para
consumo diverso. Resultan fallidos el 20% de los créditos para vivienda, el 15% de los créditos
para industria y el 70% de los créditos para consumo. Calcula la probabilidad de que se pague
un crédito elegido al azar.
29º.- El volumen de producción en tres plantas diferentes de una fábrica es de 500 unidades en
la primera, 1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de
unidades defectuosas producidas en cada planta es del 1%, 0,8% y 2% respectivamente,
calcula la probabilidad de que al seleccionar una unidad al azar sea defectuosa.
30º.- El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El
75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también,
mientras que de los no ingenieros y no economistas solamente el 20% ocupan un puesto
directivo. ¿Cuál es la probabilidad de que un empleado directivo elegido al azar sea ingeniero?
31º.- Se toman dos barajas españolas de 40 cartas. Se extrae al azar una carta de la primera
baraja y se introduce en la segunda baraja. Se mezclan las cartas de esta segunda baraja y se
extrae una carta, que resulta ser el dos de oros. ¿Cuál es la probabilidad de que la primera
carta extraída sea una espada?
75
TEMA 7º.- DISTRIBUCIONES DISCRETAS Y
CONTINUAS.
1º.- VARIABLES ALEATORIAS
Se llama variable aleatoria a toda función que asocia a cada elemento del
espacio muestral E un número real.
X : E → R tal que a cada elemento ei de E le corresponde un número real
ei → X (ei ) . Este valor X (ei ) lo anotaremos por xi y le llamaremos valor
X ( ei ) .
de la variable.
Al conjunto de valores asignados, llamaremos recorrido de la variable.
Ejemplo 1º.- Supongamos el lanzamiento de dos dados. La función que
asocia a cada resultado la suma de los puntos obtenidos en cada dado es una variable
aleatoria que toma los valores 2,3,4,5,6,7,8,9,10,11,12.
Ejemplo 2º.- Consideremos el experimento que consiste en elegir al azar 100
judías de una plantación y medir su longitud. La función que asocia a cada judía su
longitud es una variable aleatoria.
Las variables aleatorias pueden ser de dos tipos: Discretas y continuas.
Una variable aleatoria (v.a.) es discreta cuando sólo puede tomar unos
ciertos valores enteros. El primer ejemplo corresponde a una variable aleatoria
discreta.
Una variable aleatoria (v.a.) es continua cuando puede tomar al menos
teóricamente, todos los valores posibles dentro de un cierto intervalo de la recta
real. El ejemplo 2º corresponde a una v.a. continua.
76
A) VARIABLES ALEATORIAS DISCRETAS
2º.- FUNCIÓN DE PROBABILIDAD
Se llama función de probabilidad de una v.a. X a la aplicación que asocia a cada
valor xi de la variable su probabilidad p i . Esta función la podemos expresar en la
siguiente tabla
X
pi = P ( X = xi )
x1
x2
x3 ................x n
p1
p2
p3 ............... p n
n
∑p
i =1
i
=1
La función de probabilidad de una v.a. discreta se representa gráficamente
mediante un diagrama de barras, de manera que cada ordenada representa la
probabilidad del correspondiente valor de la variable
n
En toda función de probabilidad se ha de verificar
∑p
i =1
i
= 1.
Ejemplo.- Supongamos que hemos lanzado un dado perfecto. La función de
probabilidad será
X
1
2
pi
1/6 1/6
3
4
5
6
1/6
1/6
1/6 1/6
Y su representación gráfica sería:
1
2
3
4
77
5
6
3º.- FUNCIÓN DE DISTRIBUCIÓN
Sea X una v.a. discreta cuyos valores suponemos ordenados de menor a mayor.
Ll amaremos función de distribución de la variable X y la escribiremos F(x) a la función
F ( x) = P ( X ≤ x) . A la hora de utilizar esta fórmula conviene tener en cuenta lo
siguiente:
a) X es el símbolo que representa a la v.a.
b) x es un número real cualquiera.
c) P ( X ≤ x) se lee: probabilidad de que la variable X tome un valor menor o
igual a x.
Es decir, la función de distribución asocia a cada valor de la v.a. la probabilidad
acumulada hasta ese valor. Formemos la tabla de la función de distribución del
ejemplo anterior
X
x <1 1≤ x < 2 2 ≤ x < 3 3≤ x < 4 4 ≤ x < 5 5 ≤ x < 6 6 ≤ x
F ( x) = P ( X ≤ x )
0
1/6
2/6
3/6
4/6
5/6
La gráfica de esta función sería
0
1
2
3
4
5
Veamos algunas propiedades de la función de distribución:
a) Como F(x) es una probabilidad 0 ≤ F ( x) ≤ 1 .
b) F(x) es una función escalonada.
c) F(x) es nula para todo x menor al primer valor de la variable.
d) F(x) = 1 para todo x mayor al mayor valor de la variable.
e) F(x) es creciente.
78
6
1
4º.- MEDIA, VARIANZA Y DESVIACIÓN TÍPICA DE UNA v.a. DISCRETA
4.1.- MEDIA.- Se llama media, valor esperado o esperanza matemática de una
v.a. X, que toma los valores x1 , x 2 , x3 ,........x n con probabilidades p1 , p 2 , p3 ,...... p n ,
respectivamente, y se anota “ µ “,al valor de la siguiente expresión:
n
µ = x1 p1 + x 2 p 2 + x3 p3 + ......... + x n p n = ∑ xi pi
i =1
n
µ = ∑ xi p i
i =1
4.2.- VARIANZA.- Se llama varianza de una variable aleatoria X, que toma los
valores x1 , x 2 , x3 ,........x n con probabilidades p1 , p 2 , p3 ,...... p n , respectivamente, y se
anota por “ σ 2 ” al valor de una de las siguientes expresiones:
n
σ 2 = ∑ ( x i − x) 2 p i
i =1
n
Ejercicio.- Pasa de una a otra expresión
σ 2 = ∑ xi p i − µ 2
2
i =1
4.3.- DESVIACIÓN TÍPICA.- Se llama desviación típica de una variable
aleatoria X, que toma los valores x1 , x 2 , x3 ,........x n con probabilidades
p1 , p 2 , p3 ,...... p n , respectivamente, y se anota por “ σ ” a la raíz cuadrada de la
varianza con lo que su expresión quedaría:
σ=
n
∑ (x
i =1
i
− x ) 2 pi
79
n
∑x
σ=
i =1
2
i
pi − µ 2
Ejemplo.- Un miembro del consejo de administración de una empresa ha
comprobado que, si bien todos los años tienen una junta, ha habido años que tienen
hasta cinco. Por la experiencia acumulada durante 15 años, sabe que el número de juntas
anuales se distribuye de la siguiente forma:
Nº de juntas al año
Probabilidad
1
2
3
4
5
2/15 5/15 1/15 3/15 4/15
Se pide hallar:
a) Función de probabilidad y su representación gráfica.
b) Función de distribución y su representación gráfica.
c) Media.
d) Varianza y desviación típica.
e) La probabilidad de que en un año, elegido al azar, se celebren más de tres juntas.
80
B) VARIABLES ALEATORIAS CONTINUAS
5º.- FUNCIÓN DE DENSIDAD
Sea X una v.a. continua. Diremos que una función f : I → R es una función de
densidad de la v.a. X si verifica las dos siguientes condiciones:
1º) f ( x) ≥ 0; ∀x ∈ I
2º) El área encerrada bajo la curva de la función y = f(x) es igual a 1.
Ejemplo.- Comprueba que la función definida por
0

f (x) = 1 / 3
0

si
x<0
0≤ x≤3
si
x>3
si
es una verdadera función de densidad.
6º.- FUNCIÓN DE DISTRIBUCIÓN
Es una función F, definida por F ( x) = P ( X ≤ x) que verifica:
1º) 0 ≤ F ( x) ≤ 1
2º) F ( x) = 0; ∀x anterior al primer valor de la v. a.
3º) F ( x) = 1; ∀x posterior al mayor valor de la v. a.
4º) F(x) es creciente.
La función de distribución es la integral de la función de densidad, siendo la
función de densidad la derivada de la función de distribución.
Ejemplo.- Si calculamos la función de distribución del ejemplo anterior, esta
sería
81
0

F ( x) =  x / 3
1

si
x<0
0≤ x≤3
si
x>3
si
siendo las gráficas de ambas funciones
Y
Y
1
1/3
0
3
X
0
Función de densidad
1
2
3
X
Función de distribución
7º.- MEDIA Y VARIANZA DE UNA v. a. CONTINUA
7.1.- MEDIA .- Sea X una v.a. continua cuyo recorrido es el intervalo [a, b] y
sea f(x) una función de densidad. Se llama media de la variable continua X al valor de
la siguiente integral
b
µ = ∫ xf ( x)dx
a
La media también recibe el nombre de esperanza matemáticas
o valor esperado.
7.2.- VARIANZA.- Sea X una v.a. continua cuyo recorrido es el intervalo [a, b]
y sea f(x) una función de densidad. Se llama varianza de la variable continua X al valor
de la siguiente integral
b
σ 2 = ∫ ( x − µ ) 2 f ( x)dx
a
Se llama desviación típica a la raíz cuadrada de la varianza.
Ejemplo1º.- Halla la media, varianza y desviación típica de una v. a. que tiene la
siguiente función de densidad
82
0

f (x) = 1 / 3
0

si
x<0
0≤ x≤3
si
x>3
si
Ejemplo 2º.- La función de densidad de una v. a. continua viene dada por
2 x
f ( x) = 
0
si
si
x ∈ [0,1]
x ∉ [0,1]
.
a) Hallar F(x).
b) Representar f(x) y F(x).
c) Hallar media, varianza y desviación típica.
En el tema siguiente vamos a estudiar dos tipos concretos de distribución, uno
discreto y otro continuo. Se trata de la distribución BINOMIAL y la distribución
NORMAL.
83
RELACIÓN DE EJERCICIOS. TEMA 7
1º.- Poner tres ejemplos de variables aleatorias discretas y tres de continua
2º.- Consideremos el experimento que consiste en lanzar dos dados y anotar el
resultado de la suma de sus caras. Hallar:
a) La función de probabilidad y su representación
b) La función de distribución y su representación
c) Media y desviación típica de la distribución
d) Sea X la (v. a.) anterior. Calcular: p ( X ≤ 5); p ( X ≥ 10); F (4); F (−2); F (19)
3º.- Sea el experimente que consiste en el lanzamiento de tres monedas y anotar el
número de caras obtenidas. Se pide:
a) La función de probabilidad y su representación
b) La función de distribución y su representación
c) Media y desviación típica de la distribución
d) Sea X la (v. a.) anterior. Calcular: p (1 < X < 3)
4º.- Hallar la media y la varianza de la (v. a.) X que tiene la siguiente función de
probabilidad
X
2
3
7
p
0´2
0´3
0´5
5º.- Sea X una v. a. discreta cuya función de probabilidad es:
X
0
1
2
3
4
5
p
0´1
0´2
0´1
0´4
0´1
0´1
a) Calcula y representa gráficamente la función de distribución
b) Calcula las siguientes probabilidades: p ( X < 4`5); p ( X ≥ 3); p (3 ≤ X < 4´5)
6º.- Dada la función de distribución de una v. a. continua X, definida por
si x ≤ 0
0

F ( x) = sen x si 0 < x ≤ π / 2
1
si π /2 < x

Calcular la función de densidad
7º.- La variable aleatoria X tiene la siguiente función de distribución
0

F ( x) =  x 2
0

si
x≤0
si
si
0 < x ≤1
1< x
84
a) Calcular la función de densidad
b) Representa la función de densidad y la de distribución
c) Hallar la media y la varianza
8º.- Una v. a. continua tiene la siguiente función de densidad
0
x

f ( x) =  + a
8
0
si
si
si
x ≤1
1< x ≤ 5
5< x
a) Calcular a para que sea una verdadera función de densidad
b) Hallar la media y la desviación típica
 c

9º.- Dada la función f ( x) = 1 + x 2
0
si
0≤x< 1
en el resto
a) Hallar el valor de c para que f(x) sea una verdadera función de densidad
b) Calcula la esperanza matemática de la variable X que tiene por función de
densidad f(x).
85
TEMA 8º.- DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN
NORMAL
A) DISTRIBUCIÓN BINOMIAL
1º.- VARIABLE ALEATORIA DE LA DISTRIBUCIÓN BINOMIAL
Supongamos que un experimento aleatorio tienen las siguientes características:
a) En cada prueba del experimento sólo son posibles dos resultados: éxito o
fracaso.
b) El resultado obtenido en cada prueba es independiente de los resultados
anteriores.
c) La probabilidad de éxito es constante.
Todo experimento que tenga estas características, diremos que sigue el modelo
de la distribución Binomial.
A la probabilidad de éxito se le suele llamar “p” y a la de fracaso q=1-p.
A la variable X, que expresa el número de éxitos obtenidos en cada prueba del
experimento, la llamaremos v. a. Binomial.
Esta v. a. es discreta, ya que sólo toma los valores 0, 1, 2, 3, …….,n, suponiendo
que se han realizado n-pruebas.
Representaremos por B(n, p) a la variable de la distribución binomial, siendo n y
p los parámetros de dicha distribución:
n : El número de veces que se ha realizado el experimento.
p: La probabilidad de éxito.
2º.- FUNCIÓN DE PROBABILIDAD
Supongamos un experimento aleatorio cuyos resultados únicamente pueden ser
el suceso A = << Éxito >> y A = << Fracaso >>, con probabilidades
P( A ) = q = 1- p.
86
P(A) = p
y
Realicemos n – pruebas del experimento y deseamos saber la probabilidad de
n
obtener r – éxitos en las n – pruebas. P( Obtener r éxitos) = P( X = r ) =   p r q n − r .
r 
n
P( X = r ) =   p r q n −r
r 
Ejemplo.- Una prueba de inteligencia está compuesta por 10 preguntas, cada una
de las cuales tiene 4 respuestas siendo sólo una de ellas correcta. Un alumno contesta
aleatoriamente a las 10 preguntas. Se pide:
a) Probabilidad de acertar exactamente 4 preguntas.
b) Probabilidad de no acertar ninguna.
c) Probabilidad de acertarlas todas.
d) Probabilidad de acertar al menos ocho.
e) Probabilidad de acertar al menos tres.
87
3º.- MEDIA Y VARIANZA DE LA DISTRIBUCIÓN BINOMIAL.
n
3.1.- MEDIA.- Como la función de probabilidad es P( X = r ) =   p r q n − r .
r 
n
n
 n
n
Entonces µ = ∑ r   p r q n − r = ∑ r   p r q n − r = ( sacando factor común np)
r =0  r 
r =1  r 
n
 n − 1 r −1 n − r
n −1
= (1) np ∑ 
 p q = np ( p + q ) = np. Luego
r =1  r − 1 
(1)
Hay que demostrar que
µ = np
n
 n − 1
r   = n

r 
 r −1 
3.2.- VARIANZA.- La varianza y la desviación típica, se demuestra que vale:
σ 2 = npq
σ = npq
Ejemplo.- Se ha pasado una prueba sobre fluidez verbal a un numeroso grupo de
niños y se ha detectado que el 35% tiene una fluidez verbal prácticamente nula; el resto
se puede considerar aceptable. De una muestra aleatoria formada por seis niños, hallar:
a) Media y varianza.
b) La función de probabilidad.
c) La función de distribución.
88
B) DISTRIBUCIÓN NORMAL
4º.- VARIABLE ALEATORIA DE LA DISTRIBUCIÓN NORMAL
Se dice que una v. a. continua X sigue una distribución normal de media " µ " y
desviación típica "σ " , y se designa por N ( µ , σ ) , si se cumplen las siguientes
condiciones:
a) La variable recorre toda la recta real.
b) La función de densidad, que es la expresión en términos de ecuación
matemática de la curva de Gauss, es
1  x−µ  2
σ 
− 
1
f ( x) =
e 2
σ 2π
.
Siendo:
e = base de los logaritmos neperianos
π = 3´1415….
µ = La media
σ = La desviación típica
5º.- FUNCIÓN DE DENSIDAD
La función de densidad de una distribución normal de media " µ " y desviación
típica "σ " es:
1  x−µ  2
σ 
− 
1
f ( x) =
e 2
σ 2π
. y su representación gráfica es:
N (µ , σ )
89
x=µ
Esta función cumple las siguientes propiedades:
a) Es simétrica respecto a la media.
b) El máximo lo alcanza cuando x = µ .
c) El área del recinto bajo la campana y el eje X vale 1.
d) Los puntos de inflexión los alcanza en x = µ − σ y x = µ + σ
6º.- MEDIA Y VARIANZA DE LA DISTRIBUCIÓN
Por la propia definición de la distribución se tiene que estas son " µ " y "σ 2 "
respectivamente.
7º.- DISTRIBUCIÓN NORMAL ESTÁNDAR
La representación de la función de densidad varía según los valores de la media
y la desviación típica.
De las infinitas distribuciones N ( µ , σ ) , tiene especial interés la N(0,1). Esta
distribución se llama ley normal estándar y su función de densidad es:
f ( x) =
1
2π
e−x
2
/2
La función de distribución de la ley N(0,1) proporciona el área del recinto que va
desde − ∞ hasta el valor que nos pidan. P( X ≤ a) = ∫
a
−∞
f ( x)dx pero esta integral es
muy compleja y existe una tabla para calcularla.
8º.- TIPIFICACIÓN DE LA VARIABLE
Como hemos dicho anteriormente, la distribución N (0,1) se encuentra tabulada,
lo cual permite un cálculo rápido de las probabilidades asociadas a esta distribución.
Luego lo que debemos de hacer es transformar la variable X que sigue una
distribución N ( µ , σ ) en otra variable Z que siga una distribución N (0,1).
Esta transformación se conoce con el nombre de tipificación de la variable.
90
Para llevar a cabo esta transformación hay que seguir los siguientes pasos:
a) Trasladar la media de la distribución al origen de coordenadas.
b) Reducir la desviación típica a 1.
Estos dos pasos se consiguen simultáneamente efectuando el cambio de variable
z=
x−µ
σ
9º.- MANEJO DE TABLAS
a ) P( z ≤ 1´45) =
b) P( z ≤ −1´45) =
c) P(1´25 < z ≤ 2´57) =
d ) P(−2´57 < z ≤ −1´25) =
e) P(−0´53 < z ≤ 2,46) =
10º.- APROXIMACIÓN DE LA BINOMIAL POR LA NORMAL
Como ya sabemos la media y la desviación típica de una B(n, p) son µ = np y
σ = npq .
De Moivre demostró que bajo determinadas condiciones, la distribución B(n, p)
se puede aproximar mediante la distribución normal N (np, npq ) . Es decir:
X ´→ N (np, npq )
X → B ( n, p ) .
z=
x − np
npq
→ N (0,1)
Para aplicar esta aproximación, basta con que se verifique que np ≥ 5 y nq ≥ 5
Cuanto mayor sea n y p más próximo a 0´5 mejor será la aproximación.
91
Gracias a esta aproximación es fácil hallar probabilidades binomiales pues la
probabilidad de la distribución binomial para valores grandes de n resulta muy
complicada de calcular y, en consecuencia, prácticamente inutilizable.
Como la distribución binomial es discreta, tiene sentido calcular probabilidades
puntuales, por ejemplo P(X = 2).
En cambio, la distribución normal es de variable aleatoria continua y, por tanto,
no tiene sentido calcular probabilidades puntuales, pues son todas nulas.
¿Cómo debemos proceder para calcular la probabilidad en la distribución
binomial cuando es aproximada por una normal?. Lo haremos del siguiente modo:
P ( X = 2) = P (1´5 ≤ X ´≤ 2´5)
P ( X ≤ 2) = P ( X ´≤ 2´5)
P( X < 2) = P( X ´ ≤ 1´5)
P( X > 2) = P( X ´ ≥ 2´5)
Ejemplo.- Se sabe, por una estadística sociológica, que el nivel de aceptación de
un determinado partido es del 25% de la población. De un muestreo aleatorio realizado
sobre 40 personas, se desea saber cuál es la probabilidad de que 15 de ellas acepten a
dicho partido
92
RELACIÓN DE EJERCICIOS. TEMA 8
1º.- Sea X una v. a. que sigue una distribución B(6, 0´4). Utilizando la tabla calcula las
siguientes probabilidades: a) p(X=3); p(X=6); p(X=0); p(X<3); p(X>4); p(1<X<4).
2º.- Se sabe que la tercera parte de los niños varones de 3º de la ESO dan positivo en
una prueba de agresividad. Escogida al azar una muestra de 10 chicos, hallar la
probabilidad de los siguientes sucesos:
a) Encontrar dos con agresividad positiva
b) Más de tres
c) A lo sumo, cinco.
d) Hallar la media y la desviación típica de esta distribución
3º.- Se ha pasado una prueba sobre fluidez verbal a un numeroso grupo de niños y se
ha detectado que el 35% tiene una fluidez verbal prácticamente nula; el resto se puede
considerar aceptable. De una muestra aleatoria formada por siete niños, hallar:
a) La media y la varianza
b) La función de probabilidad
c) La función de distribución
4º.- La probabilidad de que un estudiante obtenga el título de licenciado en Química es
0´3. Hallar la probabilidad de que en un grupo de siete estudiantes matriculados en 1º.
a) Ninguno de los siete finalice la carrera
b) La finalicen todos
c) Al menos dos acaben la carrera
d) Halla la media y la desviación típica del nº de alumnos que acaban la carrera.
5º.- El 75% de la población considera que los tratamientos de psicoterapia son caros.
Elegida una muestral al azar formada por seis individuos, hallar:
a) La probabilidad de que los seis lo consideren caros
b) La probabilidad de que ninguno los considere caros.
c) La probabilidad de que al menos dos los consideren caros.
6º.- La opinión que tiene la población sobre terapia de grupo es favorable en el 45% de
los casos, y desfavorable el resto. Elegidos cinco individuos al azar, hallar:
a) La probabilidad de que sólo dos la consideren favorable.
b) La probabilidad de que más de dos la consideren favorable
c) Sobre una población de 500 individuos, ¿cuántos la considerarán desfavorable?
93
7º.- Sea Z una v. a. N (0,1). Calcular:
a ) p ( Z ≥ 1´32)
b) p ( Z ≤ 2`17)
c) p (1´52 < Z ≤ 2´03)
d) p (≥ −1´32)
e) p ( Z ≤ −2´17) f) p (−2´03 < Z ≤ 1´52)
8º.- Las tallas de los individuos de una población se distribuyen normalmente con
media igual a 175 cm. y desviación típica 8 cm. Calcular la probabilidad de que un
individuo tenga una talla:
a) Mayor que 150 cm.
b) Menor que 170 cm.
c) Entre 170 y 180 cm.
9º.- El Ministerio de Educación ha hecho una encuesta sobre la distribución de las
edades del profesoradote Secundaria, y ha observado que se distribuyen normalmente
con media 38 años y desviación típica 6. De un total de 500 profesores, hallar:
a) ¿Cuántos profesores hay con edades menores o iguales a 35 años?
b) ¿Cuántos mayores de 55 años?
10º.- En Geografía humana se ha determinado que las condiciones socioeconómicas del
35% de la población son inaceptables. Elegida una muestra de esta población formada
por nueve individuos, hallar:
a) La probabilidad de que sólo tres vivan en condiciones inaceptables.
b) La media y varianza de esta población
11º.- Los resultados de una estadística sociológica sobre el nivel de aceptación de un
determinado partido político ha revelado que el 25% de la población es favorable a
dicho partido, siendo desfavorable el resto. En una encuesta realizada a diez
individuos, elegidos al azar, se desea saber:
a) La probabilidad de que sólo tres sean favorables al partido
b) La probabilidad de que al menos uno sea favorable
c) La probabilidad de que a lo sumo dos se muestren favorables.
12º.- La duración de las pilas de una linterna se distribuyen según una N (70, 2) horas.
A un establecimiento le quedan del pedido anterior 20 pilas.
a) ¿Cuántas tendrán una duración superior a 70 horas?
b) ¿Cuántas tendrán una duración entre 75 y 82 horas?
13º.- En una distribución N (163, 12), ¿dónde se sitúan el P10 y el P90 ?
14º.- En una distribución N (0, 1) ¿entre qué valores está el 94% de los valores
centrales?
15º.- Se lanza una moneda 100 veces. Hallar la probabilidad de:
94
a) Obtener a lo sumo 40 caras.
b) Obtener más de 40 caras
16º.- Supongamos que la probabilidad de nacer varón en España es de 0´512. Si
durante un año en Andalucía se han producido 2000 nacimientos, ¿cuál es la
probabilidad de que el número de varones está comprendido entre 1000 y 1080?
17º.- En un centro escolar se ha observado que el 55% de los alumnos superan las
pruebas de selectividad. Si este porcentaje es constante, y teniendo en cuenta que se
han presentado a la prueba 100 alumnos, hallar la probabilidad de que la superen
exactamente más de 50.
18º.- El porcentaje de fracaso escolar en ESO, en Andalucía es del 40%. Sobre un total
de 1000 alumnos.
a) ¿Cuál es la probabilidad de que se produzcan exactamente 400 fracasos?
b) ¿Cuál es la probabilidad de que no se superen los 400 fracasos?
19º.- En una distribución N ( µ , σ )
a) ¿Qué % de la población se encuentra en el intervalo ( µ − σ , µ + σ ) ?
b) ¿Qué % de la población se encuentra en el intervalo ( µ − 2σ , µ + 2σ ) ?
c) ¿Qué % de la población se encuentra en el intervalo ( µ − 3σ , µ + 3σ ) ?
20º.- En una distribución N ( µ , σ )
a) ¿Entre qué valores se encuentra el 90% de los valores centrales?
b) ¿Entre qué valores se encuentra el 95% de los valores centrales?
c) ¿Entre qué valores se encuentra el 99% de los valores centrales?
95
TEMA 9.- INFERENCIA ESTADÍSTICA
1º.- INTRODUCCIÓN.-
La finalidad de la estadística es obtener conclusiones sobre una población, sin
necesidad de recurrir a la observación directa del total de la población. Se recurre al
muestreo entre otras cosas porque es más rápido y económico que la consulta de la
población total.
La inferencia estadística obtiene conclusiones de los datos ya elaborados y mide
su significación, es decir, la confianza que nos merece.
Desde un punto de vista matemático, la inferencia estadística es una
prolongación del estudio de la distribución normal, pues la mayoría de sus resultados se
basan en esta distribución.
¿EN QUÉ CONSISTE LA ESTADÍSTICA INFERENCIAL?
Vamos a analizar tres situaciones, parecidas pero muy diferentes:
Problema 1º.- Las estaturas de los soldados de un regimiento tienen una media
µ = 175 cm. y σ = 5 . ¿Cuál es la probabilidad de que la estatura media de los 32
soldados de una muestra esté comprendida entre 174´4 y 175´6. P (174´4 < X < 175´6) .
Problema 2º.- La estatura media de 32 soldados de un regimiento es x = 175 cm
¿Cuál es la probabilidad de que la media , " µ " , de todos los soldados del regimiento esté
en el intervalo (174´4, 175´6)?.
P (174´4 < µ < 175´6)
Problema 3º.- Afirman que la media de las estaturas de los soldados de un
regimiento es µ = 175 cm. Para comprobarlo extraemos una muestra de 32 soldados y
calculamos su media x = 175´8 . ¿Es razonable admitir la hipótesis de que µ = 175 ?.
En el Problema 1º conocemos la población. A partir de ahí pretendemos deducir
el comportamiento de las muestras.
En el Problema 2º conocemos una muestra y, a partir de ella pretendemos
deducir aspectos de la población. En concreto pretendemos inferir el valor de la media
de la población a partir de la media de la muestra.
96
En el Problema 3º tenemos una afirmación, una hipótesis: la media de la
población es µ = 175 . Pero no tenemos garantías de que sea cierto. Para contrastarlo,
extraemos una muestra y, a partir de su resultado, x = 175´8 , debemos decidir si la
hipótesis es o no admisible.
Los parámetros de la población se pueden estimar a partir de los de la muestra
bien de forma puntual o por intervalos de la siguiente forma:
La media muestral " x" sirve para estimar la media poblacional " µ " .
La desviación típica muestral “S” es un estimador de la desviación típica
poblacional "σ " .
La estimación puntual (el valor de " µ " es aproximadamente " x" ), sirve de poco
mientras desconozcamos cuál es el grado de aproximación de " x" a " µ " . Por ese motivo
se procede a la estimación mediante intervalos.
A partir de una muestra aleatoria de tamaño “n” podemos estimar el valor de un
parámetro de la población del siguiente modo:
- Dado un intervalo dentro del cual confiamos que esté el parámetro.
Llamado intervalo de confianza.
- Hallando la probabilidad de que tal cosa ocurra. A dicha probabilidad se
la llama nivel de confianza.
En este curso sólo haremos estimaciones referentes a la media y a la proporción.
Cuanto mayor sea el tamaño de la muestra, mayor eficacia tendremos en nuestra
estimación. Esta eficacia se manifiesta de dos formas:
•
En el tamaño del intervalo (cuanto más pequeño, más precisos estamos
siendo).
•
En el nivel de confianza (más nivel de confianza significa más seguridad en
la estimación).
Tamaño de la muestra, longitud del intervalo y nivel de confianza son tres
variables estrechamente relacionadas que manejaremos a lo largo de esta unidad.
En cada caso deberemos obtener una de ellas después de haber fijado las otras
dos.
97
A) ESTIMACIÓN DE LA MEDIA
2º.- INTERVALOS CARACTERÍSTICOS
Si la variable X tiene una media " µ " , se llama intervalo característico
correspondiente a una probabilidad “p”, al intervalo ( µ − k , µ + k ) tal que
P( µ − k < x < µ + k ) = p
P
µ −k
µ
µ+k
1) Si la distribución es N(0,1), si (-k, k) es el intervalo característico
correspondiente a un probabilidad “p”, es decir, P(-k < x < k) = p diremos que k es el
valor crítico correspondiente a “p”.
Ejemplo.- Calculemos los valores críticos correspondientes a las siguientes
probabilidades: 0´9; 0´95; 0´99.
P(− k < x < k ) = 0´90 ⇒ k = 1´645
P(− k < x < k ) = 0´95 ⇒ k = 1´96
P(− k < x < k ) = 0´99 ⇒ k = 2´575
Habitualmente se designa a la probabilidad “p” por 1 − α y al valor crítico
correspondiente se denomina por zα y se tienen las igualdades siguientes:
2
P( z > zα / 2 ) = α / 2
P(− zα / 2 < z < zα / 2 ) = 1 − α
α /2
α /2
1−α
- zα
zα
2
2
98
Ejemplo.- Calcula los valores críticos correspondientes a
α = 0´21; α = 0´002
2) Si la distribución es una N ( µ , σ ) , entonces el intervalo característico
correspondiente a una probabilidad p = 1 − α es:
P ( µ − k < x < µ + k ) = 1 − α . Si tipificamos esta variable haciendo el cambio
z=
x−µ
σ
. Entonces la convertimos en una N(0, 1). Por lo que su intervalo
característico es (− zα / 2 , zα / 2 ) , es decir,
− zα / 2 <
x−µ
σ
< zα / 2 ⇒ µ − σ ⋅ zα / 2 < x < µ + σ ⋅ zα / 2 Luego el intervalo característico
buscado es ( µ − σ ⋅ zα / 2 , µ + σ ⋅ zα / 2 ) .
Ejemplo.- En una N(66, 8) calcular los intervalos característicos para el 90%,
95% y 99%.
3º.- DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES
TEOREMA CENTRAL DEL LÍMITE.- Dada una población de media " µ " y
desviación típica "σ " , no necesariamente normal, la distribución de las medias
muestrales de tamaño “n”:
•
Tienen la misma media, " µ " , que la población.
•
Su desviación típica es σ / n y, por consiguiente, disminuye al aumentar n.
•
Cuando n ≥ 30 , es prácticamente normal.
99
Este teorema nos aporta las siguientes ventajas:
1) Control de las medias muestrales.- En una población de media " µ " y
desviación típica "σ " , nos disponemos a extraer una muestra de tamaño “n”.
Antes de hacerlo, sabemos que la distribución de las medias, x , de todas las
posibles muestras es una N ( µ , σ / n ) y, por tanto, podemos averiguar la
probabilidad de que la media de una muestra concreta esté en un cierto
intervalo.
2) Control de la suma de todos los individuos de la muestra.- Como
n
x=
∑x
i =1
n
i
n
⇒ ∑ xi = nx . Como x , se distribuye según una N ( µ , σ / n ) ,
i =1
n
tenemos que
∑x
i =1
i
se distribuye según una N (nµ , σ n ) . Por tanto, podemos
calcular cual es la probabilidad de que la suma de los elementos de una
muestra esté, a priori, en un cierto intervalo.
3) Inferir la media de la población a partir de una muestra.- Esta es la aplicación
más importante de este teorema. A partir de una muestra se pueden extraer
conclusiones válidas sobre la media de la población de partida (Lo veremos
más adelante).
Como la demostración de este teorema es muy compleja, veamos un ejemplo
que lo corrobore.
Ejemplo.- Sea la población formada por los valores 1, 2, y 3 equiprobables y que
por tanto tiene como función de probabilidad
xi
1
2
3
pi
1/3
1/3
1/3
La media de esta distribución será: µ = 1.1/3+2.1/3+3.1/3 = 2. Y la desviación
2
típica σ = xi . pi − x = 2 / 3 .
2
100
Consideremos todas las posibles muestras con reemplazamiento de tamaño 2. Serán:
(1,1),(1,2),(1,3),(2,1)(2,2),(2,3), (3,1),(3,2),(3,3). Las medias serán: 1, 1´5, 2, 1´5, 2, 2´5,
2, 2´5, 3. Hemos obtenido una nueva v. a. que denominaremos por X y su función de
probabilidad es:
X
1
1´5
2
2´5
3
Pi
1/9
2/9
3/9
2/9
1/9
Calculemos la media y la desviación típica de esta distribución
Media ( X ) = 1.1/9 + 1´5.2/9 + 2.3/9 + 2´5.2/9 + 3.1/9 = 2
Desviación típica de ( X ) =
A esta desviación típica, se la llama también error típico.
Si comparamos los resultados de la población con los de la muestra, vemos que
se verifica el teorema, ya que:
Media ( X ) = µ
Desviación típica de ( X ) =
σ
n
.
Ejercicio1º.- Las bolsas de azúcar envasadas por una cierta máquina tienen
µ =500 g y σ = 35 g. Las bolsas se empaquetan en cajas de 100 unidades.
a) Calcular la probabilidad de que la media de los pesos de las bolsas de un
paquete sea menor que 495 g.
b) Hallar el intervalo característico de X para una probabilidad del 95%.
c) Calcula la probabilidad de que una caja de 100 bolsas pese más de 51 Kg.
Ejemplo 2º.- Los pesos en Kg de los alumnos de un instituto siguen una N(69,8).
Las clases formadas por 12 alumnos.
a) Hallar la probabilidad de que la media de los pesos de los alumnos de una
clase sea superior a 71 Kg.
b) Obtener el intervalo característico para X correspondiente a una
probabilidad de 0´9.
101
c) ¿Cuál es la probabilidad de que la suma de los pesos de los alumnos de una
clase sea menor que 800 Kg.?
d) ¿Cuál es la probabilidad de que un alumno de la clase, elegido al azar, pese
más de 93 Kg.?
Ejemplo 3º.- Los parámetros de una variable son: µ = 16´4; σ = 4´8 . Nos
disponemos a extraer una muestra de tamaño n = 400 individuos.
a)
Hallar el intervalo característico para las medias muestrales
correspondientes a una probabilidad p = 0´99.
Calcula P (16 < X < 17)
b)
Ejemplo 4º.- Los sueldos, en euros, de los empleados de una fábrica se
distribuyen según una N(1200, 400). Se elige al azar una muestra de25 de ellos. ¿Cuál
es la probabilidad de que la suma de sus sueldos sea superior a 35.000 €?
Halla el intervalo característico para las sumas de 25 individuos,
correspondientes a una probabilidad de 0´9.
4º- INTERVALO DE CONFIANZA PARA LA MEDIA
Se desea estimar la media, µ , de una población cuya desviación típica, σ , es
conocida.
Para ello se recurre a una muestra de tamaño “n” de la cual se obtiene una media
muestral x .
Si la población de partida es normal, o si el tamaño de la muestra es n ≥ 30 ,
entonces el intervalo de confianza de µ con un nivel de confianza de (1 − α ) ⋅ 100 % es:

σ
σ 
 x − zα / 2 ⋅
, x + zα / 2 ⋅
 .
n
n

Si σ es desconocida se debe de estimar a partir de la muestra con el parámetro
∑ (x
S n −1 =
i
− x) 2
n −1
. Sin embargo si n es grande se puede utilizar S, es decir, la
desviación típica de la muestra.
102
Demostración:

σ
σ 
Tenemos que demostrar que P x − zα / 2 ⋅
< µ < x + zα / 2 ⋅
 = 1 − α
n
n

Puesto que la media muestral, x según el teorema central del límite sigue una
distribución N ( µ ,
σ

σ
σ 
) , entonces P µ − zα / 2 ⋅
< x < µ + zα / 2 ⋅
 = 1 − α ,
n
n
n

es decir,


σ
σ 
σ
σ 
P − zα / 2 ⋅
< x − µ < zα / 2 ⋅
 = 1 − α ⇒ P − x − zα / 2 ⋅
< − µ < − x + zα / 2 ⋅
 = 1 − α
n
n
n
n



σ
σ 
⇒ P x − zα / 2 ⋅
< µ < x + zα / 2 ⋅
 = 1 − α
n
n

Ejercicio 1º.- Deseamos valorar el grado de conocimientos en Historia de una
población de varios miles de alumnos. Sabemos que σ = 2´3. Nos proponemos estimar
µ pasando una prueba a 100 alumnos.
a) Calcular el intervalo característico para x correspondiente a una
probabilidad de 0´95. Una vez realizada la prueba a 100 alumnos se ha
obtenido una media x = 6´32.
b) Hallar el intervalo de confianza de µ con un nivel de confianza de 95%.
Ejemplo 2º.- Para estimar la media de los resultados que obtendrían al realizar
un cierto test los alumnos de 4º de ESO de toda una comunidad, se les pasa dicho test a
400 de ellos elegidos al azar. Los resultados obtenidos vienen dados por la tabla
xi
1
2
3
4
5
fi
24
80
132 101 63
A partir de ellos estima con un nivel de confianza del 95% el valor de la media
de la población.
Ejemplo 3º.- De una variable estadística conocemos la desviación típica, σ = 8,
pero desconocemos la media, µ . Para estimarla, extraemos una muestra de tamaño n=60
cuya media vale x = 37. Estima µ mediante un intervalo de confianza del 99%.
103
5º.- RELACIÓN ENTRE NIVEL DE CONFIANZA, ERROR ADMISIBLE Y
TAMAÑO DE LA MUESTRA
Como acabamos de ver, el (1 − α ) ⋅ 100 % de las muestras cumplen que
/ x − µ / < zα / 2 ⋅
σ
n
. El valor E = zα / 2 ⋅
σ
n
se le denomina error máximo admisible que
como podemos observar depende de α y de n:
•
Si mayor es n menor es E, es decir, disminuye la amplitud del intervalo.
•
Cuanto mayor se 1 − α , es decir, cuanto más seguros queramos estar de
nuestra estimación mayor es E.
Los niveles de confianza más comúnmente utilizados son
1−α
α
zα / 2
0´90
0´10
1´645
0´95
0´05
1´96
0´99
0´01
2´575
En este cuadro se observa que cuanto mayor es 1 − α , mayor es zα / 2 y, por tanto
mayor es E.
De la relación E = zα / 2 ⋅
σ
n
, conociendo dos de las tres variables, E, n, α se
puede calcular la otra.
Ejemplo 1º.- De la duración de un proceso sabemos que σ = 0´5 s. ¿Cuál es el
número de medidas que hay que realizar para que, con un 99% de confianza, el error de
la estimación no exceda de 0´1 s.?
Ejemplo 2º.- Al medir el tiempo de reacción, un psicólogo sabe que σ = 0´5 s.
Desea estimar el tiempo medio de reacción con un error máximo de 0´1 s, para lo cual
realiza 100 experiencias. ¿Con qué nivel de confianza podrá dar el intervalo
( x − 0´1, x + 0´1)
104
Ejemplo 3º.- Un coronel desea estimar la estatura media de todos los soldados de
un regimiento con un error menor de 0´5 cm. utilizando una muestra de 30 soldados.
Sabiendo que σ = 5´3 cm. ¿Cuál será el nivel de confianza con el que se realiza la
estimación.
Ejemplo 4º.- Sabemos que la desviación típica de los pesos de los pollos adultos
es de 300 g. Queremos estimar el peso medio de los pollos adultos de una granja con un
error menor a 100 g y para ello tomamos una muestra de 50 individuos. ¿Con qué nivel
de confianza podemos hacer la estimación?.
105
B) ESTIMACIÓN DE UNA PROPORCIÓN
6º.- INTRODUCCIÓN
Hasta ahora hemos estimado la media de una población a partir de la media
muestral con ayuda de la distribución normal.
Ahora vamos a estimar la proporción de individuos de un colectivo que posee
una cierta cualidad (o, lo que es equivalente, la probabilidad de que ocurra un cierto
suceso).
La descripción de las probabilidades de los distintos valores de una proporción
se realizan con la ayuda de la distribución binomial y esta, a su vez, puede ser sustituida
en ciertos casos por la normal (cuando n ≥ 30 ).
7º.- DISTRIBUCIÓN DE LAS PROPORCIONES MUESTRALES.-
Si en una población la proporción de individuos que poseen una cierta
característica “C” es “p”, la proporción “ p r ”, de individuos con dicha característica en

las muestras de tamaño “n” sigue una distribución N  p,

pq 
.
n 
Demostración
Sea x = nº de individuos de la muestra que tienen la característica “C”.
x sigue una B(n, p). Si np ≥ 5 y nq ≥ 5 , entonces x sigue una N (np, npq ) .
Sea p r = proporción de individuos de la muestra que tiene la característica “C”.
Nº de individuos con la característica “C”
x
Como p r = ------------------------------------------------------ = -----.
Nº de individuos de la muestra
n
 np npq 

 = N  p,
Entonces la distribución de p r será N  ,

 n
n 


pq 
.
n 
c.q.d.
Eejmplo1º.- Una máquina produce tornillos. Se sabe que el 5% de ellos son
defectuosos. Se empaquetan en cajas de 400.
a) ¿Cómo se distribuye la proporción de tornillos defectuosos en las cajas?
106
b) Encontrar un intervalo en el cual se encuentre el 90% de las proporciones de
tornillos defectuosos en las cajas.
c) Encontrar un intervalo en el cual se encuentre el 99% de las proporciones de
tornillos defectuosos en las cajas.
Ejemplo 2º.- Supongamos que el 15% de los jóvenes entre 18 y 25 años son
miopes:
a) ¿Cómo se distribuye la proporción de jóvenes miopes en muestras de 40
individuos?
b) Hallar el intervalo característico de las proporciones muestrales
correspondientes al 80%.
8º.- INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN O UNA
PROBABILIDAD
Se desea estimar la proporción “p” de individuos de una cierta característica que
hay en una población. Para ello se recurre a una muestra de tamaño “n”, en la que se
obtiene una proporción muestral p r .
El intervalo de confianza de “p” con un nivel de confianza del (1 − α ).100% es:

 p r − zα / 2 ⋅


p r (1 − p r )
, p r + zα / 2 ⋅
n
p r (1 − p r ) 


n

Demostración

Sabemos que p r → N  p,


probabilidad 1 − α es  p − zα / 2 ⋅

pq 
 . El intervalo característico de p r para una
n 
pq
, p + zα / 2 ⋅
n
pq 
 que es tanto como decir que
n 

pq
pq 
P p − zα / 2 ⋅
< p r < p + zα / 2 ⋅
= 1−α ⇒
n
n 


pq
pq 
 = 1−α
P p r − zα / 2 ⋅
< p < p r + zα / 2 ⋅
n
n 

107
El error máximo admisible es E = zα / 2 ⋅
pq
, tiene el grave inconveniente de
n
que está expresado en función de “p”. Por tanto, una vez extraída la muestra y obtenida
la proporción muestral, p r , debemos estimar el valor de “p” y “q” así:
p = pr
q = 1 − pr
. De
este modo el error máximo admisible para la estimación de “p” es:
E = zα / 2 ⋅
p r (1 − p r )
n
Cota de error o error máximo admisible.
En el razonamiento anterior hay que añadir que pn y qn han de ser mayores o
iguales a 5. Además para poder estimar “p” por “ p r ” en la construcción del error
máximo admisible n ≥ 30 .
Ejemplo 1º.- Tomamos una muestra de 300 personas mayores de 15 años en una
ciudad, nos encontramos que 104 de ellas leían el periódico. Hallar con un nivel de
confianza del 90%, un intervalo para estimar la proporción de lectores de periódicos
entre los mayores de 15 años.
Ejemplo 2º.- A la vista del resultado anterior, se pretende repetir la experiencia
para conseguir una cota de error de 0´01 con el mismo nivel de confianza. ¿Cuántos
individuos debe tener la muestra?
Ejemplo 3º.- A partir de una muestra de 100 individuos se ha estimado una
proporción mediante el intervalo de confianza (0´17, 0´25). ¿Cuál es el nivel de
confianza con el que se ha hecho la estimación?
108
C) CONTRASTES DE HIPÓTESIS
9º.- INTRODUCCIÓN
En un test de hipótesis se emite una afirmación estadística (relativa al valor de
un parámetro de una población) y mediante una muestra se estudia si dicha afirmación
(hipótesis) es compatible con el resultado de la experiencia (contraste).
Los test de hipótesis fueron creados por Neyman y E. Pearson hacia 1940 y
desarrollados posteriormente por Abraham Wald, cuyo objetivo es comprobar, mediante
métodos matemáticos, hipótesis realizadas sobre el valor de algún parámetro de la
población a partir de una muestra aleatoria extraída de ella.
Hipótesis sobre un
MUESTRA
Aceptamos o rechazamos la
hipótesis
parámetro de la población
Los pasos necesarios para tomar decisiones sobre hipótesis estadísticas sencillas
(sobre la media y la proporción), son los siguientes:
1º) Enunciado.- Se enuncia la hipótesis emitida (llamada hipótesis nula), H 0 y la
contraria H 1 , hipótesis alternativa. Consiste en atribuirle un valor a un parámetro de
cierta población. (En este curso sólo emitiremos hipótesis sobre la media y sobre la
proporción).
2º) Deducción de conclusiones.- Si la hipótesis nula fuera cierta, tal parámetro
de la muestra se distribuiría de forma conocida. En consecuencia:
•
Se elige un nivel de significación. Los más comunes son
α = 0´10; α = 0´05; α = 0´01 .
109
•
Se construye la zona de aceptación. Es el intervalo donde se encuentre
(1 − α ).100% de la población.
Zona de
aceptación
3º) Verificación.- Se extrae una muestra cuyo tamaño se ha decidido en el paso
anterior y de ella se obtiene el correspondiente parámetro.
4º) Decisión.- Si el valor del parámetro muestral cae dentro de la zona de
aceptación, se acepta la hipótesis con un nivel de significación α . Si no, se rechaza.
Explicitar los cuatro pasos anteriores en los siguientes ejemplos con un nivel de
aceptación de α = 0´05 :
Ejemplo 1º.- Tenemos un dado que suponemos correcto. Lo lanzamos 100 veces
y obtenemos 25 cincos. ¿Podemos suponer que el dado es correcto o debemos suponer
que no?
Ejemplo 2º.- Hace 5 años se realizó una prueba de conocimientos a todos los
soldados profesionales del ejército español. El resultado fue µ = 102 y σ = 11 . Este año
se les ha pasado el mismo test a una muestra de 400 soldados y la media ha sido
x = 101 .
¿Podemos suponer que no ha habido cambio en los conocimientos de los
soldados profesionales en estos 5 años y que la diferencia observada es fruto del azar?
Ejemplo 3º.- Repite los dos ejercicios anteriores con un nivel de significación de
α = 0´01 para el primer ejemplo y α = 0´1 para el segundo.
10.- CONTRASTES DE HIPÓTESIS PARA LA MEDIA
Vamos a sistematizar los pasos que se dan para realizar contrastes de hipótesis
sobre la media de la población, distinguiendo los casos en que H 0 : µ = µ0 ó
H 0 : µ ≥ µ0 ó H 0 : µ ≤ µ0 .
110
H 0 : µ = µ0
A) Contraste bilateral.-
1º Paso.-
Hipótesis H 0 : µ = µ0 ; H1 : µ ≠ µ0 .
2º Paso.-
Obtención de la zona de aceptación. Bien cuando n ≥ 30 o la
población de partida es una N ( µ0 , σ 0 ) . Entonces las medias muestrales
σ 

x → N  µ0 , 0  .
n

Luego la zona de aceptación para un nivel de significación α es:
σ0 

 µ0 ± zα / 2 ⋅

n

3º y 4º paso.- Se extrae la muestra, se calcula x y se comprueba si está dentro de
la zona de aceptación
Valores críticos más usados
α /2
α /2
1−α
µ0 − zα / 2 ⋅
σ0
n
µ0
µ0 + zα / 2 ⋅
B) Contraste unilateral.-
1º Paso.- Hipótesis
α
zα / 2
0´10
1´645
0´05
1´96
0´01
2´575
σ0
n
µ ≤ µ0
ó
µ ≥ µ0
H0 : µ ≤ µ0
ó
µ ≥ µ0
H1 : µ > µ0
ó
µ < µ0
2º Paso.- Zona de aceptación para un nivel α
α
α
1−α
1−α
111
− zα
zα
N(0,1)
N(0,1)
σ 

La zona de aceptación en una N ( µ0 , σ 0 ) es:  − ∞, µ 0 + zα ⋅ 0  para µ ≤ µ0 y
n

σ


 µ 0 − zα ⋅ 0 ,+∞  para µ ≥ µ0
n


3º y 4º Paso.- Se extrae la muestra, se calcula x y se comprueba si está dentro o
fuera de la zona de aceptación.
Ejemplo1º.- El peso de los pollos de una granja sigue una N(2´6, 0´5). Se
experimenta un nuevo tipo de alimentación con 50 crías. Cuando se hacen adultos se les
pesa y se obtiene una media x = 2´78 Kg. Vamos a contrastar la hipótesis de que el peso
medio de la población no aumenta, con un nivel de confianza del 1%.
Ejemplo 2º.- Se cree que el coeficiente intelectual medio de los estudiantes de
una universidad es 113, con una σ = 7 . Para contrastar la hipótesis se extrae una
muestra de 180 estudiantes y se obtiene en ellos una media del coeficiente intelectual de
115.
¿Podemos aceptar la hipótesis con un nivel de significación del 5%?
11º.- CONTRASTE DE HIPÓTESIS PARA LA PROPORCIÓN
A) Contraste bilateral.-
H 0 : p = p0
1º Paso.- Hipótesis H 0 : p = p 0 ;
H 1 : p ≠ p0

2º Paso.- Zona de aceptación. Se sabe que si p = p 0 ⇒ p r → N  p 0 ,


p0 q 0
n
Por tanto, la zona de aceptación para un nivel de aceptación α es el intervalo

característico correspondiente  p 0 ± zα / 2 ⋅


p 0 q0
n

.


3º y 4º Paso.- Verificación y decisión. Se calcula, " p r " ,en la muestra y se
comprueba si está o no en la zona de aceptación.
112

.


B) Contraste unilateral.-
p ≤ p0 ó
p ≥ p0
Hipótesis
nula
H 0 : p ≤ p0
H 0 : p ≥ p0
H 1 : p > p0
H 1 : p < p0
1º
Paso
Hipótesis
alternativa
α
2º Paso
α
1−α
1−α
Zona de
aceptación

 − ∞, p 0 + z α ⋅


p 0 q0
n





 p 0 − zα ⋅



p0 q 0
,+∞ 

n

Ejemplo 1º.- A unas elecciones se presentan tres partidos, A, B y C. Un
comentarista político afirma que los electores se reparten del siguiente modo:
A favor de A, el 40%, a favor de B el 40% o más; a favor de C el 40% o menos.
Se pretende contrastar estas hipótesis mediante una muestra de 250 electores.
a) Hallar la zona de aceptación de cada uno de ellos, con un nivel de
significación del 5%.
b) Una vez extraída la muestra se obtienen 132 a favor de A, 88 a favor de B y
30 a favor de C.
Tomar decisiones respecto a las tres hipótesis.
Ejemplo 2º.- Respecto a un cierto dado, A opina que P(6) = 0´15, B opina que
P(6) ≤ 0´15 y C que P(6) ≥ 0´15 . Contrasta las tres hipótesis con un nivel de
significación de 0´10 sabiendo que se arrojó el dado 1000 veces y se obtuvo 183
veces el 6.
113
RESUMEN DEL TEMA 9.- INFERENCIA ESTADÍSTICA
1º) INTERVALOS CARACTERÍSTICOS.- Si la variable x tiene de media µ , se llama
intervalo característico para una probabilidad “p”, al intervalo (µ − k , µ + k ) tal que
P( µ − k < x < µ + k ) = p .
Si consideramos p = 1 − α y k = Z α . Entonces tenemos que:
2

Si x N(0,1) el intervalo característico será  − z α , z α
 2 2

.




Si x N ( µ , σ ) el intervalo característico será  µ − z α .σ , µ + z α .σ 
2
2


A) ESTIMACIÓN DE LA MEDIA
2º) TEOREMA CENTRAL DEL LÍMITE.- Dada una población de media µ y
desviación típica σ , no necesariamente normales. Entonces la distribución de las
medias muestrales, x , de tamaño n se distribuyen siempre que n ≥ 30 o la población
sigua una normal, como
 σ 
x → N  µ ,
 y
n

∑x
i
→ N (nµ , nσ ) .
Luego se puede inferir la media de la población a partir de la media muestral,
siendo el intervalo de confianza para la media con un nivel de confianza de (1 − α )100%

σ
σ 
es  x − z α .
; x + zα .
 . Si σ es desconocida, se debe estimar a partir de la muestra
n
n
2
2


con el parámetro s n −1 =
∑ (x
i
−x
n −1
)
2
. Sin embargo si n es grande se puede sustituir por
s.
Se llama valor máximo admisible a E = z α .
2
σ
n
que depende de α y de n, luego
de las tres variables, conociendo dos podemos calcular la tercera.
114
B) ESTIMACIÓN DE UNA PROPORCIÓN
3º) DISTRIBUCIÓN DE LAS PROPORCIONES MUESTRALES O
PROBABILIDADES
Si en una población la proporción de individuos que poseen una cierta
característica es, p, la proporción, p r , de individuos con dicha característica en las

muestras de tamaño “n” sigue una distribución N  p,

pq 
.
n 
Si se desea estimar la proporción, p, de individuos con una cierta característica
que hay en una población. Para ello se recurre a una muestra de tamaño “n” en la que se
obtiene una proporción muestral, p r .
El intervalo de confianza de, p, con un nivel de confianza del (1 − α ).100% es:

 pr − z α

2

p r (1 − p r )
; pr + zα
n
2
p r (1 − p r ) 
 . El error máximo admisible o cota de error

n

es:
E = zα
2
pq
, que está expresada en función de p y q que son desconocidos y lo que se
n
hace es estimarlos con los valores de p = p r ; q = 1 − p r . Luego E = z α
2
p r (1 − p r )
.
n
Todo lo dicho anteriormente es cierto si np ≥ 5; nq ≥ 5 y n ≥ 30 , ya que las
proporciones siguen una Binomial que es aproximable a una Normal cuando ocurre
esto.
C) CONTRASTES DE HIPÓTESIS
Consiste en hacer una hipótesis sobre un parámetro de la población y mediante
una muestra, aceptar o rechazar dicha hipótesis. Los pasos necesarios para tomar
decisiones sobre hipótesis estadísticas sencillas (sobre la media y la proporción), son los
siguientes:
115
1º Enunciación.- Se enuncia la hipótesis emitida (llamada hipótesis nula), H 0 , y
la contraria, H 1 , (hipótesis alternativa). Consiste en atribuirle un valor al parámetro.
2º Deducción de conclusiones.- Se elige la muestra, un nivel de significación y
se construye la zona de aceptación.
3º Verificación.- Se extrae una muestra cuyo tamaño ya se ha decidido en el paso
anterior y de ella se obtiene el correspondiente parámetro.
4º.- Decisión.- Si el valor del parámetro muestral cae dentro de la zona de
aceptación, se acepta la hipótesis con un nivel de significación α . Si no, se rechaza.
4º.- CONTRASTES DE HIPÓTESIS PARA LA MEDIA
a) Contrate bilateral.- H 0 : µ = µ 0 . En este caso la zona de aceptación para un

σ
σ 
nivel de significación α es  µ 0 − z α 0 ; µ 0 + z α 0 
n
n
2
2

b) Contraste unilateral.- H 0 : µ ≤ µ 0 ó µ ≥ µ 0 . En este caso la zona de
σ 

aceptación para un nivel de significación α es:  − ∞; µ 0 + zα 0  para
n


µ ≤ µ 0 y  µ 0 − zα
σ0


; ∞  para µ ≥ µ 0
n 
5º.- CONTRASTES DE HIPÓTESIS PARA LA PROPORCIÓN
a) Contraste bilateral.- H 0 : p = p 0 . En este caso la zona de aceptación para un

nivel de significación α es:  p 0 − z α

2

p0 q 0
; p0 + z α
n
2
p 0 q0
n




b) Contraste unilateral.-

H 0 : p ≤ p 0 .En este caso la zona de aceptación es:  − ∞; p 0 + zα



H 0 : p ≥ p 0 .En este caso la zona de aceptación es:  p 0 − zα


116
p0 q 0
n
p 0 q0 
;∞

n





RELACIÓN DE EJERCICIOS. TEMA 9
1º.-
2º.-
3º.-
4º.-
5º.-
6º.-
7º.-
8º.-
9º.-
En una población, una variable aleatoria sigue una ley Normal de media
desconocida y desviación típica 9. ¿De qué tamaño, como mínimo, debe ser la
muestra con la cual se estime la media poblacional con un nivel de confianza del
97% y un error máximo admisible igual a 3?
Se ha lanzado 400 veces un dado y se ha obtenido 80 veces el valor cinco.
Estime, mediante un intervalo de confianza al 95%, el valor de la probabilidad
de obtener un cinco.
a) Los valores: 52, 61, 58, 49, 53, 60, 68, 50, 53 constituye una muestra
aleatoria de una variable aleatoria Normal, con desviación típica 6. Obtenga un
intervalo de confianza para la media de la población, con un nivel de confianza
del 92%.
b) Se desea estimar la media poblacional de otra variable aleatoria Normal,
con varianza 49, mediante la media de una muestra aleatoria. Obtenga el
tamaño mínimo de la muestra para que el error máximo de la estimación,
mediante un intervalo de confianza al 97%
En una muestra aleatoria de 1000 personas de una ciudad, 400 votan a un
determinado partido político. Calcule un intervalo de confianza al 96% para la
proporción de votantes de ese partido en la ciudad.
De 500 encuestados en una población, 350 se mostraron favorables a la
retrasmisión de debates televisivos en tiempos de elecciones. Calcule un
intervalo de confianza, al 99´5%, para la proporción de personas favorables a
estas retransmisiones.
El gasto anual en videojuegos, de los jóvenes de una ciudad sigue una Normal
de media desconocida y desviación típica 18 €. Elegida, al azar, una muestra de
144 jóvenes se ha obtenido un gasto medio de 120 €.
a) Indique la distribución de las medias de las muestra de tamaño 144.
b) Determine un intervalo de confianza, al 99%, para el gasto medio en
videojuegos de los jóvenes de esa ciudad.
c) ¿Qué tamaño muestral mínimo deberíamos tomar para, con la misma
confianza, obtener un error menor que 1´9?
De una población Normal, con media desconocida y varianza 36, se extrae una
muestra aleatoria que resulta tener una media muestral de 173.
a) Obtenga un intervalo de confianza del 97% para la media poblacional, si el
tamaño de la muestra es de 64.
b) ¿Cuál debe de ser el tamaño mínimo de la muestra, si se desea que el error
cometido al estimar la media poblacional sea inferior a 1´2, para un nivel de
confianza del 95%?
Las calificaciones obtenidas por los estudiantes de Matemáticas siguen una ley
Normal de media desconocida y desviación típica 1´19. Para una muestra de
esa población se obtiene que (6´801, 6´899) es un intervalo de confianza, al
92%, para la media poblacional.
a) Determina la media muestral.
b) Determina el tamaño de la muestra
a) Sea la población {1, 5, 7}. Escribe todas las muestras de tamaño dos,
mediante muestreo aleatorio con reemplazamiento, y calcule la varianza de las
medias muestrales.
117
10º.-
11º.-
12º.-
13º.-
14º.-
15º.-
16º.-
c) De una población de 300 hombres y 200 mujeres se desea seleccionar,
mediante muestreo aleatorio estratificado con fijación proporcional, una
muestra de tamaño 30 distribuida en los dos estratos, ¿cuál será la
composición de la muestra?
Dada la población de elementos {3, 4, 5, 8}, se pretende seleccionar una
muestra de tamaño dos, mediante muestreo aleatorio con reemplazamiento.
a) Escribe todas las muestras posibles.
b) Calcule la varianza de la población.
c) Calcule la varianza de las medias muestrales.
Lanzamos 36 dados correctos y calculamos la media de sus resultados, x . Si
repetimos esta experiencia de forma reiterada:
a) ¿Cual será la distribución de las medias?.
b) ¿Cuál es la probabilidad de que la media de una de las tiradas sea mayor
que 4?
c) Halla un intervalo centrado en la media en el que se encuentre el 99% de las
medias de los lanzamientos.
Un ganadero de reses bravas quiere estimar el peso medio de los toros de su
ganadería con un nivel de confianza del 95%. Para ello, toma una muestra de
30 toros y los pesa. Obtiene una media x = 507 kg y una desviación típica s =
32 kg.
a) ¿Cuál es el intervalo de confianza para la media µ de la población?
b) ¿Cual será el intervalo si queremos que el nivel de confianza sea del 99%?
El cociente intelectual de un determinado colectivo tiene una media µ
desconocida y una desviación típica σ = 8 . ¿De qué tamaño debe ser la muestra
con la cual se estime la media con un nivel de confianza del 99% y un error
admisible E = 3?
Para estimar el peso medio de las chicas de 16 años de una ciudad, se toma una
muestra aleatoria de 100 de ellas. Se obtienen los siguientes parámetros:
x = 52,5kg , s = 5,3kg
Se realiza la afirmación siguiente: el peso medio de las chicas de 16 años de
esta ciudad está entre 51 y 54 kg. ¿Con qué nivel de confianza se hace la
afirmación?
En una empresa que fabrica microcircuitos se ha comprobado que el 4% de
estos son defectuosos. Un cliente va a comprar un paquete de 500
microcircuitos procedentes de la fábrica. Determina:
a) El número esperado de microcircuitos defectuosos en un paquete de 500.
b) La distribución de la proporción de microcircuitos defectuosos en las cajas
de 500 microcircuitos.
c) La probabilidad de que el número de microcircuitos defectuosos (en un
paquete de 500) esté entre 20 y 30.
Se ha lanzado 100 veces una moneda obteniéndose 62 caras. Estima la
probabilidad de “cara” mediante intervalos de confianza:
a) Del 90% b) Del 95%. C) Del 99%
17º.-
Basándonos en la experiencia del problema anterior, pretendemos estimar la
probabilidad de “cara” con un error menor que 0,002 y un nivel de confianza
del 95%. ¿Cuántas veces tendremos que lanzar la moneda?
118
18º.-
19º.-
20º.-
21º.-
22º.-
Para estimar el número de peces que hay en un pantano se procede de la
siguiente forma: se pescan con red una cierta cantidad de ellos, 349, se marcan
y se devuelven al pantano. Al cabo de varios días se vuelve a pescar otro montón
de ellos y se averiguan qué proporción. En esta segunda pesca se han obtenido
514 peces, de los cuales hay 37 marcados.
a) Halla un intervalo de confianza, al 90% para la proporción de peces
marcados en el pantano.
b) Halla un intervalo de confianza, al 90% para el total de peces del pantano.
Se ha comprobado que el tiempo de espera (en minutos) hasta ser atendido, en
cierto servicio de urgencias, sigue un modelo normal de probabilidad.
A partir de una muestra de 100 personas que fueron atendidas en dicho servicio,
se ha calculado un tiempo medio de espera de 14,25 minutos y una desviación
típica de 2,5 minutos.
a) ¿Podríamos afirmar, con un nivel de significación del 5%, que el tiempo
medio de espera, en ese servicio de urgencias, no es de 15 minutos?
b) ¿Qué podríamos concluir si el nivel de significación hubiese sido del 0,1%?
c) ¿Existe contradicción en ambas situaciones? Justifica la respuesta.
La duración de las bombillas de 100 vatios que fabrica una empresa sigue una
distribución normal con una desviación típica de 120 horas. Su vida media está
garantizada durante un mínimo de 800 horas.
Se escoge al azar una muestra de 50 bombillas de un lote y, después de
comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de
significación de 0,01, ¿habría que rechazar el lote por no cumplir la garantía?
Reflexionemos sobre cada una de las siguientes experiencias:
a) Lanzamos una moneda 10 veces y obtenemos 6 caras.
b) Lanzamos una moneda 100 veces y obtenemos 60 caras.
c) Lanzamos una moneda 1000 veces y obtenemos 600 caras.
¿Podemos deducir de alguna de ellas que la moneda es incorrecta tomando
como nivel de significación del 0,01?
En las última votaciones, el 53% de los votantes estaban a favor del alcalde. Se
acaba de realizar una encuesta a 360 personas elegidas al azar y 176 de ellas
estaban a favor del alcalde.
¿Se puede afirmar con un nivel de confianza del 90%, que el alcalde no pierde
popularidad?
119