Download Estadística II - Instituto Wiener

Document related concepts
no text concepts found
Transcript
INSTITUTO SUPERIOR
TECNOLÓGICO
NORBERT WIENER
Manual del Alumno
ASIGNATURA: Estadística II
PROGRAMA: S3C
Lima-Perú
2
Manual del Alumno
Índice General
Pág. N°
1. Introducción: Análisis Combinatorio, técnicas de conteo
..........................................................................................
03
2. Permutaciones: simples y circulares
..........................................................................................
10
3. Introducción a la Probabilidad: espacios muestrales
..........................................................................................
17
4. Definición de probabilidad en espacios muestrales finitos
..........................................................................................
22
5. Practica Calificada Nº 01
..........................................................................................
27
6. Axiomas de probabilidad: propiedades
.........................................................................................
28
7. Probabilidad condicional: Teorema de la multiplicación
.......................................................................................
33
8. Teorema de la Probabilidad total: Teorema de Bayes
.......................................................................................
43
9. Variables Aleatorias Discretas
.......................................................................................
53
10. Examen de la I Unidad Formativa
.......................................................................................
59
3
Manual del Alumno
11. Variables Aleatorias Continuas
.........................................................................................
60
12. Desigualdad de Tchevichev
........................................................................................
67
13. Distribución Binomial
.......................................................................................
70
14. Distribución de Poisson
.......................................................................................
77
15. practica calificada Nº 02
.......................................................................................
81
16. Distribución Normal
......................................................................................
82
17. Teorema central del Limite
.....................................................................................
88
18. Pruebas de hipótesis
....................................................................................
93
19. Examen de la II Unidad Formativa
...................................................................................
107
4
Manual del Alumno
SESION 01
INTRODUCCIÓN
El término Estadística tiene diversos significados, dependiendo del
modo en que se emplee; así pues, para un político, estará relacionado con
algún tipo de récord nacional o regional; un científico lo relacionará con
alguna técnica más o menos sofisticada de prueba de hipótesis; para un
matemático, este término estará relacionado con alguna fórmula empleada
para estimar algún parámetro de una variable aleatoria. Todos estos
significados se agrupan para formar esta ciencia, rama de las
matemáticas, la cual se fundamenta básicamente en la teoría de
probabilidades.
Antes de tratar de discutir este tema, será conveniente revisar algunas
definiciones:
Steel y Torrie dicen que la estadística "es la ciencia, pura y aplicada,
que se encarga de crear, desarrollar y aplicar técnicas, de tal manera que
la incertidumbre de las inferencias inductivas pueda ser evaluada".
Según Lewis, "ciencia y técnica que se ocupa de reunir, analizar y
resumir datos y de estimar la probabilidad de la inferencia que se haga con
dichos datos".
5
Manual del Alumno
Toro, define a la estadística como "ciencia que tiene por objeto agrupar
metódicamente todos los hechos que se presten a una valuación
numérica".
Toro , define a la bioestadística como "parte de la biología que aplica a los
seres vivientes los métodos estadísticos y el cálculo de probabilidades".
La Estadística, particularmente desde el punto de vista aplicado al método
científico, es una ciencia joven pudiéndose estudiar desde dos aspectos:
el descriptivo y el inferencial:
La Estadística Descriptiva. se ocupa de la representación
objetiva de la información (datos) colectada; para esto se requiere
al menos de un mínimo de conocimientos teóricos, así como de
bastante habilidad para comunicar en forma clara un mensaje
deseado, haciendo uso de figuras, gráficas, tablas, dibujos, etc.
La Estadística Inferencial.
trata de lo concerniente a la
obtención de deducciones de una parte al todo, desarrollando para
esto las técnicas de muestreo, las técnicas de estimación y las
técnicas de prueba de hipótesis.
Para llegar a la parte aplicada, y principalmente para conocer las bases
sobre las que descansa esto, se necesita tener al menos un concepto
somero acerca de mediciones, álgebra de conjuntos, probabilidades,
variables, funciones, densidades, distribuciones y de límites de confianza
en la estimación de parámetros o constantes poblacionales.
Los objetivos que expone Güenter para un curso de este estilo, parecen
muy apropiados para finalizar este capítulo de introducción:
6
Manual del Alumno
Introducir a los estudiantes en el lenguaje y filosofía de la
estadística. relacionarlos con los tipos de problemas que pueden
ser conducidos a soluciones estadísticas.
Presentar suficiente técnica estadística para que los estudiantes
puedan trabajar algunos tipos estándar de problemas.
Habilitar a los estudiantes para que puedan leer y comprender los
resultados sumarizados de experimentos estadísticos llevados a
cabo por otros investigadores. puede ser que algunos nunca
tengan que llevar a cabo un experimento por sí mismos, pero
puede ser que tengan que leer acerca del trabajo de otros en
"Journals".
PERMUTACIONES
Permutación: Conjunto ordenado de n elementos.
Notación: Pn
;
Pn,n
;
An, n
Permutación de 5 elementos
P5 = 5! Por lo que:
Pn = n!
P5 = 5! = 5 x 4 x 3 x 2 x 1 = 120
Ejemplo 1:
Para el conjunto {a, b, c} existen las siguientes permutaciones:
Solución:
Abc, acb, bca, bac, cab, cba = 6
P3 = 3! = 6
7
Manual del Alumno
Ejemplo 2:
En una asamblea de accionistas, hay 6 personas que han solicitado hacer
uso de la palabra ¿En cuántas órdenes diferentes pueden hablar, si es que
no se ha establecido un orden de prioridades?
Solución:
P6 = 6! = 720 formas distintas
Ejemplo 3:
En un proceso de manufactura hay seis operaciones distintas, que se
indican con A, B, C, D, E y F. En general no existe una secuencia fija para
las operaciones, con la salvedad de que A debe efectuarse al principio y F
al final. ¿Cuántas secuencias diferentes pueden ocurrir?
Solución:
A B C D E F
P4 = 4! = 24 formas diferentes
Cuando se toman parte de los elementos del conjunto se tiene:
Pn,r =
(n
n!
r )!
Ejemplo 4:
Si : n = 5
P5,3 =
y
5!
(5 3)!
Ejemplo 5:
r=3
5!
2!
120
2
60
8
Manual del Alumno
Hay 7 candidatos para desempeñar 3 tareas, si todos los candidatos son
igualmente eficientes, ¿De cuántas maneras se puede efectuar la
asignación?
Solución:
P7,3 =
7!
(7 3)!
7!
4!
7.6.5.4!
4!
210
Ejemplo 6:
De cuántas maneras 3 fresadoras, 4 tornos, 4 taladros y 2 cepillos pueden
ordenarse en fila en un taller, de modo que el mismo tipo de máquina
queden juntas.
3F
4T
4T
2C
P3 = 3!
P4 = 4!
P4 = 4!
P2 = 2!
P4 = 4!
3! x 4! x 4! x 2! x 4! = 165,888 maneras diferentes
Combinaciones :
Una combinación de “ n ” elementos tomados de “ r ” en “ r ” es un
subconjunto no ordenado de “r” elementos con r ≤ n.
9
Manual del Alumno
2 combinaciones formadas por r elementos son distintas, si difieren al
menos en un elemento.
Ejemplo 1:
Sea el conjunto {a, b, c} de cuántas maneras podemos seleccionar:
a)
un elemento
b)
dos elementos
c)
tres elementos
Solución:
a)
Existen 3 formas de seleccionar un elementos: a; b; c.
b)
Existen 3 formas de seleccionar dos elementos: ab, ac, bc
c)
Existe 1 forma de seleccionar 3 elementos: abc
Notación: nCr;
n
r
Para determinar el número de combinaciones de n elementos tomando de
r en r:
Crn
n!
r!(n r )!
Ejemplo :
Si n = 10
C710
r=7
10!
7!(10 7)!
10!
7!.3!
10.9.8.7!
7!.3!
720
120
6
10
Manual del Alumno
Ejemplo 2:
El congreso anglomexicano de administración pública, debe elegir el futuro
comité ejecutivo que regirá a esa institución durante el próximo año.
La comisión directiva se forma con 6 integrantes y este año han sido
propuestos 7 representantes mexicanos y 4 ingleses para ser electos. Se
pide determinar de cuántas maneras se puede integrar la comisión en los
siguientes casos:
a)
b)
Si en la comisión debe haber 4 mexicanos y 2 ingleses.
Si en la comisión debe haber como mínimo 2 ingleses y 2
mexicanos.
Solución:
a)
Los mexicanos se pueden escoger de: C47
7!
35
4!.3!
Los ingleses se pueden escoger de:
C24
4!
2!.2!
6
Conjuntamente : C 47 . C 24
= 35 x 6 = 210
b)
Se pueden presentar los casos:
1)
2 ingleses y 4 mexicanos: C 24 C 47 = 6 x 35 = 210
2)
3 ingleses y 3 mexicanos: C34 C37 = 140
3)
4 ingleses y 2 mexicanos: C 44 C37 = 21
210 + 140 + 21 = 371
Ejemplo 3:
11
Manual del Alumno
En los laboratorios “ELKO” hay 3 plazas vacantes de un total de 33
solicitudes de empleo, sólo 14 se han considerado aceptables, en bases
en las entrevistas practicadas por el departamento de personal. ¿De
cuántas maneras pueden asignarse las 3 plazas?
a)
Si todos los empleos son de la misma categoría
b)
Si un empleo es de gerente de ventas, uno es de agente visitador
para las ciudades de Puebla y Tlaxcala y otro de agente visitador para las
ciudades de Tampico y Cd. Madero.
Solución:
a)
b)
C314
14 P3
364
14!
11!
2184
Problemas y Ejercicios Propuestos:
1. De 7 candidatos ¿ Cuántas ternos se pueden escoger?
2. 4 alumnos deciden el horario en el cual harán sus prácticas pre
profesionales , sabiendo que existen 6 turnos disponible distintos y en
cada turno debe asistir uno de ellos. Entonces cuántas formas pueden
practicar
3. En la distribución de material para médico para 5 hospitales se tomó en
cuenta lo siguiente :
12
Manual del Alumno
A uno de ellos se debe entregar el material a las 8:30 al otro a las 9:00
y al siguiente a las 9:30 y así sucesivamente hasta el último . Si existe la
posibilidad de variar el orden de entrega de material a cada hospital,
entonces de cuantas formas distintas se entrega el material.
4. Cuántos objetos distintos deben existir para que el número de
combinación que se puede formar , tomándolos de 2 en 2 sea igual a 6
veces el número de objetos
5. Calcular :
a) K
b) K
c) K
35!*28!
27!*36!
29!
27! 28!
36! 37!
37! 36!
SESION 02
COMBINACIONES
13
Manual del Alumno
Análisis Combinatorio
Principio Fundamental del Conteo:
Suponga que una persona tiene 2 formas de ir de una ciudad A a otra
ciudad B; y una vez llegada a B, tiene 3 maneras de llegar a otra ciudad C,
¿De cuántas maneras podrá realizar el viaje de A a C pasando por B?
Si empezó a pie, podrá tomar luego avión, carro o trasatlántico, y si
empezó en bicicleta, también podrá tomar avión, carro o trasatlántico.
La persona tuvo 6 formas diferentes de realizar el viaje que son:
(iniciales) pa, pc, pt, ba, bc, bt. (2 x 3 = 6)
Se puede representar en un diagrama de árbol
Por lo que el principio fundamental del análisis combinatorio, puede
expresarse así:
14
Manual del Alumno
Si una primera decisión, operación o acción puede efectuarse de a formas
diferentes, una segunda acción puede efectuarse de b formas diferentes,
una tercera acción puede efectuarse de c formas diferentes y así
sucesivamente hasta la enésima acción que puede efectuarse de z formas
diferentes, entonces el número total de formas diferentes que pueden
efectuarse estas n acciones es igual con:
a x b x c x ... x z
Este principio también se llama principio del análisis combinatorio ó
principio multiplicativo.
Ejemplo 1: ¿De cuántas maneras diferentes podrá vestirse un joven que
tiene 3 camisas diferentes, 4 pantalones y 2 pares de calzado?
Solución:
3 x 4 x 2 = 24 maneras diferentes
Ejemplo 2: En una ciudad los números de teléfono constan de 5 dígitos,
cada uno de los cuales se llama con alguno de los 10 dígitos (0 al 9).
¿Cuántos números diferentes pueden formularse?
Solución:
10 x 10 x 10 x 10 x 10 = 100,000 números diferentes
Ejemplo 3:
La agencia de Publicidad PIPSA, ha obtenido la exclusividad respecto a
una línea de polvos para preparar postres. A estos efectos la agencia ha
decidido organizar un concurso nacional destinado a adivinar el nombre
futuro de esa línea de productos.
Las condiciones son:
15
Manual del Alumno
a)
Los nombres que se propongan deben ser de 4 letras.
b)
Ninguna letra debe repetirse.
c)
La primera y tercera letras deben ser consonantes.
d)
La segunda y cuarta letras deben ser vocales.
e)
Si una persona propone 2 veces el mismo nombre queda
descalificada.
¿Cuántos nombres debe proponer una persona para estar seguro que
participa en el sorteo público?
Considerar 28 letras del alfabeto
Solución:
23 x 5 x 22 x 4 = 10,120 nombres diferentes
¿Por qué esos números?
Porque hay 28 letras del alfabeto, 23 consonantes y 5 vocales, pero se
disminuyó de 23 a 22 en la primera y tercera cifra porque una de las
condiciones es que las letras no se repitan. Así como 5 y 4 en la segunda y
cuarta cifras, que son las vocales.
Notación Factorial
En algunos problemas de matemáticas se nos presentan multiplicaciones
de números naturales sucesivos tal como:
4 x 3 x 2 x 1 = 24
;
3x2x1=6
;
2 x 1 = 2.
Para abreviar estas expresiones, se usa una notación especial llamada
notación factorial y nos denota las multiplicaciones sucesivas de n hasta l y
se define como:
4 x 3 x 2 x 1 = 4!
3 x 2 x 1 = 3!
Se lee: “cuatro factorial” o
Se lee: “tres factorial”
o
“factorial de cuatro”
“factorial de tres”
16
Manual del Alumno
En términos generales:
n(n-1)(n-2)...x 2 x 1 = n! Se lee “n factorial”
o “factorial de n”
Propiedades:
a)
para n natural
n! = n(n-1)!
Ejemplo: 7! = 7 x 6! = 7 x 6 x 5 x 4!
b)
0! = 1
Ejemplos:
1)
5! = 5 x 4 x 3 x 2 x 1 = 120
2)
4! 3! = (24)(6) = 144
3)
4)
5)
Cuando n es demasiado grande se suele utilizar la fórmula de Stirling:
Ejemplo:
Determinar 50! por Stirling:
17
Manual del Alumno
18
Manual del Alumno
SESION 03
VARIACIONES
Calcula el número de subgrupos de 1, 2, 3, etc.
elementos que se pueden establecer con los "n"
elementos de una muestra. Cada subgrupo se diferencia
del resto en los elementos que lo componen o en el
orden de dichos elementos (es lo que le diferencia de las
combinaciones).
Por ejemplo, calcular las posibles
variaciones de 2 elementos que se pueden
establecer con los números 1, 2 y 3.
Ahora tendríamos 6 posibles parejas: (1,2),
(1,3), (2,1), (2,3), (3,1) y (3,3). En este caso
los subgrupos (1,2) y (2,1) se consideran
distintos.
SESION 04
INTRODUCCIÓN A LA PROBABILIDAD
Azar y Desconocimiento.
El azar está relacionado con el desconocimiento. Un ejemplo nos puede
ayudar; piense en un proceso industrial que produce grandes cantidades
de un artículo determinado. No todos los artículos producidos son
idénticos, cada artículo puede calificarse como ``bueno'' o ``defectuoso''. Si
19
Manual del Alumno
de toda la producción se escoge un artículo ``a ciegas'', ese artículo puede
resultar bueno o defectuoso. Esta es una situación azarosa (o aleatoria) y
la parte esencial de este azar es que no sabemos si el artículo
seleccionado es defectuoso. Claro que con experiencia en el proceso es
posible cuantificar de una manera numérica qué tan factible es que el
artículo sea defectuoso o no.
Azar e incertidumbre.
Hay otro concepto asociado al azar y es el de incertidumbre. Veamos un
ejemplo. Respecto a una inversión, podemos estar contemplando invertir
una cantidad de dinero. El retorno sobre la inversión puede ser fijo, como
en el caso de una cuenta en un banco con interés fijo; pero pensemos en
una empresa. El negocio puede resultar desde un gran éxito hasta un
fracaso, es decir, la ganancia no es fija, sino que depende del éxito a
obtener. Si no podemos evaluar qué tan factible es cada monto posible de
la ganancia, tenemos una situación de incertidumbre. Por el contrario, si
podemos tener una idea de qué tan probables son los diferentes
resultados y entonces tendremos una situación de riesgo. Esta última es la
que llamamos aleatoria o azarosa.
Espacio Muestral y Probabilidad.
El párrafo anterior se resume diciendo que en las situaciones o
experimentos aleatorios tenemos dos elementos esenciales:
1. Una lista de posibilidades a futuro: espacio muestral
2. Una cuantificación de la incertidumbre sobre esa lista de
posibilidades: asignación de probabilidades.
20
Manual del Alumno
Cualquier problema o situación en la probabilidad, parte de esos dos
elementos: Espacio Muestral y Probabilidades.
ESPACIO MUESTRAL.
El espacio muestral es el conjunto de todos los posibles resultados de un
experimento o situación aleatoria.
Si en una caja hay 10 manzanas y 2 están echadas a perder (¡al menos en
este momento!), al extraer tres manzanas y ver cuantas son buenas
podemos obtener 1, 2 o 3 buenas (¡0 buenas es imposible!). De modo que
en este ejemplo el espacio muestral es: { 1, 2, 3 }.
Si un juego consiste en tirar todos los volados que hagan falta hasta
obtener tres águilas seguidas o hasta que sean 15 volados, si nos fijamos
en el número de volados requeridos, el espacio muestral es: { 3, 4, 5, . . . ,
15 }. Pero si nos fijáramos en el número de soles que resultan, entonces el
espacio muestral es: { 0, 1, 2, . . . , 15 }.
Es claro que para determinar el espacio muestral en un experimento
aleatorio es necesario entender perfectamente:
Qué se va a hacer.
Qué se va a observar o contar.
SUCESOS O EVENTOS.
Cuando se tiene un espacio muestral llamamos, formalmente evento a
cualquier subconjunto del espacio muestral.
Decimos que un evento se realiza, cuando el resultado del experimento
aleatorio es un elemento del evento.
21
Manual del Alumno
Las dos definiciones anteriores son muy abstractas. Veamos un par de
ejemplos.
En el caso de contar cuantos volados hacen falta para conseguir tres
águilas seguidas o tirar 15 volados; el espacio muestral son los números:
3, 4, 5, . . . , 15.
Un evento podría ser { 3, 5, 7, . . . , 15}.
Este evento corresponde a que el número de tiros necesario sea n ó n. Si
al hacer los volados los resultados fueran:
AASAASSSAAA (aquí nos detenemos porque han caído ya, tres
águilas seguidas), el evento si se realizó porque el número
necesario fue 11 y es n ó n .
SSSAAA (aquí paramos porque ya hay tres águilas), el evento no
se realizó.
Podemos pensar que cada experimento al azar es un juego y que un
evento es una lista de los resultados que hacen que YO gane.
Otro ejemplo más. Al comprar llantas para mi auto, puede ser que
manifiesten un defecto de fabricación dentro del período de garantía total y
que el fabricante deba reponerlas. También puede pasar que el defecto se
manifieste en el período de garantía parcial y que el fabricante bonifique
sólo un porcentaje o que el defecto se manifieste después de vencido el
período de garantía en cuyo caso el fabricante no paga nada. También
puede pasar que las llantas no tengan defecto de fabricación aparente y
que no haya garantía que reclamar. Como se puede considerar que las
llantas que me vendieron se escogieron al azar de entre toda la
producción, tenemos un experimento aleatorio.
22
Manual del Alumno
El espacio muestral en este experimento es: S = { T, P1, P2, P3, N, OK }.
Con la siguiente notación T: pago total, P1 pago del 50%, P2: pago del
30%, P3: pago del 10%, N: nada de pago, OK: llantas sin defecto. El
evento { OK } sólo se realiza cuando las llantas no tienen defecto.
En este último ejemplo se tiene un evento simple porque consta de un solo
punto del espacio muestral. Será compuesto cuando tiene varios puntos
del espacio muestral. Se llama evento imposible al que no puede ocurrir;
éste evento corresponde al conjunto vacío. Otro evento extremo es el
espacio muestral mismo que, puesto que siempre ocurre, se llama evento
seguro.
Problemas Propuestos:
1. En una caja hay 8 focos de los cuales 3 están fundidos. Se van a
sacar los focos de uno en uno, hasta encontrar los tres fundidos.
Si nos fijamos en el número de focos que se quedan en la caja
¿cuál es el espacio muestral?
2. En el experimento de los volados mencionado arriba. Si nos
fijamos en el número de soles que salieron, describa en sus
propias palabras, cuál es el evento { 0, 1, 2 }. Si los resultados
fueron AASAASAAA ¿Por qué se detuvo el experimento? ¿Se
realizó el evento?
3. Júntese con un compañero de este curso y entre los dos discutan
y encuentren un ejemplo de un experimento aleatorio relacionado
con las personas que están en la biblioteca después de las 10 de
la noche. Expliquen cuál es el espacio muestral. Expliquen qué
información necesitarían para asignar probabilidades.
23
Manual del Alumno
4. Con su mismo compañero, encuentren un ejemplo de un
experimento aleatorio referente a las inscripciones. Detallen el
espacio muestral. Propongan un evento. Den un ejemplo de un
resultado que implique que el evento no se realizó y otro resultado
donde el evento sí se haya realizado.
24
Manual del Alumno
SESION 05
PRACTICA CALIFICADA
SESION 06
PROBABILIDAD
Aparte del espacio muestral, en cada experimento aleatorio hay una
asignación primaria de probabilidades. Basados en la experiencia o en
razonamientos de simetría, a cada elemento del espacio muestral le
asignamos una evaluación de qué tan factible es. Esta evaluación se
refleja en un porcentaje (número entre 0 y 1). Entre más factible sea el
resultado, mayor es el porcentaje que se le asigna. Los casos extremos
son:
Un evento que no puede suceder, tiene probabilidad cero. Muchas
veces estos eventos con probabilidad cero son imposibles por
alguna contradicción lógica en su definición. Por ejemplo: ``que la
suma de dos dados sea n ó n y los dos dados tengan el mismo
número''.
En el otro extremo hay eventos que siempre suceden y estos
tienen probabilidad uno. Por ejemplo: ``que el número de águilas
en dos volados sea menor o igual a 7.8'', aunque el evento pueda
resultar extraño en su definición, siempre sucede y tiene
probabilidad igual a 1.
25
Manual del Alumno
La asignación toma la forma matemática de una función y se llama función
de probabilidad.
El dominio de esta función es el espacio muestral y su codominio es el
intervalo real [ 0, 1 ].
Esta función nos da las probabilidades de los eventos simples. Para un
evento compuesto, simplemente sumamos las probabilidades de los
elementos que lo componen.
EJEMPLOS.
La probabilidad es un concepto muy viejo en las matemáticas. Actualmente
lo aplicamos en prácticamente todos los campos de la actividad humana.
La variedad de situaciones en que se aplica va desde la producción hasta
la planeación a largo plazo de las empresas.
Aunque esta es la visión moderna, y la razón de que estemos estudiando
probabilidad en este curso, los orígenes del concepto son muy humildes,
comenzó aplicándose a los juegos de azar.
Pensemos en un dado perfectamente balanceado de modo que ninguno
de los seis lados es favorecido.
El espacio muestral es { 1, 2, 3, 4, 5, 6 }.
La función de probabilidad le asigna a cada uno de los elementos del
espacio muestral el valor de 1 / 6.
Esta asignación la hacemos porque el dado está balanceado.
Decimos que la probabilidad de un evento es el número de resultados
favorables al evento entre el número de resultados posibles.
26
Manual del Alumno
Por ejemplo, la probabilidad de que el resultado sea mayor que 4 es 2 / 6,
porque hay 2 resultados favorables entre los 6 resultados posibles.
Formalmente, el evento es A = { 5, 6 } y P[A] = 2/6.
La probabilidad que resulta de esta manera, tiene una interpretación
empírica; si hacemos una serie larga de lanzamientos del dado, y
observamos la frecuencia de resultados favorables al evento A, esta
frecuencia tiende a ser 2/6.
Otro ejemplo: una urna con 50 papelitos numerados de los cuales se
escoge uno para que tenga un premio. El espacio muestral es { 1, 2, 3, . . .
, 50 }. La asignación de probabilidades es de 1 / 50 para cada resultado. Si
yo compré los números 1, 14 y 18; el evento de que yo gane es { 1, 14, 18
} y la probabilidad de que gane es 3 / 50.
SESION 07
PROBABILIDAD DE SUCESOS
27
Manual del Alumno
Al definir los sucesos hablamos de las diferentes
relaciones que pueden guardar dos sucesos entre sí, así
como de las posibles relaciones que se pueden
establecer entre los mismos. Vamos a ver ahora cómo se
refleja esto en el cálculo de probabilidades.
a) Un suceso puede estar contenido en otro: entonces,
la probabilidad del primer suceso será menor que la del
suceso que lo contiene.
Ejemplo: lanzamos un dado y analizamos dos sucesos:
a) que salga el número 6, y b) que salga un número par.
Dijimos que el suceso a) está contenido en el suceso b).
P(A) = 1/6 = 0,166
P(B) = 3 / 6 = 0,50
Por lo tanto, podemos ver que la probabilidad del suceso
contenido, suceso a), es menor que la probabilidad del
suceso que lo contiene, suceso b).
b) Dos sucesos pueden ser iguales: en este caso, las
probabilidades de ambos sucesos son las mismas.
Ejemplo: lanzamos un dado al aire y analizamos dos
sucesos: a) que salga número par, y b) que salga múltiplo
de 2. Las soluciones coinciden en ambos casos.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
28
Manual del Alumno
c) Intersección de sucesos: es aquel suceso
compuesto por los elementos comunes de los dos o más
sucesos que se intersectan. La probabilidad será igual a
la probabilidad de los elemntos comunes.
Ejemplo: lanzamos un dado al aire y analizamos dos
sucesos: a) que salga número par, y b) que sea mayor
que 3. La intersección de estos dos sucesos tiene dos
elementos: el 4 y el 6.
Su probabilidad será por tanto:
P(A B) = 2 / 6 = 0,33
SESION 08
PROBABILIDAD DE SUCESOS
d) Unión de dos o más sucesos: la probabilidad de la
unión de dos sucesos es igual a la suma de las
probabilidades individuales de los dos sucesos que se
unen, menos la probabilidad del suceso intersección
29
Manual del Alumno
Ejemplo: lanzamos un dado al aire y analizamos dos
sucesos: a) que salga número par, y b) que el resultado
sea mayor que 3. El suceso unión estaría formado por los
siguientes resultados: el 2, el 4, el 5 y el 6.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P (A B) = 2 / 6 = 0,33
Por lo tanto,
P (A u B) = (0,50 + 0,50) - 0,33 = 0,666
e) Sucesos incompatibles: la probabilidad de la unión
de dos sucesos incompatibles será igual a la suma de las
probabilidades de cada uno de los sucesos (ya que su
intersección es el conjunto vacio y por lo tanto no hay que
restarle nada).
Ejemplo: lanzamos un dado al aire y analizamos dos
sucesos: a) que salga un número menor que 3, y b) que
salga el número 6.
La probabilidad del suceso unión de estos dos sucesos
será igual a:
P(A) = 2 / 6 = 0,333
P(B) = 1 / 6 = 0,166
Por lo tanto,
30
Manual del Alumno
P(A u B) = 0,33 + 0,166 = 0,50
f) Sucesos complementarios: la probabilidad de un
suceso complementario a un suceso (A) es igual a 1 P(A)
Ejemplo: lanzamos un dado al aire. el suceso (A) es que
salga un número par, luego su complementario, suceso
(B), es que salga un número impar.
La probabilidad del suceso (A) es igual a :
P(A) = 3 / 6 = 0,50
Luego, la probabilidad del suceso (B) es igual a:
P(B) = 1 - P(A) = 1 - 0,50 = 0,50
Se puede comprobar aplicando la regla de "casos
favorables / casos posibles":
P(B) = 3 / 6 = 0,50
g) Unión de sucesos complementarios: la probabilidad de la unión
de dos sucesos complementarios es igual a 1.
Ejemplo: seguimos con el ejemplo anterior:
a) que salga un número par, y b) que salga
un número impar. La probabilidad del suceso
unión de estos dos sucesos será igual a:
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
Por lo tanto,
31
Manual del Alumno
P(A U B) = 0,50 + 0,50 = 1
32
Manual del Alumno
SESION 09
AXIOMAS DE LA PROBABILIDAD
Teniendo en cuenta las operaciones para hacer conjuntos nuevos, hay
algunos hechos fundamentales respecto a la probabilidad que se cumplen
siempre:
1. P(A) mayor o igual a 0
2. P(S) = 1
3. P(A ó B) = P(A) + P(B) si A y B son excluyentes.
De estas tres propiedades, los matemáticos deducen un montón de reglas
útiles para calcular probabilidades en situaciones más complicadas. A este
tipo de proposiciones de las que se deducen otras, se les llama axiomas y
los tres de arriba son los axiomas de la probabilidad. Algunas de las
fórmulas más útiles, deducidas de los axiomas, son las siguientes.
P( vacío ) = 0
P(A') = 1- P(A)
P(A - B) = P(A) - P(A y B)
Si A está contenido en B entonces P(A) menor o igual a P(B)
P(A) menor o igual a 1
P(A ó B) = P(A) + P(B) - P(A y B).
La deducción de estas leyes a partir de los tres axiomas es un ejercicio de
ingenio matemático al que valdría la pena asomarse, pero en el que no
tenemos intención de meternos de lleno. Ya que desde el punto de vista de
este curso, lo interesante es aplicarlas.
Respecto a la tercera de la reglas, note bien que la resta de conjuntos se
define así: ``A - B'' es la colección de elementos de A que no están en B.
33
Manual del Alumno
De tal suerte que P(A - B) debe contemplar sólo a elementos de A y por
eso es que a P(A) no le restamos P(B) sino solamente P(A y B).
Otro comentario lo merece la última regla:
P(A ó B) = P(A) + P(B) - P(A y B).
Es preciso restar P(A y B) ya que así no lo hiciéramos, se estaría tomando
en cuenta dos veces a los elementos comunes a A y a B.
Problemas Propuestos
Resolver los siguientes ejercicios
1. Inventen un juego con dos dados. Como ejemplos,
o
tirar dos dados y el resultado no es la suma de los dados
sino la multiplicación.
o
tirar dos dados y el resultado es 1000 si la suma de los
dos es par y 5000 si la suma es n ó n.
Escriban el espacio muestral y, teniendo en cuenta que las 36
parejas de posibles resultados con dos dados: { (1,1), (1,2), (1,3), .
. . } son igualmente probables, encuentren la función de
probabilidad para el juego que inventaron.
Combinaciones de Sucesos o Eventos.
Definir la unión e intersección de eventos. Obtener la probabilidad de la
unión e intersección de eventos. Enunciar y aplicar las leyes de la
probabilidad. Definir eventos mutuamente excluyentes y la partición de un
espacio muestral. Establecer y aplicar la ley de la adición de la
probabilidad para n eventos.
34
Manual del Alumno
De la función de Probabilidad al cálculo de probabilidades
Toda la información matemáticamente importante respecto a un
experimento aleatorio se encuentra en:
El espacio muestral.
La función de probabilidad.
El cálculo de la probabilidad de un evento se simplifica partiéndolo en
eventos más sencillos y uniendo los pedazos de acuerdo a la llamada ley
de la adición para probabilidades.
Un ejemplo nos puede servir. Se van a tirar dos dados y yo gano si
la suma de los dados da siete o
aunque la suma no sea siete, si uno, al menos, de los dados cae
en uno.
Los resultados de tirar los dados son 36: S = { (1,1),(1,2),(1,3), . . . ,(6,6) }.
Además, por la simetría interna de los dados, cada uno de estos 36
resultados es igualmente probable. Esto establece la función de
probabilidad.
Pasemos al problema de calcular la probabilidad de ganar. Una manera
equivocada de resolver el problema es así. Yo gano si
el primer dado cae uno o
el segundo dado cae uno o
la suma de los dos es siete.
Como las respectivas probabilidades son: 1 / 6, 1 / 6 y 1 / 6. La
probabilidad de que gane es la suma de estas tres, 1 / 2. Lo que tiene mal
este razonamiento es que los eventos en que hemos partido el resultado
35
Manual del Alumno
de que yo gane no son ajenos, y en estas circunstancias no se vale sumar
las probabilidades y ya.
Para responder correctamente hay que partir el resultado de que yo gane
en más pedazos:
que el primer dado caiga uno y el otro no o
que el segundo caiga uno y el primero no o
que los dos caigan uno o
que la suma sea siete pero no haya ningún uno.
Las respectivas probabilidades son: 5 / 36, 5 / 36, 1 / 36 y 4 / 36. Para una
probabilidad total de ganar de: 15 / 36; esto es menor que 1 / 2 que es la
que habíamos calculado mal.
Fíjese que para resolver el problema lo partimos en pedazos más
pequeños,
los pedazos son ajenos.
la probabilidad fue la suma de esos pedazos.
En el ejemplo usamos un espacio muestral equiprobable.
Problemas propuestos:
Resuelva estos ejercicios.
1. Se van a tirar 5 monedas y el resultado va a ser el número de
águilas menos el número de soles. Escriban el espacio muestral
equiprobable para este experimento. (Debe tener 32 resultados).
2. Siguiendo con el ejercicio anterior, me van a dar una cantidad de
pesos igual a la resta: [número de águilas] MENOS [número de
soles]. Si sale negativo quiere decir que ¡yo pago! ¿Cuál es la
probabilidad de que gane más de dos pesos?
36
Manual del Alumno
3. Si un dado se construye de modo que un 1 o un 2 ocurran dos
veces más frecuentemente que un 5, mismo que se presenta tres
veces más seguido que un 3 o un 4 o un 6. ¿Cuál es la
probabilidad de que el número que se obtiene sea par? ¿Cuál la
de que sea un cuadrado perfecto? ¿Cuál la de que sea mayor que
4?
4. ¿Cómo harían Uds. para construir un dado como el que se
propone en el ejercicio anterior?
37
Manual del Alumno
SESION 10
EXAMEN PARCIAL
SESION 11
PROBABILIDAD CONDICIONAL
Consideremos la siguiente situación. Se tienen tres urnas similares; por
fuera son idénticas. Se sabe que
en la urna 1 hay 3 bolas blancas y 19 azules,
en la urna 2 hay 20 bolas blancas y 2 azules,
en la urna 3 hay 11 bolas blancas y 11 azules.
Se va a sacar una bola de una de las urnas. Puede ser azul o blanca.
¿Cuál es la probabilidad de que sea blanca?
Hay cuatro posibles soluciones:
1. La probabilidad de una blanca es 3 / 22. Esto es porque si se
escoge la urna 1, hay 3 de 22 bolas que son blancas. Esta
respuesta nos deja pensando en que es muy arbitrario decir que la
urna escogida es la 1. Si la urna escogida fuese la 1 esta sería la
respuesta correcta.
2. De manera similar, podemos pensar que la urna escogida es la 2 y
entonces la probabilidad de una bola blanca es 20 / 22.
3. Claro que, también, la urna escogida puede ser la 3 y entonces la
probabilidad de blanca es 11 / 22.
38
Manual del Alumno
4. Como no se sabe cual es la urna escogida y las tres urnas tienen
el mismo número de bolas, la probabilidad se calcula como si
fuese una gran urna con 66 bolas de las cuales 3 + 20 + 11 son
blancas y, así, la probabilidad es 34 / 66
¿Cuál es la respuesta correcta? o ¿habrá otra que sea la respuesta
correcta?
Una cosa es clara; si podemos suponer que la urna escogida es la 1, la
respuesta correcta es la primera. Lo mismo se puede decir de la segunda y
la tercera. La cuarta es un poquito más atrevida y quizá sea correcta. Por
lo pronto vamos a darle un nombre a las tres primeras: les llamamos
probabilidad condicional.
A la primera la llamamos ``probabilidad condicional de blanca dado
que la urna es la 1''.
A la segunda, la llamamos de manera similar condicional de blanca
dado que la urna es la 2.
A la tercera se le da un nombre análogo [¿Cuál nombre?].
Más adelante en el curso, veremos lo que se llama fórmula de la
probabilidad total y entonces, veremos que la cuarta respuesta daría la
``probabilidad no condicional''.
Por el momento ampliemos nuestras ideas sobre probabilidad condicional
con un poco de matemáticas.
Formalmente, definimos en clase la probabilidad condicional de la
siguiente manera:
P( A | B ) = [P( A y B )] / [P( B )]
39
Manual del Alumno
El símbolo P( A | B ) lo leemos como probabilidad de A dado B. Lo
interpretamos como la probabilidad de que, sabiendo que ya
sucedió B, además suceda A. En el ejemplo de las urnas A sería el
evento ``la bola es blanca''; B sería la urna correspondiente.
Como lo que está abajo en el quebrado es la probabilidad de lo
dado, la fórmula no es simétrica en A y B. Si los intercambiamos,
da otro número. Esto se ve en el ejemplo ya que no es lo mismo
que nos informen cual es el número de la urna escogida a que nos
digan que la bola fue blanca y nos pregunten cuál es la urna.
Esta fórmula no tiene sentido matemático si P(B) = 0. En tal caso
decimos que la probabilidad condicional no está definida. Claro
que eso está bien porque no puede haber sucedido algo que es
imposible.
Fíjese que esta fórmula se usará cuando haya una manera fácil de calcular
las probabilidades no condicionales y la condicional sea difícil. Eso no fue
el caso con el color de la bola y las urnas.
Para ejemplificar el tipo de situación en que nos sirve la fórmula descrita,
considere este problema.
Se tiran dos dados y se sabe que el primero no tiene el número 5. ¿Cuál
es la probabilidad de que la suma de los dados sea 8?
Para resolver, llamemos
B el evento: ``el primer dado no es 5''.
A el evento: ``la suma de los dados es 8''.
Con los datos se ve que:
P(B) = 30 / 36.
40
Manual del Alumno
Porque de las 36 parejas posibles, 6 tienen 5 en el primer dado.
P(A y B) = 4 / 36.
Porque sólo se obtiene 8, con las parejas (2,6), (3,5), (4,4) y (6,2) [La
pareja (5,3) sí suma ocho pero tiene un 5 en el primer dado].
y, usando la fórmula, P(A|B) = 4 / 30.
También hubiéramos podido calcular sin la fórmula, pero esa cuenta
requiere más ingenio. En este ejemplo es fácil calcular las probabilidades
no condicionales.
Hay muchos problemas, como en el de las urnas, en que lo contrario es lo
cierto: es fácil calcular la condicional y la podemos usar para calcular la
conjunta.
Si despejamos a P(A y B), tendremos una fórmula para calcular la
probabilidad conjunta cuando sea fácil calcular la condicional.
En clase hacemos un ejemplo simple de cálculo de probabilidad
condicional con una tabla de dos clasificaciones cruzadas.
En ese ejemplo se ven tres cosas:
1. La probabilidad condicional nos permite medir la información. En
los ejemplos vimos como cambia la probabilidad de A, antes de
conocer nada: P(A) y después de conocer la ocurrencia de el
evento B: P(A | B).
2. En un extremo está el cambio enorme que corresponde a que A y
B sean excluyentes (ajenos). En este caso la probabilidad podría
llegar incluso a ser cero.
3. En el otro extremo están los eventos en los que sucede que P(A |
B) = P(A). Esto quiere decir que la información de que B ocurrió no
41
Manual del Alumno
cambia la probabilidad de A y decimos que A y B son
independientes.
Esta última característica, la independencia, juega un papel muy
importante en la probabilidad y merece una atención más detallada. Por el
momento debemos establecer una definición:
A y B son eventos independientes si y sólo si P(A y B) =
P(A) P(B)
En forma equivalente decimos:
A y B son eventos independientes si y sólo si P(A | B) =
P(A)
La equivalencia se sigue de una sustitución algebraica muy sencilla.
La consecuencia de que esta sea una definición es que:
para comprobar la independencia de dos eventos es
preciso hacer ver que P(A y B) = P(A)P(B).
Es importante remarcar la diferencia de concepto entre eventos
independientes y eventos excluyentes o ajenos. En nuestro ejemplo se ve
claramente que ambos conceptos son antitéticos. El hecho de que dos
eventos se excluyan casi implica que no son independientes. La excepción
se da en el caso degenerado de que alguno de ellos (o los dos), sea
imposible. En el habla cotidiana, a veces, se confunden estos conceptos.
Note que si A es imposible; P(A) = 0. Además ``A y B'' también es
imposible y se tiene P(A y B) = P(A)P(B) ya que ambos lados de la
igualdad valen cero . Pero éste es el único caso en que dos eventos son
ajenos e independientes a la vez; en términos geométricos la idea de
independencia se asemeja a la perpendicularidad y la de ``ajenos'' al
paralelismo.
42
Manual del Alumno
Probabilidades de Intersecciones de Sucesos o Eventos.
Establecer y aplicar la ley general multiplicativa de la probabilidad para n
eventos.
Definir independencia de n eventos.
Dada una colección de eventos, determinar si son o no independientes.
Establecer y aplicar la ley particular multiplicativa de la probabilidad para n
eventos independientes.
Probabilidades conjuntas
Con:
la definición que hicimos de probabilidad condicional y
la definición de independencia podemos establecer igualdades que
nos auxilien para calcular la probabilidad de la ocurrencia
simultánea de dos eventos.
1. Para dos eventos en general.
P(A y B) = P(A) P(B | A)
o
Esta igualdad no es más que la definición de probabilidad
condicional volteada al revés.
o
Para aplicar esta igualdad es preciso que contemos, de
alguna manera indirecta, con la probabilidad condicional.
o
La igualdad se puede escribir también, condicionando
sobre B, así.
P(A y B) = P(B) P(A | B)
2. Para dos eventos independientes
P(A y B) = P(A) P(B)
43
Manual del Alumno
o
Para poder usar esta igualdad se necesita saber, de otras
fuentes, que A y B son independientes.
o
Esta igualdad no es más que la versión de la de arriba
cuando P(B | A) = P(B).
Estas igualdades son muy útiles cuando el experimento aleatorio se va a
llevar a cabo en etapas temporales. Por ejemplo, suponga que una
empresa recibe materia prima empaquetada en sobres de 300g. que
vienen en cajas de 50 sobres cada una; suponga, además que cada sobre
puede ser: bueno o deficiente. Para revisar una caja, se van a tomar, al
azar, 3 sobres.
si más de 2 sobres son deficientes se rechazará la caja completa.
si ningún sobre es deficiente, se aceptará la caja completa.
si hay 1 o 2 sobres deficientes, se tomarán otros 3 sobres y si el
total de deficientes de los 6 sobres revisados, se pasa de 2, se
rechazará la caja completa (en caso de ser 2 o menos, se acepta
la caja).
Una fuente secreta nos informa que una caja específica tiene 10 sobres
deficientes. ¿Cuál es la probabilidad de que esa caja sea aceptada?
El problema es complejo, trate Ud. de resolverlo, la respuesta involucra
pensar en etapas, de acuerdo a los diferentes resultados de la primera
etapa. El problema lo resolvemos en el salón.
Más de dos Sucesos o Eventos
Ambas igualdades se pueden llevar a tres o más eventos, como sigue:
P(A y B y C) = P(A) P(B | A) P(C | A y B)
o cualquier otro orden para el condicionamiento,
por ejemplo:
44
Manual del Alumno
P(A y B y C) = P(B) P(C | B) P(A | B y C)
Para el caso de eventos independientes la igualdad se simplifica en su
escritura:
P(A y B y C) = P(A) P(B) P(C)
La generalización de las fórmulas anteriores a más de tres eventos es
inmediata.
No olvide que para aplicar cualquiera de estas fórmulas es preciso
conocer, previamente los valores de las probabilidades involucradas.
Un
ejemplo
de
uso
de
estas
fórmulas
es
el
siguiente:
Si una pistola está cargada con 15 cartuchos, de los cuales 2 son inútiles y
no funcionarán, ¿Qué probabilidad hay de que el primer cartucho funcione
y los dos siguientes no?
En este ejemplo, por la especificación del evento, podemos calcular las
probabilidades condicionales por separado y eso nos lleva aplicar la
primera de las fórmulas vistas arriba.
La solución la damos en el pizarrón.
Más sobre independencia
Respecto a la independencia de dos eventos, hay algunas cosas muy
elementales que agregar a la definición que hicimos en notas pasadas.
1. La independencia de dos eventos A y B, quiere decir que el saber
que A sucedió no modifica la probabilidad de que B también haya
sucedido. Como consecuencia saber que A no sucedió tampoco
puede afectar a la probabilidad de B.
Hacemos una demostración formal en el pizarrón.
Podemos poner esto diciendo que
45
Manual del Alumno
Si A y B son independientes, también lo son las
tres siguientes pares: A' y B ; A y B' ; A' y B'
(estamos usando el apóstrofe ' para denotar
complemento)
2. Cuando se tienen tres eventos, se puede presentar una situación
muy curiosa. Puede pasar que
o
A y B sean independientes y
o
A y C sean independientes y
o
B y C también sean independientes.
Pero A, B y C NO sean independientes.
Esta situación curiosa se describe diciendo que no basta que
varios eventos sean independientes a pares, para que sean
independientes.
El ejemplo clásico es el de un experimento aleatorio con cuatro
posibles resultados igualmente probables: 1, 2, 3 y 4 .
o
Si el resultado es 1, A gana y nadie más.
o
Si el resultado es 2, B gana y nadie más.
o
Si el resultado es 3, C gana y nadie más, pero
o
Si el resultado es 4, los tres A, B y C ganan.
Usted puede calcular las probabilidades para darse cuenta que:
o
P(A y B) = P(A) P(B)
o
P(A y C) = P(A) P(C)
o
P(B y C) = P(B) P(C)
pero P(A y B y C) no es igual a P(A) P(B) P(C).
46
Manual del Alumno
3. Una nota final de un estilo menos matemático. La palabra
independencia se utiliza en otros contextos para denotar un
sinnúmero de conceptos diferentes.
Los ejemplos más comunes son en política, en historia, en
derecho. En la ciencia se habla de variables independientes y el
significado es diferente que el que usamos aquí. Aún en otras
ramas de la matemática se usa la palabra independencia para
denotar a otros conceptos. Cuando queremos distinguir la
definición técnica que usamos en la probabilidad de otras nociones
le
ponemos
un
apellido
a
la
independencia
y
decimos
independencia estocástica.
Es conveniente recordar que cuando existe duda si dos eventos son
independientes o nó, la única forma de zanjar la cuestión es viendo si P(A
y B) es igual o diferente al resultado de multiplicar P(A) P(B). Naturalmente
que si la independencia de dos eventos está en duda, el cálculo de P(A y
B) no se puede hacer simplemente multiplicando P(A) P(B) sino que se
debe justificar de alguna otra manera.
47
Manual del Alumno
SESION 12
TEOREMA DE BAYES
Veamos un problema que nos llevará a una regla interesante de cálculo de
probabilidades que se llama: el teorema de Bayes.
En una etapa de la producción de un artículo se aplica soldadura y para
eso se usan tres diferentes robots. La probabilidad de que la soldadura sea
defectuosa varía para cada uno de los tres, así como la proporción de
artículos que cada uno procesa, de acuerdo a la siguiente tabla.
robot prob. Defect. prop. Proces.
A
0.002
18%
B
0.005
42%
C
0.001
40%
Tenemos un par de preguntas:
Cuál es la proporción global de defectos producida por las tres
máquinas
Si tomo un artículo al azar y resulta con defectos en la soldadura,
cuál es la probabilidad de que haya sido soldado por el robot C.
(I) La primera pregunta nos va a llevar a lo que se conoce con el nombre
de fórmula de la probabilidad total.
Queremos conocer la proporción global de defectos delos tres robots.
Después de reflexionar un momento se ve que si todas las soldaduras las
pusiera el robot C, habría pocos defectos, serían 0.001 o 0.1%. En cambio,
si todas las pone el B, ¡sería un desastre!, tendríamos cinco veces más:
48
Manual del Alumno
0.005 o 0.5%. De modo que en nuestra respuesta debemos tener en
cuenta las diferentes proporciones de lo maquinado en cada robot.
Nuestra idea es empezar por descomponer el evento ``defectuoso'' en
``viene del robot A y es defectuoso'' o ``viene del robot B y es defectuoso''
o ``viene del robot C y es defectuoso''. En símbolos tendremos
P(d) = P(A y d) + P(B y d) + P(C y d)
ó
P(d) = P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)
Antes de ponerle números y resolver nuestro problema fijémonos en la
fórmula obtenida.
1. Hay tres eventos A, B y C que
o
son ajenos y
o
cubren todo el espacio muestral.
2. Conocemos las probabilidades de cada uno de ellos.
3. Además, conocemos las probabilidades condicionales de otro
evento dado cada uno de ellos.
La fórmula de arriba se llama fórmula de la probabilidad total.
Llenando con nuestros números, tenemos que
P(d) = (0.18)(0.002) + (0.42)(0.005) + (0.40)(0.001)
o sea que P(d) = 0.00286 casi 3 piezas por cada mil.
Es bueno comparar este resultado con los porcentajes de soldaduras
defectuosas de cada robot por separado. Podemos ver que el resultado se
encuentra entre todas ellas y se encuentra relativamente cerca de los
porcentajes de los robots más utilizados (el B y el C). Esto es muy
razonable.
49
Manual del Alumno
(II) La segunda pregunta es, a la vez más simple y más complicada. Nos
va a llevar a lo que se conoce con el nombre de teorema de Bayes.
La probabilidad que buscamos es una condicional pero al revés de las que
tenemos. Buscamos
P( C | d)
para calcularla usamos la definición de probabilidad condicional:
P( C | d) = [P(C y d)] / [P( d )]
El numerador (lo de arriba) lo calculamos con
P( C y d ) = P(C) P(d|C)
y el denominador lo calculamos con la fórmula de probabilidad total
P(d) = P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)
juntando las dos tenemos la fórmula de Bayes:
P( C|d) = [P(C) P(d|C)] / [P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)]
Aplicándola a nuestro caso tenemos
P(C|d) = [(0.40)(0.001)]/[(0.18)(0.002) + (0.42)(0.005) + (0.40)(0.001)]
o sea
P(C|d) = [0.0004]/[0.00286] = 0.1399
casi 14%.
O sea que si tomamos una pieza al azar, la probabilidad de que haya sido
soldada por el robot C es alta, 40%. Pero, como ese robot produce sólo 1
50
Manual del Alumno
de cada mil soldaduras defectuosas, al saber que la pieza seleccionada es
defectuosa, la probabilidad de que provenga del robot C disminuye a
solamente 14%. Esto quiere decir que, en este caso el saber que la
soldadura es defectuosa, nos provee con una gran cantidad de
información.
Si analizáramos, usando de nuevo la fórmula de Bayes las probabilidades
de los robots A y B, tendríamos
P(B|d) = 0.7343 y P(A|d) = 0.1259
Comparadas con las probabilidades de cada máquina sin saber que la
pieza es defectuosa vemos un gran incremento en la probabilidad de B.
Si, por el contrario la pieza no hubiese tenido defectos de soldadura, el
mismo teorema de Bayes nos daría (haga Ud. las cuentas y ¡fíjese que no
me haya equivocado yo!):
P(A|no d) = 0.1802 P(B|no d) = 0.4191 y P(C|no d) = 0.4007
Las probabilidades no son idénticas a las probabilidades no condicionales,
pero la diferencia es muy pequeña.
Para apreciar mejor el cambio, pongamos en una sola tabla las
probabilidades iniciales y las condicionales obtenidas bajo el conocimiento
de la soldadura de la pieza.
Robot P()
P( |d)
P( |no d)
A
0.18 0.1259 0.1802
B
0.42 0.7343 0.4191
C
0.40 0.1399 0.4007
Es tan grande el éxito de los tres robots en el soldado correcto que el
saber que la pieza no tiene defectos, prácticamente no altera las
probabilidades de producción en uno u otro.
51
Manual del Alumno
Por el contrario, el robot C es tan bueno, comparado con el B que, al saber
que la pieza es defectuosa, las probabilidades cambian dramáticamente.
En este ejemplo el cálculo de probabilidades condicionales nos cuantifica
algo que el sentido común nos dice de otra forma. Note que la fórmula de
Bayes nos sirvió para pasar de las probabilidades no condicionales a las
condicionales.
Otro ejemplo del uso del teorema de Bayes
Otro ejemplo clásico del uso del teorema de Bayes es un problema de oro
y plata. Hay tres bolsas que tienen, cada una dos monedas. Las de la
primera son de oro, las de la segunda son de plata y las de la tercera son
una de plata y otra de oro. Se escoge una bolsa al azar y de ella una
moneda también al azar. Si la moneda es de oro, ¿cuál es la probabilidad
de que la otra moneda en la bolsa sea de oro también?
Primero notemos que la segunda bolsa no pudo haber sido elegida
(porque no tiene monedas de oro), sólo pudo haber sido seleccionada la
primera o la tercera. Si la bolsa elegida hubiese sido la tercera, el evento
cuya probabilidad nos interesa no se realiza. De modo que el evento que
nos interesa es equivalente a que se haya elegido la primera bolsa.
Una vez establecido lo anterior, apliquemos el teorema de Bayes para
calcular
P(I|Au) = [P(I)P(Au|I)] / [P(I)P(Au|I) + P(II)P(Au|II) + P(III)P(Au|III)]
Las probabilidades que entran al lado derecho de la igualdad las sacamos,
inmediatamente, de las condiciones del problema y después de hacer
cuentas tenemos:
P(I|Au) = 2 / 3
52
Manual del Alumno
Este problema es clásico porque existe una ``solución'' a la que muchas
personas llegan y es falsa. El argumento es el siguiente. Como todas las
bolsas son igualmente posibles, y el hecho de que la primer moneda
extraída sea de oro, nos indica que no se trata de la segunda bolsa.
Concluimos que las dos bolsas restantes tienen igual probabilidad y, por
tanto, la probabilidad de que la otra moneda sea de oro es 1/2.
Si Ud. piensa de acuerdo a este razonamiento (¡erróneo!), es muy difícil
que encuentre en qué se equivoca.
Lo que está mal es que lo que averiguamos, al saber que la moneda
extraída es de oro, es algo más que el rechazo de la segunda bolsa. Si
sólo nos dijeran que la bolsa escogida al azar no fue la segunda, sin
informarnos del metal de la moneda sacada, todavía tendríamos
incertidumbre respecto a la primer moneda; todavía podríamos apostar a si
ésta es de oro o de plata. Al decirnos que la moneda fue de oro, estamos
aprendiendo algo más, y eso echa por tierra el argumento de ``igual
probabilidad para las dos bolsas restantes''.
Lo interesante del problema es que, si nos hubieran dicho que la moneda
sacada fue de plata, aplicando la fórmula de Bayes, llegamos a la
conclusión de que la probabilidad de que la otra moneda sea también de
plata es 2/3 [¡Haga Ud. las cuentas!].
Es decir, si vamos a apostar al metal de la otra moneda, nos conviene
apostar por el metal de la primera.
Este ejemplo nos lleva a reflexionar sobre el uso adecuado de la
información contenida en ``lo dado'' en el cálculo de la probabilidad
condicional.
53
Manual del Alumno
Problemas Propuestos :
1. Una mujer portadora de hemofilia clásica da a luz tres hijos.
a) ¿Cual es la probabilidad de que de los tres hijos, ninguno esté
afectado por la enfermedad?
b) ¿Cual es la probabilidad de que exactamente dos de los tres
niños esté afectado?
2. El 60% de los individuos de una población están vacunados contra una
cierta enfermedad. Durante una epidemia se sabe que el 20% la ha
contraído y que 2 de cada 100 individuos están vacunados y son
enfermos. Calcular el porcentaje de vacunados que enferma y el de
vacunados entre los que están enfermos..
3. La proporción de alcohólicos que existe en la población de Málaga es,
aproximadamente, un 10%; no obstante, en las bajas que dan los médicos
de la Seguridad Social difícilmente se encuentra el diagnóstico de
alcoholismo. Aparecen sin embargo diagnosticados de hepatopatías,
lumbalgias, etc., que pueden hacer sospechar alcoholismo subyacente. Se
realizó un estudio que puso de manifiesto que el 85% de los individuos
alcohólicos y el 7% de los no alcohólicos sufrían tales patologías. Se
desea saber cuál es la probabilidad de que un individuo con esas
patologías sea realmente alcohólico.
4. Dos tratamientos A y B curan una determinada enfermedad en el 20% y
30% de los casos, respectivamente. Suponiendo que ambos actúan de
modo independiente, cuál de las dos siguientes estrategias utilizaría para
curar a un individuo con tal enfermedad:
a) Aplicar ambos tratamientos a la vez.
54
Manual del Alumno
b) Aplicar primero el tratamiento B y, si no surte efecto, aplicar el
A.
5. Se eligen al azar 3 deportistas de un equipo de 10 integrantes para
realizar un control antidopaje; Se sabe que 2 de los jugadores del equipo
han tomado sustancias prohibidas. ¿Cuál es la probabilidad de elegir para
el análisis a alguno de los infractores?
6. Estamos interesados en saber cuál de dos análisis A y B es mejor para
el diagnóstico de una determinada enfermedad, de la cual sabemos que la
presentan un 10% de individuos de la población. El porcentaje de
resultados falsos positivos del análisis A es del 15% y el de B es del 22%.
El porcentaje de falsos negativos de A es del 7% y de B es del 3%. ¿Cuál
es la probabilidad de acertar en el diagnóstico con cada método?
7. Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal
técnica tiene una sensibilidad del 91% y una especificidad del 98%. En la
población que nos ocupa la probabilidad de colelitiasis es del 20%.
a) Si a un individuo de tal población se le aplican los ultrasonidos
y dan positivos, ¿cuál es la probabilidad de que sufra la
colelitiasis?
b) Si el resultado fuese negativo, ¿cuál es la probabilidad de que
no tenga la enfermedad?
8. Entre los estudiantes de una Facultad de Filosofía y Letras se dan las
siguientes proporciones: el 40% son hombres. El 70% de los varones
fuman, mientras que entre las mujeres sólo fuman el 20%. Escogido un
estudiante al azar, calcúlese la probabilidad de que fume.
9. Los estudios epidemiológicos indican que el 20% de los ancianos sufren
un
deterioro
neuropsicológico.
Sabemos
que
la
tomografía
axial
55
Manual del Alumno
computerizada (TAC) es capaz de detectar este trastorno en el 80% de los
que lo sufren, pero que también da un 3% de falsos positivos entre
personas sanas. Si tomamos un anciano al azar y da positivo en el TAC,
¿cuál es la probabilidad de que esté realmente enfermo?
10. Sabemos que tiene estudios superiores el 15% de la población
española, estudios medios el 40%, estudios primarios el 35% y no tiene
estudios el 10%. Los desempleados no se distribuyen proporcionalmente
entre esas categorías, dado que de entre los de estudios superiores están
sin trabajo el 10%, entre los de estudios medios el 35%, entre los de
estudios primarios el 18%, y entre los que no tienen estudios el 37%.
Obtenga las probabilidades de que extraído uno al azar, éste sea:
a) Titulado superior, sabiendo que está parado.
b) Un sujeto sin estudios que está en paro.
c) Un sujeto con estudios primarios o que está trabajando.
11. Una enfermedad puede estar producida por tres virus A, B, y C. En el
laboratorio hay 3 tubos de ensayo con el virus A, 2 tubos con el virus B y 5
tubos con el virus C. La probabilidad de que el virus A produzca la
enfermedad es de 1/3, que la produzca B es de 2/3 y que la produzca el
virus C es de 1/7. Se inocula un virus a un animal y contrae la enfermedad.
¿Cuál es la probabilidad de que el virus que se inocule sea el C?
12. El 70% de los estudiantes aprueba una asignatura A y un 60% aprueba
otra asignatura B. Sabemos, además, que un 35% del total aprueba
ambas. Elegido un estudiante al azar, calcular las probabilidades de las
siguientes situaciones:
a) Haya aprobado la asignatura B, sabiendo que ha aprobado la
A.
56
Manual del Alumno
b) Haya aprobado la asignatura B, sabiendo que no ha aprobado
la A.
c) No haya aprobado la asignatura B, sabiendo que ha aprobado
la A.
d)
No haya aprobado la asignatura B, sabiendo que no ha
aprobado la A.
13. La cuarta parte de los conductores de coche son mujeres. La
probabilidad de que una mujer sufra un accidente en un año es de
5/10.000, y para los hombres es de 1/10.000. Calcúlese la probabilidad de
que si acaece un accidente, el accidentado sea hombre.
14. En un campus universitario existen 3 carreras sanitarias. Se sabe que
el 50% cursan estudios de Enfermería, el 30% Medicina y el 20%
Veterinaria. Los que finalizaron sus estudios son el 20, 10 y 5%
respectivamente. Elegido un estudiante al azar, hállese la probabilidad de
que haya acabado la carrera.
57
Manual del Alumno
SESION 13
VARIABLE ALEATORIA
Frecuentemente el resultado de un experimento aleatorio se denota con un
número:
el resultado de lanzar un dado,
el
número
de
unidades
defectuosas
entre
10
unidades
seleccionadas,
el tiempo que hay que esperar para que se presente una falla en
un circuito,
el número de estaciones de una red de computadoras que
requieren la atención del servidor de la red en un momento dado,
el número de personas en una comunidad que requieren atención
médica en un día especificado,
el peso sumado de las personas que están en un elevador en un
momento determinado del día,
la cantidad en dinero de lo transportado en un camión antes de
que sufra una descompostura, etc.
A un número tal, le llamamos variable aleatoria. Ponga atención al hecho
de que una variable aleatoria no es una variable en el sentido usual. Las
variables que estamos acostumbrados a manejar son, por ejemplo: el peso
de un cohete que va quemando el combustible que lo impulsa, la distancia
del piso a un objeto que cae hacia él, la concentración de una solución
dentro de un tanque conforme pasa el tiempo, etc. En los ejemplos
anteriores el valor de la variable puede cambiar con el tiempo, pero es
58
Manual del Alumno
predecible a partir de las leyes de la mecánica, la química, la hidráulica o
alguna otra ciencia. Con una variable aleatoria la situación es enteramente
diferente. El valor de una variable aleatoria no se puede conocer con
exactitud de antemano a la realización del experimento. ¿Qué otros
ejemplos de variables aleatorias se le ocurren además de los mencionados
arriba? Al contestar esta pregunta tenga en cuenta que el azar debe jugar
algún papel en la medición de la variable y que su valor no debe ser
predecible.
Una variable aleatoria presenta dos características importantes:
1. Una colección (conjunto) de valores posibles al que llamamos
imagen de la variable aleatoria (antes lo llamábamos espacio
muestral).
2. Una probabilidad asociada a los posibles resultados la cual queda
expresada mediante una función de probabilidad.
Las variables aleatorias que tienen un conjunto de posibles valores
discreto, se llaman discretas. Estas variables son el resultado de contar .
¿Cuáles de las variables aleatorias mencionadas arriba son discretas?
Ciertamente el peso de las personas en el elevador no es discreto, pero
entre las otras ¿cuáles son discretas?
Por otra parte, las variables aleatorias cuyos valores posibles se
encuentran en cualquier parte de un intervalo, se llaman continuas. Estas
variables son el resultado de medir.
El hecho de que una variable aleatoria nos interesa cuando aún no tiene
un valor específico, nos obliga a utilizar una notación extraña al referirnos
a ella. Denotamos con letras mayúsculas a las variables aleatorias y con
minúsculas a los valores que contemplamos para ellas.
59
Manual del Alumno
Si tomamos como variable aleatoria el resultado (suma) de lanzar dos
dados, desde el punto de vista de la probabilidad, el número resultante nos
interesa antes de que realicemos el experimento. Conocido el resultado, ya
no es interesante (al menos, no para la probabilidad). La imagen de esta
variable aleatoria es S = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 }. Llamando X al
resultado del experimento, podemos contemplar el evento de que X sea
igual a x, donde x es cualquier elemento de S. Claro que nos resultará muy
interesante saber cosas como P(X = x) para los diferentes valores de x en
S; por ejemplo, P(X = 6) = 5/36 [esto se lee: ``la probabilidad de que X sea
igual a seis es un sexto'']. ¿Puede Ud. mostrar que P(X = 8) = 5/36 ?
Siguiendo con el ejemplo de los dos dados, el lanzar dados para ver que
número cae no es muy apasionante que digamos, acompañemos los
dados con un tablero de oca o de serpientes y escaleras o de turista o de
back gamón o algún otro juego interesante. Ya puestos a jugar turista o
monopolio, es natural que nos interesen otro tipo de eventos. Podríamos
estar interesados en saber
si el resultado es menor que 8: P(X < 8) = 21/36 ¿Puede Ud. ver
por qué?;
que el resultado sea desde 4 hasta menos que 9: P(3 < X < 9) =
23/36 ¿Por qué?;
también podemos estar interesados en que X sea distinta de 7:
P(X distinto de 7) = 1 - P(X = 7) = 1 - 1/6 = 5/6.
Naturalmente esta notación se extiende de manera natural a todo tipo de
intervalos y desigualdades.
Regresando a donde estábamos,
60
Manual del Alumno
A la función: f(x) = P(X = x) se le llama función de
probabilidad de X.
Esta función es una función ordinaria de las que estudiamos en los cursos
de matemáticas; no tiene nada de aleatorio. Dicho de otra forma, una vez
determinados los valores de las probabilidades, la función de probabilidad
es una función común y corriente, tiene su dominio, su codominio, su
gráfica, puede ser inyectiva, etc.
Hay algunos hechos importantes respecto a esta función:
1. Para una variable aleatoria discreta los valores posibles son los
únicos para los cuales esta probabilidad es diferente de cero.
Dicho de otra forma, no nos hace daño ampliar el dominio de la
función de probabilidad a todos los reales, pero va a valer cero
casi siempre excepto en un conjunto discreto de puntos.
2. El valor de la función de probabilidad depende esencialmente de la
variable aleatoria a la que nos referimos, cuando no sea claro a
cuál variable nos referimos, es conveniente poner el símbolo de la
variable como subíndice para la función: f X(x).
Esta costumbre puede causar estragos en la comprensión de los
novatos, esté Ud. prevenido. ¿Qué querrá decir f Y(w)?
3. La gráfica de una función como ésta se presenta en el pizarrón.
Regresando al ejemplo de los dados, cambiemos el turista por otro juego.
En este juego Ud. gana si el resultado es par y pierde si es n ó n; la
cantidad que pierde o gana será el doble del resultado. Aquí, su ganancia
(positiva si Ud. gana, negativa si pierde) es una variable aleatoria Y, su
imagen es S = {-22, -18, -14, -10, -6, 4, 8, 12, 16, 20, 24} >Puede Ud.
terminar la tabla de la función de probabilidad de Y?:
61
Manual del Alumno
Y
-22 -18 -14 -10 -6 4 8 12 16 20 24
f(y)
Una vez que haya llenado la tabla anterior, calcule la probabilidad de que
gane Ud. más de 8 pesos; la probabilidad de que pierda más de 10 pesos;
la probabilidad de que su ganancia esté entre -10 y +16 inclusive; la
probabilidad de que su ganancia o pérdida exceda a 9 pesos.
Una función de probabilidad de una variable aleatoria discreta, para ser
correcta, debe satisfacer dos propiedades
f(x) debe ser siempre mayor o igual a 0
la suma de f(x) para todos los valores de x debe dar 1 .
Función de Distribución.
Cuando la imagen de una variable aleatoria es un intervalo real decimos,
según habíamos quedado, que la variable es continua. La matemática que
utilizamos para las variables continuas es diferente a la de las discretas
Por eso empezamos nuestro estudio con las discretas. Aún no acabamos
con las variables discretas, todavía nos faltan por discutir temas muy
importantes. Pero antes, hablaremos de una noción que es común a las
discretas y a las continuas.
Una función muy útil en el cálculo de probabilidades de una v. a. es la
función de distribución. Esta función se define de igual forma para
continuas
y
discretas:
F (x) = P(X <= x)
Vea bien la definición anterior y apréndasela de memoria. Coja una hoja de
papel en blanco y escríbala.
62
Manual del Alumno
Para no confundirnos con la notación, suele escribirse también así:
F (t) = P(X <= t)
La función de distribución tiene las siguientes propiedades:
1. F(en menos infinito) = 0 ; F(en más infinito) = 1
2. F es una función no decreciente.
3. F
sirve
para
calcular
probabilidades
así
P( a < X <= b ) = F(b) - F(a)
Para que esta última propiedad nos sea de utilidad deberíamos tener la
distribución ya calculada. Para muchas variables aleatorias de uso común,
las distribuciones ya están calculadas y tabuladas (una hoja de cálculo,
como Excel ya incluye prácticamente todas las distribuciones que veremos
en este curso).
Para las variables aleatorias discretas hay que tener cuidado con el hecho
de que la primera desigualdad es estricta y la segunda no.
Por ejemplo si la imagen de X son todos los enteros, P(2 < X <= 5) se
puede calcular haciendo la resta F(5)-F(2). Pero la probabilidad P(2 < X <
5) se obtiene restando F(5)- F(1) (¿Por qué?). ¿Cómo calcula Ud. P(2 <= X
< 5)?
Las 4 propiedades que se señalaron arriba definen a una función de
distribución, de modo que para saber si una función es una distribución o
no, basta ver que las cumpla.
Considere
el
siguiente
ejemplo.
F (x) = 1 - exp. (- 0.7 x ) para x > 0
Se trata de una variable aleatoria continua, cuya imagen son los números
positivos(¿Por qué?). Lo que Ud. tiene que hacer es:
Mostrar que es una distribución y
63
Manual del Alumno
usarla para calcular P( X >= 1.0), P( 0.7 < X < 1.0), P(X < 0.7), P(
X > 1.0 ó X <= 0.4 ).
En el pizarrón hacemos ejemplos de cómo es la forma matemática de una
función de distribución y de su gráfica.
variables Aleatorias Continuas
Las variables aleatorias que hemos estudiado hasta ahora tienen la
propiedad de que son el resultado de contar; sus valores posibles varían
en forma discreta (a saltos). Hay otro tipo de variables aleatorias, las que
son el resultado de un proceso de medir; sus valores posibles cubren todo
un intervalo en los reales.
Cuando la imagen de una variable aleatoria es un intervalo real decimos
que la variable es continua. La matemática que utilizamos para las
variables continuas es diferente a la de las discretas aunque los conceptos
probabilísticos sean los mismos de manera que en nuestro estudio de las
continuas utilizaremos este paralelo con las discretas.
Densidad de una variable aleatoria continua
El primer hecho de importancia es que una v. a. (variable aleatoria)
continua tiene probabilidad cero de tomar un valor específico, sólo tiene
valores positivos para intervalos:
P( X = a ) = 0 para cualquier valor de a
Para calcular la probabilidad de que X esté en un intervalo (a,b) o (a,b] o
[a,b) o [a,b] debemos hacer uso de una función asociada a la variable
64
Manual del Alumno
aleatoria, la función de densidad de X. Las variables aleatorias discretas
tienen la función de probabilidad, las continuas tienen función de densidad.
Esta función de densidad tiene las siguientes características:
f(x) >= 0
la integral de f(x) vale 1
La integral a la que nos referimos es la integral definida sobre toda la
imagen de la variable aleatoria.
Note que estas características son el análogo continuo de las de la función
de probabilidad de una v. a. discreta. Es decir la probabilidad
nunca es negativa y
la suma de todas las probabilidades es uno.
Por este motivo, es frecuente utilizar el nombre de densidad tanto para
esta función como para la función de probabilidad de una v. a. discreta.
Además, como en el caso discreto, la función de densidad está ligada a la
v. a. X de modo que cuando sea necesario aclarar a cuál densidad nos
referimos podemos usar la notación fX(x), poniéndole el subíndice X a la f.
Cálculo de Probabilidades con la densidad.
Para obtener la probabilidad de un intervalo, hacemos la integral de la
densidad sobre el intervalo del que queremos calcular la probabilidad. De
nuevo, la integral a la que nos referimos es una integral definida cuyos
extremos son los del intervalo.
Escriba la integral que da la probabilidad de que X esté entre 3 y 44.2
Escriba en forma de integrales las siguientes:
P(a < X < a + h),
P( 2.2 < X <= 5 ),
65
Manual del Alumno
P( X > 8 ),
P( X <= 15 ),
P( X < 2 ó X > 3)
Considere un par de ejemplos que le servirán para apreciar las
implicaciones de lo anterior.
Como primer ejemplo tome el siguiente. Sea X una v. a. continua cuya
densidad es:
f(x) = a x para x en [ 3, 7]
a es una constante necesaria para que la integral de f(x) definida de 3 a 7,
sea igual a uno. Muestre que a = 1/20 = 0.05, además muestre que P( 3 <
X <= 5 ) = 0.40
Otro
ejemplo
más
es
el
siguiente.
La
densidad
es:
f(x)=
o
0.025x para x en (3,7)
o
k x si x está en [7,10)
o
0 en cualquier otra parte
2
muestre que k = 1/438 y muestre también que P(6 <= X <= 8) = 0.3155
Distribución de una variable aleatoria continua
Una función muy útil en el cálculo de probabilidades de una v. a. continua
es la función de distribución. Esta función se define de igual forma para
continuas y discretas:
F (x) = P(X <= x)
66
Manual del Alumno
Para no confundir la notación, suele escribirse también así:
F (t) = P(X <= t)
En el caso de una v.a. continua la derivada de la distribución es la
densidad:
f(x) = F '(x)
En los dos ejemplos anteriores calcule las funciones de distribución
correspondientes.
La función de distribución tiene las siguientes propiedades:
1. F(menos infinito) = 0; F(mas infinito) = 1
2. F es una función no decreciente.
3. F sirve para calcular probabilidades así
P( a < X <= b ) = F(b) - F(a)
En esta última propiedad, si se trata de una v.a. continua no importa si las
desigualdades son estrictas o no. En el caso de la v.a. discreta es muy
importante que la primera desigualdad sea estricta y la segunda nó.
Estas propiedades se deducen de la definición de la distribución. Estas
propiedades caracterizan a la distribución de modo que para saber si una
función es una distribución o nó, basta ver que las cumpla.
Considere el siguiente ejemplo.
F (x) = 1- exp (- 0.7 x ); para x > 0
muestre que es una distribución y úsela para calcular P( X >= 1.0), P( 0.7 <
X < 1.0), P(X < 0.7), P( X > 1.0 ó X >= 0.4 ).
En el pizarrón hacemos ejemplos de cómo es la forma matemática de una
función de distribución y de su gráfica.
Valores Esperados.
67
Manual del Alumno
Hay un par de cantidades importantes asociadas con cada variable
aleatoria:
el
valor
esperado,
esperanza
matemática
o
simplemente
esperanza o media.
la varianza y su raíz cuadrada, la desviación estándar.
Ambas cantidades se definen en base a un operador que llamamos el
operador esperanza. Matemáticamente la esperanza se define así, para
una v.a. discreta
E( g(X) ) = suma { g(i) f(i) }
donde g(i) es cualquier función y f(i) es la función de probabilidad de la
v.a.; f(i) = P(X = i). Por ejemplo,
Si la función g es g(t)=52t,
E(52X) = suma{52i f(i)} = 52 suma{i f(i)} = 52 E(X)
2
Si la función g es g(t)= (t-4) , su esperanza es
E(
2
[X
-
4]
suma{i f(i)}
-
suma{8if(i)}
2
)
2
=
+
suma{[i-4] f(i)}
=
suma{16f(i)}
=
2
E(X ) - 8E(X) + 16
Y si g es g(t)= t/ 28
E(
X/
28)
=
suma{i/
28
f(i)}
=
1/28
suma{i
f(i)}
=
= (1/ 28) E(X) = E(X)/ 28
Utilizando el operador esperanza, definimos para cualquier v.a. discreta X :
68
Manual del Alumno
1. El valor esperado de X es E(X).
2
2. La varianza de X es var(X) = E( [X - E(X)] ).
Ejemplo.
Ejemplos: si X es una v.a. continua cuya función de probabilidad es
X
1
2
3
4
5
6
f(x) 1/21 2/21 3/21 4/21 5/21 6/21
E(X) = 13 / 3 (detalles en el pizarrón) y var(X) = 20 / 9 así la desv.est.(X) =
1.4907.
Propiedades Aritméticas.
Las definiciones matemáticas de valor esperado y varianza, nos dicen
cómo calcular estas cantidades. Como operaciones matemáticas, tienen
algunas propiedades que vale la pena resaltar, porque a veces simplifican
algunas cuentas
E(c) = c
la esperanza de una constante es la misma constante
E(c g(X)) = c E(g(X))
una constante multiplicando se puede sacar
de la esperanza.
E(g(X) + h(X)) = E(g(X)) + E(h(X))
la esperanza de una suma es
la suma de las esperanzas.
Las anteriores propiedades son muy parecidas a las de la integral.
Ahora tenemos algunas propiedades de la varianza.
2
2
var(X) = E(X ) - [E(X)] esta propiedad es muy útil para calcular, y
podemos tomarla como definición de la varianza.
2
var(aX) = a var(X) una constante multiplicando se saca de la
varianza elevándola al cuadrado.
var( c ) = 0 la varianza de una constante es cero.
69
Manual del Alumno
La varianza de una suma en general no es igual a la suma de las
varianzas. Según veremos después, la igualdad se cumple sólo
cuando las variables son independientes.
Como un ejemplo de estas propiedades, veamos la razón de la fórmula
2
2
var(X) = E(X ) - [E(X)] . De acuerdo a la definición
var(X)
2
=
=
E[X
=
2
2XE(X)
2
E(
=
X)
-
2
E(
X)
2
= E( X ) - E(X)
E([X-E(X)] )
-
E(2XE(X))
2E(X)
2
+
E(X)
E(X) ]
=
2
+
E(E(X) )
+
E(X)
2
=
=
2
haciendo las operaciones y, juntando los dos extremos, se tiene:
2
var(X) = E(X ) - [E(X)]
2
SESION 14
DESIGUALDAD DE TCHEBYSHEV
Si conocemos la distribución de probabilidad de una variable aleatoria X (
la función de densidad en el caso continuo, la función de probabilidad en el
caso discreto ) hemos visto que podemos determinar μ y σ 2 (media y
varianza) , si existen. Pero lo reciproco no es cierto es decir, conociendo la
media (μ) y la varianza (σ 2)no podemos determinar la distribución de
probabilidad de X. Sin embargo se puede dar una cota superior (o inferior)
para probabilidad del tipo:
P[IX-uI ≥ kσ ], este resultado se conoce con el nombre de la desigualdad
de tchebyshev.
70
Manual del Alumno
Teorema (De Tchebyshev)
Si la variable aleatoria X tiene media (μ) y varianza(σ2) finita, entonces
para cualquier K > 1 , se cumple:
P[IX-μI ≥ k σ] ≤
1
k2
La cual indica que la probabilidad
que X tome algún valor fuera del
intervalo :
< μ – k σ , μ + k σ > es a lo más
1
k2
Consecuencias:
a)
Si
ε = k σ se tiene : P[IX-uI ≥ ε ] ≤
b)
Puesto que { IX- μ
2
2
I ≥ kσ } y { IX- μ I < kσ } son eventos
complementarios, entonces se cumple que:
P[ IX- μ I ≥ kσ ] ≥ 1 -
1
k2
Indica que la probabilidad de que X tome valores dentro del intervalo < μ –
k σ , μ + k σ >es por lo menos 1 -
1
k2
Ejemplo de Aplicación:
Sea X una variable aleatoria con media 33 y varianza 16 . Hallar una cota
inferior para :
P [ 23 < X < 43 ]
Solución:
71
Manual del Alumno
P [ 23 < X < 43 ]
= P [ 23 - 33 < X - 33 < 43 - 33 ]
= P [ - 10 < X – 33 < 10 ] = P [ IX- μ I < 10 ]
y σ = 4 , entonces k = 5/2 .
Observe que: 10 = kσ
Luego: P [ 23 < X < 43 ] = P [ IX- μ I < (5/2) (4) ] ≥ 1 -
Por lo tanto: P [ 23 < X < 43 ] ≥
1
(5 / 2) 2
21
25
Problemas propuestos:
1. Sea X una variable aleatoria con media μ =2 y varianza σ2 = 1.
use la desigualdad de tchebyshev para hallar una cota inferior para
:
P [ IX- 2 I < 4 ]
a)
b) P [ - 3 < X < 7 ]
2. Sea X una variable aleatoria con media μ = 10 y varianza σ2 = 4
Hallar : a)
P
[ IX- 10 I ≥ 3 ]
b)
P
[ IX- 10 I < 3 ]
c)
P [ 5 < X < 15 ]
3. Con los datos del problema anterior determine el valor de “c” tal
que:
P
[ IX- 10 I ≥ c ] ≤ 0.04
72
Manual del Alumno
DISTRIBUCIONES DISCRETAS
Modelos Especiales.
Hay
algunas
variables
aleatorias
discretas
que
se
usan
muy
frecuentemente en una gran cantidad de aplicaciones. Estos modelos
reciben nombres especiales, que se utilizan en todo el mundo. Los
modelos principales que estudiamos son: el binomial, el hipergeométrico y
el de Poisson. Estudiaremos cada una por turno
DISTRIBUCIÓN BINOMIAL
Se tiene un número fijo de pruebas n. Con las siguientes características:
Cada prueba tiene sólo dos posibles resultados: genéricamente los
llamamos éxito y fracaso. Los denotamos con 1 (éxito) y 0
(fracaso).
El resultado de cada prueba es independiente del resultado de las
demás pruebas.
La probabilidad de éxito no cambia de una prueba a otra.
Nos interesa sólo el número total de éxitos X y no el orden en que
hayan ocurrido.
Cuando se cumplen las condiciones anteriores X tiene la distribución
binomial con parámetros n y p, donde n es el número de intentos y p la
probabilidad de obtener un éxito. Los valores posibles son desde cero
hasta ene: { 0, 1, 2, ... , n }. La función de probabilidad es:
k (n-k)
f(k) = P(X=k) = nCk p q
, para k en {0,1,2,...,n}
73
Manual del Alumno
donde me he visto obligado por la tipografía, a usar el símbolo poco usual
nCk para denotar las combinaciones de k objetos tomados de un total de
n:
nCk
= [n!] / [k!(n-k)!]
además, la letra q representa la probabilidad de fracaso q = 1-p.
La media de la binomial es: E(X) = np y la varianza: var(X) = npq.
¿Dónde se aplica el modelo binomial?:
1. ¿En una familia de tres hijos, cuál es la probabilidad de que a lo
más 2 sean niñas? La probabilidad de niña es 0.5; el sexo de cada
hijo es independiente del de los demás; n=3 y p=0.5.
P(X
<=
=
2)
=
0.125
P(X=0)
+
+
P(X=1)
3(0.125)
+
+
P(X=2)
3(0.125)
= 0.875
o bien. P(X <= 2) = 1 - P(X=3) = 1 - 0.125 = 0.875
2. Se extraen 4 canicas CON REEMPLAZO de una urna que tiene 5
blancas y 3 negras. ¿Cuál es la probabilidad de que salgan menos
de 2 blancas? Como la elección se hace con reemplazo, se
cumplen los requisitos de un experimento binomial. X es el número
de canicas blancas, n = 4 y p = 5/8 = 0.625. La probabilidad que
necesitamos es P(X < 2) y ésta es igual a:
P(X
=
<
2)
0.375
4
=
P(X=0)
+
+
P(X=1)
(4)(0.625)(0.375)
3
= 0.1516
3. De un lote con 1,000 artículos de los cuales el 10% son
defectuosos, se escogen al azar 10. ¿Cuál es la probabilidad de
que haya más de 2 defectuosos? Aunque el muestreo se hace sin
74
Manual del Alumno
reemplazo, por la gran cantidad de artículos que hay en el lote
comparados con los que se escogen, suponemos que son válidos
los supuestos del modelo binomial. X es el número de artículos
defectuosos y la probabilidad que se nos pide es: P(X > 2).
Como el cálculo de las 8 probabilidades necesarias es muy latoso,
notemos que P(X > 2) = 1 - P(X <= 2). Aún así, hagamos esta
cuenta consultando la tabla de la binomial adecuada: n = 10, p =
0.10. La tabla dice que P(X <= 2) = 0.9298. Por tanto, la
probabilidad buscada es P(X > 2) = 0.0702 [Vea su tabla y
descubra este valor]. Claro que también tenemos la posibilidad de
calcular P(X <= 2) y restarla de uno.
P(X
=
<=
(.9)
2)
10
=
+
P(X=0)
+
(10)(.1)(.9)
9
P(X=1)
+
+
P(X=2)
2
(45)(.1) (.9)
8
= 0.9298
Distribución de Bernoulli.
Este modelo se llama así en honor del probabilista de este apellido. A la
binomial cuando n = 1 se le llama Bernoulli.
Es aquel modelo que sigue un experimento que se realiza una sola vez y
que puede tener dos soluciones: acierto o fracaso:
Cuando es acierto la variable toma el valor 1
Cuando es fracaso la variable toma el valor 0
Ejemplo: Probabilidad de salir cara al lanzar una moneda
al aire (sale cara o no sale); probabilidad de ser admitido
en una universidad (o te admiten o no te admiten);
probabilidad de acertar una quiniela (o aciertas o no
aciertas)
75
Manual del Alumno
Al haber únicamente dos soluciones se trata de sucesos
complementarios:
A la probabilidad de éxito se le denomina "p"
A la probabilidad de fracaso se le denomina "q"
Verificándose que:
p+q=1
Veamos los ejemplos anteriores :
Ejemplo 1: Probabilidad de salir cara al lanzar una
moneda al aire:
Probabilidad de que salga cara: p = 0,5
Probabilidad de que no salga cara: q = 0,5
p + q = 0,5 + 0,5 = 1
Ejemplo 2: Probabilidad de ser admitido en la universidad:
Probabilidad de ser admitido: p = 0,25
Probabilidad de no ser admitido: q = 0,75
p + q = 0,25 + 0,75 = 1
Ejemplo 3: Probabilidad de acertar una quiniela:
Probabilidad de acertar: p = 0,00001
Probabilidad de no acertar: q = 0,99999
p + q = 0,00001 + 0,99999 = 1
Distribución Hipergeométrica
76
Manual del Alumno
Se tiene un grupo de N objetos de los cuales k son éxitos y el resto,(N-k),
son fracasos. Se seleccionan n de los N, SIN REEMPLAZO. La v.a. X que
nos interesa es el número total de éxitos entre los n seleccionados y no el
orden en que salieron.
En estas condiciones la v.a. X tiene la distribución hipergeométrica. Su
imagen es {0,1,...,n}. La función de probabilidad está dada por:
P(X=x) = [ kC x (N-k)C(n-x) ] / [ NCn ]; para x en { 0,1,...,n }
La media es: E(X) = nk/N y la varianza: var(X) = [N-n]/[N-1] n (1-k/N) k/N
¿Dónde se aplica?
1. En situaciones de muestreo sin reemplazo en que la muestra es
un porcentaje considerable de la población. Como ejemplo, de un
lote de 40 artículos se seleccionan al azar 4 para probarlos y si
fallan la prueba más de 2 se rechaza el lote completo. ¿Cuál es la
probabilidad de rechazar un lote que tenga 8 defectuosos? Dado
que el muestreo se hace sin reemplazo y la fracción de muestreo
es grande (10%) tenemos una v.a. hipergeométrica. Los
parámetros son: N=40, k=8, n=4, X es el número de defectuosos
en la muestra y queremos la probabilidad
P(X > 2) = P(X=3) + P(X=4) = 1792/91390 + 70/91390 = 0.0204
ésta es la probabilidad de rechazar un lote con 25% de
defectuosos y es muy baja. Para mejorar el proceso de selección,
los ingenieros deciden rechazar el lote cuando haya 2 o más
defectuosos. ¿Cuál es la probabilidad de rechazar un lote que
tenga 8 defectuosos? Los parámetros permanecen iguales lo que
cambia es la probabilidad, ahora es
P(X >= 2) = P(X=2) + P(X>2) = 0.1520 + 0.0204 = 0.1724
77
Manual del Alumno
Con esta nueva política de rechazar el lote cuando sean 2 o más,
¿cuál es la probabilidad de rechazar un lote con 6 defectuosos?
Los parámetros son, ahora, N=40, k=6, n=4 y queremos la
probabilidad:
P(X
=
>
10)
1
-
=
1
[46376/
91390
[P(X=0)
+
+
P(X=1)]
35904/
91390]
= 0.0997
2. En el salón de tercer año de una escuela hay 35 alumnos, de los
cuales 10 son niñas y 25 niños. Se nombra un comité de 7
alumnos que represente al salón. La selección se hace al azar.
¿Qué probabilidad hay de que en el comité haya mayoría de
niñas? En esta situación se cumplen las hipótesis de una
hipergeométrica. Los parámetros son: N=35, k=10, n=7, X es el
número de niñas en el comité. La probabilidad pedida es:
P(X
>
3)
=
P(X=4)
+
P(X=5)
+
P(X=6)
+
P(X=7)
= 0.0839
Problemas Propuestos:
1.
La probabilidad que en cierto establecimiento industrial el
consumo de
energía eléctrica sea normal en 24 horas es
igual a ¾. Determinar la distribución de probabilidad del
número de días de consumo normal de energía eléctrica en un
lapso de 6 días; represente en un diagrama esta distribución .
determine además cuál es la probabilidad que haya 4 días de
consumo normal?
78
Manual del Alumno
2.
Se lanza un dado 4 veces cuál es la probabilidad que la suma
9 aparezca exactamente 2 veces.
3.
Una máquina produce cierto tipo de piezas , de las cuales un
promedio de 5% son defectuosas . En una muestra aleatoria
de cinco piezas . ¿cuál es la probabilidad de obtener :
a) Exactamente una pieza defectuosa.
b) Por lo menos una pieza defectuosa.
4.
La probabilidad de fallar durante el vuelo para cada uno de los
6 motores de un avión es 0.0005 . Suponiendo que los 6
motores trabajan independientes, determine la probabilidad
que en un vuelo determinado :
a) no ocurra ninguna falla de motor.
b) No ocurra más de una falla.
c) Ocurra exactamente 2 fallas.
5.
Suponga que los motores de un avión de cierta marca que
operan independientemente , tienen una probabilidad de falla
de 0.1 . suponga que un avión efectúa un vuelo exitoso , si al
menos la mitad de sus motores operan normalmente ,
determine cuál avión , una con 4 motores y otro con 6 motores
, tiene mayor probabilidad de efectuar un vuelo exitoso.
6.
Suponga que la máquina A produce el doble de artículos que
la máquina B . Se sabe que el 6% de los artículos que produce
la máquina A son defectuosos mientras que el 3% de los
artículos que produce la máquina B son defectuosos .
Suponga que se junta la producción diaria de estas máquinas
79
Manual del Alumno
y se toma una muestra aleatoria de 10 artículos. Cuál es la
probabilidad de obtener 3 artículos defectuosos.
7.
Un examen consta de 20 preguntas , cada una tiene 5
respuestas, de las cuales sólo una es correcta . Un estudiante
que desconoce el curso responde el examen al azar.
a) Cuál es la probabilidad que acierte mas de 10 respuestas
correctas?
b) Cuál es la probabilidad que acierte mas de 15 respuestas
correctas?
8.
Se sabe que la probabilidad de que germine una sola semilla
de cierta clase es 0.9 . un agricultor quiere vender cultivos de
esta planta, para lo cuál asevera que cada uno contiene 100
plantas . Si siembra 110 semillas en cada cultivo ( que se
suponen germinarán en forma independientes ) ¿cuántas
plantas se puede esperar que contenga un cultivo promedio?
SESION 15
DISTRIBUCIÓN DE POISSON
Este modelo se llama así para honrar la memoria de otro gran probabilista
y matemático. La v.a. de Poisson se refiere a sucesos en un intervalo de
tiempo o en una área específica. El intervalo de tiempo puede ser de
cualquier duración, un minuto, una hora, un día, un año. Algunos ejemplos
de situaciones modeladas con el modelo de Poisson son: el número de
fallas de una máquina en una semana, el número juegos de algún deporte
pospuestos por lluvia en una temporada.
80
Manual del Alumno
Cuando se trata de superficies, los ejemplos son: el número de ratas en un
terreno, el número de errores de mecanografía por página, el número de
defectos por centímetro cuadrado.
Para que una v.a. sea de Poisson, se requiere que se satisfagan 3
hipótesis (que suelen llamarse también postulados del proceso de
Poisson).
En los problemas que resolvemos en este curso, el hecho de que el
modelo a utilizar sea el de Poisson, forma parte del enunciado del
problema.
La v.a. de Poisson tiene un solo parámetro que es mu = lambda.t ;donde t
es la longitud del intervalo o la superficie de la región y lambda es la tasa
de ocurrencia de eventos por unidad de medida.
La imagen de la v.a. de Poisson es {0, 1, 2, . . . } es decir todos los enteros
no negativos. La función de probabilidad esta dada por:
P(X = k) = exp(-mu)[mu
(k)
/ k!]; k = 0, 1, 2, . . .
La media es E(X) = mu y la varianza es var(X) = mu.
¿Dónde de aplica la v.a. de Poisson?
1. Si el promedio de llamadas por día hábil (de ocho horas) que se
reciben en un banco es 96. ¿Cuál es la probabilidad de que en una
hora se reciban exactamente 14?
Aquí, mu = 12 y
P(X = 14) = e
(-12)
(14)
[12
/ 14!] = 0.0905
En la misma situación ¿Cuál es la probabilidad de tener más de 16
llamadas en una hora? Ahora queremos:
P(X > 16) = 1 - P(X <= 16)
81
Manual del Alumno
esta última probabilidad la leemos en la tabla de Poisson y
tenemos:
P(X > 16) = 1 - 0.8987 = 0.1013
2. Una aplicación muy importante de la probabilidad de Poisson se
da para aproximar la binomial. Esta aproximación funciona bajo las
siguientes circunstancias.
o
La v.a. X cuyas probabilidades se quieren es binomial.
o
La n es muy grande (n >= 20) y
o
La p es muy pequeña (p <= 0.05).
o
De modo que, aproximadamente np < 5
En estas condiciones:
(k)
P(X = k) aproximadamente es exp(-mu)[mu
/ k!]
donde mu = np
Ejemplo. En una cierta comunidad la probabilidad de que una
persona infectada por neumonía muera es 0.002. ¿Cuál es la
probabilidad de que mueran a lo más 5 de las siguientes 2000
personas infectadas? Aquí se dan las condiciones para la
aproximación: n= 2000 y p = 0.002 de modo que mu = 4 y la
probabilidad pedida se obtiene de la tabla como
P(X >= 5) aproximadamente es 0.7851
3. Un mecanógrafo comete, en promedio, 2 errores por página. ¿Cuál
es la probabilidad de que tenga más de 20 errores en un
documento de 7 páginas? Aquí mu = 14 que es el número
esperado de errores en el documento. La probabilidad buscada,
usando la tabla es
P(X > 20) = 1 - P(X <= 20) = 0.0479
82
Manual del Alumno
Geométrica y Binomial Negativa.
El modelo geométrico surge con la misma situación básica de la binomial:
Se tiene una serie de pruebas. Con las siguientes características:
Cada prueba tiene sólo dos posibles resultados: genéricamente los
llamamos éxito y fracaso. Los denotamos con 1 (éxito) y 0
(fracaso).
El resultado de cada prueba es independiente del resultado de las
demás pruebas.
La probabilidad de éxito no cambia de una prueba a otra.
Fíjese que ahora no tenemos fijo el número de pruebas, sino que vamos a
realizar las pruebas hasta obtener el primer éxito. La variable aleatoria que
vamos a observar es el número total de pruebas realizadas.
Por ejemplo, si tiramos volados hasta que salga la primera águila, el
número total de volados necesarios será la variable aleatoria.
Esta v. a. tiene como posibles valores {1, 2, 3, . . . }.
La función de probabilidad es:
P(X = k) = q
(k-1)
p; para k en {1,2,3, . . . }
2
La media y la varianza son: E(X) = 1 / p y var(X) = (1-p) / p .
¿Dónde se aplica el modelo geométrico?
1. En un canal de comunicación, un modem puede equivocar un
carácter enviado con una probabilidad p=0.001. ¿Qué probabilidad
hay de que transmita 300 caracteres sin error?
Se aplica el modelo geométrico. La probabilidad que buscamos es
P(X > 300). Para calcular esta probabilidad hay que encontrar el
83
Manual del Alumno
(k-1)
valor de la serie suma desde 301 a infinito {q
300
q
= (0.99)
300
p} . Esta serie da
= 0.049.
En el mismo problema ¿Cuál es el promedio de caracteres sin
error?
La repuesta es E(X) = 1 / 0.001 = 1,000
2. En un proceso de manufactura se sabe que, en promedio, una de
cada cien piezas es defectuosa. ¿Cuál es la probabilidad de que la
quinta pieza seleccionada al azar sea la primera defectuosa?
Aquí aplicamos el modelo geométrico con p=0.01. La probabilidad
que requerimos es P(X = 5). De acuerdo a la fórmula ésta es:
4
(0.99) (0.01)=0.0096
La Binomial Negativa es el modelo que aplicamos cuando, en la misma
situación que la geométrica, nos interesa el número de intentos necesarios
para obtener el k-ésimo éxito.
La imagen de esta variable aleatoria es: {k, k+1, k+2, . . . }
La función de probabilidades es:
P(X
=
m)
=
(k) (m-k)
(m-1)C(k-1)p q
<B
para m en { k, k+1, k+2, . . . }
¿Dónde se aplica?
1. Una persona se entretiene lanzando al aire dos monedas, las
recoge y las vuelve a lanzar, siempre lanzando las dos. ¿Cuál es
la probabilidad de que las dos monedas caigan águilas ambas por
tercera ocasión, en el sexto lanzamiento.
Este es un problema binomial negativo (¡también parece un
problema de ociosos!) donde éxito es que las dos monedas caigan
ambas águilas. La probabilidad de que suceda esto, en un solo
84
Manual del Alumno
intento es p = 0.25. Si X es el número de intento en que ambas
sean águilas por tercera vez, X es binomial negativa con k=3. La
probabilidad que se nos pide es P(X = 6) usando la fórmula,
tenemos:
5C2(0.25)
3
3
(0.75) = 0.0659
85
Manual del Alumno
SESION 16
DISTRIBUCIONES CONTINUAS
Modelos Uniforme y Exponencial.
En las notas anteriores definimos el modelo exponencial (con media beta)
y el modelo uniforme en el intervalo (0, 1).
Sólo queda mencionar respecto a ellos sus usos más frecuentes.
El modelo exponencial se usa para modelar tiempos de espera.
Por ejemplo, el tiempo que un foco dura prendido hasta el momento en
que se funde es una variable aleatoria ya que el foco se puede fundir en
cualquier momento. La experiencia de las personas que se dedican al
mantenimiento indica que este fenómeno se puede modelar bien con la
densidad exponencial.
Otro ejemplo es el tiempo entre llegadas de llamadas telefónicas a un
conmutador. En este caso, la experiencia también indica que se puede
modelar razonablemente bien este flujo de llamadas con la exponencial; en
un rato del día que el conmutador esté muy ocupado (por ejemplo en las
horas hábiles de una oficina), el promedio entre llegadas será pequeño
(beta pequeño) mientras que cuando las llamadas están mas espaciadas
beta será grande.
El modelo uniforme se utiliza para modelar loterías. Si busco un número
real entre 3 y 18 y quiero que la probabilidad se reparta por igual entre
todos los números, utilizo una variable aleatoria uniforme U que sea
86
Manual del Alumno
uniforme en el intervalo (0, 1) y la multiplico por 15 y al resultado le sumo
3; en fórmula: X = U * 15 + 3. Note que como el valor más pequeño para U
es el 0, el valor más pequeño para X será 3. En el otro extremo, para U =
1, X será 18.
[¿Cómo hace un número uniforme entre -15 y 45?].
Con la uniforme en el (0, 1) también es posible tener números uniformes
discretos.
Por ejemplo, si quiero un número que valga 1 ó 2 ó 3 con igual
probabilidad, tomo un uniforme en el intervalo (0, 1);
Si me toca U menor que 1/ 3, entonces toca el 1
Si U sale entre 1/ 3 y 2/ 3, entonces toca el 2
Si U es mayor que 2/ 3, entonces toca el 3.
Es claro que con este mecanismo los tres valores: 1, 2 y 3 tienen la misma
probabilidad. [¿Cómo hacemos un número que valga 1, 2, 3, . . . , 34 con
la misma probabilidad a partir de un uniforme en el (0, 1)?]
Las técnicas de simulación por computadora utilizan mucho los números
uniformes en el intervalo (0, 1) como elementos básicos para construir
modelos de colas en los bancos, procesos industriales, funcionamiento de
redes de computadoras, procesos de espera, tráfico en andenes de
ferrocarril,
movimiento
de
mercancías
en
aduanas,
etc.
87
Manual del Alumno
LA DISTRIBUCION NORMAL.
La Normal Estándar
El modelo normal estándar es el de una variable aleatoria continua cuya
imagen son todos los números reales.
La densidad de la normal estándar es:
f(z) = (2π) 1/2exp(-z / 2)
-
2
Esta función no tiene una integral elemental de modo que se requiere una
tabla especial para conocer los valores de la probabilidad de una variable
normal. La tabla da probabilidades para
F(t) = P(Z < t)
La variable aleatoria normal estándar tiene propiedades importantes:
La probabilidad está concentrada cerca de cero. Se puede ver,
usando la tabla, que la probabilidad de un intervalo cercano a cero
es mayor que la de un intervalo del mismo ancho pero alejado de
cero. En el salón hacemos varios ejercicios de cálculo de
probabilidades que nos convencen de este hecho.
La probabilidad está simétricamente distribuida alrededor del cero.
Haciendo cuentas con la misma tabla se ve que la F(a) + F(-a) = 1,
para cualquier valor de a. Esto nos lleva a concluir la simetría de la
distribución.
Para algunos cálculos de probabilidad de una normal es
conveniente considerar el eje real partido en cuatro pedazos,
1. antes de -a,
88
Manual del Alumno
2. entre -a y 0,
3. entre 0 y a,
4. después de a.
Las probabilidades de (1) y (4) son iguales; las de (2) y (4) son
iguales; las de (1) y (2) sumadas dan 0.5; las de (3) y (4) suman
0.5.
Use la tabla para calcular: P(Z < 1.45), P(Z > -0.92), P(-0.53 < Z < 1.23).
En la tarea tiene Ud. muchos ejercicios más de cálculo de diferentes
probabilidades en el modelo normal.
Esta variable aleatoria, debido a la forma de la densidad, tiene un valor
central (el cero) que ``atrae'' los valores. La unidad de medida de esta
variable es el uno.
Usos de la normal. La normal no estándar
En los casos en que este modelo se usa, generalmente:
el valor central o promedio vale mu (distinto de cero)
la unidad de medida o desviación estándar es sigma (distinta de
uno).
Para calcular en este caso no estándar, es preciso hacer una
transformación que se llama estandarización. Esta estandarización es un
codificación de los valores.
La fórmula para estandarizar es:
Z = (X - mu) / sigma
La forma de usar esta codificación la ejemplificamos en el pizarrón y tiene
Ud. abundantes ejercicios en la tarea.
89
Manual del Alumno
En esta parte del curso calcularemos probabilidades suponiendo que el
promedio y la desviación estándar nos son dados. En un problema real,
estos valores se tendrán que obtener mediante observaciones a través del
proceso de estimación.
Modelos relacionados con la normal
Los distribuciones relacionadas con la normal referidas en el objetivo 5.2
del temario: t, ji cuadrada y F, serán vistas posteriormente cuando
tengamos necesidad de usarlas. Por el momento es muy importante que
haga Ud. abundantes ejercicios con la normal.
Ejemplo:
Sea X una variable aleatoria N(5, 4) .
a)
¿Cuál es la probabilidad de que X tome valores entre 4 y 7?
b)
¿ Cuál es la probabilidad de que X tome valores mayores que 10.?
Solución:
a) P[ 4 < X < 7 ] = P [
P[ -1/2 < Z < 1 ] =
4
5
<
2
(1)
X
<
7
5
2
( 1 / 2)
= 0.8413 – 0.3085
= 0.5328
b)
P[ X > 10 ] = 1 - P[ X ≤ 10 ]
=1-P[
X
<
10
= 1 - P[ Z < 5/2 ] =
=1-
(2.5)
= 1 – 0.9938 = 0.0062
5
2
]
]
90
Manual del Alumno
Problemas Propuestos.
1.
Sea X una variable aleatoria con N( μ, 25 )
Calcular: P[ І X – μ І > 3 ]
2.
Si X es una variable aleatoria con N( 650, 625 ). Hallar la constante
“c > 0” tal que:
P[ І X – 650 І < c ] = 0.9544
3.
En una distribución normal se tienen los siguientes datos:
P[ X < 45 ] = 0.31
P[ X > 64 ] = 0.08
Hallar la media y la desviación estándar de la distribución.
4.
Una pequeña ciudad es abastecida de agua cada 2 días ;
El
consumo en volumen de agua para esa pequeña ciudad tiene una
distribución normal con media 20000 litros y una desviación de 1000
litros ( se entiende el consumo cada 2 días ) . Se trata de hallar la
capacidad de su tanque de agua para que sea de solo 0.01 , la
probabilidad que en un periodo de dos días el agua no sea suficiente
para toda la demanda.
5.
Si la duración de los periodos de duración de los postes telefónicos
de madera es tal que el 9.51% tienen un periodo de duración que
exceden los 9 años, determine la desviación estándar de los
periodos de duración
periodos es normal.
SESION 17
si se
sabe que la distribución de dichos
91
Manual del Alumno
TEOREMA CENTRAL DEL LÍMITE
La distribución de probabilidad de una estadística
Quizá el resultado mas importante para la estadística es el Teorema del
Límite Central. Este resultado nos indica que, para la estadística promedio
de la muestra
el valor esperado es la media de la población.
la varianza es igual a la de la población dividida por el número
de elementos de la muestra.
la distribución de probabilidad es la normal.
Este teorema es muy importante porque permite calcular probabilidades
acerca de dónde se encuentra el valor del promedio muestral. Es sólo
cuestión de usar la tabla normal teniendo cuidado al estandarizar de usar
la desviación estándar adecuada que es la de la población dividida por la
raíz cuadrada del número de elementos de la muestra.
En el salón hacemos en forma detallada, ejemplos de estos cálculos
92
Manual del Alumno
En este applet, vemos nuevamente tiradas de dados. Sea X el numero que
muestra un dado al ser tirado. El valor medio de los valores posibles de X
es 3.5, y la varianza es 35/12 . Si Sn es el la suma de n dados tirados,
entonces si n es ``grande'', la variable aleatoria
Puede ser aproximada por una normal, luego Sn puede considerarse una
normal de media 3.5*n y varianza 35n/12. La curva roja es el grafico de la
función de densidad de una normal con esos parámetros.
Problemas propuestos:
1.
Un examen de tipo test contiene 100 preguntas, cada una con dos
posibles respuestas (verdadera-falsa), de las que sólo una es
cierta. Hacer uso de la aproximación normal para:
a. Calcular la probabilidad de que un alumno consiga acertar
40 preguntas sorteando al azar las 100 respuestas.
b. Calcular la probabilidad de que un alumno consiga acertar
70 preguntas cuando sabe la respuesta de 25 preguntas y
sortea las respuestas de las otras 75.
c.
Determinar el número de preguntas que un alumno debe
acertar para que el profesor asegure que con una
probabilidad de 0.9 el alumno no ha sorteado todas las
respuestas.
93
Manual del Alumno
2.
En cierta población de animales, el 30% de los individuos tienen
menos de un año de edad. Utiliza el Teorema Central del Límite
para calcular la probabilidad de que en una muestra de 40
animales haya 10 de menos de un año
3.
La variable aleatoria Yn es igual a la suma de los puntos que
salen al realizar n lanzamientos independientes de un dado
equilibrado. Utilizando el teorema central del límite, escoger n de
modo que
4.
Se selecciona una muestra de 10000 votantes. Definimos la
variable aleatoria:
Sea
¿Cuál es la probabilidad de que
se diferencie de la proporción p
de votantes afirmativos que hay en la población en menos de
0.01?
5.
Un jugador va a jugar a cara o cruz 400 partidas, en cada una de
las cuales, y con idéntica probabilidad, puede ganar o perder una
94
Manual del Alumno
peseta. ¿Cuál es la mínima cantidad que debe llevar para que,
supuesto que los pagos o cobros se hacen al final de la serie,
tenga una probabilidad de 0.95 de hacer frente a sus posibles
pérdidas?
6.
Se toman 30 números reales elegidos al azar entre 10 y 20; cada
uno de ellos sirve para formar un paralelepípedo de dimensión 30.
Calcular el valor de a para que P(Volumen < a)=0.95
7.
Supongamos que extraemos una muestra aleatoria simple de una
población que se distribuye según una
U[0,2]. Encontrar
aproximadamente la probabilidad de que la media muestral es
encuentre entre 0.8 y 1.1, si el tamaño de la muestra es 48.
8.
Sea
variables
aleatorias
independientes
e
idénticamente distribuidas con media 75 y varianza 225.
a.
Utilizar la desigualdad de Tchebichev para calcular la
probabilidad de que la media muestral no difiera de la
media poblacional en más de 6 unidades.
b.
Utilizar el Teorema Central de Límite para calcular la
misma probabilidad.
9.
Un individuo posee tres monedas idénticas externamente, pero en
las que las probabilidades de obtener cara son diferentes e iguales
a 0.8, 0.6 y 0.4. Las tres monedas son lanzadas simultáneamente
95
Manual del Alumno
100 veces.¿Cuál es la probabilidad de obtener más de 175 caras
en los 100 lanzamientos?
10.
En un cierto juego la probabilidad de ganar es 18/37. Supongamos
que en cada juego se puede ganar 1 pts. o perder 1 pts.¿Cuántas
veces hay que jugar para ganar al menos 1000 pts. con
probabilidad 0.5?
Las ganancias diarias de un jugador (en dólares) se distribuyen
uniformemente en el intervalo (-40,50). ¿Cuál es la probabilidad de
que el jugador gane más de 500 dólares en 60 días?
96
Manual del Alumno
SESION 18
PRUEBAS DE HIPÓTESIS
Introducción y Suposiciones
Una hipótesis es una aseveración sobre algún atributo poblacional. Según
Méndez (1973), una hipótesis es "Una suposición teórica que se acepta
provisionalmente para explicar ciertos hechos". Aseveraciones sobre
parámetros poblacionales conducen a pruebas paramétricas. Estas
pruebas se basan en el análisis de muestras con el fin de evaluar algún
valor hipotético. Las técnicas paramétricas se basan generalmente en una
o varias suposiciones sobre los elementos de la población. Por otra parte,
existen hipótesis que se plantean con respecto a un intervalo de valores,
es decir, en este caso el interés no es determinar un valor en particular
sino construir un intervalo de confianza, es decir, con base a una muestra
determinar el valor de P (a< Q < b), la probabilidad de que el parámetro Q
se encuentre entre (a,b) y el grado de confiabilidad en esta aseveración.
Las suposiciones mas importantes en la mayoría de las pruebas de
hipótesis son:
1. Normalidad. Los observaciones deben tener una distribución
normal. Estas observaciones se distribuyen alrededor de una
2
2
media Mu y una varianza sigma . Yij ~ N(Mu, sigma ). Es decir, la
distribución de los errores es normal. En ciertos casos, la
distribución puede ser otra, por ejemplo, chi-cuadrada, t-student,
exponencial, etc., sin embargo, la mayoría de las pruebas son
97
Manual del Alumno
robustas a la normalidad, es decir, relativamente insensible al tipo
de distribución, debido al teorema del limite central (la distribución
de medias es aproximadamente normal para cualquier distribución
siempre y cuando el tamaño de muestra sea grande). Por otra
parte, los datos pueden transformarse para cumplir con esta
suposición.
2. Independencia. Los datos deben ser independientes. En otras
palabras, las observaciones deben ser extraídas al azar y no estar
correlacionadas. Cuando los datos están correlacionados, la
validez de la prueba disminuye. La independencia se logra
mediante muestreo aleatorio o asignación aleatoria de tratamientos
a unidades experimentales. Esta es una suposición fundamental
en
la
realización
de
pruebas
de
hipótesis.
La
falta
de
independencia, debido a la pobre planeación de un experimento,
generalmente conduce a la invalidez de los resultados. A
diferencia de las otras suposiciones en las cuales es posible
realizar transformaciones o cambiar de análisis para cumplir con
esas suposiciones, en el caso de falta de independencia lo
recomendable es analizar cuidadosamente el experimento para
determinar las causas de la falta de independencia y corregir estas
fallas (Sokal y Rohlf, 1995).
3. Varianzas homogéneas. La variabilidad de las observaciones
2
entre dos o mas conjuntos de datos debe ser similar: Sigma1 =
2
2
sigma_2 =... = sigmat . Esto significa que las fuentes de error
experimental deben ser similares. Cuando las varianzas no son
98
Manual del Alumno
homogéneas puede haber problemas en la detección de
diferencias entre medias. En este caso conviene realizar una
transformación para hacer las varianzas homogéneas o bien hacer
el análisis con subgrupos. Otra alternativa es emplear métodos no
paramétricos.
Procedimiento General para Formular y Probar
Hipótesis Estadísticas
La formulación y prueba de hipótesis estadísticas siguen, en
general, los siguientes pasos (no necesariamente en este orden):
Especificar la población sobre la cual nuestras inferencias son
aplicables.
Extraer una muestra de la población sobre la cual se pretende
probar alguna hipótesis. Esta muestra (o muestras) deben
extraerse al azar para que las inferencias tengan validez. El
tamaño de muestra depende de la variabilidad de los datos, los
costos de procesar la muestra y la confiabilidad en las
estimaciones.
Establecer la hipótesis nula e hipótesis alternativa. La hipótesis
nula (Ho) es la aseveración de que el parámetro es igual a cierto
valor, mientras que la hipótesis alternativa (Ha) es la negación de
la hipótesis alternativa. Por ejemplo, para determinar la efectividad
de algún insecticida, Ho sería: no hay efecto del insecticida sobre
la población de insectos plaga de interés. La hipótesis alternativa
99
Manual del Alumno
seria que sí existe efecto del plaguicida. El rechazo de Ho significa
la "aceptación" de la hipótesis alternativa. La decisión sobre el
rechazo o no de la hipótesis nula siempre conlleva un riesgo de
error pues la decisión se basa en una muestra que no contiene
todos los elementos de la población. Cuando no se rechaza Ho no
quiere decir que se acepta Ho. Es decir, la evidencia no significa
que la aseveración es cierta; simplemente es que los datos se
conforman, hasta ese momento, con Ho.
Seleccionar y determinar el valor de la estadística de prueba. La
estadística de prueba es la variable que se calcula con base a
cierto modelo probabilístico. La estadística de prueba es una
variable aleatoria que tiene cierta distribución conocida cuando Ho
es cierta. La idea es determinar que tan probable es que el valor
de la estadística de prueba calculada ocurra cuando Ho es cierta.
Si esta probabilidad es baja, se rechaza Ho, con una probabilidad
de equivocarse también baja.
Determinar el riesgo de equivocarse cuando se rechaza la
hipótesis nula (Error tipo I). Este riesgo generalmente se establece
a priori y valores entre 0.10 y 0.001 son generalmente usados. En
una sección posterior se discute el empleo de los valores de P (Pvalúes) asociados a la estadística de prueba y empleados para
tomar una decisión sobre Ho.
Determinar un valor crítico de la estadística de prueba acuerdo al
modelo
probabilístico
que
genera
dicha
estadística
y
la
100
Manual del Alumno
probabilidad de cometer error tipo I. Este valor permite decidir
sobre la aceptación o el rechazo de Ho. Alternativamente se puede
calcular el valor de P.
Establecer un criterio de decisión: Por ejemplo, rechazar Ho si y
solo si el valor calculado de la estadística de prueba es mayor o
igual que el valor crítico.
Comparar el valor calculado contra el valor crítico y tomar una
decisión. Esta es la parte final de una prueba de hipótesis, sin
embargo, en toda investigación, este proceso es cíclico (Platt,
1964).
Alternativamente, el valor de la estadística de prueba puede emplearse
para calcular la probabilidad de obtener dicho valor cuando la hipótesis
nula es cierta. Si esta probabilidad es reducida, se tienen dos opciones
(Méndez, 1973):
a) La hipótesis nula es falsa, o b) La hipótesis nula es cierta pero se obtuvo
una muestra "rara" o poco probable. En este situación se rechazará la
hipótesis nula y queda la incertidumbre (baja) de cometer un error tipo I.
Distribuciones de Referencia
La mayoría de las pruebas estadísticas hacen uso de una distribución de
referencia. Una distribución de referencia es un modelo probabilístico de la
estadística de prueba que ocurre cuando Ho es cierta, es decir, cuyo(s)
parámetro(s) corresponden a los establecidos en la hipótesis nula. Con
esta distribución de referencia podemos calcular las probabilidades de
101
Manual del Alumno
obtener el valor observado de dicha estadística. Por ejemplo, suponga que
examinamos una muestra de la cual obtuvimos una media muestral =8.
Podemos suponer que este valor provino de una distribución N(5,2), es
decir, de una distribución de medias distribuidas normalmente, Media ~
N(5, 2). En este caso, estamos suponiendo que la media poblacional µ <=
5, i.e., Ho: µ <= 5, contra Ha: µ > 5. Además, también suponemos que la
varianza de las medias es 2. La Figura 1 ilustra la distribución
probabilística N(5,2).
Fig. 1. Distribución normal N(5, 2).
En la Fig. 1 observamos que el valor de nuestra media muestral (8) se
encuentra en el extremo de la distribución. En efecto, la probabilidad de
102
Manual del Alumno
obtener valores >= 8 cuando Ho µ <=5 y varianza = 2 son bajas. Al calcular
la probabilidad exacta obtenemos el siguiente valor:
P(Y media >= 8)= 0.067
Observamos que el valor de la media muestral (mayores o iguales a 8)
ocurre con una probabilidad muy baja. Es decir, si Ho fuese cierta, la
probabilidad de obtener un valor de 8 o mayor es 0.067. Ciertamente, otros
valores de µ > 5 podrían generar muestras con Y media = 8 con una mayor
probabilidad. Cuando las probabilidades de ocurrencia de la estadística de
prueba son bajas (digamos < 0.05) entonces podemos tomar la decisión de
rechazar Ho, corriendo el riesgo de cometer un error igual a la probabilidad
de obtener valores iguales o mayores de dicha estadística. En este caso,
podemos rechazar Ho con un riesgo de error equivalente a P(Ymedia >= 8)
= 0.067. El valor de P(Ymedia >= 8) corresponde al P-value.
Existen algunas pruebas que hacen uso de una distribución de referencia,
en particular, las pruebas de aleatorización y pruebas basadas en
"experimentos previos" permiten probar hipótesis sin necesidad de
contar con una distribución de referencia .
Ejemplos de Formulación de Hipótesis Estadísticas
Para una, dos o mas poblaciones.
Una población
103
Manual del Alumno
1. Se inspecciona una muestra de pulgones de cierta región y se
mide la longitud de cornículo. Por datos obtenidos en otra región,
se sabe que la longitud promedio del cornículo es de 0.10 mm.
La hipótesis nula se expresa como: Ho : mu= 0.10,
la hipótesis alternativa: Ha: mu <> 0.10 mm.
En otras palabras, se prueba si la muestra proviene de una
población con media 0.1 mm, la hipótesis alternativa es que la
media es distinta.
2. Se inspecciona una muestra de plantas de fríjol, se cuenta el
número de picudos del ejote por vaina. Se desea saber que tipo de
distribución probabilística representa los conteos de insectos.
Dos poblaciones
1. Se realiza el siguiente experimento. Se pretende probar si cierto
tipo de trampa captura adultos de "salivazos" igualmente del lado
norte y del lado sur. Aqui la hipótesis es mu1 = mu2, contra Ha:
mu1 <> mu2. mu1 es la media poblacional (número de insectos
capturados) en el lado sur, y mu2 es la media poblacional en el
lado norte.
2.
Se postula que existe una relación lineal entre el numero de
chinches del sorgo y el rendimiento del sorgo. El modelo
estadístico mas simple es que el rendimiento (Y) es una función
lineal del número de chinches (X): Yi = B0 + B1X + ei. Si este
modelo es cierto, entonces B1 <> 0, de otra manera no existe
relación entre X y Y y el modelo se colapsa a: Yi = B0 + ei.
104
Manual del Alumno
B0 representa la media general y B1 la pendiente de una recta. La
hipótesis que se desea probar es: Ho: B1 = 0 vs B1 <> 0.
Varias poblaciones (> 2 poblaciones)
1. Se evalúan cuatro herbicidas A, B, C, D. Los herbicidas A y B son
preemergentes y C, D post-emergentes. Los herbicidas A y C
contienen el mismo ingrediente activo y
la misma formulación pero son hechos por dos compañías distintas
y tienen costo distinto. El herbicida B es una mezcla del
ingrediente activo del herbicida A y otro componente. Lo mismo
ocurre con el herbicida D. Es decir, el herbicida D es una
formulación
del
herbicida C
(ingrediente
activo)
con otro
ingrediente activo. Además de estos herbicidas se tiene un
tratamiento testigo (no hay control de malezas) y otro tratamiento
que consiste en control manual (machete). Los herbicidas A y B
son producidos por la compañía Agroquímicos-1, los herbicidas C
y D son producidos por la compañía Agroquímicos-2.
Se formulan las siguientes hipótesis:
a) Existe diferencia en los tratamientos químicos con respecto al
testigo (no control) ?
b) Existe diferencia entre los herbicidas preemergentes con
respecto a los postemergentes?
Observe
que
experimento
estas
hipótesis
son
propuestas
antes
del
105
Manual del Alumno
2. Se diseña un experimento para determinar la efectividad de dos
depredadores: Hippodamia y Coccinella. Se evalúan ambos
depredadores tanto en estado larval como adultos. Se prueban las
siguientes hipótesis:
Existen diferencias en el consumo entre Hippodamia y Coccinella?
Existen diferencias en el consumo de pulgones entre larvas y
adultos de ambos depredadores?
La diferencia en el consumo entre larvas y adultos es el mismo
para las dos especies?
3. Se prueban varias variedades de frijol con respecto al ataque de
Zabrotes. El objetivo es determinar si existen variedades
resistentes al ataque de este insecto, evaluado mediante el efecto
de dichas variedades sobre las tasas de desarrollo. Una hipótesis
de interes sería:
Cual es la variedad mas resistente con respecto al testigo
PROBLEMAS PROPUESTOS:
1.
Un contador cree que los problemas de flujo de efectivo de
una empresa son resultado directo del lento proceso de cobro de
las cuentas por cobrar. Dice que al menos el 70% de las actuales
cuentas por cobrar tienen más de dos meses. Una muestra de 120
106
Manual del Alumno
cuentas por cobrar indica que hay 78 con más de dos meses.
Pruebe la afirmación del contador, al nivel de significancia de
=0.05.
2. Se tiene la siguiente prueba de hipótesis:
Ho:
Ha:
1
-
0
2
1
-
2
>
0
Los resultados siguientes son para dos muestras independientes
tomadas
de
Muestra 1
n1 = 40
dos
poblaciones
Muestra 2
n2 = 50
= 22.8
= 25.2
S1 = 5.2
S2 = 6.0
a) ¿Cuál es su conclusión de la prueba de hipótesis con
= 0.05?
b) ¿Cuál es el valor p?
3. Se tiene la siguiente prueba de hipótesis
Ho:
Ha:
1 -
1
=0
2 0
2
Los resultados siguientes son para dos muestras independientes tomadas
de
dos
poblaciones
Muestra 1
n1 = 80
= 104
Muestra 2
n2 = 70
= 106
107
Manual del Alumno
S1 = 8.4
S2 = 7.6
a.
¿Cuál es su conclusión de la prueba de hipótesis con
b.
¿Cuál es el valor p?
RESPUESTA:
a)
z
=
-1.53;
b)
no
= 0.05?
rechazar
Ho
0.1260
4. Se tiene la siguiente prueba de hipótesis
Ho:
1
-
2
=0
Ha:
1
-
2
Los
resultados
0
siguientes
corresponden
a
dos
muestras
independientes de las dos poblaciones. ¿Cuál es su conclusión de
la
prueba
de
hipótesis
Muestra 1
Muestra 2
n1 = 8
n2 = 7
= 1.4
= 1.0
S1 = 0.4
S2 = 0.6
con
a
=
0.05?
5. Los siguientes estadísticos corresponden al ejercicio anterior, en el
que con dos muestras independientes de viajeros se calificaron los
aeropuertos
de
Miami
y
Los
Ángeles.
108
Manual del Alumno
Aeropuerto
Tamaño
muestra
Miami
Los Ángeles
50
50
de
la Media de la Desviación
muestra
estándar de la
muestra
6.34
2.163
6.72
2.374
¿Es la media de la población de calificaciones del aeropuerto de Los
Ángeles mayor que la del de Miami? Apoye su conclusión con una
prueba estadística que emplee un nivel de significancia de
RESPUESTA:
0.84,
no
=0.05
rechazar
Ho
6. El estudio de las tiendas Greyston Department Store de la sección
10.1 produjo los siguientes datos acerca de las edades de los
clientes, con dos muestras aleatorias independientes tomadas en
dos lugares de la ciudad.
Tienda del centro
Tienda suburbana
n1 = 36
n2 = 49
= 40 años
= 35 años
S1 = 9 años
S2 = 10 años
Para a = 0.05, pruebe Ho:
1
-
2
= 0 contra la alternativa Ha:
1
-
2
0.
¿Cuál es su conclusión acerca de las medias de las edades de las
poblaciones
de
los
clientes
en
las
dos
tiendas?
109
Manual del Alumno
7.
El Servicio de Evaluación educativa llevó a cabo un estudio para
investigar las diferencias entre las calificaciones de alumnos hombres y
mujeres en la Prueba de Aptitud Escolar (PAE). El estudio identificó una
muestra aleatoria de 562 alumnos mujeres y 852 alumnos hombres que
alcanzaron la misma alta calificación en la parte de matemáticas. Esto es,
se consideró que los alumnos, mujeres y hombres, tenían aptitudes
semejantes y altas en matemáticas. Las calificaciones de expresión oral
del PAE, para las dos muestras, se resumen en la tabla siguiente.
Alumnos mujeres
= 547
Alumnos hombres
= 525
S1 = 83
S2 = 78
Esos datos, ¿respaldan la conclusión que, dada una población de alumnos
mujeres y una de alumnos hombres con aptitudes matemáticas altas, los
alumnos mujeres tienen una aptitud bastante mayor de expresión oral?
Haga la prueba con nivel de significancia de
= 0.02. ¿Cuál es su
conclusión?
RESPUESTA: z = 4.99; rechazar Ho
SESION 19
EXAMEN DE LA II UNIDAD FORMATIVA
110
Manual del Alumno
SESION 20
EXAMEN SUSTITUTORIO