Download TEMA Nº 7

Document related concepts
no text concepts found
Transcript
1
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
TEMA Nº 1
TEORÍA DE PROBABILIDADES
1.1.- COMPETENCIA DE TEMA:
HABILIDAD: Describe
CONTENIDO: Los conceptos fundamentales de la teoría del cálculo de probabilidades.
PROCESO:
Mediante un proceso interactivo y el uso de diferentes fuentes de información.
CONTEXTO: En el aula
1.2. PROBABILIDADES.- El cálculo de Probabilidades, es una rama de las
matemáticas que se ocupa de medir o cuantificar la posibilidad de que ocurra un
determinado suceso o evento. La probabilidad es una herramienta indispensable
para toda clase de investigaciones que implican INCERTIDUMBRE. Si se está
frente a experimentos cuyos resultados están completamente determinados, es
decir de antemano se sabe qué suceso ocurrirá, entonces desaparece el problema
de incertidumbre, por lo tanto no hay necesidad de recurrir al cálculo de
probabilidades. Sin embargo, como hay una infinidad de fenómenos los cuales
implican incertidumbre, la importancia de considerar la teoría de probabilidades en
nuestro estudio, es realmente relevante.
La creación de la Probabilidad se atribuye a los matemáticos franceses del siglo
XVII Blaise Pascal y Pierre de Fermat, aunque algunos matemáticos como Gerólamo
Cardano en el siglo XVI, habían aportado importantes contribuciones a su
desarrollo. La probabilidad matemática comenzó como un intento de responder a
varias preguntas que surgían en los juegos de azar, como ser los dados, los naipes y
las monedas.
A través de la historia, se han estructurado tres definiciones de probabilidad que
son complementarias y su aplicación depende de la naturaleza del problema o
fenómeno que se esté encarando o tratando de resolver. Estas definiciones son:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
2
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
a) Definición clásica
b) Definición por Frecuencia Relativa
c) Definición Subjetiva
PROBABILIDAD OBJETIVA
PROBABILIDAD SUBJETIVA
a) DEFINICIÓN CLÁSICA: Fue estructurada por Simón Laplace en el año 1812,
en su obra:” Teoría Analítica de las Probabilidades” y dice:
“LA PROBABILIDAD DE UN EVENTO ES LA RAZÓN ENTRE EL NÚMERO DE CASOS O
SUCESOS FAVORABLES A UN EVENTO Y EL NÚMERO TOTAL DE CASOS O SUCESOS
POSIBLES, SIEMPRE Y CUANDO NADA OBLIGUE A CREER QUE ALGUNOS DE ESTOS
SUCESOS DEBA TENER PREFERENCIA A LOS DEMÁS, LO QUE HACE QUE TODOS SEAN
IGUALMENTE POSIBLES”.
En la definición anterior, se tiene:
N(
)
n
N ( A)
na
Número de elementos del espacio muestral (número total
de sucesos).
Número de elementos o sucesos favorables al evento A.
Entonces:
PA
N (A)
N( )
N ( A)
n
Número de casos favorablesal eventoA
Número de casos posibles
En la presente definición, está implícito un supuesto muy importante referido al
Espacio Muestral , es el concepto de EQUIPROBABILIDAD. Según este principio,
todos los elementos del espacio muestral deben tener la misma probabilidad de
ocurrencia, de no ser así no es aplicable el concepto de Probabilidad Clásica.
La probabilidad de un resultado se representa con un número que fluctúa entre 0 y
1, ambos inclusive. La probabilidad CERO indica que el resultado no ocurrirá nunca,
y la probabilidad 1, que el resultado ocurrirá siempre. El cálculo matemático de
probabilidades se basa en situaciones teóricas en las cuales puede configurarse un
espacio muestral , cuyos sucesos elementales tengan todos la misma probabilidad.
Por ejemplo: al lanzar un dado normal, la probabilidad de cada una de las caras es
1/6. Al lanzar dos dados, la probabilidad de cada uno de los resultados es de 1/36.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
3
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
EJEMPLO 1: Si se lanza un dado no cargado, debe considerarse que hay igual
probabilidad que salga cualquiera de los números del espacio Muestral .
= {1, 2, 3, 4, 5,6}
La probabilidad de que salga cualquier número es = a 1/6
EJEMPLO 2: Sea el experimento que consiste en lanzar dos dados una vez y en
condiciones normales.
a) ¿Cuál es la probabilidad de que la suma de los puntos que aparecen sea 12?
b) ¿Cuál es la probabilidad de que sea 7?
c) ¿Cuál es la probabilidad de que la suma no sea mayor que 3 ?
SOLUCIÓN:
a)
= {(1,1) (1,2) (1,3)..................................... (6,6)}
62
36
1
(1,1)
(2,1)
(3,1)
(4,1)
(5,1)
(6,1)
1
2
3
4
5
6
2
(1,2)
(2,2)
(3,2)
(4,2)
(5,2)
(6,2)
3
(1,3)
(2,3)
(3,3)
(4,3)
(5,3)
(6,3)
4
(1,4)
(2,4)
(3,4)
(4,4)
(5,4)
(6,4)
5
(1,5)
(2,5)
(3,5)
(4,5)
(5,5)
(6,5)
6
(1,6)
(2,6)
(3,6)
(4,6)
(5,6)
(6,6)
a) La suma de los puntos es = 12 y solo existe una opción.
N(A) = {(6,6)} = 1
P( A) = 1/36
b) La suma de los puntos es 7
N(A)
P( A)
6,1 5,2 4,3 3,4 2,5 1,6
6
36
6
1
6
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
4
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
c) La suma de los puntos es < 4
P(A)
{(1,1)(1,2)(2,1)}
P( A )
3
36
3
1
12
EJERCICIOS PARA RESOLVER EN CLASES:
1.- Se lanza una moneda tres veces. ¿Cuál es la probabilidad de obtener 3 caras?
¿Cuál es la probabilidad de obtener dos caras y un sello?.
2.- Un lote consta de 10 artículos, 4 con pequeños defectos y 2 con defectos
graves. Se elige un artículo al azar. Encontrar la probabilidad de que:
a) No tenga defectos.
b) Tenga un defecto grave.
b)
DEFINICION POR FRECUENCIA RELATIVA:
El supuesto fundamental sobre el cual se apoya la definición clásica de probabilidad,
es el referido a la equiprobabilidad de los elementos del espacio muestral , o sea
que, todos los elementos del espacio muestral tengan la misma probabilidad de ser
elegidos. Sin embargo no todos los fenómenos o problemas de la vida real cumplen
necesariamente con dicho supuesto, para estos casos la ciencia de la estadística
estructuró la Teoría de las probabilidades por Frecuencia Relativa o el concepto
frecuencialista de Probabilidad, que toma en cuenta dos aspectos:
1.- No es necesario que los elementos de sean equiprobables.
2.- n debe ser grande, o tender al infinito.
Si se cumplen las dos condiciones anteriores, se puede estimar la probabilidad de la
ocurrencia de un evento cualquiera a partir de su Frecuencia Relativa:
P( A )
Donde:
P( A)
na
n
= Probabilidad de que ocurra el evento “A”.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
5
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
na
= Frecuencia Absoluta de A
n
= Tamaño de la Muestra
Esta aproximación es más real cuando n es grande tiende al infinito.
EJEMPLO Nº 1: En una muestra aleatoria de 10 fábricas que emplean un total de
10.000 trabajadores, se evidenció que ocurrieron 500 accidentes de trabajo
durante un período reciente de 12 meses. Hallar la probabilidad de que ocurra un
accidente de trabajo en una industria determinada.
SOLUCION: En el problema anterior no se puede señalar que los casos posibles
sean equiprobables por cuanto las condiciones de trabajo y seguridad industrial
varían en cada empresa, por lo tanto no podemos hablar de
equiprobable, por
tanto no es posible aplicar el concepto de la probabilidad Clásica. Los datos con los
que contamos son:
n
= 10.000 trabajadores
n a = Accidentes de trabajo ocurridos en un periodo de doce meses = 500
Entonces, se puede estimar la probabilidad de ocurrencia de un accidente a partir
del concepto de Frecuencia Relativa:
P( A)
na
n
500
10.000
0,05
EJEMPLO Nº 2: Sea la distribución de los miembros de los partidos políticos, el
siguiente:
PARTIDO
NÚMERO TOTAL
DE MILITANTES
MILITANTES
MUJERES
A
105
B
100
C
70
D
45
E
40
F
15
TOTALES
375
15
20
5
10
3
2
55
¿Cuál es la probabilidad de que un miembro seleccionado aleatoriamente :
a) Sea una mujer ?
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
6
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
b) Pertenece al partido B?
c) Sea un hombre miembro del partido C?
SOLUCIÓN:
a) n = total de militantes = 375
Sea: “A” : El militante seleccionado es una mujer.
na
55
375
0,147
a) Sea B: El seleccionado pertenece al partido “B”.
nb
100
375
0,27
c) Sea C: El seleccionado es hombre y pertenece al partido C.
nc
70
P( c)
nb
n
5
65
375
65
0,17
c) PROBABILIDAD SUBJETIVA:
Esta es una definición alternativa y se utiliza cuando existen muchas situaciones
donde el concepto de Probabilidad Clásica ( equiprobable) y el de Frecuencia
Relativa, carece de significado, o sea no se cumplen ninguna de las dos condiciones
señaladas.
En este caso se aplica el concepto de probabilidad subjetiva:
EJEMPLO: ¿Cuál es la probabilidad de que una expedición tripulada desembarque en
el planeta Marte en la próxima década ?
El ejemplo anterior tratase de un evento único sin antecedente alguno, por tanto, no
existe forma de que se pueda interpretar tal probabilidad a través de la
probabilidad clásica ni la frecuencia relativa.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
7
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
En consecuencia, en estos casos, el ENFOQUE SUBJETIVO de probabilidad resulta
ser el más adecuado, donde hay una sola oportunidad de ocurrencia del evento.
DEFINICIÓN: Dado un experimento determinado, la probabilidad de un evento A
es el grado de CERTEZA asignado a la ocurrencia de ese evento por un individuo
particular, basado en toda la evidencia a su disposición, con las siguientes
exigencias:
1.- P( A)
2.- P(A)
Representa la certeza de que el evento A no ocurrirá.
0
Representa la certeza de que el evento A si ocurrirá.
1
3.- 0 < P( A) < 1
Representa el grado de certeza de que el evento A ocurrirá, a
partir
de
toda
la
información
disponible
en
relación
al
evento
analizado.
1.3 AXIOMAS DE PROBABILIDAD Y PROPIEDADES.- El tratamiento de las
Probabilidades implica el empleo de axiomas y teoremas, las mismas que los
podemos clasificar en tres axiomas y seis teoremas:
AXIOMA 1
0
1
PA
Para cada evento A que es parte de
AXIOMA 2: Probabilidad del Evento seguro.
P
1
AXIOMA 3: Para cualquier número finito k de eventos mutuamente excluyentes y
colectivamente exhaustivos en
P
k
k
 Ai
i 1
P AB
P Ai
i 1
PA
PB
TEOREMAS:
TEOREMA 1: Si
es el evento imposible, entonces
Demostración: Sabemos que:
=
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
P
0
Cobija – Pando - Bolivia
8
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Por otro lado:
P
y
P
P
Por el Axioma 3
Por el axioma 2
1 1 P
P
son mutuamente excluyentes
11 0
TEOREMA 2:
Para cada evento A, se cumple que:
PA
1 PA
PA
ó
1
PA
Demostración:
Se sabe que:
Por otro lado los eventos
_
AA
y
A
_
A
son mutuamente excluyentes:
_
AA
En consecuencia:
P
1
PA
PA
PA
PA
Por el Axioma 2
PA
1 PA
Por el Axioma 3
ó Viceversa
TEOREMA 3:
Si A y B son eventos de
PA
, tales que A B
PB
DEMOSTRACIÓN:
B
Ω
A
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
9
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
B A  B A
y además:
A  B A
Ambos eventos son mutuamente excluyentes
Luego por el Axioma 3:
PB
PA
P BA
0
PB
PA
TEOREMA 4:
Si A y B son dos eventos cualesquiera de
P AB
PA
PB
P AB
DEMOSTRACION:
El evento A  B puede representarse como la unión de los eventos
mutuamente excluyentes.
A
y A  B , y son
Empleamos la siguiente gráfica para explicar la demostración:
A
B
Ω
An
B

AB
AB A AB
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
10
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Luego:
(l)
P AB
PA
P/Axioma 3
P AB
Por otro lado, el Evento B también puede escribirse como la unión de los eventos
mutuamente excluyentes:
y
AB
B
AB  AB
PB
ó
AB
P AB
P A B
P A B
PB
P/Axioma 3
P AB
Sustituyendo este resultado en (l), tenemos:
P AB
PA
PB
P AB
Como consecuencia, tenemos demostrado la igualdad.
TEOREMA 5:
Si: A, B y C son tres eventos cualesquiera en
P ABC
PA
PB
PC
P AC
,
P AC
P CB
P ABC
DEMOSTRACION:
Podemos escribir A  B  C
que A  B es un evento.
AB C
y aplicamos el Teorema Nº 4, tomando en cuenta
TEOREMA 6: Si: A1 , A2 , A3 ,, AK es una colección de eventos cualesquiera en
entonces:
P A1A2 A3 Ak
k
i 1
P AI
k
P Ai  A j
i j2
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
k
P Ai  A j  A r

1
k 1
 P A1A2 Ak
i j2
Cobija – Pando - Bolivia
,
11
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
EJERCICIOS DE APLICACIÓN
EJERCICIO 1: La probabilidad de que llueva en una determinada ciudad el 12 de
junio es 0,10; de que truene es 0,05 y que llueva y truene es 0,03. ¿ Cuál es la
probabilidad que llueva ó truene ese día ?
SOLUCIÓN: Definimos previamente los siguientes eventos:
A = “Llueva el 12 de junio”.
B = “Truene el 12 de junio”.
C = “Llueva y truene ese día”.
P(A)
0,10
P(B)
0,05
PAB)
0,03
AB
C
PC
P AB
PC
PA
PB
P AB
0,10 0,05 0,03 0,12
EJERCICIO 2:
La probabilidad de que una señora reciba al año más 5 llamadas
telefónicas en un día es 0,20 y por lo menor 9 llamadas en un día es 0,50 ¿ Cuál es la
probabilidad de la dicha señora reciba 6,7 u 8 llamadas en un día ?.
SOLUCIÓN:
=
0, 1, 2, 3,4,........................
Definimos los siguientes eventos en
:
A: “Recibe a lo más 5 llamadas”.
B: “Recibe por lo menos 9 llamadas”.
C: “Recibe 6,7 u 8 llamadas”.
Definimos ahora el sub espacio muetral para cada uno de los eventos:
A
=
0, 1, 2, 3, 4,5
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
12
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
= 9, 10, 11,12,...................
6, 7,8
C=
Además sabemos que:
B
PA
0,20
PB
0,50
PC
?
Los eventos A, B y C son mutuamente excluyentes y colectivamente exhaustivos,
A  BC
P
PA
PB
PC
P/Axioma 3
Por axioma 2:
1 PA
PB
PC
Remplazando datos:
1 0,20 0,50 P C
PC
PC
1 0,20 0,50
0,30
EJERCICIO 3: Una caja contiene 100 tubos de televisión. La probabilidad de que
haya al menos un tubo defectuoso es 0,05 y de que haya al menos 2 tubos
defectuosos es 0,01. ¿Cuál es la probabilidad de que la caja contenga?:
a) Ningún tubo defectuoso?
b) Exactamente un tubo defectuoso?
c) A lo más un tubo defectuoso?
SOLUCIÓN:
: Ver cuantos tubos defectuosos hay en una caja que contiene 100 tubos
de televisión.
=
0, 1, 2, 3, 4,5,.............................., 100
Ahora definimos en los siguientes eventos:
A: “Haya al menos un tubo defectuoso”.
B: “Haya al menos dos tubos defectuosos”.
C: “Ninguno de los tubos es defectuoso”.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
13
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
D: “Exactamente un tubo es defectuoso”.
E: “Hay a lo más un tubo defectuoso”.
Los sub espacios muestrales asociados a cada evento son:
= 1, 2, 3,4,.....................,100
2, 3, 4,5,.....................100
B =
0
C =
1
D =
0,1
E =
A
Además tenemos los siguientes otros datos:
PA
0,05
PB
0,01
Finalmente calculamos las probabilidades solicitadas utilizando los axiomas y los
teoremas:
?
a) La Probabilidad de que ningún tubo es defectuoso: P C
Teniendo en cuenta de que
= AUC y que los dos eventos son mutuamente
excluyentes y colectivamente exhaustivos:
AB
P
PA
PB
P/Axioma 3
Despejamos P C
PC
P
P `A
PC
1
P/Axioma 2
PA
P C 1 0,05 0,95
b) La probabilidad de que haya exactamente un tubo defectuoso:
PD
?
De acuerdo a los eventos descritos, podemos escribir lo siguiente:
A
BD
PA
PB
PD
PD
PA
PB
PD
0,05 0,01 0,04
c) Probabilidad de a los más un tubo defectuoso:
PE
?
Podemos escribir, que:
E CD
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
14
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
PE
PE
PC
P/Axioma 3
PD
0,95 0,04
PE
0,99
EJERCICIO 4: De un grupo de personas, el 30 % practica fútbol y el 40 % juega
ajedrez.
De los futbolistas el 50 % juega también ajedrez. Sise elige
aleatoriamente una persona. ¿Cuál es la probabilidad de que?:
a) Juegue fútbol y ajedrez?
b) Practica sólo uno de estos deportes?
c) No practica ni fútbol ni ajedrez?
SOLUCION: Definimos los eventos en
A: “la persona elegida practica fútbol”.
B: “La persona seleccionada practica ajedrez”.
DATOS:
PA
0,30
PB
0,40
a) Probabilidad de que juegue fútbol y ajedrez.
P AB
PA
PB
P AB
P/Axioma 4
Por otro lado sabemos que la P AB
P AB
P AB
0,15
0,30 0,40 0,15
0,55
b) Probabilidad de que practique uno solo de estos deportes:
GRAFICAMENTE:
A
0,15
B
0,15
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
0,25
Cobija – Pando - Bolivia
15
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
C: “Practica uno de los dos deportes”.
C
A  B  B A
Como los eventos A  B y B  A son mutuamente excluyentes, Entonces:
Por el Axioma 3 tenemos:
PC
P AB
P BA
PC
0,15 0,25 0,40
1.4
PROBABILIDAD CONDICIONAL O CONDICIONADA
1.4.1. INTRODUCCIÓN: Llamada también probabilidad ligada o relativa; es un
modelo de probabilidad de bastante aplicación práctica: Lo que se trata de
determinar con la probabilidad condicional es la medida de la ocurrencia de un
suceso dado que ha ocurrido otro suceso. En otras palabras, si se dispone de cierta
información se pretende averiguar, tomando como base esa información, cuál es la
probabilidad de la ocurrencia de algún suceso.
EJEMPLO:
Si se sabe que una carta extraída de una baraja de 52 cartas es un as, podemos
estar interesados en saber si es un as de corazones.
Deseamos saber la probabilidad de que un estudiante seleccionado sea varón, si
se sabe que es uno de los reprobados en el examen.
GRAFICAMENTE:
Ω
A
B
An
B
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
16
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
1.4.2. DEFINICIÓN: La probabilidad Condicional de que ocurra A, dado que ha
ocurrido B, está dada por:
P AB
PB
PA/B
Siempre y cuando: P B
Si :
PB
0
PA/ B
0
NOTA: En la probabilidad condicional se cumplen los axiomas y los teoremas
planteados en los capítulos anteriores.
EJEMPLO 1: En una universidad de 10.000 estudiantes y 1.000 profesores, el 10 %
de los profesores son de izquierda y el 90 % de derecha; mientras que en los
estudiantes este porcentaje es al contrario. Se selecciona al azar un miembro de la
universidad y se encuentra que es de derecha.
a) ¿Cuál es la probabilidad de que se haya seleccionado un estudiante?
b) ¿Un profesor?
SOLUCION:
TENDENCIA DERECHA IZQUIERDA
CATEGORIA
PROFESORES
900
100
ESTUDIANTES
1.000
9.000
TOTALES
1.900
9.100
= 11.000
D: “El miembro seleccionado es de derecha”.
E: “El integrante seleccionado es estudiante”.
a)
P ED
PD
PE/D
Sabemos que:
PD
PD
P ED
1.900
11.000
TOTALES
1.000
10.000
11.000
0
1.000
11.000
10
110
19
110
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
17
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
10
110
19
110
PE/D
1.100
2.090
10
19
b) Que sea seleccionado un profesor:
E
900
11.00
9
110
P ED
PE/D
P ED
PD
9
110
19
110
PE/D
990
2.090
9
19
EJEMPLO 2: Un aparato electrónico consta de dos partes. La probabilidad de que
falle la primera parte es 0,20 ; que fallen las dos partes es 0,15 y de que falle sólo
la segunda parte es 0,45. Calcular la probabilidad de que:
a) Falle sólo la primera parte.
b) Falle la primera parte cuando se sabe que falló la segunda parte.
SOLUCION:
Definimos dos eventos en
:
A: “Falla sólo la primera parte”.
B: “Falla la segunda parte”.
DATOS:
P
A
P
AB
0, 2 0
0,1 5
GRAFICAMENTE TENEMOS:
A
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
B
Cobija – Pando - Bolivia
18
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Entonces:
a) P A
b)
0,05
0,15
0,60
PA/B
0,25
1.5 REGLA DE LA MULTIPLICACIÓN.- Como una derivación de la definición
de probabilidad condicional, es posible obtener una fórmula para hallar la
probabilidad de la intersección o producto de los eventos A y B:
P AB
PB
PA/B
P
P B/ A
P
P AB
PA
Si
PB
Si
PA
0
0
Despejando en ambas expresiones P AB
P AB
PB PA/ B
P AB
PB PA/ B
Este resultado en Teoría de Probabilidades, se denomina REGLA DE
MULTIPLICACIÓN o Probabilidad conjunta, que dice: “ La probabilidad de que
ocurra los eventos A y B es igual a la probabilidad de la ocurrencia de uno de
ellos multiplicado por la probabilidad condicional de que ocurra el segundo, dado
que el primero ha ocurrido”.
EJERCICIO 1: Una urna contiene 5 bolas blancas y 6 negras; se extrae al azar
sucesivamente y sin reposición dos bolas. ¿ Cuál es la probabilidad de que las dos
resulten blancas?.
SOLUCIÓN:
1 bola
5B
6N
1 bola
= 11
A1
A2
= “La primera bola extraída es blanca”.
= “La segunda bola extraída es blanca”.
E: Las dos bolas son blancas.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
19
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
E A1  A2
A1 A2
P E P A1 A2
DATOS:
PA
P A1 P A2 / A1
5
11
P A 2 / A1
4
10
2
PE
5
4
11 10
4
22
11
2
11
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
20
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
TEMA Nº 2
VARIABLES Y MODELOS ALEATORIOS DISCRETOS
2.1. COMPETENCIA DE TEMA:
HABILIDAD: Caracteriza
CONTENIDO: La variable y los modelos aleatorios discretos más importantes.
PROCESO: Mediante la resolución de ejercicios prácticos de aplicación.
CONTEXTO: En el aula.
2.2. INTRODUCCIÓN: En los temas precedentes se ha hecho mención a que los
elementos del espacio muestral podían expresarse o simbolizarse indistintamente
con letras o mediante números, tal era el caso cuando analizábamos el experimento
de lanzar una moneda al aire y esperar que salga un resultado; en este caso el
espacio muestral estaba compuesto por C y S ; vale decir: cara o sello. Lo mismo
sucedía cuando el experimento consistía en seleccionar un artículo defectuoso de un
lote que contenía tanto defectuosos como no defectuosos, en este caso utilizábamos
el siguiente espacio muestral:
= { N , D }. En ambos casos la simbología utilizada
son letras.
Sin embargo, el propósito del tema de VARIABLES ALEATORIAS es el de expresar
en todos los casos a los elementos del espacio muestral mediante números, que es el
objeto de estudio del tema presente.
2.2. DEFINICIÓN DE VARIABLE ALEATORIA: Dado un experimento aleatorio
y
el Espacio Muestral asociado a , una función X, que asigna a cada
elemento del Espacio Muestral , uno y solamente un número x que pertenece a
los números reales R, se llama VARIABLE ALEATORIA.
En otros términos:
R
X1
w1
X2
w2
X3
w3
DOMINIO
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
RANGO O RECORRIDO R x
Cobija – Pando - Bolivia
21
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
El dominio de la Variable Aleatoria X es y el Rango o Recorrido
de los números reales R, que lo denotamos por R x .
Rx
es un conjunto
En otras palabras, la Variable Aleatoria es una función que asigna un número real a
cada suceso simple de un Espacio muestral, o sea cada elemento de .
EJEMPLO 1: Si consideramos el juego más sencillo que consiste en lanzar una
moneda, sabemos que puede resultar cara o sello, es decir que:
= { C, S }
Si definimos la Variable Aleatoria X como: El número de veces que aparece cara,
entonces X es una función sobre , de manera que: X C 1 y X S 0 . Entonces X toma
los valores 0 y 1.
X = {0,1}
EJEMPLO Nº 2: Sea el experimento que consiste en lanzar tres monedas al aire y
sea la variable aleatoria:
X: Número de caras
Definir el Dominio y Rango de X.
SOLUCION: El Espacio Muestral
asociado al experimento está dado por:
= {CCC, CCS, CSS, SSS, SSC, SCC, CSC, SCS
Si la variable que nos interesa está referido al número de caras, entonces tenemos
que:
CCC, CCS, CSS, SSS, SSC, SCC, CSC, SCS
3
2
X CCC
3;
1
0
X CCS
2;
1
X CSS
2
1;
2
X SSS
1
0
En consecuencia, la Variable X toma los valores de: 0,1,2,3
Rx
0,1,2,3
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
22
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
2.4. VARIABLE ALEATORIA DISCRETA: Si el Rango o Recorrido R x de la
variable Aleatoria X es un conjunto finito o infinito numerable de elementos, se
llama VARIABLE ALEATORIA DISCRETA.
En este caso:
Rx
x1 , x 2 , x 3 , x 4 , x 5 , x 6
DISCRETO FINITO
Rx
x1 , x 2 , x 3 ,......... ........
DISCRETO INFINITO NUMERABLE
EJEMPLO: Un lote de artículos contiene artículos defectuosos (D) y no defectuosos
(N), se extrae sucesivamente y sin reposición 4 artículos. Si definimos X: Número
de artículos defectuosos. Determinar el Dominio y rango de la Variable Aleatoria X.
SOLUCION:
= {DDDD, DDDN, DDNN, DNNN, NNNN, NNND, NNDD, NDDD, DNND, NDDN,
(4)
(3)
(2)
(1)
(0)
(1)
(2)
(3)
(2)
(2)
DDND, DNDD, NDND, DNDN, NDNN, NNDN
(3)
(3)
(2)
(2)
(1)
(1)
Entonces:
Rx
0,1,2,3,4
EJEMPLO 2: Ahora bien, en el ejemplo anterior consideremos la extracción de
artículos hasta lograr un artículo defectuoso y definimos:
NUMERO NECESARIO DE EXTRACCIONES HASTA HALLAR UNO
DEFECTUOSO.
X:
Determinar el Dominio y Rango de X.
SOLUCION:
= {D, ND, NND, NNND, NNNND,...............................
Rx
0,1,2,3,4,5,......... .......... ....
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
23
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
2.5
FUNCION DE PROBABILIDAD PARA UNA VARIABLE ALEATORIA
DISCRETA O FUNCION DE CUANTIA
DEFINICION.- La función de probabilidad para una Variable Aleatoria Discreta X,
es una función que asigna a cada valor que toma la variable Aleatoria X discreta, una
probabilidad p x cuando X toma un valor particular xi.
O sea:
p
PX
x
P
x
w
/X w
w
x
Además esta función cumple las siguientes condiciones:
1.-
px
2.-
0
p
x Rx
PX
x
x Rx
x
1
x Rx
Esta función también recibe el nombre de FUNCION DE CUANTIA, que puede ser
expresado mediante pares ordenados, tablas y gráficos. O sea:
x, p x ; x R x
Por otro lado, si x
Rx
se trata de un evento imposible, por lo tanto
px
0
Al igual que en la definición de Variable Aleatoria, la Función de Cuantía tiene un
dominio y un codominio o Rango, expresado por:
1,0
Rx
DOMINIO
RANGO
REPRESENTACION TABULAR DE LA FUNCION DE CUANTIA:
xi
px
Px
X
x1
x2
x3
p x1
p x2
p x3
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
.
.
.
.
.
.
Cobija – Pando - Bolivia
24
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
REPRESENTACION GRAFICA DE LA FUNCION DE CUANTIA:
p(x)
p(x2)
p(x3)
(x1,p(x1))
p(x1)
p(xn)
0
x2
x1
...........................
x3
xn
EJEMPLO: Sea el experimento que consiste en rodar dos dados simultáneamente
por una sola vez. Sea X: La suma de los puntos que aparecen. Definir el dominio y
el rango para la distribución de probabilidades de X.
SOLUCIÓN:
= { ( i,j )/y = 1,2,.........,6 y j = 1,2,.........,6}
GRAFICAMENTE:
6
5
4
3
2
1
1
2
2
3
3
4
4
5
5
6
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
7
6
8
9
10
11
12
Rx
Cobija – Pando - Bolivia
25
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Finalmente, de acuerdo a la definición de Función de Cuantía, asignamos
probabilidades a cada uno de los elementos de R x , a partir de la definición de
Probabilidades.
PA
NA
N
p x2
PX
1
36
2
Entonces:
Rx
= { 2,
1
36
3,
4,
5,
2
36
3
36
4
36
6,
5
36
7, 8, 9, 10, 11, 12 }
6
36
5
36
4
36
3
36
2
36
1
36
REPRESENTACION TABULAR:
SUMA DE
PUNTOS
2
3
4
5
6
7
8
9
10
11
12
SUMA
Nº DE
VECES
1
2
3
4
5
6
5
4
3
2
1
36
PX
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
1
Donde se cumplen las condiciones exigidas, o sea:
1.2.-
0 px
px
1
1
x Rx
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
26
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
EJERCICIO PARA RESOLVER EN CLASES:
Sea el experimento aleatorio , consistente en lanzar una moneda tres veces y
definimos:
X = nc - ns
Donde:
nc = Número de caras obtenidas
ns = Número de sellos obtenidos
Hallar la distribución de probabilidades o función de cuantía.
2.6.FUNCION DE DISTRIBUCION ACUMULADA DE UNA VARIABLE
ALEATORIA DISCRETA.- La Función de distribución Acumulada de la variable
Aleatoria Discreta X, es un concepto de mucha importancia cuando se utilizan las
Tablas de Cálculo de probabilidades, donde las funciones son acumuladas.
DEFINICION.- Sea X una Variable Aleatoria Discreta con rango R x x1 , x 2 , x3 ,......... y
función de probabilidad o cuantía p xi PX xi , entonces la Función de Distribución
Acumulada de X denotada por F x , se define como:
Fx
PX
p xi
x
xi x
PX
xi
xi x
Donde la sumatoria se realiza para todos los valores de 1 tales que
xi
x
EJEMPLO Nº 1: Se lanzan tres monedas al aire y definimos X: Número de caras.
Determinar la Función de cuantía y la Función de Distribución Acumulada de X.
SOLUCION:
= {CCC, CCS, CSS, SSS, SSC, SCC, CSC, SCS
Rx
p0
PX
0
p1
PX
1
p2
PX
2
p3
PX
3
1
3
= {0, 1, 2, 3}
8
8
3
8
1
8
Entonces, podemos expresar la Función de Cuantía y la Función de Distribución
Acumulada de X a través de la siguiente tabla:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
27
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Rx
px
Fx
0
1
2
3
1/8
3/8
3/8
1/8
1
PX
x
1/8
4/8
7/8
1
-.-
O sea:
FUNCION DE CUANTIA:
= 1/8
= 3/8
=0
Px
px
Si: x = 0 ó 3
x=1ó2
En cualquier otro caso
FUNCION DE DISTRIBUCIÓN ACUMULADA:
Fx
Si:
0
1
2
x
0
= 1/8
= 4/8
= 7/8
=1
Fx
x<0
x 1
x 2
x 3
3
Asimismo, ambas funciones se los puede representar gráficamente:
a) FUNCION DE CUANTIA: p(x)
F(x)
3/8
2/8
1/8
0
1
2
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
3
x
Cobija – Pando - Bolivia
28
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
b) FUNCION DE DISTRIBUCIÓN ACUMULADA:
F(x)
1
7/8
4/8
1/8
0
1
2
3
4
x
EJERCICIO PARA RESOLVER EN CLASES:
Se tiene una urna con 2 bolas negras, 3 bolas blancas y cuatro rojas. Se extrae
sucesivamente una bola sin reposición hasta que salga una roja. Hallar la Función de
Cuantía del número de extracciones que hay que realizar y la Función de distribución
acumulada. Además representar ambas funciones en tablas y gráficas.
2.7. ESPERANZA MATEMATICA PARA UNA VARIABLE ALEATORIA
DISCRETA
INTRODUCCION: En los capítulos iniciales de estadística descriptiva se estudiaron
medidas de Tendencia Central y de variabilidad, así como sus diferentes
aplicaciones.
En forma análoga, en el caso de tener Funciones de Cuantía, es importante obtener
medidas que indiquen el comportamiento de la variable aleatoria, vale decir la media
y la varianza, fundamentalmente.
Por consiguiente además de saber el intervalo de recorrido de una variable
Aleatoria X, es muy frecuente la necesidad de conocer el promedio de los valores
que ella toma ó el valor que se espera que tome la Variable. por ejemplo:
a) Si apostamos Bs 100 a la ocurrencia de un cierto resultado en un juego de azar
equitativo, estaremos interesados en saber cuanto en promedio se espera
recuperar en base a una distribución de probabilidades.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
29
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
b) Si realizamos una inversión anual de $us 10.000 en un negocio, deseamos saber
cuanto de utilidad en promedio se espera obtener.
c) Si se aplica un sistema de alimentación especial a 1.000 bovinos, cuánto
esperamos que aumenten de peso al cabo de cierto tiempo ?.
Por consiguiente, así como en los tres casos anteriores, podemos estar frente a un
sin número de problemas relacionados con el valor promedio de una variable
aleatoria. A este valor promedio se denomina Esperanza Matemática ó Valor
esperado, cuando trabajamos con Variables Aleatorias.
DEFINICION: Sea X una variable Aleatoria Discreta, con rango R x y Función de
Cuantía p x , el Valor Esperado y Esperanza matemática E x ó V x se define como:
E
Vx
x
x p
x
x Rx
Siempre y cuando:
x p
Sea absolutamente convergente, o sea:
x
x Rx
xp
sea FINITA.
x
x Rx
La Esperanza Matemática de X se llama también MEDIA de X y se denota por:
E x Vx
EJEMPLO Nº 1: Hallar el Valor Esperado para la siguiente Distribución de
Probabilidades:
X
0
0,2
px
SOLUCION:
1
0,4
2
0,3
3
0,08
4
0,02
Para la solución del ejercicio, utilizamos la fórmula de la
E
x
x p
Ex
:
x
x Rx
Reemplazamos datos en la fórmula:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
30
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
= 0 (0,2) + 1 (0,4) + 2 (0,3) + 3 (0,08) + 4 (0,02)
= 1,32
Ex
Ex
EJERCICIO Nº 2: Hallar el Valor Esperado para la Variable Aleatoria que consiste
en lanzar tres monedas al aire y se a:
X=Número de caras.
SOLUCION:
= {CCC, CCS, CSS, SSS, SCC, CSC, SCS
3
2
1
0
2
2
1
Rx
={
0,
1,
px
=
1/8
3/8
2,
3/8
3}
1/8
Ex
= 0 (1/8) + 1 (3/8) + 2 (3/8) + 3 (1/8)
Ex
= 3/8 + 6/8 + 3/8 = 3/2 = 1,5
2.7.1. PROPIEDADES DEL VALOR ESPERADO:
Si X es una Variable Aleatoria discreta y a una constante, entonces:
1)
2)
3)
E
a
E
aX
E
X Y
a
a E
E
X
E
X
Y
DEMOSTRACIÓN:
1) Partimos de la definición del valor esperado:
Ex
Si: x = a
x px
x Rx
E
a p
a
x
x Rx
1
Ea
a
p
x
x Rx
Ea
a
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
31
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
2) Remplazamos en la fórmula:
E
a xp
ax
Si: x = a
x
x Rx
E
a
ax
x p
E(x)
x
x Rx
E ax
3)
EX
EX
Y
E
X Y
E
X Y
aE x
EY
p
X Y
x ,y R x R y
X p
y
Y p
y
y Ry
EX
Y
p
x
x Rx
EX
x
EY
2.7.1.VARIANZA Y DESVIACION STANDAR DE UNA VARIABLE ALEATORIA
DISCRETA
DEFINICION.- Si X es una Variable Aleatoria Discreta con esperanza
entonces la Varianza de X está dada por :
x2
Vx
E
x
Ex
2
Y la desviación standar es:
x2
Vx
También podemos utilizar la fórmula alternativa:
VX
EX
2
x2
DEMOSTRACION:
VX
E
EX
VX
EX
VX
EX
EX2
2
x
2
2
2
2
2 xX
x2
EX
2 x2
x2
x2
x2
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
,
32
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
EJERCICIO:
Sea la siguiente distribución de cuantía:
X
0
1/8
px
1
3/8
2
3/8
3
1/8
Calcular la Varianza de X.
SOLUCION:
Para calcular la
Vx
primeramente se calcula la
1
3
3
1
1
2
3
8
8
8
8
0
3
2
0
Vx
2
1
2
2
3
2
1
3
8
2
ó
3
2
= 1,5
Seguidamente calculamos V(x) = E (X Vx
Ex
3
2
2
3
8
3
3
2
2
1
8
)2
24
32
3
4
0,75
POR EL SEGUNDO MÉTODO:
Vx
2
x2
Ex
2
x2
Primeramente calculamos E(x)2
Ex
2
02
Entonces: V x
1 2 3
3 2 1
1
22
3
8
8
8
8
3
3
2
2
3
9
4
0
12 9
4
3
8
3
4
12
8
9
8
24
8
3
0,75
PROPIEDADES DE LA VARIANZA:
1.2.3.-
Vx
Ex
Vx
0
Vk
0
2
x2
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
33
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
4.- V k X k 2 V x
EJERCICIOS PARA RESOLVER EN CLASES:
Se tiene una urna con tres fichas negras y 2 rojas. Se extrae al azar y
sucesivamente una ficha sin reposisción hasta que salga una roja. Sea X el número
de extracciones que hay que realizar. Calcular:
a) La Función de Cuantía.
b) El Valor Esperado de X.
c) La varianza de la variable Aleatoria X.
2.8.
DISTRIBUCIONES DE PROBABILIDADES DISCRETAS MAS IMPORTANTES
2.8.1. INTRODUCCION.- Se ha establecido que pueden existir un número muy grande
de distribuciones de probabilidad, tantos experimentos y fenómenos aleatorios puedan
presentarse en la naturaleza.
Estudiar individualmente cada distribución realmente sería cosa de titanes.
Muchas distribuciones guardan ciertas características análogas o similares, por tanto es
posible adecuarlos a algunos MODELOS STANDAR.
La búsqueda de un modelo de probabilidades que sea capaz de describir la distribución
de los datos que se tengan disponibles es una tarea básica que todo investigador
científico debe realizar.
Sin embargo, es importante tener mucho cuidado en identificar el modelo correcto
antes de memorizar el detalle de la expresión matemática o fórmula de cada modelo de
distribución de probabilidades.
En este sentido, a continuación abordaremos las distribuciones de probabilidades discretas
más importantes. Entre estos tenemos:
a) El Modelo de BERNOULLI
b) La distribución BINOMIAL
c) El Modelo Hipergeométrico
d) El Modelo de POISSON
2.8.2. MODELO DE BERNOULLI.- Bernoulli, uno de los pioneros del cálculo de
probabilidades formuló un modelo que se aplica a Variables Aleatorias que toman sólo dos
resultados posibles: Éxito (E) y Fracaso (F).
También suele denominarse: Modelo Bernoulli, Prueba Bernoulli, Variable Bernoulli o
Distribución Bernoulli.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
34
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
DEFINICION: Una prueba Bernoulli es un experimento que tiene dos resultados posibles,
generalmente llamados: Éxito (E) y Fracaso (F). El espacio muestral asociado a este tipo de
experimentos está dado por:
= { E, F }
Son muchos los resultados que corresponden a este modelo:
a) Lanzar una moneda: Cara o sello
b) Artículo producido: Defectuoso y No defectuoso.
c) Opinión de una persona: Está de acuerdo o no con algo
En general sólo interesa que ocurra dos resultados éxito o fracaso
Rx = {
1
0 }
0 : Fracaso
1 : Éxito
p ( 1-p )=q
Entones la Función de Cuantía de la distribución de Bernoulli está dada por:
p(x) = p
=q
=0
si x=1
si x=0
en cualquier otro caso
GRAFICAMENTE TENEMOS:
Rx
Rx
E
F
X1=1
X2=2
Siempre y cuando:
1)
2)
p(x)
0
p(x) = p + q = 1
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
35
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
2.8.3. MEDIA Y VARIANZA DE LA VARIABLE BERNOULLI:
E(x) =
x.p(x) = 1. p + 0 . q = p
x Rx
E(x) = p
Calculamos luego la varianza para una variable Aleatoria Bernoulli:
V(x) = E(x)2 - x2
E(x)2 = 12 . p + 02 . q = p
V(x) = p – p2 = p ( 1 - p )
Si sabemos que: 1 - p = q , Entonces:
V(x) = p . q
EJERCICIO DE APLICACION: Supongamos que de un conjunto de amas de casa, el 70 %
está de acuerdo con utilizar un nuevo aceite comestible fabricado a base de palma africana.
Si seleccionamos aleatoriamente una ama de casa del conjunto y designamos x=1 si está a
favor del nuevo aceite y x=0 si prefiere aceite comestible de otras plantas oleaginosas,
entonces X es una variable aleatoria BERNOULLI.
Calcular la media y la Varianza de X.
SOLUCION: El modelo cumple las siguientes condiciones:
1.- El experimento sólo se repite una sola vez.
2.- El experimento admite dos resultados posibles: Éxito y Fracaso.
3.- La probabilidad de éxito es p y la de fracaso es q.
Entonces, se trata de una distribución de Bernoulli, con:
p = 0,70
q = 1 - p = 0,30
E(x) = x = p = 0,70
y V(x) = p . q = 0,70 x 0,30 = 0,21
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Además:
x
Vx
0,46
Cobija – Pando - Bolivia
36
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
2.8.4. DISTRIBUCION BINOMIAL.- El Modelo de Bernoulli implica realizar el
experimento sólo una vez; si se realizara una y otra vez (más de una vez) el mismo
experimento bajo las mismas condiciones y cuyos resultados son independientes, unos con
otros, entonces se dice que estamos ante una sucesión de pruebas Bernoulli que no es otra
cosa que el modelo de Distribución Bernoulli.
CONCEPTO.- Sea X una Variable Aleatoria Discreta que indica el número de éxitos (E) en
n pruebas independientes Bernoulli, con probabilidad p(x)=p. constante en cada prueba,
entonces se dice que X es una variable Aleatoria Binomial con parámetros n y p.
B1 + B2 + B3 + B4 + ................... + Bn = BINOMIAL
REQUISITOS:
1.- Bernoulli se repite más de una vez.
2.- Admite dos resultados: Éxito (E) y Fracaso (F)
3.- P(E) = p
y
P(F) = 1 - p = q
4.- Los experimentos son independientes, unos con otros.
EJEMPLO: Se lanzan tres monedas al aire, determinar si este experimento obedece a una
distribución de tipo Binomial.
SOLUCION:
C
S
C
S
C
S
Si definimos a la Variable Aleatoria X como número de caras, Entonces:
Éxito constituye cuando sale Cara y Fracaso cuando sale sello.
PE
p
1
2
y
PF
1 p
1
2
Por otro lado, los experimentos son independientes.
Podemos afirmar, en consecuencia, que el experimento obedece a una distribución de
probabilidades de tipo BINOMIAL.
2.8.5. FORMULA DE CÁLCULO PARA LA DISTRIBUCIÓN BINOMIAL:
Si X es una Variable Aleatoria Binomial, con parámetros n y p, la función de probabilidad
Binomial está dada por:
P[X
/ n,p
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
37
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Que viene representada por la siguiente función de cuantía:
p
n x
p qn
x
x
x = 0,1,2,.........,n
x
= 0
En otro caso.
En este caso se dice que la distribución es de tipo BINOMIAL con parámetros n y p.
Donde:
n = Número de repeticiones de la prueba.
p = Probabilidad de éxito
q = La probabilidad de fracaso
x = Los valores que toma la variable X.
EJEMPLO:¿ Cuál es la probabilidad de obtener trica de ases, si rodamos 5 veces un dado ?.
SOLUCIÓN:
El experimento se repite más de una vez (Cinco veces) , Entonces n=5
En el experimento cada resultado admite dos resultados posibles: Éxito si es un as y
fracaso si sale cualquier otro número.
La probabilidad de éxito es p= 1/6
y q = 1 - p = 1 - 1/6 = 5/6
Los resultados son independientes entre sí.
Dadas estas características, el experimento es un modelo Binomial con parámetros n= 5 y p
= 1/6
Entonces aplicamos la fórmula:
p
5 1x 55
x 6
6
x
= 0
x
x=1,2,3,4,5
En otro caso
A partir de esta expresión podemos calcular las probabilidades para todos los valores que
toma X.
Ejemplo, para x = 1
p1
5
5 11 5 5 1
1 6 6
1 625
6 1.296
3.125
7.776
0,40
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
38
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Pero a nosotros nos interesa TRICA de ases, o sea
p3
10
5 13 55
3 6 6
1 25
216 36
3
250
7.776
0,032
En consecuencia, la probabilidad de sacar trica de ases lanzando cinco dados es de 0,032
2.8.6. CARACTERISTICAS DE LA DISTRIBUCION BINOMIAL:
a) VALOR ESPERADO:
Binomial está dada por:
E(x) = x = n . p
b)
V(x) =
La esperanza matemática o valor esperado para la distribución
VARIANZA:
x2 = n . p . q
EJERCICIO DE APLICACION: En Cobija en el mes de Octubre la lluvia cae con un
promedio de uno cada cuatro días, durante los días nublados. Determinar la distribución de
probabilidades del número de días con lluvia entre los cuatro primeros días nublados,
suponiendo la independencia de los eventos. Hallar la media y varianza del número de días
lluviosos.
SOLUCION:
X: Número de días con lluvia durante los próximos cuatro días nublados”.
Rx= {0, 1, 2, 3,4}
Admite dos resultados: E= Llueve
F= No llueve
Se repite más de una vez
n=4
Suponemos independencia entre los eventos.
P(E) = p = ¼
q= ¾
Una vez corroborado que el fenómeno o experimento cumple con los requisitos exigidos
podemos señalar que se trata de una Distribución Binomial con parámetros n=4 y p=1/4.
Luego aplicamos la fórmula general de la Distribución Binomial:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
39
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
4 1X 34
X 4 4
P[X; 4,1/4 = P X;1/ 4
X
x= 0,1,2,3,4
A partir de la fórmula general estamos en condiciones de calcular las probabilidades para
todo el Recorrido de X.
Ejemplo para x=1
4 11 3 4 1
1 4 4
p1
p1
1 27
4 64
4
27
64
0,42
Finalmente calculamos E(x) y V(x)
Ex
Vx
x
2
x
x
n p q
n p q
Vx
1
1
4
1 3
4
4 4
4
0,75
0,87
EJERCICIOS PARA RESOLVER EN CLASES:
1.De un lote que contiene 25 artículos, 5 de los cuales son defectuosos, se eligen 4 al
azar. Sea X el número de artículos defectuosos encontrados. Obtener la distribución de
probabilidades de X. a) Los artículos se escogen con sustitución. b) Se escogen sin
sustitución c) Graficar la función de cuantía.
2.8.6.1. USO DE LA TABLA PARA LA DISTRIBUCIÓN BINOMIAL.- Los valores de
la Distribución Binomial están dados en tablas especiales y el uso de las mismas simplifica
enormemente el cálculo de todo tipo de probabilidades con Distribución Binomial.
Esto quiere decir:
X
(B/n,p)
= X se distribuye Binomialmente
La Tabla nos da la probabilidad Acumulada Binomial dado en la Tabla Y.
O sea:
P[X
r
= P[X
r/B:n,p
= P[X
r/n,p
En otras palabras, la tabla da la probabilidad de que la variable aleatoria binomial toma
valores mayores o iguales a r. Estas probabilidades se muestran a continuación en el
siguiente diagrama:
P[X
r
= P[X=r +P[X=r +1 + P[X=r +2 + .....................+ P[X=n
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
40
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
GRAFICAMENTE TENEMOS:
0
1
2
3
.
.
r
r+1
.
.
.
.
P[X
P[ X
P[ X
r / n,p
= 1 - P[ X
r / n,p
n-1
n
r / n,p
= P[ X
r + 1 / n,p
r / n,p
P[ X = r / n,p = P[ X
r
r / n,p
- P[ X
r +1 / n,p
En consecuencia, los valores que nos da la Tabla Nº 1 de la Distribución Binomial , son
valores mayores o iguales a r; O sea: P[X r/n,p .
El diagrama anterior muestra los posibles valores que toma la variable aleatoria, asociado
con sus respectivas probabilidades y se ve también que cada probabilidad en la tabla es la
suma de las probabilidades individuales. O sea:
P[X
r
= P[X=r + P[X=r+1 +...........................+ P[X=n
Algunas de las probabilidades más simples se dan en el siguiente cuadro:
PROBABILIDADES QUE
SE QUIEREN CALCULAR
P[X r/n,p
P[X>r/n,p
P[X=r/n,p
PROBABILIDADES DADAS EN
LA TABLA
P[X r/n,p
ESTA EN LA TABLA
P[X r+1/n,p
P[X
r/n,p
- P[X
P[ X < r / n,p
1 - P[ X
P[ X
1 - P[ X
r / n,p
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
r+1/n,p
r / n,p
r+1 / n,p
Cobija – Pando - Bolivia
41
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
EJEMPLO Nº 1
Calcular: P[X =2/4,0.23 = ?
SOLUCION:
Para resolver la interrogante a través del uso de Tablas debemos en primer lugar elegir la
opción más conveniente para resolverlo; para ello observamos las posibilidades que nos
ofrece la tabla anterior: Entonces empleamos la tercera opción, o sea:
P[X=r/n,p
P[X
r/n,p
- P[X
r+1/n,p
Luego remplazamos los valores para los parámetros n y p y buscamos el valor de la
probabilidad solicitada en la Tabla Nº y
P[X =2/4,0.23 = P[X
2/4,0.23
- P[X
3/4,0.23
= 0,2285 - 0,0403 = 0,1882
2.8.6.2. FORMA DE UTILIZAR LA TABLA TABLA BINOMIAL:
P[X
r/n,p
n=4
p
r
1
2
3
4
.
.
.
21
22
23
24
25
26
6105
1963
0312
0019
.
.
.
6298
2122
0356
0023
.
.
.
6485
2285
0403
0028
.
.
.
6664
2450
0453
0033
.
.
.
6836
2617
0508
0039
.
.
.
7001
2784
0566
0046
.
.
.
....
....
30
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7599
3483
0837
0081
.
.
.
EJERCICIO N º 1
Calcular: P[X<3/4,0.3
Verificamos cuál de las opciones podemos utilizar previamente a la aplicación de la Tabla
Binomial. La opción 4 es la que mejor se adecua al ejercicio .
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
42
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
P[X<3/4,0.3 = 1 - P[X
3/4,0.3
Cuyos resultados si se los puede ubicar en la tabla.
P[X<3/4,0.3 = 1 - 0,837 = 0,163
EJERCICIO Nº 3:
Calcular:
P[X>2/4,0.25
Para resolver la interrogante utilizando la tabla utilizamos la opción 2, que señala:
P[X>r/n,p
P[X
r+1/n,p
Remplazamos valores:
P[X>2/4,0.25 = P[X>2+1/4,0.25 = P[X>3/4,0.25
P[X>2/4,0.25 = 0,508
2.8.6.3. USO DE LA TABLA PARA p>0,5:
Para utilizar la tabla Binomial,
complementarios, como ser:
cuando p>0,5,
debemos considerar algunos aspectos
1.- No se tiene en la tabla valores para p>0,5
2.- Para ello se recurre a un procedimiento alternativo que toma en cuenta la asimetría de
la Distribución Binomial.
Para ello procedemos de la siguiente manera:
a) Consideramos la ocurrencia de la Variable Aleatoria X como el número de éxitos. Luego
consideramos la ocurrencia de X’ como el número de fracasos.
b) Si p > 0,5 se hacen las siguientes adaptaciones o sustituciones:
* Se sustituye r por n-r
* Se sustituye p por 1-p
* Luego se invierten las desigualdades de la siguiente manera:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
43
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Se cambia por
Se cambia por
* Finalmente, empleamos el mismo procedimiento para calcular probabilidades con p
EJEMPLO:
Calcular:
0,5
P[X<4/10,0.8
SOLUCION: Debemos determinar datos para efectuar los cambios necesarios:
n = 10
n-r = 10 - 4= 6 = r’
p = 0,8
1 - p = q 1-0,8 = 0,2
r=4
Invertimos el signo < por >
Luego remplazamos los datos:
P[X<4/10,0.8 = P[X’> 6/10,0.2
Esta fórmula cae en:
P[X>r/n,p
P[X’
r+1/n,p
Remplazamos valores:
P[X’>6/10,0.2 = P[X’>7/10,0.2 = 0,0009
2) Calcular:
P[X
4/10,0.8
Remplazamos:
P[X
4/10,0.8
= P[X’
P[X’
6/10,0.2
= 1 - P[X’
6/10,0.2
Esto cae en:
7/10,0.2
= 1 - 0,0009 = 0,9991
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
44
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
2.9. MODELO DE DISTRIBUCION HIPERGEOMÉTRICO
CARACTERISTICAS DEL MODELO: Es una distribución similar a la Binomial, o sea:
a) Admite dos resultados posibles: Éxito (E) y Fracaso (F)
b) Se producen n ensayos
c) Existe un lote N, donde r tiene una característica y N-r la otra característica.
d) La probabilidad (p) de éxito no es constante para todos los ensayos.
e) No se cumple la función de independencia.
Los n ensayos se realizan SIN REPOSICION, en consecuencia no podemos hablar de
independencia de eventos, por que los mismos no son independientes.
EXPLICACION:
Si se tiene una población de N artículos, de los cuales r poseen una de las categorías,
entonces habrán (N-r) que poseen la otra característica. Si seleccionamos n artículos
aleatoriamente sin reposición de los N artículos, cada selección subsiguiente será
dependiente, de manera que la probabilidad de que se obtengan éxitos cambia en cada
ensayo simple.
Fracaso
(N-r)
Se extraen n artículos sin
reposición o devolución.
Entonces cada extracción
es dependiente de la anterior y así sucesivamente.
Éxito
r
N
Ahora bien, es posible que nos interese conocer la probabilidad de obtener exactamente x
artículos de los r éxitos, en una muestra de tamaño n.
En consecuencia, bajo estas condiciones, el número de éxitos en n pruebas dependientes
corresponde a una Variable Hipergeométrica, cuya función de probabilidades está dada
por:
px
r
N r
x
n x
N
x= 0,1,2,3,...........,n
n
Donde:
N= Número de artículos (lote)
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
45
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
r = Número de elementos que tiene una de las características deseadas o
esperadas ( Éxitos).
N-r= Número de elementos que tiene la otra característica (Fracaso)
n = Tamaño de la muestra ( son dependientes)
x = Número de artículos de los r éxitos que deseamos calcular.
EJEMPLO: Una caja contiene 12 latas de leche, 9 de las cuales son frescas (recién
envasadas). Se seleccionan aleatoriamente 2 latas sin devolución.
Sea X: el número de latas de leche no frescas que se seleccionan. Definir si la variable X
es una Variable Hipergeométrica.
SOLUCION:
No frescas
3
Frescas
9
X: “Nº de latas de leche no frescas”
= 12
N = 12 latas
r =3
Fracaso
N-r = 9
Éxito
n=2
Remplazamos datos en la fórmula general:
3 12 3
px
x
2 x
12
x= 0,1,2
2
=0
En otro caso
a) Calcular la probabilidad de obtener una lata de leche no fresca, o sea x=1
Remplazamos este dato en la fórmula general de la Función de Cuantía:
3 9
p1
1 1
12
2
27
66
b) Calcular la probabilidad de que las dos latas sean frescas. o sea: x=0
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
46
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
3 9
0 2
p0
36
66
12
2
6
11
2.9.1. ESPERANZA MATEMATICA, VARIANZA Y DESVIACIÓN
STANDAR PARA LA VARIABLE HIPERGEOMÉTRICA:
El Valor esperado o Esperanza Matemática para la variable Hipergeométrica está dado por:
Ex
x
n
r
N
Donde:
N = Número total de la población estudiada
r = Número de elementos que tiene una de las características deseadas (Éxitos)
n = Tamaño de la muestra
VARIANZA DE X:
2
Vx
x
n
r N r N n
N N
N 1
EJEMPLO: Para el ejercicio anterior:
Ex
2 3
12
Vx
2
x
6
12
3 10
12 11
0,34
1
2
60
176
30
88
0,34
0,58
EJERCICIOS PARA RESOLVER EN CLASES:
1) Se extrae una muestra aleatoria de tamaño 2, una a una, sin reposición de un lote de 10
artículos que contiene 3 artículos defectuosos. Si X: representa el número de artículos
defectuosos encontrados en la muestra. Determinar:
a) La Función de Cuantía p(x)
b) Calcular E(x), V(x) y Desviación standar
c) Interpretar los resultados.
SOLUCION:
datos: N = 10
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
47
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
r=3
N-r = 7
n=2
a)
3
x
px
7
2 x
10
x = 0,1,2
2
b)
Ex
Vx
2 3
10
2
6
10
0,60
3 7 8
10 10 9
84
225
2) Una urna contiene 5 bolas blancas y 6 rojas. Se extrae 4 bolas de la urna sin reposición,
una tras otra,. Hallar la distribución de probabilidad del número de bolas extraídas y:
a) Cual es la probabilidad de extraer exactamente 3 bolas rojas ?.
b) Cuál es el número esperado de bolas extraídas ?.
RESPUESTA:
a) 0,3
b) 2,18
2.10. MODELO DE DISTRIBUCIÓN DE POISSON
2.10.1. INTRODUCCION: El modelo de distribución de probabilidades de Poisson es una
de las distribuciones discretas más importantes por que se aplica en muchos problemas
prácticos.
Una idea intuitiva del mismo se deriva a partir de un proceso de Poisson, que consiste en
observar la ocurrencia de eventos discretos en un intervalo continuo. O sea trátase de un
fenómeno que se presenta aleatoria e independientemente en el tiempo espacio en el que
sólo interesa la ocurrencia del fenómeno un número contable de veces.
“EN UN PROCESO DE POISSON SE OBSERVAN RESULTADOS DISCRETOS ENUN
INTERVALO DE TIEMPO”.
Ejemplos:
a) La frecuencia de terremotos que ocurren en Méjico en un año.
b) Observar la llegada de autos al estacionamiento de vehículos entre las 8 y 9 de la
mañana.
c) La cantidad de imperfecciones (agrietamientos) encontradas en un metro de alambre
producidas por un proceso electrolítico continuo.
d) Número de partículas de polvo encontrados en un metro cúbico de aire.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
48
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
e) Número de accidentes de aviación u otras calamidades que aparecen aleatoria e
independientemente en un intervalo de tiempo.
f) Glóbulos rojos encontrados en una muestra de sangre.
g) Número de llamadas telefónicas sobre una línea en una hora indicada.
En esta clase de eventos interesa únicamente el número de éxitos del suceso y no así el
número contrario. Interesa solamente p.
Ejemplo: número de personas que llagan a pagar impuestos y no así otras personas, en una
hora dada.
VALORES DE LA VARIABLE ALEATORIA
X:
La variable aleatoria X, toma en consecuencia los siguientes valores:
x= 0, 1, 2, 3,..........................
x representa la frecuencia con que ocurre un fenómeno en un intervalo de tiempo o en el
espacio, un número contable de veces.
2.10.2. DEFINICION: La probabilidad de conseguir exactamente x éxitos,
proceso de Poisson, está dada por:
x
px
en un
x = 0, 1, 2, 3,....................
x !
= 0
En otro caso
Donde:
= Promedio de éxitos en n pruebas, con probabilidad p
e = 2,71828 base de los logaritmos naturales.
En otros términos,
n = número de pruebas
n p
p
= Promedio de éxitos
EJEMPLO: Supóngase que el número de muertes por accidente en una ciudad es un proceso
Poisson con = 3 por mes.
Sea X: El número de muertes por accidente que ocurren entre el 1º de enero y el 31 de
marzo inclusive de 1974.
a) Determine si la variable X obedece a una distribución de Poisson.
b) Anote la función de cuantía.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
49
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
SOLUCION:
* El número de muertes es una variable que asume valores discretos en un intervalo de
tiempo. _
*
Entonces:
=3.3=9
n p
Remplazamos valores en la fórmula general de la función de cuantía:
px
e
9
9x
x !
x= 1,2,3,.......
Calcular la probabilidad de que ocurra un accidente
x=1
p1
x=2
p2
e
e
9
91
1!
92
2!
0,803
9
0,876
2.10.3. ESPERANZA MATEMATICA Y VARIANZA PARA LA DISTRIBUCION DE
POISSON:
Si X es una variable Poisson, entonces la esperanza Matemática y la Varianza es igual a .
E(x) = V(x) =
2.10.4. USO DE TABLAS PARA LA DISTRIBUCION DE POISSON:
Debido a que el uso de la ecuación es muy tediosa como alternativa se utiliza la función de
distribución acumulada P[X x /p;
para determinar probabilidades de cualquier tipo. Para
ello se utiliza la Tabla Nº II, que otorga probabilidades acumuladas del tipo:
P[X = x /p;
=
x
px
P[X
x !
x /p;
EJEMPLO:
Las personas llegan aleatoriamente a la ventanilla de un banco en promedio a una razón de
24 personas por hora durante el período de tiempo entre las 11:30 am y 12:00 am de cierto
día.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
50
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
a) Cuál es la probabilidad de que exactamente 5 personas lleguen durante un período de
tiempo de 12 minutos?
b) Cuál de que lleguen por lo menos 10 personas?
c) Que lleguen a lo más 12 personas?
SOLUCION: X = Número de personas que llegan a la ventanilla durante un período de 12
minutos.
Rx = {0, 1, 2,3,...............}
_
Determinamos ahora:
=n.p
p
n = 12
24
60
Finalmente:
24
12
60
4,8
Entonces X se distribuye a través de una Variable Poisson con la siguiente Función de
Cuantía:
PX
e
x / 4 ,8
4 ,8
4,8 x
x !
x = 0, 1, 2,3,..............
a) Cuál es la probabilidad de que 5 personas exactamente lleguen a la ventanilla del banco ?.
1
P[X = 5 = ?
0
1
2
3
4
5.
6.........................................................................................
P[X
6
P[X
5
∞.
P[X = 6
1 - P[ X
P[X = 5 /4,8 = P[X
5 /4,8
5
- P[X
6 /4,8
= 0,5237 - 0,3490 = 0,1747
b) Por lo menos 10 personas?
P[X 10 /4,8 = 0,0251
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
51
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
c) Que lleguen a lo más 12 personas?
P[X
12 /4,8
= 1 - P[X 12 /4,8
= 1 - 0,0040 = 0,996
EJERCICIO Nº 1: Una compañía de seguros contra accidentes de tránsito sabe que el
0,005 % de la población fallece cada año por accidente de tránsito. ¿ Cuál es la
probabilidad de que la Cia. Tenga que pagar a más de 3 de los 10.000 asegurados que tiene
al año ?.
SOLUCIÓN:
Primeramente calculamos
=n.p
p = 0,005/100 = 0,00005
n = 10000
Entonces
= 10000 x 0,0005 = 0,5
Luego remplazamos este valor en la Función de Cuantía:
e
px
0,5
0,5 x
x !
x = 0, 1, 2,3,.........
La probabilidad de que la Cia. Tenga que pagar a más de 3 asegurados al año está dado por :
P(X>3)
= 1 - P(X
3)
= 1 - [ P(0) + P(1) + P(2) + P(3)
e
1
1
e
0,5
0,5
0,50
0!
1 0,5
e
0,5
0,5
2
0,51
1!
2
0,5
6
e
0, 5
0,52
2!
e
0, 5
0,53
3!
3
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
52
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
EJERCICIO Nº 2: Solo uno de cada mil generadores ensamblados en una fábrica tienen
unidades defectuosas y los generadores defectuosos se distribuyen independiente y
aleatoriamente a través de la producción.
¿ Cuál es la probabilidad de que un embarque de 500 generadores no contenga ningun
generador defectuoso ?
SOLUCION:
px
e
0
0,5 0
0!
= 1/1000 x 500 = 0,5
0,5
e
0,5
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
53
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
TEMA Nº 3
VARIABLES Y MODELOS ALEATORIOS CONTINUOS
3.1. COMPETENCIA DE TEMA:
HABILIDAD: Caracteriza
CONTENIDO: Los fundamentos teórico-prácticos de una variable aleatoria continua y
Los modelos probabilísticas continuos más importantes, con énfasis en
El modelo de Distribución Normal.
PROCESO:
Mediante la resolución de ejercicios prácticos de aplicación.
CONTEXTO: En el Aula.
3.2. INTRODUCCION:
Si el Recorrido o rango de la Variable Aleatoria X (Rx), está formado por un gran número
finito de valores; por ejemplo: Todos los valores de X en el intervalo 0 x 1, de la forma
0,01 - 0,02 - 0,03 - 0,04 etc., etc., cuya suma total sea igual a 1.
Ahora bien, con cada uno de estos valores de x, está asociado un número no negativo p (xi) =
P[X=xi donde i= 1,2,3,4,.............. cuya suma, como se dijo anteriormente, es igual a 1.
GRAFICAMENTE TENEMOS:
p(x)
f(x)
0
1
Rx
Matemáticamente podrá ser más fácil idealizar la anterior descripción probabilística de X
al suponer que la variable pude tomar todos los valores posibles entre 0 x 1.
Si hacemos esto, nos preguntamos ¿Que le sucede a las probabilidades puntuales p(xi) ?.
Los valores de X no son contables, por tanto no tendría sentido hablar del iésimo valor de
X y, entonces p(xi) pierde significado.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
54
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Lo que se hace es sustituir p(x), definida sólo para x1, x2, x3, ..............., por una función f(x)
definida para todos los valores de x/ 0 x 1
3.3.
DEFINICION: Sea X una variable Aleatoria Continua, si existe una función f(x),
llamada FUNCION DE DENSIDAD DE PROBABILIDADES DE X, que
satisfaga las siguientes condiciones:
a)
b)
f(x)
0
x
Rx
f x dx 1
c) Para cualquier valor a y b, tal que
P[ a
X
b
=
b
-
<a<b<+
Entonces:
f x dx
a
También se dice Variable Aleatoria Continua, si el Rango Rx es un intervalo sobre la recta
de los números reales R.
La definición de Variable Aleatoria Continua indica la existencia de una función f (x) definida
sobre Rx, la condición (a) establece que la gráfica de la función de densidad está por
encima del eje de las x.
Por otro lado, la condición (b) indica que el área delimitada por la curva f (x), el eje X y las
rectas verticales que pasan por los puntos extremos de Rx es igual a 1, como se indica en la
siguiente gráfica:
f(x)
Area =1
∞
-∞
a
0
b
Ahora, Supóngase que estamos interesados en calcular la probabilidad de que la variable
Aleatoria tome los valores entre a y b, donde el intervalo [ a,b
Rx. Es decir queremos
calcular la P[ a X b .
Puesto que toda el área vale 1, podemos definir esta probabilidad como el área delimitada
por la gráfica f(x), las rectas x=a, x=b y el eje X. Por tanto, la probabilidad del evento es:
P[ a
X
b
=
b
a
f x dx
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
55
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
GRAFICAMENTE TENEMOS:
f(x)
P[a≤X≤b
x
-∞
0
x1 =a
∞
x2 =b
Por consiguiente, es importante señalar que f(x) no representa la probabilidad de algo y que
solamente cuando la función se integra entre dos puntos produce una probabilidad.
EJEMPLO Nº 1: Supóngase que la variable Aleatoria X es continua. Además,
función de densidad de probabilidades f(x) dada por :
f(x) = 2x
sea la
x= 0<x<1
Para cualquier otro valor
=0
Calcular la probabilidad de que: X
P[ X 1/2 = ?
1/2; o sea:
SOLUCION: En primer lugar graficamos la función:
f(x)
2
f(x)=2x
1
x
0
a) f(x)
b)
1/2
0
f x dx
1
2 x dx
0
2
x
2
2
x2
1
1
0
1 0 1
Finalmente, para buscar la probabilidad o calcular la probabilidad buscada empleamos el
siguiente procedimiento:
P[ X
1/2
=?
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
56
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
P[X
1
2
0
=
1/2
x2
2x dx
1
2
1
0
2
02
1
0
4
1
4
0,25
EJEMPLO Nº 2:
Sea X una Variable Aleatoria Continua con función de densidad:
f(x) = a(3x - x )2
= 0
: 0
X 3
En otro caso.
a) Hallar el valor del Coeficiente a
b) Construir la gráfica de la función de densidad de probabilidad.
c) Calcular la probabilidad de que X se encuentre en el intervalo [ 1, 2
SOLUCIÓN:
a) Para hallar el valor del coeficiente a, partimos de la segunda condición de la función de
densidad.
3
0
2
a 3x x dx 1
Integramos luego:
a
3 2
x
2
1 3
x
3
3
a
0
3 2
3
2
1 3
3
3
0 1
Entonces:
a
27
2
9
a
9
2
1
1
a
1
9
2
a
2
9
b) La gráfica de la función f(x) en el intervalo [0,3 , es por tanto una parábola.
Y = a ( 3x - x )2
Remplazamos valores: a
2
9
Y = 3ax – ax2
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
57
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
2
x
9
Y
3
Y
2
x
3
2 2
x
9
2 2
x
9
LUEGO GRAFICAMOS:
f(x)
1
2
x
3
fx
2 2
x
9
4/9
0
1
2
3
Valores
x
y
0
0
1
4/9
2
4/9
3
0
c)
P1
2
X1 2
1
2
x
3
2 3
x dx
9
2 1 2
x
3 2
2 1 3
x
9 3
2
1
1 2
x
3
2 3
x
27
2
1
4
3
16
27
1
3
2
27
20
27
7
27
13
27
0,48
EJERCICIO PARA RESOLVER EN CLASES:
Se supone que el diámetro de un cable eléctrico, digamos X, es una variable aleatoria
continua con f(x)=6x(1-x)
x:0≤x≤1.
a) Verificar que f(x) es una función de distribución de probabilidad
b) Graficar f(x) y dibujarla
c) Calcular p(x≤1/2)
d) Hallar µ y σ
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
58
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
3.4
FUNCION DE DISTRIBUCION ACUMULADA DE UNA VARIABLE
CONTINUA:
3.4.1. DEFINICION: Sea X una Variable Aleatoria Continua con función de Densidad f(x),
entonces la Función de Distribución o Función de Distribución
Acumulada de la Variable Aleatoria X, denotado por F(x), se define
por:
F(x) = P[ X
x
=
x
x R
f x dx
GRAFICAMENTE TENEMOS:
f(x)
F(x)=P[X≤x]
x
-∞
0
∞
x
EJERCICIO: Sea X una Variable Aleatoria Continua con función de densidad f(x) denotada
por:
f(x)=
:0
3
x2 x
4
0
x
2
En otro caso
a) Hallar la función de Distribución Acumulada de X y su gráfica.
b) Hallar el valor de F(1)
SOLUCION:
La Función de Distribución F(x) está definida para todo x
consecuencia, pueden darse los siguientes casos:
R,
1.- Si: x<0
F(x) = P[ X
2.- Si:
0 x
F(x) = P[ X
x
=
2
x =
0
2
0 dx
0
f x dx
Entonces:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
En
59
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
F(x) = P[ X
x
=
0
0 dx
2
0
3
x 2 x dx
4
0
3 2
x
4
x
3
3
x
0
2
3
x
x 1
4
3
3.- Si x>2
F(x) = P[ X
F(x) = P [ X
x
= 0
=
x
2
0
x
f x dx
3
x 2 x dx
4
x
2
0 dx 1
4.- Finalmente la Función de Distribución F(x) de la V.a.c. está dada por:
0
F (x)=
x<0
3 2
x
x 1
4
3
0
x
2
x≥2
1
GRAFICAMENTE TENEMOS:
f(x)
1
1/2
x
0
b) Hallar: F(1) = P[ x
1
2
3
1
Remplazamos en F(x) el valor de 1
F1
3 2
1
1 1
4
3
F1
1
2
3 3 1
4 3
3 2
4 3
6
16
1
2
EJERCICIO: Calcular F(X) para resolver el anterior problema.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
60
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
3.5
ESPERANZA MATEMATICA PARA UNA VARIABLE ALEATORIA
CONTINUA
3.5.1. INTRODUCCION: Antes de definir el concepto de Esperanza Matemática o Valor
Esperado, es preciso efectuar algunas consideraciones sobre su significado, pues además
de saber los valores que toma una variable aleatoria continua, en un intervalo definido, es
frecuente la necesidad de conocer el promedio de los valores que ella toma o el valor que se
espera que tome en dicho intervalo. Este valor en estadística inferencial se aproxima
más a su valor verdadero o parámetro cuando la muestra es grande o cuando n tiende a
infinito.
3.5.2. DEFINICION:
Sea: X es una Variable Aleatoria Continua con rango [X
y función de Densidad
f(x), el Valor Esperado o Esperanza matemática de X( x ), denotado por:
E(x) =
Ex
x
x f x dx
EJEMPLO:
Sea: X una Variable Aleatoria Continua cuya función de densidad está definida por:
2x
Si : 0
0
En otro caso
x
1
f(x)=
Calcular la E(x).
SOLUCION: Para la solución del problema primeramente recordamos la fórmula general de
la E(x).
Ex
x f x dx
Luego remplazamos los datos del problema:
Ex
x 2x dx
1
2x 2
0
Integramos luego:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
61
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
1
Ex
x3
2
3
2
12
0
3
2
3
0
Luego:
Ex
2
3
El resultado anteriormente obtenido, entonces, es el valor que en promedio se espera que
tome la variable aleatoria continua en el intervalo definido.
3.6
VARIANZA DE UNA VARIABLE ALEATORIA CONTINUA:
3.6.1. INTRODUCCIÓN:
Para comprender mejor el significado de la Varianza, cuando trabajamos con variables
aleatorias continuas, debemos previamente hacer un repaso de los conceptos que se
trataron sobre Varianza en los capítulos anteriores. En términos sencillos podemos decir
que si la E(x) = 2, significa que, si consideramos un número de valores de X, digamos: x1,
x2,........., xn y luego los promediamos, este resultado estará cercano a 2 si n es grande o
tiende a infinito. Sin embargo el simple hecho de tener la esperanza Matemática de X no
nos dice mucho cuando nos encontramos por ejemplo en la siguiente situación:
Supongamos que X representa la duración de una bombilla eléctrica que se recibe de un
fabricante y que E(x) = 1000 horas. Este valor podría significar una de varias posibilidades.
Podría significar que se espera que la mayor parte de las bombillas dure entre 900 y 1100
horas. También podría significar que las bombillas que se entregan son de dos tipos
diferentes: Alrededor de la mitad son de muy alta calidad y con duración de casi 1300
horas, mientras que la otra mitad son de muy mala calidad y tienen una duración de ceca de
700 horas.
Entonces, hay una necesidad obvia de presentar una medida cuantitativa que distinga entre
estas situaciones. Precisamente, una de estas medidas es la Varianza, que se define de la
siguiente manera.
DEFINICION:
La Varianza V(x) = x2 para una Variable Aleatoria Continua se denota por:
Vx
x2
x
x
2
f x dx
EJEMPLO:
Hallar la Varianza de X para el ejercicio anterior:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
62
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
SOLUCION: Primeramente calculamos E(x) y luego aplicamos cualquiera de los dos métodos
siguientes:
a) PRIMER METODO:
Partir de la definición de V(x):
x2
Vx
x
2
x
f x dx
Remplazamos los valores en la fórmula general: Tomando en cuneta que E x
1
x2
Vx
0
2
3
x
2
2x dx
1
0
x2
2
2
x
3
2
3
2
1
2x dx
0
2x 3
1
2
8
9
8
18
8 2
x
3
2
3
8
x dx
9
Ahora integramos:
1
x4
2
4
Vx
8 x3
3 3
8 x2
9 2
2
1
4
8 1
3 3
8 1
9 2
0
9 16 8
18
1
18
0
V(x) = 0,055
b) SEGUNDO METODO: Para empezar sabemos que E x
2
3
Utilizamos la siguiente fórmula: E(x)2 - x2
Calculamos primero E(x)2
1
Ex
2
1
1
0
0
x 2 2 x dx
2 x 3dx
x
2
4
4
1
2
0
Remplazamos datos en la fórmula del método 2:
vX
1
2
2
3
2
1
2
4
9
9 8
18
1
18
0,055
EJERCICIO PARA RESOLVER EN CLASES: Sea: X una variable aleatoria continua cuya
función de densidad está definida por:
fx
3
x2 x
4
Si:
0
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
0
x
2
e.o.c.
Cobija – Pando - Bolivia
63
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Calcular la E(x) y V(x).
3.7
VARIABLES ALEATORIAS CONTINUAS MAS IMPORTANTES
3.7.1. INTRODUCCION:
En el capítulo anterior señalamos que muchos fenómenos se hacen matemáticamente más
sencillos al considerar un recorrido continuo, en el cuál todos los números reales pueden
considerarse como resultados posibles. Al igual que para Variables Aleatorias Discretas,
es posible identificar algunos modelos probabilísticos continuos, entre las cuales, por su
grado de aplicación, estudiaremos las siguientes:
a) Modelo Exponencial.
b) Modelo de distribución Normal
3.7.2. MODELO EXPONENCIAL
Se dice que una variable aleatoria continua X, que toma todos los valores no negativos
tiene una distribución exponencial con parámetro >0 si su función de densidad está dada
por la siguiente expresión:
e
x
:x>0
f(x)=
0
En otro caso
GRAFICAMENTE LA FUNCIÓN ES LA SIGUIENTE:
f(x)
α
x
0
3.7.3. PROPIEDADES DE LA FUNCION EXPONENCIAL:
El valor esperado y la Varianza de la Función Exponencial, se calcula de la siguiente manera:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
64
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
a) Valor Esperado
Ex
b) Varianza de X V x
x
1
1
2
3.7.4. APLICACIONES DE LA FUNCION EXPONENCIAL:
La función exponencial es ampliamente empleado en problemas de control de calidad y
algunos problemas de Biometría, se asume que la vida útil de una pieza de máquina o de un
micro-organismo está descrito por la Distribución Exponencial y como E x
1
, se dice que
el parámetro es el recíproco de la esperanza matemática de la vida útil del artefacto o
del micro-organismo o que el promedio de vida útil es recíproco del parámetro .
EJERCICIO DE APLICACION:
Una partícula tiene un tiempo de vida útil (en segundos) descrito por la siguiente Función de
densidad.
0,01-0,01x
Si : x ≥ 0
0
Si :x < 0
f(x)=
a) Cuál es la probabilidad de que la partícula sobreviva por lo menos un minuto ?.
b) Cuál es el promedio de vida útil de la partícula ?.
SOLUCION:
a)
P(X
60)
=
60
0,01 e
0, 01x
dx
e
0, 01x
60
Remplazando valores:
P(X
b)
Ex
60)
= 0 - (-e -0,01·60) = 0 +e
1
100
0,01
-0,6
= 0,5488
Entonces, el promedio de vida útil de la partícula es de 100 seg.
EJERCICIO PARA RESOLVER EN CLASES:
Dada la Función de densidad F(x) =5e -5x para x
una x mayor que su Esperanza matemática.
0,
Calcular la probabilidad de obtener
SOLUCION:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
65
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Sabemos por definición que la E(x) para la distribución exponencial está dado por
en el caso concreto de nuestro problema E x
1
, o sea
1
5
Entonces la probabilidad buscada podemos expresarla de la siguiente manera:
P[X>E(x) = P( X≥1/5) =
1
5
5e
5x
dx
= 0+e
3.8
-1
e
5x
1
5
= 0,367879
MODELO DE DISTRIBUCION NORMAL
3.8.1. INTRODUCCION:
La Distribución de probabilidad continua más importante en todo el campo de la estadística,
es con toda seguridad, la Distribución NORMAL, debido a que en la práctica muchos
fenómenos industriales, científicos o de la vida diaria se describen a través de esta
función.
3.8.2. IMPORTANCIA:
La importancia de la Distribución Normal se puede resumir en los siguientes puntos:
a) Muchas de las técnicas utilizadas en la estadística Aplicada se basan en la Distribución
Normal.
b) Las Variables Aleatorias que se definen a partir de las observaciones prácticas y/o
trabajos de investigación se distribuyen normalmente, por ejemplo los efectos
considerados como una suma de efectos aleatorios independientes se distribuyen
normalmente.
c) Algunas variables se distribuyen aproximadamente según normal y aún en el caso en que
no estén distribuidos normalmente, es posible aproximarlos a la Normal mediante
transformaciones matemáticas.
d) Muchas distribuciones tienden a la Normal, como la Binomial.
e) Ciertas variables que son básicas en estadística Inferencial se definen a partir de
supuestos de la normalidad, como la Chi Cuadrada, T-student y otras.
3.8.3. DEFINICION:
Una variable Aleatoria Continua X, se dice que está distribuida NORMALMENTE, con media
(- < < ) y Varianza 2>0, si su función de densidad de probabilidad está dado por:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
66
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
fx
1
e
1
2
2
x
:-
2
<x<
Donde:
= 3,14159
e = 2,71828
La notación comúnmente utilizada es:
X
N(
2
,
)
Que se lee: “LA VARIABLE ALEATORIA X SE DISTRIBUYE NORMALMENTE CON
MEDIA
Y VARIANZA 2 ” .
Indistintamente se puede utilizar la siguiente notación:
X
N( , )
Que se lee: “X
TIENE UNA DISTRIBUCION NORMAL CON MEDIA
DESVIACIÓN STANDAR ”.
Y
GRAFICA DE LA DISTRIBUCION NORMAL:
CURVA DE GAUSS
AREA=1
µ-σ
3.8.4.
0
µ
µ+σ
CARACTERÍSTICAS DE LA CURVA NORMAL:La curva tiene un máximo
absoluto en x = .
a) Los puntos de inflexión, o sea el cambio de máximo a curva descendente se produce en x
= + y x= b) El gráfico de f(x) es llamado también “Curva de Gauss” tiene forma de una campana, es
simétrica con respecto a , es asintótica al eje de las x y continua en todo el recorrido.
c) El área bajo la curva es igual a 1.
d) En la Normal coinciden la Media, Mediana y la Moda.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
67
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
En consecuencia,
parámetros
y
si la variable Aleatoria Continua X se distribuye normalmente con
2, entonces:
E(x) =
V(x) =
2
Es decir, los dos parámetros que determinan completamente la forma de la distribución
Normal son su Media y su varianza; o sea: La f (x) es simétrica respecto de su media.
f(x)
0
µ1
Entonces:
1
2
µ2
µ3
3
Mientras más alejado se encuentre la media de 0 , ésta es mayor. En cambio la Varianza
V(x), es una medida de variabilidad o dispersión de la Variable Aleatoria. A mayor Varianza,
mayor variabilidad.
Ejemplo:
f(x)
G12
G22
Entonces:
2
1
<
2
2
<
2
3
G32
1
=
2
=
3
3.8.5.
DISTRIBUCIÓN NORMAL STANDAR: Una de las características muy
importante de la Distribución Normal es que la misma puede transformarse en Distribución
Normal Standar con media
= 0 y Varianza 2 = 1, de manera tal que cualesquier
distribución con media y Varianza puede aproximarse a la Distribución Normal Standar
simplemente haciendo la operación de Standarización. Aquello permite, como veremos más
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
68
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
adelante, a que la mayoría de las distribuciones discretas y no discretas pueden ser
transformadas en normal standar.
3.8.5.1. DEFINICIÓN: Si Z es una variable Aleatoria que tiene una distribución Normal,
con media = 0 y Varianza 2 = 1, entonces Z se llama Variable Aleatoria Normal Standar
y su función de densidad está dada por la siguiente expresión:
1
fz
e
1 2
z
2
:-
2
<z<
o también expresado de otra manera:
P[ Z
z
=
z
1
t2
2
e
dt
2
La ventaja de los valores de esta función es que están tabulados en la Tabla Nº III. En
esta tabla, los valores de f(z) están dados para valores de -3 a 3.
Por consiguiente cualesquier variable aleatoria X Normal con media
y Varianza 2 ,
puede ser transformada a una variable aleatoria Standarizada Z, a través de la siguiente
expresión:
X
Z
Donde:
E
X
0
y
X
Var
1
La gráfica de la Normal Standard se muestra a continuación:
f(z)
Z
-3
-2
-1
0
1
2
3
µ
68,26 %
95,46 %
99,74 %
Nótese en el gráfico anterior que el 99,74 % del área de una distribución Normal está
entre
+3
y
- 3 . El área correspondiente a ambas colas es despreciable. Por esta
razón es que las tablas dan valores de f(z) de -3 a +3.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
69
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
TEOREMA:
Si X es una variable aleatoria con distribución Normal con media
entonces
Z
y Varianza
2,
es una variable aleatoria con distribución normal standard, siendo su
X
función de densidad la siguiente expresión:
1
fz
e
1 2
z
2
:-
2
<z<
Y la función de distribución acumulada F(x), por:
F(x) = P[ Z
z
=
1
z
e
t2
2
dt
2
Esta función como lo señalamos en acápites anteriores tiene la ventaja de estar tabuladas
en la tabla Nº III, lo que facilita el cálculo de probabilidades para la Normal Standarizada.
USO DE TABLAS PARA LA DISTRIBUCIÓN NORMAL STANDAR:
3.8.6.
Una vez conocido los valores de la media ( ) y la Varianza V(x) de una Variable Aleatoria X
con distribución Normal, es sólo cuestión de cálculo encontrar la probabilidad buscada.
Para ello pueden darse 3 casos de acuerdo a la información con la que se cuente. Estos
casos son:
CASO “A”:
P
X
b
= P
X
P
b
b
b
Z
CASO “B”
P
X>b
= 1- P X b 1
b
.
CASO “ C”
P
a
X
b
= P
P
a
X
b
=
a
x
b
b
P
a
Z
b
a
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
70
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
PROCEDIMIENTO PARA LA LECTURA DE LA TABLA III:
f(z)
P[Z ≥ z α] = Ø(-zα)
P[Z ≥ z α]
-Zα
0
Z
Zα
Para la lectura de la Tabla III. se deben tomar en cuenta los siguientes aspectos:
1) La tabla proporciona el área bajo la curva normal Standard desde el área correspondiente a P[Z z = ( z ).
hasta +
, es decir
2) Los valores de z están dados en centésimos (o sea con dos decimales), desde -3,49 hasta
3,49.
3) La tabla III es una tabla de dos entradas encabezado por la letra z. En la primera
columna (primera entrada) se lee el valor de z en décimos (es decir con un decimal), por Ej.
1,8
Luego, en la primera fila se lee el centesimal (segundo decimal de z) 0,06 . Entonces Z =
1,86
4) La tabla ayuda a resolver dos tipos de problemas:
a) Conocido z hallar el área:
* Conocido z digamos z=1,86, queremos calcular la P[Z
1,86
Luego, en la primera columna se ubica el valor de z con un decimal 1,8 y el segundo decimal
se ubica en la primera fila 0,06. Por ambos puntos se traza una recta horizontal y una
vertical respectivamente, el número que corresponde a la intersección de ambas rectas es:
0,0686
O sea:
P[ Z
1,86
=
(1,86)
= 0,9686
b) Conocido la probabilidad hallamos z.
Es un procedimiento inverso al anterior. Se ubica el área en el cuerpo de la tabla, por este
punto se traza una horizontal y una vertical.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
71
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
z se obtiene sumando el punto de la intersección de la horizontal con la primera columna en
el punto de la intersección de la vertical con la primera fila.
Por Ej. se pide calcular z, tal que: P[ Z
z
= 0,9382
Entonces, se ubica el número 0,9382 en el cuerpo de la tabla. Por este punto se traza un
horizontal y una vertical, las que intersectan a la primera columna y primera fila en 1,5 y
0,04 respectivamente.
Z = 1,5 + 0,04 = 1,54
EJEMPLO Nº 1: Sea X una variable aleatoria con N(5,4).
a) ¿Cuál es la probabilidad de que X tome valores entre 4 y 7 ?.
b) ¿Cuál es la probabilidad de que tome valores mayores que 10 ?
SOLUCION:
a)
P
P
4>X<7
4>X<7
=
P
4 5
2
X
7 5
2
P
1
Z
2
1
1
2
1
= 0,8413 - 0,3085 = 0,5328
REPRESENTACION GRAFICA:
f(x)
0,5328
x
4
5
6
-1/2
b) P
X > 10
=1-P
X 10
= 1 PX
7
1
10 5
2
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
1 PZ
2, 5
1 0,9938
0,0062
Cobija – Pando - Bolivia
72
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
EJERCICIO Nº 2:
La fábrica de neumáticos “DURAMAS” produce un tipo de neumáticos que tiene vida útil
media de 80000 Km. y una Desviación Standard de 8000 Km. Suponiendo que esta vida útil
está distribuida normalmente.
¿Cuál es la probabilidad de que un neumático dure más de 96000 Km. ?
SOLUCION:
X: “Vida útil de un neumático en Km.”
Entonces: X
N(80000, 80002)
P
X > 96000
=1-P
X
96000
P
X > 96000
= 1-P
Z
2
=
o N( ,
= 1
P
2
)
X
96000 80000
8000
1 - 0,9772 = 0,0228
EJERCICIO PARA RESOLVER EN CLASES:
El tiempo T requerido para la digestión de una unidad de alimento por un protozoario es una
variable aleatoria normal con media 31 minutos y Desviación Standard de 5 minutos.
a) ¿Cuál es la probabilidad de que una unidad de alimento sea digerido en menos de 35
minutos?
b) Si una unidad particular de alimento se observa que no está digerido completamente en
30 minutos. ¿Cuál es la probabilidad de que sea digerido antes de los 35 minutos?.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
73
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
TEMA Nº 4
MUESTREO Y DISTRIBUCIONES MUESTRALES
4.1.
COMPETENCIA DE TEMA:
HABILIDAD: Aplica
CONTENIDO: Las técnicas de muestreo, para muestras grandes y pequeñas.
PROCESO:
Mediante el estudio de las diferentes clases de muestreo, resolviendo
trabajos prácticos y el proyecto de curso.
CONTEXTO: En el aula y la comunidad.
4.2. Introducción.- Una parte fundamental para realizar un estudio estadístico de
cualquier tipo es obtener resultados confiables y que puedan ser aplicables. Como ya se
comentó anteriormente, resulta casi imposible o impráctico llevar a cabo algunos estudios
sobre toda una población, por lo que la solución es llevar a cabo el estudio basándose en un
subconjunto de ésta denominada: muestra.
Sin embargo, para que los estudios tengan la validez y confiabilidad buscada, es necesario
que tal subconjunto de datos, o muestra, posea algunas características específicas que
permitan, al final, generalizar los resultados hacia la población en su conjunto. Esas
características tienen que ver principalmente con el tamaño de la muestra y con la manera
de obtenerla.
4.3. IMPORTANCIA DEL MUESTREO
Usualmente se hace referencia a dos tipos de razonamiento: el deductivo y el inductivo. El
primero está relacionado directamente con la teoría de probabilidad, y que a partir de las
características de la población se obtienen las posibles características de una muestra. El
segundo tipo de razonamiento se relaciona con la denominada inferencia estadística:
utilizar las características de un subconjunto de la población (la muestra) para hacer
afirmaciones (inferir) sobre la población en general. Éste será el caso de nuestro interés.
El muestro, como ya se mencionó, implica algo de incertidumbre que debe ser aceptado para
poder realizar el trabajo, pues aparte de estudiar una población resulta ser un trabajo en
ocasiones demasiado grande, para Wonnacott y Wonnacott las razones principales para
utilizar muestras son:
Recursos limitados. Es decir, no existen los recursos humanos, materiales o
económicos para realizar el estudio sobre el total de la población. Es como cuando se
compra un aparato, un automóvil usado (por ejemplo), que se prueba unos minutos (el
encendido, una carrerita, etc.) para ver si funciona correctamente y luego se
adquiere, pero no se espera a probarlo toda la vida (encendiéndolo y apagándolo o,
simplemente, dejándolo encendida) antes de realizar la adquisición.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
74
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el
estudio paleontológico de los dinosaurios (el T. Rex por ejemplo) sería muy bueno
contar con, al menos, muchos restos fósiles y así realizar tales investigaciones; sin
embargo, se cuenta sólo con una docena de esqueletos fosilizados (casi todos
incompletos) de esas criaturas en todo el mundo.
Pruebas destructivas. Es el caso en el que realizar el estudio sobre toda la población
llevaría a la destrucción misma de la población. Por ejemplo, si se quisiese saber el
conteo exacto de hemoglobina de una persona habría que extraerle toda la sangre.
El muestreo puede ser más exacto. Esto es en el caso en el que el estudio sobre la
población total puede causar errores por su tamaño o, en el caso de los censos, que
sea necesario utilizar personal no lo suficientemente capacitado; mientras que, por
otro lado, el estudio sobre una muestra podría ser realizada con menos personal
pero más capacitado.
4.4. TIPOS DE MUESTREO.- Deben seguirse ciertos procedimientos de selección para
asegurar de que las muestras reflejen observaciones a la población de la que proceden, ya
que solo se pueden hacer observaciones probabilísticas sobre una población cuando se usan
muestras representativas de la misma. Los tipos más comunes de técnicas de muestreo
aleatorios son: el muestreo aleatorio simple, el muestreo sistemático, el muestreo
estratificado y el muestreo por conglomerados.
a) MUESTREO ALEATORIO SIMPLE
Es aquella en la que los elementos se escogen del total de la población en forma individual
con una oportunidad igual e independiente para todas. Por lo general se utiliza una tabla de
números aleatorios.
Si la población es infinita el muestreo aleatorio ocurre cuando la extracción de los
elementos de la muestra se hace con o sin reemplazo. Si la población es finita de tamaño N,
el muestreo aleatorio ocurre también si la extracción es con o sin reemplazo.
Con reemplazo, la probabilidad de cada elemento de ser elegido es 1/N. Si es sin
reemplazo, la probabilidad de cada elemento de ser elegido es 1/N en la primera
extracción, es 1/(N-1) en la segunda extracción, es 1/(N-2) en la tercera extracción y así
sucesivamente.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población
tengan la misma probabilidad de ser seleccionado, se llama muestra aleatoria simple.
Ejemplo:
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
75
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos
las 15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un
recipiente y después los revolvemos, entonces podremos tener una muestra aleatoria de 5
si seleccionamos un trozo de papel con cinco nombres. Un procedimiento más simple para
elegir una muestra aleatoria sería escribir cada uno de los 20 nombres en pedazos
separados de papel, colocarlos en un recipiente, revolverlos y después extraer cinco papeles
al mismo tiempo.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico,
imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para las
encuestas nacionales de opinión sobre productos o sobre elecciones presidenciales, sería
muy costoso o tardado.
b) MUESTREO SISTEMÁTICO
Una muestra aleatoria sistemática es aquella en la que sus elementos se eligen de la
población a intervalos uniformes a partir de un listado ordenado. El k-ésimo elemento de la
muestra es k=N/n, donde n es el tamaño de la muestra y N el tamaño de la población.
Por ejemplo: al elegir una muestra sistemática de 100 alumnos de una unidad educativa que
tiene 3000 estudiantes. K = 3000/100 =30, entonces el primero se elige en forma aleatoria
de los 30 primeros de la lista y los demás sistemáticamente cada 30 alumnos de la lista.
c) MUESTREO ESTRATIFICADO.- Primero se clasifican a los elementos de la población
en sub-grupos separados de acuerdo con una o más características importantes (estratos).
Después se obtiene por separado una muestra aleatoria simple o sistemática en cada
estrato. El tamaño de cada sub-muestra debe ser proporcional al tamaño del estrato para
asegurar la representatividad.
Por ejemplo: Para obtener una muestra aleatoria de 600 electores de una población de
600.000 electores de los cuales 300.000 son de clase baja, 200.000 de clase media y
100.000 de clase alta. Para ello, primeramente se obtiene el % de participación de cada
estrato sobre el total: 300.000/600.000 = 0,5 x 600 = 300; 200.000/600.000 = 0,33 x
600 = 200; y finalmente 100.000/600.000 = 0,166x600 = 100. Al interior de cada estrato
se eligen en forma aleatoria simple.
d) MUESTREO POR CONGLOMERADOS.- Los elementos de la población se dividen en
forma natural en sub-grupos o por conglomerados. Luego se eligen al azar los sub-grupos
que forman la muestra. Ejemplo: Al estudiar las pensiones que se pagan en los colegios
particulares donde no es posible tener la lista de todas las pensiones, pero puede obtenerse
una lista de los colegios particulares (grupos). Entonces, con esta lista puede obtener una
muestra aleatoria de colegios y así obtener las pensiones que se pagan en estos colegios.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
76
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de
unidades heterogéneas entre sí de la población llamadas conglomerados. Cada elemento de
la población pertenece exactamente a un conglomerado, y los elementos dentro de cada
conglomerado son usualmente heterogéneos o disímiles.
En el muestreo por conglomerados, éstos se forman para representar, tan fielmente como
sea posible, a toda la población; entonces se usa una muestra aleatoria simple de
conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias,
hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por
conglomerados.
En la lección anterior analizamos las diferentes modalidades de muestreo y tipos de
muestreo: Muestra probabilística, muestra no probabilística, etc.
En este capítulo profundizaremos algunas consideraciones relativas a las distribuciones que
se dan dentro del muestreo.
4.5.
DISTRIBUCION DE MUESTREO – CONCEPTO: Consideremos todas las posibles
muestras de tamaño n en una población dada (Con o sin reposición). Para cada muestra,
podemos calcular un estadístico tal como la Media, la Desviación Standard y otros que
lógicamente variará de muestra a muestra. Con estos datos, entonces, obtenemos una
distribución del estadístico que se llama DISTRIBUCIÓN DE MUESTREO.
Si por ejemplo, el estadístico utilizado es la Media muestral, entonces la Distribución se
llama la DISTRIBUCIÓN DE MUESTREO DE MEDIAS O DISTRIBUCIÓN DEL
MUESTREO DE LA MEDIA. De la misma manera, podríamos tener la distribución de
muestreo de la Desviación Standard, de la varianza, de las proporciones, etc. En
consecuencia, para cada distribución de muestreo podemos calcular la Media, la Desviación
Standard, etc.
4.6. DETERMINACIÓN DEL TAMAÑO DE UNA MUESTRA.- Uno de los aspectos que
deben definirse en el proceso de muestreo, es el tamaño de la muestra. Para ello, deben
tomarse en cuenta los siguientes aspectos:
a) Tamaño del universo o población = N
b) Grado de heterogeneidad de dicho universo, expresado por el valor de la desviación
estándar de la variable aleatoria.
c) Magnitud del error estadístico que estemos dispuesto a aceptar en los resultados.
Dicho error dará lugar a un intervalo de valores en torno al valor medio que
produzca la muestra. Llamamos I a la amplitud total del intervalo, es decir, a la
diferencia entre sus límites superior e inferior.
d) Grado o nivel de confianza que quisiéramos poder depositar en los resultados. A
dicho nivel corresponderá el coeficiente z, dado que, según la ley de los grandes
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
77
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
números, la distribución de la media de muestras, en la que nos apoyamos
conceptualmente para el cálculo, es normal; a menos que se trate de una muestra
pequeña (n<30), en cuyo caso la distribución es de Student, y es necesario usar t en
lugar de z.
FORMULA PARA DETERMINAR EL TAMAÑO DE LA MUESTRA
La fórmula para definir el tamaño de la muestra n, es la siguiente:
2
n=
Z x p x qxN
2
2
Z xpxq+ NxE
Donde:
n= Tamaño de la muestra
Z = Variable Z
p= probabilidad de éxito
q= probabilidad de fracaso
N=Tamaño de la población
E= Error estadístico
Ejemplo: Sea una población de 42074 miembros. Se desea conocer el ingreso familiar
mensual promedio con un error promedio no mayor de 0,05 con un nivel de confianza del 95
%. ¿Cuántos miembros se deben muestrear, sabiendo que se estima que la probabilidad de
éxito es del 80 % ?.
SOLUCIÓN
N = 42075
Z = 1,96
E = 0,05
p = 0,8
q= 0,2
2
n = (1,96) x 0,8 x 0,2 x 42074
2
1,96 x 0,8 x 0,2 + 42074 x 0,05
2
n = 245 miembros
4.7. DISTRIBUCIÓN DE MUESTREO DE LA MEDIA: Supongamos que se toman todas
las posibles muestras de tamaño n, SIN REPOSICIÓN, de una población finita de tamaño N
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
78
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
> n. Si denotamos la Media y la Desviación Standard o Típica como la distribución de
muestreo de Medias por x y x
y las de la población y , respectivamente. Entonces, se tiene:
POBLACION
FINITA O
MUESTREO SIN
REPOSICION
ESTADISTICO
POBLACIÓN
INFINITA O
MUESTREO CON
REPOSICION
x
n
N n
N 1
n
x
Esto es general cuando se analizan todas las posibles muestras y cuando ello no sucede
tanto x y x tienden a ubicarse cerca de
y .
EJEMPLO: Una población consta de los siguientes números: 2,3,6,8,y 11. Consideremos
todas las posibles muestras de tamaño 2 que pueden tomarse con REPOSICION de esa
población.
Hallar:
a) La Media de la Población
b) La Desviación Standard de la Población.
c) La Media de la Distribución de muestreo de medias.
d) La Desviación Standard de la distribución de muestreo de medias.
SOLUCION:
a)
b)
2 3 6 8 11
5
2
2 6
Y finalmente:
2
3 6
30
5
2
10,8
6
6 6
5
2
8 6
2
11 6
2
10,8
3,29
c) Cuando el muestreo es
son:
(2,2) (2,3)
(3,2) (3,3)
(6,2) (6,3)
(8,2) (8,3)
(11,2) (11,3)
con reposición, existen 52 = 25 muestras de tamaño 2; estas
(2,6)
(3,6)
(6,6)
(8,6)
(11,6)
(2,8)
(3,8)
(6,8)
(8,8)
(11,8)
(2,11)
(3,11)
(6,11)
(8,11)
(11,11)
Las correspondientes medias muestrales serán:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
79
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
2,0
2,5
4,0
5,0
6,5
2,5
3,0
4,5
5,5
7,0
4,0
4,5
6,0
7,0
8,5
5,0
5,5
7,0
8,0
9,5
6,5
7,0
8,5
9,5
11,0
Entonces, la media de la distribución de muestreo de la media es:
2,0 2,5 4,0 ................. 11,0
25
x
Entonces:
d) Obtenemos ahora
y
150
25
6,0
x
2,0 6
2
2
2,5 6
2
4,0 6,0
25
x
2
................. 11.0 6
2
135 2
25
5,40
= 2,32
x
Empleemos ahora la fórmula del cuadro, para muestreo con reposición:
2
2
x
_
10,8
2
n
5,40
2,32
EJERCICIO Nº 2: Resolvamos ahora el mismo ejercicio para el muestreo sin reposición.
SOLUCION: Sin reposición, la muestra será igual a:
5
2
5
2 3
5 4
21
20
2
10
n= (2,3) (2,6) (2,8) (2,11) (3,6) (3,8) (3,11) (6,8) (6,11) (8,11)
Calculamos luego las medias para cada muestra:
2,5
x
4,0
5,0
6,5
4,5
5,5
2,5 4,0 5,0 6,5 4,5 5,5 7,0 7,0 9,5
10
7,0
60
10
7,0
8,5
9,5
6
Con ello se demuestra que: x =
d) Calculamos primero la varianza:
2,5 6
2
4,0 6
x
y
x
2
.................. 9,5 6
10
2
40,5
10
4,05
= 2,01
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
80
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Empleando la fórmula de la tabla anterior tenemos:
2
N n
N 1
2
x
x
n
10,8 5 2
2 5 1
5,4 0,75
4,5
= 2,01
4.8. POBLACIONES DISTRIBUIDAS NORMALMENTE:
Para valores grandes de n ( n > 30) la distribución del muestreo de medias es
aproximadamente NORMAL con media x y x , esto independientemente de la población,
siempre y cuando la media poblacional y la varianza sean finitas y el tamaño de la población
sea menor el doble que el de la muestra.
Para una población infinita, este resultado es un caso especial del TEOREMA CENTRAL
DEL LIMITE, que afirma que la precisión de la aproximación mejora al crecer el tamaño de
la muestra n.
Por otro lado, en caso de que la población esté normalmente distribuida, la distribución del
muestreo de medias también lo está incluso para valores pequeños de n < 30.
EJERCICIO Nº 3: Las estaturas de 3000 estudiantes varones de una Universidad están
normalmente distribuidas con media 68 y Desviación Standard 3,0. Si se toman 80
muestras de 25 estudiantes cada una. ¿Cuales serán la media y la Desviación Standard
Típica esperadas de la resultante de la distribución de muestreo de medias, si el muestreo
se lo hizo a) con y B9 sin reposición?
SOLUCION: El número de muestras de tamaño 25 que podrían elegirse de un grupo de
3000 estudiantes con reposición y sin reposición son: (3000)25 y
3000
25
que son mucho más
que 80.
Por tanto, se obtendrá no una verdadera distribución del muestreo de medias, sino solo
una distribución de muestreo experimental. Sin embargo, como el número de muestras es
grande (n>30), se espera que x y x están próximos a
y ; entonces tenemos:
a)
b)
x
x
=
=
= 68
= 68
y
2
3
n
25
x
x̂
y
x
0,6
= 0,6 x 0,99599 = 0,5976
0,6
Entonces, se esperaría tener una distribución de muestreo experimental de medias
distribuida normalmente con media 68 y desviación típica 0,6
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
81
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
EJERCICIO PARA RESOLVER EN CLASES: Una población consiste de las edades de los
niños de una familia de 4 niños. Estas edades son : 2,4,6 y 8 años.
a) Determinar la media y la Desviación Standard
b) Enumerar todas las posibles muestras sin reposición de 2 niños que pueden seleccionarse
en esta familia y determine x raya para cada muestra.
c) Calcular la media y la Desviación Standard de las medias muestrales y verifique si se
cumple:
=
x
y
N
n
x
n
N 1
4.9. OTRA SITUACIÓN DE LA DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Sea X una población con distribución de probabilidad f(x), Media y Varianza 2.
Sea X1, X2,.......,Xn una muestra aleatoria de tamaño n de X. la media muestral es:
n
xi
i 1
x
n
Entonces:
1)
x
=
2
y
2
x
n
2) Para n suficientemente grande, por el Teorema Central del Límite, la Variable Aleatoria
X se distribuye aproximadamente según normal con media y Varianza 2/n
Por lo tanto la Variable Aleatoria Z, es igual a:
Z
X
X
n
n
Que tiene aproximadamente una distribución Normal Standard.
3) Si la población X tiene una distribución Normal con media y Varianza, la muestra
aleatoria X1, X2, X3,...... Xn son variables aleatorias distribuidas normal e idénticamente con
media y Varianza 2. Entonces:
Tiene una distribución normal con media
la variable Aleatoria:
__
X
Z
X
y Varianza
2/n
para todo n. En consecuencia,
n
Tiene aproximadamente una distribución Normal Standard N(0,1).
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
82
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
El Teorema anterior es válido para cualquier población finita o infinita, discreta o continua,
cuando n 30. Si la población es Normal, el teorema se cumple cualquiera sea el tamaño de
n.
EJEMPLO: Sea 1,1,1,3,4,5,6,6,6,7 una población. Se extrae una muestra de tamaño 36 con
reemplazamiento de esta población. Calcular:
a) La media
y la Desviación Standard
b) La media
c) P[3,6 X
x
4,4
de la población.
= y la Desviación Standard
x
de la Media muestral X
=?
SOLUCION:
Primeramente calculamos la distribución de probabilidades de la población:
1
0,3
X
P
X=x
3
0,1
a) Calculamos luego la media
4
0,1
5
0,1
6
0,3
7
0,1
.
= E(x) = 1·0,3+3·0,1+4·0,1+5·0,1+6·0,3+7·0,1 = 4
=4
2
Seguidamente calculamos
= E(x)2 -
2
E(x)2 = 12·0,3 + 32·0,1+42·0,1 + 52·0,1 + 62·0,3 + 72·0,1 = 21
2
= 21 - 16 = 5
5 2,23
Luego:
b) Por el teorema anterior, tenemos:
x
=4
2,23
x
n
36
2,23
6
c) Como n=36 > 30, entonces
= 4 y Varianza = 0,14
P
3,6
x
4,4
x
0,39
tiene aproximadamente una distribución normal con media
=?
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
83
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
P
3, 6 4 6
2, 23
x
2,4
2,23
4, 4 4 6
2, 23
Z
2,4
2,23
(1,07)
( 1,07)
Buscamos el resultado en la tabla de la curva Normal:
= 0,8577 - 0,1423 = 0,7154
EJERCICIO PARA RESOLVER EN CLASES: Sea X una población constituida por 2,4 y 6.
Calcular:
a) La media poblacional y la Desviación Standard poblacional. Luego se extrae una muestra
de tamaño 54 con reemplazamiento de la población. Se pide calcular:
b) La media x y x de las x raya.
c) P
4,1
4.10.
x
4,4
=?
DISTRIBUCIONES MUESTRALES PARA MUESTRAS PEQUEÑAS
En el capítulo precedente hemos visto las distribuciones muestrales para una media grande
( n
30). Estas distribuciones eran aproximadamente Normal o que el tamaño de la
muestra era suficientemente grande, de tal manera que se cumplía el Teorema Central del
Límite.
Sin embargo, cuando la muestra es pequeña ( n < 30) no se puede aplicar el TEOREMA
CENTRAL DEL LIMITE y si la población no es Normal, tampoco podemos suponer que la
distribución muestral sea Normal.
Para estos casos, se aplica o utiliza distribuciones relacionadas con la distribución normal.
Entre estas tenemos:
a) La distribución Chi-cuadrado
b) La distribución T de student
c) La distribución F
4.11. DISTRIBUCIÓN CHI-CUADRADO:
DEFINICION:
“Sean n variables aleatorias independientes: Z 1, Z2, Z3, ......., Zn
distribuidas Normalmente, cada una con media 0 y Varianza 1 N(0,1), o sea Normal Standard.
Para cada y = 1,2,3,....., n. Entonces el estadístico:
2
n
Zi
2
i 1
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
84
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
ó
2
Z12 + Z22 + Z32 + .......... + Zn
=
Se dice que es una Variable Aleatoria CHI-CUADRADO con n grados de libertad.
b) Si X1, X2, X3, ........, Xn es una muestra aleatoria de una variable aleatoria normal, con
distribución N( , 2), entonces:
2
2
xi
n
Con n grados de libertad
y 1
FUNCION DE DENSIDAD DE LA CHI-CUADRADO:
fx
n
1
2n
2
n
2
X2
1
e
= 0
El símbolo
x
2
para todo x > 0
En otro caso
es la función Gama.
* Para el caso particular de n = 2 , tenemos la Distribución Exponencial:
fx
1
e
2
x
2
Que significa la función para 2 grados de libertad.
Por otro lado, se puede apreciar que los valores que toma la variable Aleatoria ChiCuadrado, son todos reales y positivos, debido a que es una suma de cuadrados.
4.12. GRADOS DE LIBERTAD: (r) Es el número de Variables Aleatorias independientes
que se suman. También podemos definir grados de libertad (r) como un parámetro asociado
con la distribución de probabilidades o como el número de variables que pueden variar
libremente.
Otra forma de conceptualizar los Grados de Libertad es a partir del siguiente
razonamiento.
Para el cálculo de un estadístico como:
2
ns 2
X1 X
2
X2
X
2
2
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
................. X n
X
2
2
Cobija – Pando - Bolivia
85
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Es necesario emplear tanto observaciones de muestras como propiedades de ciertos
parámetros de la población. Si estos parámetros son desconocidos, hay que estimarlos a
partir de la muestra.
El número de grados de libertad de un estadístico denotado por r, se define como el
número n de observaciones independientes de la muestra (tamaño de la muestra) menos el
número k de parámetros de la población que debe ser estimado a partir de las
observaciones muestrales.
r=n-k
En el caso del estadístico anterior, el número de observaciones independientes de la
muestra es n, de donde podemos calcular s, sin embargo debemos estimar
Entonces:
r=n-1
Grados de libertad.
GRAFICA DE LA DISTRIBUCION CHI CUADRADO:
f(x)
r=2
r=3
r=4
r=5
r
0
En la medida en que r aumenta, la distribución Chi-cuadrada tiende a una Normal.
4.13.
LA MEDIA Y LA VARIANZA DE LA CHI-CUADRADO:
Cuando la variable aleatoria X tiene una distribución Chi-cuadrado,
libertad, la media y la varianza de la Chi-cuadrado está dada por:
con r grados de
= E ( )2 = r
2
= Var ( )2 = 2 r
Es decir, la media es igual al número de grados de libertad y la varianza a dos veces el
número de grados de libertad.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
86
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
4.14. FUNCION DE DISTRIBUCION ACUMULADA DE LA CHI-CUADRADO: F(x)
Debido a la aplicabilidad de la Chi-cuadrado en inferencia estadística es má importante
trabajar con la distribución acumulada de F(x) por que las mismas están calculadas en tablas
(Tabla IV), para diferentes valores seleccionados de r y para un valor determinado .
Por lo tanto se puede encontrar en la tabla la probabilidad de que la variable Aleatoria X
2
tiene una distribución
P
X<
( 1<r<30 ) sea menor a un valor constante r2, representado por:
=
r2
0<
<1
O sea:
2
PX
r2
0
0
r
1
2
f x dx
2r
2
r
2
1
x2 e
r
2
dx
GRAFICAMENTE TENEMOS:
f(x)
1-α
0
2
α
P
[X> 2
= 1-
Obsérvese, puesto que existe una distribución Chi-cuadrado diferente para cada valor de
r, resulta muy poco práctico proporcionar tablas de áreas completas, En lugar de ello, la
Tabla IV presenta un resumen de la información acerca de la distribución.
La columna de la izquierda de la tabla se refiere a grados de libertad, por lo tanto, cada
fila en la tabla corresponde a una distribución Chi-cuadrado particular, Ejemplo:
Si r = 5
Entonces
P
=P
X < 2 0,10
X < 1,61
2 0,10 = 1,61; Por lo tanto:
= 0,10
EJERCICIO Nº 1: Sea X una Variable Aleatoria
a) P
b) P
X < 7,564
X > 27,59
2
17 . Calcular:
=?
=?
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
87
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
c) P
6,408 < X > 27,59
=?
SOLUCION:
a) P X < 7,564 = P X < 2 0,025 = 0,025
b) P X > 27,59 = 1 - P X < 27,59 = 1 - P X <
c) P 6,408 < X > 27,59 = P X < 2 0,95 - P X <
2 0,95
20,01
= 1 - 0,95 = 0,05
= 0,95 - 0,01 = 0,94
EJERCICIO PARA RESOLVER EN CLASES:
1) Hallar:
a)
b)
c)
2
0,01
Si: r = 10
0,975
Si: r = 29
2
tal que P X < 2 = 0,99
2
Si: r = 4
EJERCICIO Nº 2: Si X es una Variable Aleatoria con una distribución
tal que:
P
a<X>b
= 0,95
y P
X<a
2
23 . Hallar a y b
= 0,025
SOLUCION:
P X < a = 11,69
P a < X > b = 0,95
P X < b - P X < a = 0,95
P X < b = 0,025 + 0,95 = 0,975
Entonces:
b = 38,08
4.15.
DISTRIBUCION T DE STUDENT:
DEFINICION:
* Sea Z una variable Aleatoria Normal con Media 0 y Varianza 1.
* Sea Y una Variable Aleatoria que tiene una distribución Chi-cuadrada con r grados de
libertad.
Si Z e Y son independientes, entonces la Variable Aleatoria T es igual a:
T
Z
Y
r
Z r
Y
se dice que tiene una distribución T de student o simplemente tiene una distribución T, con
r grados de libertad y su función de densidad está dada por:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
88
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
r 1
2
ft
r
2
r
t
1
r
Para todo: -
2
r 1
2
<t<
De la función de densidad f(t) podemos observar que la variable Aleatoria T está
completamente determinado sólo por el parámetro r. Entonces hay una distribución t
correspondiente a cada grado de libertad.
GRAFICA DE LA DISTRIBUCIÓN T DE STUDENT.
En la presente gráfica se presenta un bosquejo de la función de densidad de la Variable
aleatoria T, para diferentes grados de libertad r.
N(0,1)
n=5
n=3
0
-3
-2
-1
0
1
2
3
La distribución T de Student es muy similar a la distribución Normal Standard N (0,1), ya que
ambas varían de a + , son simétricas y centradas al rededor de t=0, es decir su
media es igual a cero, pero la distribución T tiene mayor dispersión que la distribución
Normal Standard.
Esto se observa de la varianza igual a:
2
y
r
r 2
= E(T) = 0
Entonces la Varianza de T es mayor que 1, la Varianza de la distribución T varía para
diferentes grados de libertad.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
89
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
La distribución t se aproxima a la Distribución Normal Standard cuando r es
suficientemente grande. En la práctica se trata a la distribución t como Normal N(0,1),
cuando n > 30.
2
Al igual que la distribución
, la distribución t de student está tabulada en la Tabla V,
donde podemos calcular, probabilidades para valores menores a un determinado punto.
Gráficamente, tenemos:
F(x)
tα
Ejemplo: Si r = 5, Calcular P
T < 1,476
= 0,90
EJERCICIO: Si r = 14 y p = 0,99, se lee x = 2,624
Es decir: P
X < 2,624
= 0,99
Esto mismo suele simbolizarse de la siguiente manera:
t0,99 (14) = 2,624
Ó
t0,95 (6) = 1,943 que equivale a : P X < 1,943 = 0,95
Por lo siguiente:
t = - t1NOTA: Si la probabilidad p es pequeña, también resulta posible utilizar la tabla, teniendo
presente que para la distribución t se verifica la siguiente identidad.
P T x = 1 - P T -x
Esto por el carácter simétrico de la distribución T.
EJEMPLO: Sea: r = 5 y p = 0,01 Entonces:
P X 2,602 = 0,99 entonces:
P
T
- 2,602
= 0,01
EJERCICIO PARA RESOLVER EN CLASES:
2
Sea T una variable Aleatoria que tiene una distribución t con Varianza
Calcular:
P
- 1,812 < T < 2,228
2
= 5/4.
= ?
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
90
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
TEMA Nº 5
ESTIMACION DE PARAMETROS POBLACIONALES
5.1 COMPETENCIA DE TEMA:
HABILIDAD: Infiere.
CONTENIDO: Parámetros poblacionales a partir de un estimador estadístico muestral
Haciendo hincapié en el método de estimación de máxima verosimilitud.
PROCESO:
Resolviendo casos reales planteados en el Proyecto de Curso.
CONTEXTO: En el aula y la comunidad.
5.2 INTRODUCCION: En innumerables casos, cuando se lleva adelante un proceso de
investigación, estamos interesados en conocer una medida de un conjunto de elementos
pertenecientes a una población en estudio. Por ejemplo, la media, la Desviación Standard, la
varianza, etc.
Existen una serie de factores que impiden conocer estas medidas si se quiere tomar en
cuenta a todos los elementos de una población, sea por que el número de componentes es
muy grande, lo que incide en los costos de obtención y elaboración de datos, sea por que
se requiere mayor tiempo para conseguir los resultados y muchas veces no es realmente
posible conseguir toda la información necesaria.
Sin embargo, todo ello no constituye obstáculo para poder obtener de una muestra tomada
aleatoriamente de la población, una medida que sea un buen estimador del valor de la
medida poblacional correspondiente. Se sabe, que no siempre es necesario tomar en cuenta
a todos los elementos de la población, ya que admitiendo un pequeño error se pueden
obtener casi
estimaciones exactas o muy cercano a los valores poblacionales.
Científicamente aquello es posible. Esta situación es fácilmente percatable de las
encuestas que unidades de investigación serias y neutrales realizan antes de las elecciones
nacionales en nuestro país, donde las estimaciones previas a las justas electorales son
ratificadas, con escaso margen de error, una vez concluido con el recuento o escrutinio de
votos.
5.3
METODOS DE ESTIMACION:
A través de la historia, los cientistas han desarrollado dos métodos de estimación:
a) La Estimación Puntual.
b) La estimación por intervalos.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
91
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
5.3.1
ESTIMACION PUNTUAL: La Estimación Puntual o de punto, es un modelo
estadístico que nos proporciona un valor único para estimar un parámetro desconocido de la
población, por Ej. Si se trata de estimar el salario promedio de los artesanos de una ciudad,
un valor como por Ej. Bs. 1,195,.., obtenido de una muestra, representa una estimación
puntual, por que hace referencia sólo a un dato.
Existen, a su vez, tres métodos que son los más conocidos para la estimación puntual de
parámetros:
* Método de Momentos.
* Método de máxima verosimilitud.
* Método Bayesiano.
En este curso nos abocaremos únicamente al método de Máxima verosimilitud por su
aplicabilidad general.
5.4
METODO PUNTUAL DE MAXIMA VEROSIMILITUD:
El Método de máxima Verosimilitud para generar estimadores de parámetros poblacionales
desconocidos, se basa sobre una muestra de una variable aleatoria.
Fue introducida por primera vez por R. A. Fisher.
estimadores.
Este método proporciona buenos
El Método de Máxima verosimilitud, establece que el valor de
debe ser tal, que la
probabilidad de observar lo que realmente se está observando sea máxima. es decir, que se
trata de hallar una estimación de
con la máxima probabilidad de que se obtenga el valor
de como una función de los elementos de una muestra aleatoria.
DEFINICION: Sea X una Variable aleatoria con función de densidad o cuantía f(x, ) que
depende del parámetro desconocido . Tomando una muestra aleatoria de X y sean: x1, x2,
x3,....., xn los valores muestrales observados. Entonces la Función de Máxima Verosimilitud
está definida por:
L( ) = fx(X1, ) . fx(X2, ) . fx(X3, )..............fx(Xn, )
ó
L
n
i 1
fx
Xi
Se trata ahora de maximizar la función L( );
L( ) = Max L(
)
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
92
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Para ello se deben cumplir las condiciones necesaria y suficientes:
L
1)
2
0
L
0
2)
2
EJEMPLO:
Sea X una Variable Aleatoria con distribución exponencial, cuya función de densidad es:
fx(x) =
. e- x
para todo x>0. Estimar el parámetro desconocido , si tomamos una
muestra aleatoria x1, x2, x3,......, xn de X, entonces la Función de Verosimilitud será:
n
L
n
fx X i ,
i 1
e
x
n
e
x
y 1
Aplicando logaritmos, se tiene:
Log L(
)
= n Log
-
x
Derivando la función L respecto a
dL
d
n
x
e igualando a cero, tenemos:
0
Despejamos luego
1
x
n
1
x
El estimador máximo verosímil de
es el inverso de la media muestral.
Así como se determinó el estimador Máximo verosímil de
de la función exponencial, por
el mismo método podemos obtener para todos las funciones de densidad y cuantía que
queramos. A continuación presentamos una tabla de estimadores de máxima verosimilitud
para algunas distribuciones más importantes:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
93
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
DISTRIBUCION
PARAMETRO
BERNOULLI
p
POISSON
=
EXPONENCIAL
=
ESTIMADOR DE
MAXIMA
VEROSIMILITUD O DE
MAXIMA PROBABILIDAD
p =
X
= X
1
X
= x
NORMAL
2
x X
n
2
EJERCICIO DE APLICACION:
Supongamos que se compra una docena de naranjas de cierta granja frutícola y se toman
sus pesos en onzas. Si la Variable Aleatoria X indica el peso de cada naranja de toda la
producción, entonces podemos considerar a x1, x2,..............., x12 como una muestra aleatoria
donde cada xi ( i= 1,2,3,........,12) nos indica el peso de la i-ésima naranja.
Efectuado los cálculos, se obtuvieron los siguientes resultados:
Peso total =
12
xi
= 66 onzas y,
i 1
12
Xi
2
385
Xi = 385 Onzas cuadradas.
Onzas cuadradas
i 1
Estimar el peso promedio y la desviación standard de la producción total, asumiendo que los
pesos tienen distribución Normal.
SOLUCION:
Sabemos por la tabla que los estimadores máximo verosímiles son:
X
y
2
Xi X
n
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
2
Cobija – Pando - Bolivia
94
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Y luego:
xi
n
X
y
66
12
Xi X
n
2
385 2 5,5 66
12
Luego:
2
1,83
5,5
xi
2
Onzas
x nX 2
2X
n
12 5,5
1,83
2
y
1,83
2
1,35
EJERCICIO PARA RESOLVER EN CLASES:
Se trata de estimar el tiempo de duración sin falla de tubos eléctricos de un stock
producido por una fábrica de artículos de alumbrado.
Sabemos o se sabe que el tiempo de duración en funcionamiento sin falla de este tipo de
artículos, tiene una distribución exponencial.
Para estimar el tiempo de duración medio sin falla, se toman aleatoriamente 30 tubos y se
ponen en funcionamiento.
Se asume, además, que se registraron todos los tiempos de duración sin falla y que se
obtuvo un total de 32,916 horas. Estimar el tiempo medio de duración sin falla a partir de
la muestra.
5.5
PROPIEDADES DE UN BUEN ESTIMADOR:
El parámetro se estima en base a un número que se calcula a partir de una muestra dada;
este valor calculado es una aproximación del valor exacto desconocido del parámetro.
Cuando proponemos a como un estimador puntual de , no esperamos que sea igual a
Recordemos que es una variable aleatoria y por lo tanto puede tomar muchos valores.
.
Como consecuencia, supongamos que 1 y 2 son dos estimadores de ; debemos encontrar
algún medio para decidir si una estimación es preferible a otra o que característica se
quiere que posea un buen estimador puntual.
PROPIEDADES: Un buen estimador debe ser:
a) Insesgado
b) Eficiente o de varianza mínima
c) Consistente.
a)
INSESGADO:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
95
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
es un estimador Insesgado de
si y solo si E(
)
=
EJEMPLO:
Supongamos que las edades de cuatro hermanos son; 2,5,8 y 13 respectivamente. Tomemos
todas las posibles muestras de tamaño 2, de manera que la probabilidad de elegir una
muestra cualquiera es de 1/6 para todos los casos. Si estamos interesados en medir la
edad media, entonces las medias muestrales posibles son:
(2,5) (2,8) (2,13) (5,8) (5,13) (8,13)
2 5
2
X1
Luego:
EX
2 8
5
X 3 7,5
2
1
1
1
4
1
1
3,5
5
7,5
6,5
9
10,5
7
6
6
6
6
6
6
3,5
X2
X4
6,5
X5
9
X6
10,5
Además sabemos que:
2 5 8 13
4
Ex
7
El estimador
es Insesgado de
b) PROPIEDAD DE EFICIENCIA:
Sean 1 y 2 estimadores insesgados de , para la misma muestra, Entonces
es más
eficiente que , como estimadores de , si y solo si, V( 1) < V( ), Entonces el de menor
varianza es el estimador más eficiente.
c) PROPIEDAD DE CONSISTENCIA:
Un estimador es consistente, cuando se cumple el siguiente requisito:
Sean
1,
2
, ..........,
n
una sucesión de estimadores de
, donde :
1 es un estimador obtenido de una muestra aleatoria de tamaño 1
2 es u estimador obtenido de una muestra aleatoria de tamaño 2
n es un estimador obtenido de una muestra aleatoria de tamaño n
Entonces, se dice que n es un estimador consistente de si:
Lím E n
a)
n
b)
5.6.
Lím V
n
n
0
ESTIMACIÓN DE INTERVALOS DE CONFIANZA
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
96
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
La estimación puntual de un parámetro, si bien es muy útil, no resulta de mucho valor si no
se tiene alguna medida del posible error cometido en la estimación. Toda estimación de un
parámetro desconocido debería acompañarse de un cierto intervalo que incluyera a , por
ejemplo de la forma: ( - k ;
+ k), junto con alguna medida de seguridad de que el
verdadero valor del parámetro estuviera comprendido dentro de dicho intervalo.
De manera que es mucho más satisfactoria y eficaz la determinación de un “intervalo
aleatorio” en el cual esté comprendido el verdadero valor del parámetro desconocido con
una probabilidad próxima a uno. Un intervalo tal, recibe el nombre de INTERVALO DE
CONFIANZA, en tanto que a los valores extremos del intervalo, se los designa límites
confidenciales o límites de confianza.
5.6.1. DEFINICIÓN
2
Sea X una variable aleatoria que tiene distribución N(µ, σ ), donde σ2 se supone conocida,
mientras que µ es el parámetro desconocido. Sea: X1, X2, X3,………,Xn una muestra
aleatoria de X y x el promedio muestral.
Sabemos que X tiene distribución normal N(µ, σ/√n). Por tanto, Z=(x - µ/ σ/√n) tiene una
distribución Normal (0,1).
Los dos estadísticos Li y Ls (Límite superior e inferior) forma un intervalo confidencial de (
1 – α ) = 100 %:
P (Li ≤
≤ Ls) ≥ 1 – α
Sin importar cuál sea el valor desconocido de .
Ejemplo:
Supongamos que el número de onzas de mermelada que una máquina envasa en un frasco de
vidrio es una variable aleatoria NORMAL con media µ desconocida y cuya desviación
estándar es de 0,5 la onza. Si seleccionamos aleatoriamente n frascos envasados por dicha
máquina y si X1, X2, …..Xn son los números de onzas que contienen, respectivamente cada
uno de los n frascos; entonces x es una v.a. normal con media µ y desviación estándar 0,5/ √
n. De una tabla de distribución de probabilidades Normal, sabemos que:
P ( - 1,96 ≤ Z
≤ 1,96 ) = 0,95
Donde Z es una v.a. Normal Estándar. Pero para nuestra muestra:
X -µ
0,5 √ n
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
97
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
De este modo:
P( - 1,96 ≤ X - µ ≤ 1,96 ) = 0,95
0,5 √ n
Entonces:
P{ X – (1,96) 0,5 ≤ µ ≤ X + (1,96 ) 0,5 } = 0,95
√n
√n
Luego:
Li =
X
Ls =
X
- (1,96) 0,5
√n
+ (1,96) 0,5
√n
Forman un intervalo confidencial del 95 % para µ. Si se observan los pesos de 75 frascos y
se halla que X = 12,1 los valores de Li y Ls serán:
Li = 12,1 - (1,96) 0,5 = 11,99
√ 75
Ls = 12,1 + (1,96) 0,5 = 12,21
√ 75
Entonces podemos decir que estos límites 11,99 y 12,21 contienen el valor del parámetro
verdadero, o sea que el verdadero promedio de contenido en onzas de mermelada en los
frascos llenados por dicha máquina, está comprendido en intervalo (11,99 y 12,21) con una
seguridad del 95 %.
Entonces:
P( 11,99 ≤ µ ≤ 12,21 ) = 0,95
Que significan la probabilidad de que el intervalo aleatorio x – 0,11 a x + 0,11 contenga a la
media verdadera µ es 0,95. Esto es, si se extraen repetidamente muestras de tamaño 75, y
si se calcula para cada muestra el intervalo aleatorio X – 0,11 a X + 0,11, es de esperar que
el 95 % de estos intervalos contengan la media verdadera µ. Tenemos pues, una gran
confianza de que el intervalo 11,99 a 12,21 cubra la media verdadera. Es posible obtener
intervalos con cualquier grado de confianza. En nuestro ejemplo, si se desea obtener un
intervalo confidencial del 99 %, será:
P( - 2,58 ≤ z ≤ 2,58 = 0,99
3.6.
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL
CASO 1) Con σ conocido:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
98
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Sea
donde µ es desconocido y σ conocido.
Sea x1, x2, ... , xn una muestra aleatoria de la variable aleatoria X y sea
muestral.
Se sabe que
límite.
la media
independientemente del valor de n, por el teorema central del
Luego, tipificando:
Se plantea:
entonces:
Observaciones:
- Si las muestras se toman sin reposición de una población finita de tamaño N, debe
emplearse el factor de corrección por finitud y el intervalo será:
- Si la población es sólo aproximadamente normal, la igualdad sigue siendo válida en forma
aproximada.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
99
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Ejemplo 1: Un grupo de investigadores en Medicina desea estimar el cambio medio de
presión sanguínea por paciente en un sanatorio. Se ha seleccionado una muestra al azar de
30 pacientes y se halló que
puls/seg. Los investigadores saben que la desviación
estándar de los cambios de presión sanguínea para todos los pacientes es σ = 3 puls/seg
según estudios anteriores. Ellos desean estimar el cambio medio de la presión sanguínea por
paciente con un intervalo del 95% de confianza, suponiendo que la variable aleatoria
"cambios de presión sanguínea" tiene asociada una distribución normal de probabilidad.
Respuesta:
X = cambio en la presión sanguínea por paciente del sanatorio (en pulsaciones por segundo)
n = 30
σ = 3 1 - ά = 0.95
Por tabla:
Entonces:
Límite inferior (LI) =
Límite superior (LS) =
Por lo tanto resulta el Intervalo del 95% de confianza para la media:
ICM0,95 = (3,9 ; 6,1)
Luego, puede decirse que el cambio medio en la presión sanguínea por paciente, pertenece al
intervalo (3,9 ; 6,1) pulsaciones, con un nivel de confianza del 95%.
Observación: Nótese que se cae en un abuso de lenguaje pues se debería decir que el
intervalo (3,9 ; 6,1) pulsaciones pertenece a la sucesión que ofrece un nivel de confianza del
95% para estimar el cambio medio de presión sanguínea, pero se simplifica la expresión
para hacerla menos engorrosa o extensa.
En cuanto al tamaño óptimo de muestra,
= e determina el error máximo admitido de
muestreo e indica la precisión de la estimación. Lógicamente se pretende que sea lo más
pequeño posible. Por otra parte, (1 - ά ) es el coeficiente de confianza y se pretende que
sea lo más grande posible. Pero
depende del valor de ά y al hacer mayor el coeficiente
de confianza (1 - ά ), el valor
será mayor y por lo tanto el error aumentará. Esto se
puede regular aumentando el tamaño de la muestra con lo que el error disminuirá.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
100
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Para el ejemplo 1,
con un nivel de confianza del 95%.
Si se desea elevar el nivel de confianza a 99%, pero sin aumentar el error e de estimación,
el tamaño de la muestra debería ser:
O sea que debe tomarse una muestra de aproximadamente 52 pacientes en lugar de 30.
Por el contrario, si el investigador deseara un error de estimación menor, por ejemplo 1
puls/seg, manteniendo el nivel de confianza en 95%, el tamaño de la muestra requerido
será:
pacientes.
CASO 2) Con σ desconocido
Para estimar σ se debe utilizar el desvío estándar muestral corregido.
, ya que según se ha visto, es un estimador insesgado del correspondiente
parámetro poblacional σ . Reemplazando en la variable tipificada
por
resulta:
Por lo tanto:
=1-ά
Ejemplo 2: Una muestra de 15 aves tomadas al azar en un establecimiento con 5000 aves,
(que elabora alimentos balanceados), permitió establecer un aumento de peso promedio de
90 g por semana y por ave, y un desvío típico de 10 g. Se busca estimar el incremento de
peso promedio para las 5000 aves del establecimiento con un intervalo de confianza del
90%.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
101
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Respuesta:
X = aumento de peso por ave
n = 15
= 90 g S = 10 g ¿ICM0,90?
Por tabla:
y el intervalo resulta:
Interpretando este resultado, se dice que el aumento de peso por ave por semana en el
establecimiento está entre 85,5 y 94,6 gramos, con un 90% de confianza.
3.7.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
CASO 1: Poblaciones normales
y
con
y
conocidos.
Se fija el nivel de confianza (1 - ά ), se extraen dos muestras independientes de X1 y X2
de tamaño n. Ya se ha visto que:
y el estadístico tipificado tiene la siguiente distribución:
(1)
Además,
(2)
Reemplazando en (2), a Z por la expresión (1), se obtiene:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
102
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Donde:
Ejemplo 3: Al determinar la superficie en miles de hectáreas de las explotaciones agrícologanaderas de cierta zona, una muestra de 40 explotaciones dio una superficie media de 900
ha, con una desviación típica de 300 ha. En otra zona, al muestrear también 40
explotaciones, la superficie media fue de 600 ha con una desviación típica de 150 ha.
Suponiendo que en ambas zonas la variable "superficie en ha por explotación" se distribuye
normalmente, estimar por un intervalo de confianza del 90%, la diferencia entre las
superficies medias de las explotaciones de ambas zonas.
Respuesta:
X1 = superficie de cada explotación agrop. de la primera zona
X2 = superficie de cada explotación agrop. de la segunda zona
,
Por tabla:
n = 40 ¿ICDM0,90?
Luego:
=
= 300 ± 87,24 = (212,76 ; 387,24) = (212,8 ; 387,2)
Interpretando este resultado, se dice que la diferencia entre las superficies medias de las
explotaciones agrícola-ganaderas de ambas zonas, se encuentra entre 212,8 y 387,2 ha, con
un 90% de confianza.
Observación: En la fórmula también puede utilizarse
considerarse
y en ese caso debe
en lugar de
CASO 2: Poblaciones normales
y
con
y
desconocidos
Se extraen dos muestras independientes (una de cada población) de tamaños n1 y n2
respectivamente, se fija (1 - α ), se calculan
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
y
su diferencia.
Cobija – Pando - Bolivia
103
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
a) Si σ
1
y σ
2
son desconocidos pero estadísticamente pueden considerares iguales (σ
σ2), se estiman por
amalgamada o mancomunada)
b) Si σ 1 y σ
σ 2),
2
1
=
y se procede como en el caso 1. (Sa es la variancia
son desconocidos pero estadísticamente no pueden considerarse iguales (σ 1 ≠
Se fija (1 - ±), se extraen dos muestras independientes, se calcula
distribución en el muestreo del estadístico de prueba, ya tipificado, es:
y la
donde el número de grados de libertad de la distribución t de Student viene dado por la
fórmula:
De manera análoga al primer caso, se deduce que:
Ejemplo 4: Las variables aleatorias X1 y X2 distribuidas normalmente, representan las
edades al morir de tuberculosis de los individuos en dos ciudades. Una muestra de 10
individuos que murieron por tal enfermedad en la primera ciudad dio una edad media de 48
años y una desviación típica de 5 años. En la segunda ciudad, una muestra de 12 individuos
dio una edad media de 41 años y una desviación típica de 3 años. Se desea estimar por
intervalos con un 95% de confianza, la diferencia entre las edades medias de los muertos
por tuberculosis en ambas ciudades, sabiendo que investigaciones anteriores no permiten
tomar las desviaciones típicas de ambas variables como iguales.
X1 = edad al morir de tuberculosis en la ciudad A.
X2 = edad al morir de tuberculosis en la ciudad B.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
104
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
n1 = 10,
, S1 = 5
n2 = 12,
, S2 = 3, σ 1 ≠ σ 2 ¿ICDM0,95?
Respuesta:(corresponde al item b) del caso 2)
Con estos datos, reemplazamos en la fórmula para calcular los grados de libertad:
grados de libertad.
Luego, por tabla, t0,05; 15 = 2,1315 y finalmente el intervalo resulta:
ICDM0,95 =
= 7 ± 3,843 = (3,157; 10,843) ~ (3 ; 11)
Interpretando el resultado se puede decir que la diferencia entre las edades medias de las
personas que murieron de tuberculosis en ambas ciudades, se encuentra entre 3 y 11 años,
con una confianza del 95%.
3.8.
INTERVALO DE CONFIANZA PARA LA VARIANCIA POBLACIONAL
Suponemos: Población normal X ~ N( µ , σ )
Se fija (1 - ±) y el estadístico tipificado de prueba tiene una distribución muestral:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
105
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
(1) donde Ã2 es la variancia poblacional.
Además:
(2)
Reemplazando (1) en (2) resulta:
Invirtiendo fracciones:
Multiplicando miembro a miembro por (n - 1) .S2 para despejar Ã2, se obtiene:
Invirtiendo la desigualdad:
Ejemplo 5: Un productor de fertilizantes, para controlar el buen embolsado de sus
productos, pesa 15 bolsas del mismo, obteniendo una desviación típica de 0,50 kg. ¿Qué
varianza puede inferirse con un 98% de confianza que tendrá la producción total?
Respuesta:
X = peso de cada bolsa de fertilizante
n = 15 S = 0,50 kg. ¿ICV0,98?
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
106
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Por tabla:
Luego, el intervalo buscado es:
Se interpreta este resultado diciendo que existe un 98% de confianza de que la variancia
del peso por bolsa en toda la producción de bolsas de fertilizantes de ese productor esté
entre 0,12 y 0,75
Observaciones:
1) Del intervalo de confianza visto para la variancia, se deduce el correspondiente para el
desvío típico:
Para el ejemplo 5:
2) Si n > 100 , los valores ya no se encuentran en la tabla de la distribución Chi cuadrado, y
por lo tanto se la aproxima a una normal,
utilizando para aproximar percentiles en esta distribución:
Luego, el intervalo buscado es:
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
107
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
TEMA No 6
PRUEBAS DE HIPÓTESIS
COMPETENCIA DE TEMA:
HABILIDAD:
Aplica
CONTENIDO:
Las pruebas de hipótesis para la toma de decisiones en situaciones
de incertidumbre.
PROCESO:
Resolviendo casos reales planteados en el proyecto de curso.
CONTEXTO:
En el aula y la comunidad.
4.1. DEFINICIÓN.- Una hipótesis estadística es una afirmación o conjetura que
se hace acerca de la distribución de una o más poblaciones. Las hipótesis
estadísticas se pueden contrastar con la información extraída de las muestras, con
el propósito de saber si los resultados de la muestra, contradicen o no a tal
conjetura.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se
representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).
4.2. TIPOS DE PRUEBAS DE HIPÓTESIS
El tipo de prueba depende básicamente de la hipótesis alternativa (o alterna) H1.
Se denomina prueba de una cola a toda prueba de hipótesis donde la alternativa H1
es unilateral. Si la alternativa es bilateral, la prueba se denomina prueba de dos
colas. Entonces, tenemos las siguientes situaciones:
1)
Ho : θ = θo
y
H1: θ ≠ θo
De dos colas o bilateral
2)
Ho : θ ≤ θo
y
H1: θ > θo
De una cola unilateral derecha
3)
Ho : θ ≥ θo
y
H1: θ < θo
De una cola unilateral izquierda
4.3. ERRORES DE TIPO I Y II, Y NIVEL DE SIGNIFICACIÓN
Se denomina error de tipo I, al error que se comete al rechazar una hipótesis nula
Ho, cuando ésta es realmente VERDADERA.
Se denomina error de tipo II, al error que se comete al aceptar una hipótesis nula
Ho, cuándo en realidad es FALSA.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
108
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Nivel de significación: La probabilidad e cometer un error de tipo I se denota por
α. Entonces:
α = P(error de tipo I) = P(rechazar Ho cuando Ho es verdadera)
La probabilidad de cometer un error de tipo II, se denota por β. Entonces:
β = P(error de tipo II) = P(aceptar Ho cuando Ho es Falsa)
Se denomina Nivel de significación de una prueba de hipótesis a la probabilidad de
cometer un error de tipo I.
4.4. POTENCIA DE UNA PRUEBA
La potencia de una prueba se define como la probabilidad de rechazar Ho cuándo es
realmente FALSA, o de aceptar H1 cuando ésta es VERDADERA. La potencia de una
prueba es calculada por 1 – β.
El nivel de significación se fija previamente por lo general en α = 0,05 ó α = 0,01. En
la vida real ocurre que, cuanto menos es la posibilidad de alcanzar una meta
perseguida, cuanto más es la satisfacción si se la alcanza. En estadística ocurre algo
análogo; así, tanto más grande sea el riesgo que se corre en una prueba, tanto más
significativo será el resultado del experimento si coincide con lo esperado. Por
ejemplo, si con α = 0,05 se llega a rechazar Ho, diremos que los resultados
maestrales son significativamente diferentes de Ho. Por esto, cuando la hipótesis
nula se rechaza con un nivel de significación del 5 %, se dice que el resultado de la
prueba es significativo; y es más, si se rechaza Ho con α = 0,01 se dice que el
resultado de la prueba es altamente significativo.
El concepto nivel de significación se usa para señalar que una prueba estadística
evalúa la “significación” de la diferencia entre el valor hipotético de un parámetro
comparado con el resultado de la muestra.
4.5. REGIÓN CRÍTICA Y REGLA DE DECISIÓN
Una vez planteada la hipótesis nula Ho y la hipótesis alterna H1, referidas a un
parámetro θ, y especificado el nivel de significación α de la prueba Ho contra H1, se
deberá determinar una estadística ( o estadígrafo) Ф correspondiente al
parámetro, cuya distribución muestral se conozca. Por ejemplo, si la si las Ho y H1
se expresan en términos de la media poblacional (µ), entonces se seleccionará la
media muestral ( ) como la estadística apropiada para efectuar la prueba. Si se
supone que la Ho: θ = θo es verdadera; entonces, la distribución de probabilidad de
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia
109
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
la estadística (Ф) queda bien definida por esta hipótesis, ya que esta hipótesis
especifica completamente la distribución.
En la distribución de probabilidad fijada por la hipótesis Ho: θ = θo se establece la
regla de decisión de acuerdo con la cual se rechazará o por el contrario se
aceptará la hipótesis Ho. El rechazo de la hipótesis nula Ho implica la aceptación de
H1.
La regla de decisión implica la división de la distribución muestral del
estadístico (Ф) de la prueba en dos partes mutuamente excluyentes: La región
de rechazo o región crítica (RC) de Ho, y la región de aceptación (RA) o no
rechazo de Ho. Esta división depende de H1, del nivel de significación (α) y de
la distribución del estadístico.
Ejemplo práctico: Supongamos que se tiene una población normal N(µ,9) con varianza
conocida σ2 = 9 y que se trata de probar la hipótesis nula Ho: µ = 70 contra H1: µ >
70. Dado que
es un buen estimador de µ utilizaremos esta estadística para
determinar la región crítica y la región de decisión de esta prueba. Puesto que
estamos interesados en la discriminación entre µ = 70 y los valores de µ >70, parece
razonable que debamos rechazar Ho si - 70 es muy grande, esto es si
> K,
siendo K un valor crítico que vamos a determinar.
Si se supone verdadera la hipótesis Ho: µ = 70, entonces la distribución de la media
es normal con media µ = 70 y desviación estándar σ = 3. En consecuencia, la
distribución de:
Z=
- 70
3/√n
Es normal N(0,1). Para una muestra aleatoria de tamaño n = 40 y la probabilidad de
error de tipo I, α = 0,05 se tiene:
0,05 = P (
-70 > K-70) = P [ Z > k -70]
3/√n
3/√n
0,474
De la tabla normal N(0,1) se obtiene:
K – 70 = 1,645
Luego k = 70 + 1,645x0,474 = 70,78
0,474
Por lo tanto, la región crítica en el rango de la variación de
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
es el intervalo:
Cobija – Pando - Bolivia
110
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
RC = [ 70,78; + ∞ ]
La regla de decisión establece que: Si x es el valor de
obtenido a partir de la
muestra aleatoria de tamaño 40, se rechazará Ho si x > 70,78.
4.6. PROCEDIMIENTO DE LA PRUEBA DE HIPOTESIS
Los pasos generales para efectuar una prueba de hipótesis, son las siguientes:
1) Formular Ho y H1.
2) Prueba estadística
3) Nivel de significación
4) Distribución muestral
5) Región de rechazo
6) Toma de decisiones.
Ejemplo: Se conoce que un cierto proceso de manufactura utilizado en una fábrica,
rinde una producción promedio de 155 unidades por hora, con una desviación
estándar de 8 unidades. Aparece en el mercado un nuevo tipo de máquina que realiza
el mismo producto. El gerente de la fábrica estima que si el rendimiento de
producción de las nuevas máquinas es en promedio mayor que 155 unidades/hora,
éstas deberían comprarse no obstante de ser más caras. Se experimenta con 35
máquinas del nuevo tipo, con miras a utilizarlas en el proceso de manufactura, en
lugar de las antiguas. La decisión final se hará de acuerdo al procedimiento de toma
de decisiones visto.
SOLUCIÓN
1.- Hipótesis de Nulidad.- Asumamos que el gerente está inclinado a creer que el
promedio de producción es mayor que 155 y que quiere evitar la posibilidad de
cometer el error de comprarlas cuando en realidad no sería conveniente hacerlo;
entonces las hipótesis son:
Ho: µ = 155 unidades/hora
H1: µ > 155 unidades/hora
2.- Prueba estadística. Para este caso el estadístico de prueba más adecuado es:
z=
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
- µo
σx
Cobija – Pando - Bolivia
111
UNIVERSIDAD AMAZÓNICA DE PANDO
PROGRAMA DE ADMINISTRACIÓN DE EMPRESAS
Donde z tiene distribución Normal Estándar.
3.- Nivel de significación. En este caso rechazar la hipótesis nula si es verdadera
conduciría a serias consecuencias, puesto que se tomaría la acción equivocada de
comprar máquinas más costosas siendo así que la producción promedio no diferirá
mayormente de las que actualmente se están usando. A fin de prever una decisión
errada como ésta, el gerente decide utilizar un nivel de significación de α = 0,01,
ósea una probabilidad pequeña de rechazar Ho siendo verdadera.
4.- Distribución Muestral. Supongamos que las 35 máquinas (N=35) del nuevo tipo,
constituyen una muestra aleatoria, y que se ha obtenido una producción media de
=160 unidades por hora. Por otro lado, asumamos que la σx al de las máquinas
antiguas, entonces con N=35, tenemos:
Tenemos:
σx = 8/√35= 1,35
Luego:
z= 160 – 155/1,35 = 3,7
5.- Región de rechazo. Para α=0,01 y para una prueba de extremo derecho, la
regla de decisión es: Rechazar Ho siempre y cuando z > 2,33, en otro caso, aceptar
Ho.(Recurrir a la tabla A).
6.- Decisión. Como z = 3,7 > 2,33 entonces z cae dentro de la región de rechazo,
por tanto se rechaza Ho, lo que implica aceptar H1. Por tanto, es recomendable
comprar las nuevas máquinas y para utilizarlas en lugar de las de tipo antiguo.
TEXTO GUÍA DE ESTADISTICA Y PROBABILIDADES II
Preparado por el Lic. René Mamani Quisbert
Cobija – Pando - Bolivia