Download Probabilidades y Estadistica

Document related concepts
no text concepts found
Transcript
REPÚBLICA BOLIVARIANA DE VENEZUELA
UNIVERSIDAD EXPERIMENTAL POLITÉCNICA
DE LA FUERZA ARMADA NACIONAL
(UNEFA)
Probabilidades y
Estadística
Ing° Luis Castellanos MSc
UNEFA. Probabilidades y Estadística.
ii
Índice
1
INTRODUCCIÓN A LA ESTADÍSTICA.......................................................................................................1
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
1.10
1.11
1.12
1.13
2
TEOREMAS DE PROBABILIDADES. ......................................................................................................10
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3
DEFINICIONES VARIAS. ..........................................................................................................................26
PROPIEDADES O LEYES DE LA ESPERANZA MATEMÁTICA.........................................................................27
VARIANZA DE UNA VARIABLE ALEATORIA.................................................................................................27
TEOREMA DE CHEBYSHEV. ....................................................................................................................28
EJERCICIOS. .........................................................................................................................................29
DISTRIBUCIONES DE PROBABILIDAD..................................................................................................31
5.1
5.2
5.3
5.4
6
DEFINICIONES VARIAS............................................................................................................................21
FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA. ..........................22
DISTRIBUCIÓN ACUMULATIVA DE UNA VARIABLE ALEATORIA DISCRETA ....................................................22
FUNCIÓN O DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE...............................................................23
DISTRIBUCIÓN ACUMULATIVA DE UNA VARIABLE ALEATORIA CONTINUA....................................................24
EJERCICIOS. .........................................................................................................................................24
ESPERANZA MATEMÁTICA....................................................................................................................26
4.1
4.2
4.3
4.4
4.5
5
DEFINICIONES. ......................................................................................................................................10
PRINCIPIO DE ENUMERACIÓN O CONTEO. ...............................................................................................12
PRINCIPIO DE ADICIÓN ...........................................................................................................................13
PROBABILIDAD DE UN EVENTO ...............................................................................................................15
TEOREMA DE PROBABILIDAD COMPLETA (TEOREMA ADITIVO):.................................................................16
TEOREMA DE PROBABILIDAD COMPUESTA (TEOREMA DE MULTIPLICACIÓN)..............................................16
PROBABILIDAD CONDICIONAL .................................................................................................................17
TEOREMA DE BAYES ..............................................................................................................................18
EJERCICIOS ..........................................................................................................................................19
VARIABLE ALEATORIA Y FUNCIÓN DE PROBABILIDADES. .............................................................21
3.1
3.2
3.3
3.4
3.5
3.6
4
DEFINICIÓN DE ESTADÍSTICA. ...................................................................................................................1
DIVISIÓN DE MÉTODOS ESTADÍSTICOS......................................................................................................1
MEDIDAS USADAS EN LA ESTADÍSTICA DESCRIPTIVA ..................................................................................1
MEDIDAS USADAS EN ESTADÍSTICA INDUCTIVA: .........................................................................................2
MEDIDAS USADAS EN MÉTODOS COMPLEJOS ............................................................................................2
PASOS PARA SEGUIR EN UN MÉTODO ESTADÍSTICO ...................................................................................2
MÉTODOS DE RECOLECCIÓN DE DATOS ...................................................................................................2
POBLACIÓN Y MUESTRA ...........................................................................................................................2
DISTRIBUCIÓN DE FRECUENCIAS ..............................................................................................................3
GRÁFICAS DE FRECUENCIAS ....................................................................................................................5
ESTADÍSTICOS IMPORTANTES ...................................................................................................................6
RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODO EN UN POLÍGONO DE FRECUENCIAS ...................................8
EJERCICIOS ............................................................................................................................................9
DISTRIBUCIÓN BINOMIAL........................................................................................................................31
DISTRIBUCIÓN DE POISSON ....................................................................................................................32
DISTRIBUCIÓN NORMAL .........................................................................................................................33
EJERCICIOS ..........................................................................................................................................35
DISTRIBUCIÓN EN EL MUESTREO ........................................................................................................38
6.1
6.2
6.3
6.4
TEORÍA DEL MUESTREO .........................................................................................................................38
DISTRIBUCIÓN MUESTRAL DE MEDIA ARITMÉTICA....................................................................................42
DISTRIBUCIÓN MUESTRAL DE MEDIA ARITMÉTICA CON DOS MUESTRAS ...................................................42
DISTRIBUCIÓN MUESTRAL χ2 / CHI 2 / JI 2 ................................................................................................43
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
6.5
6.6
6.7
7
iii
DISTRIBUCIÓN “T” DE STUDENT ..............................................................................................................43
DISTRIBUCIÓN F (DE FISCHER)...............................................................................................................45
EJERCICIOS ..........................................................................................................................................46
TEORÍA DE LA ESTIMACIÓN ..................................................................................................................47
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
8
GENERALIDADES. ..................................................................................................................................47
ESTIMACIÓN PUNTUAL O LOCAL .............................................................................................................47
ESTIMACIÓN POR INTERVALOS ...............................................................................................................48
ERROR MUESTRAL ................................................................................................................................48
ESTIMACIÓN DE LA MEDIA ......................................................................................................................49
¿CÓMO SE CALCULA EL TAMAÑO DE UNA MUESTRA?...............................................................................50
LÍMITE DE TOLERANCIA ..........................................................................................................................51
DISTINCIÓN ENTRE LÍMITES DE CONFIANZA Y LÍMITES DE TOLERANCIA .....................................................52
ESTIMACIÓN DE LA VARIANZA .................................................................................................................52
EJERCICIOS ..........................................................................................................................................52
ENSAYOS DE HIPÓTESIS Y SIGNIFICACIÓN........................................................................................54
8.1
8.2
8.3
8.4
8.5
9
HIPÓTESIS ESTADÍSTICA ........................................................................................................................54
HIPÓTESIS NULA (H0) ............................................................................................................................54
PRUEBA DE HIPÓTESIS ESTADÍSTICA ......................................................................................................54
PRUEBA DE MEDIAS Y VARIANZAS ..........................................................................................................57
EJERCICIOS ..........................................................................................................................................59
ANÁLISIS DE CORRELACIÓN Y REGRESIÓN ......................................................................................61
9.1
9.2
9.3
ANÁLISIS DE REGRESIÓN PARA DOS VARIABLES.......................................................................................61
ANÁLISIS DE CORRELACIÓN PARA DOS VARIABLES ...................................................................................64
EJERCICIOS ..........................................................................................................................................66
10
BIBLIOGRAFÍA......................................................................................................................................68
11
ANEXOS.................................................................................................................................................69
11.1
11.2
11.3
11.4
11.5
ÁREAS BAJO LA CURVA NORMAL ............................................................................................................69
VALORES CRÍTICOS DE LA DISTRIBUCIÓN Χ2............................................................................................70
VALORES CRÍTICOS DE LA DISTRIBUCIÓN T .............................................................................................71
SUMAS DE DISTRIBUCIÓN BINOMIAL .......................................................................................................72
FACTORES DE TOLERANCIA PARA DISTRIBUCIONES NORMALES ...............................................................73
[email protected]
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
1
1 Introducción a la Estadística
1.1
Definición de Estadística.
•
Técnica especial apta para el estudio cuantitativo de los fenómenos de masa
o colectivos, cuya medición requiere una masa de observaciones de otros
fenómenos (Conrado Gini)
•
Ciencia que trata de la recolección, clasificación y presentación de los
hechos sujetos a una apreciación numérica como base a la explicación,
descripción y comparación de un fenómeno (G. Vany Yule)
•
Basa sus leyes, no en el estudio de una observación aislada o individual,
sino en el estudio de un gran número de observaciones.
•
Dato Estadístico: aquel que mide un fenómeno colectivo (Tasa de
Mortalidad de Venezuela en últimos 10 años, Producción de Petróleo en
Venezuela durante los últimos 5 años, etc.).
1.2
División de Métodos Estadísticos.
•
Métodos Descriptivos (o Estadística Descriptiva): resumen o condensan
todos los datos de una serie de valores para describir determinados aspectos de
la serie.
•
Métodos Inductivos (o Estadística Inferencial): tratan de estimar las
características del universo estadístico o población total a través del estudio de
una parte de ese universo.
•
Métodos Simples: se refieren al estudio de una sola característica o variable.
•
Métodos Complejos: se refieren al estudio de dos o más características o
variables, determinando la relación entre ellas.
1.3
Medidas usadas en la Estadística Descriptiva
•
Razones, tasas y porcentajes
•
Distribución de frecuencias
•
Medidas de Tendencia Central (Media, Mediana, Modo)
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
1.4
1.5
1.6
1.7
1.8
•
Medidas de Dispersión (Desviación cuartel, quintil, decil, percentil)
•
Momentos, Asimetría, Kurtosis
2
Medidas usadas en Estadística Inductiva:
•
Probabilidades
•
Distribuciones
•
Pruebas de Significación
Medidas usadas en Métodos Complejos
•
Dispersión
•
Correlación
•
Regresión
Pasos para seguir en un Método Estadístico
•
Formulación del Problema
•
Desarrollo del Método de Recolección de Datos
•
Recolección de Datos
•
Clasificación de Datos
•
Análisis Estadístico
•
Presentación de Resultados
•
Interpretación de los Resultados
Métodos de Recolección de Datos
•
Entrevista Personal
•
Cuestionario
•
Observación Directa
•
Experimentos Estadísticos
Población y Muestra
•
Población: conjunto de individuos, objetos o cosas que se van a analizar. Es el
Universo Estadístico. Es el TODO. Puede ser:
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
3
o Finita: se pueden contar todos sus elementos
o Infinita: el número de elementos es ilimitado.
•
Muestra: parte representativa de la población. Puede ser:
o Probabilística: sus elementos tienen una probabilidad conocida y no nula
de ser seleccionados usando un método de selección aleatorio.
o No Probabilística: sus elementos son escogidos de acuerdo al criterio del
investigador y no al azar.
•
Estudio Poblacional: análisis deductivo. Lo que es válido para el todo, es
válido para uno.
•
Estudio Muestral: análisis deductivo. Lo que es válido para uno, podría ser
válido para el todo.
1.9
Distribución de Frecuencias
• Componentes:
o Intervalo Total (o Rango): diferencia entre Límite Superior y el Límite
Inferior. (IT)
o Clases: fraccionamiento de la amplitud total o Rango.
o Intervalo de Clase: diferencia entre los Límites Inferior y Superior de una
Clase. (IC)
o Punto Medio del Intervalo de Clase. (xi)
o Frecuencia de Clase: número de casos en que la variable está
comprendida entre los límites de una clase. (fi)
•
Organización:
o Determinar el Intervalo Total
•
IT = LS - LI
o Determinar el número de Clases (se recomiendan entre 3 y 25)
o Determinar el Intervalo de Clase
IC =
IT
N º Clases
IC =
IT
1 + 3,322 x log n
(Ecuación de Sturges)
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
4
o Determinar Límites de Clase, de acuerdo a los IC definidos.
Series Discretas
Series Continuas
10 – 19
10 – 19,99
20 – 29
20 – 29,99
30 – 39
30 – 39,99
o Determinar las frecuencias: registrar el número de datos u ocurrencias en
cada clase.
•
Ejemplo:
o Agrupar en Distribución de Frecuencias las notas obtenidas por la
Sección J en Matemática II:
•
16, 8, 6, 10, 12, 10, 10, 10, 11, 7, 10, 8, 14, 10, 11, 11, 8, 17, 8, 6,
10, 2, 10.
Se recomienda primero ordenar los datos:
2, 6, 6, 7, 8, 8, 8, 8, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 12,
14, 16, 17.
n=3
IT = LS - LI Æ IT = 17 – 2 Æ IT = 15
IC =
IT
15
→ IC =
→ I C = 2,72 → I C = 3
1 + 3,322 x log n
1 + 3,322 x log 23
Sin embargo, se recomienda tomar IC = 4, para que se incluya en
el Límite Inferior de la primera clase, el número menor, y en el Límite
Superior de la última clase, el número mayor.
Frecuencia
Clases
Punto Medio
Frecuencia
2–5
3,5
1
1
6–9
7,5
7
8
10 – 13
11,5
12
20
14 – 17
15,5
3
23
Ing° Luis Castellanos (Versión 1.20)
Acumulada
UNEFA. Probabilidades y Estadística.
5
1.10 Gráficas de Frecuencias
•
Polígono de Frecuencias: diagrama de líneas que representa los puntos
medios y sus respectivas frecuencias de una distribución.
Frecuencias
Polìgono de Frecuencias
15
10
5
0
2-5
6-9
10 - 13
14 - 17
Clases
•
Histograma de Frecuencias: serie de rectángulos paralelos, cuya base
representa el Intervalo de Clase y su altura la magnitud de la frecuencia de la
clase respectiva.
Histograma de Frecuencias
Frecuencias
15
10
5
0
2-5
6-9
10 - 13
14 - 17
Clases
•
Histograma de Frecuencias Acumuladas: serie de rectángulos paralelos,
cuya base representa el Intervalo de Clase y su altura la magnitud de la
frecuencia acumulada.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
6
Histograma de Frecuencias Acumuladas
Frecuencias
30
20
10
0
2-5
6-9
10 - 13
14 - 17
Clases
1.11 Estadísticos Importantes
•
Estadístico: Medida que se calcula para describir la característica de una sola
muestra (, s, s2, p).
•
Media Aritmética:
n
x =
∑
f i .x
i=1
n
∑
i=1
•
i
f
i
Media Geométrica:
n
∑ f i . log x i
G = 10
•
i =1
n
Desviación Estándar:
∑ (x
n
s =
i =1
i
− x
)
2
n
A mayor desviación, mayor dispersión. En una Distribución Normal (ver
Unidad correspondiente), el porcentaje de los datos muestrales se agrupan de
acuerdo a la siguiente proporción:
o  ± s Æ 68,27% (Zona Normal)
o  ± 2 s Æ 95,45%
o  ± 3 s Æ 99,73%
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
7
•
Varianza (s2)
•
Moda: valor que más se repite o más típico.
Mo= Li +
•
f sig
f ant + f sig
Ic
Mediana: valor que divide una distribución de tal manera que quede a cada lado
un número igual de términos.
n
∑f
i=1
i
Md = Li + 2
•
− f ant
Ic
fi
Ejemplo:
o Añadimos unas columnas a la tabla del Ejercicio del Ejemplo anterior,
para facilitar los cálculos.
Clases
xi
fi
facum
fi xi
fi log xi
(xi -  )2
2–5
3,5
1
1
3,50
0,54
48,39
6–9
7,5
7
8
52,50
6,13
8,74
10 – 13
11,5
12
20
138,00
12,73
1,09
14 – 17
15,5
3
23
46,50
3,57
25,44
240,50
22,97
83,66
Totales
23
n
o
x =
∑
f i .x i
i =1
n
∑
i=1
→ x =
fi
240 , 50
→ x = 10 , 4565
23
n
∑ f i . log x i
o
G = 10
i =1
∑ (x
n
o
s =
i =1
→ G = 10
n
i
n
− x
)
22 , 97
23
→ G = 9 , 9689
2
→ s =
83 , 66
23
o s2 = ( 1,9072) 2 Æ s2 = 3,6374
Ing° Luis Castellanos (Versión 1.20)
→ s = 1 , 9072
UNEFA. Probabilidades y Estadística.
o
Mo= Li +
8
f sig
f ant + f sig
Ic → Mo= 10+
3
4 → Mo= 11,20
7 +3
n
∑f
i=1
o
Md = Li + 2
i
− f ant
fi
23
−7
2
Ic → Md = 10+
4 → Md = 11,50
12
1.12 Relación entre la Media, Mediana y Modo en un Polígono de Frecuencias
•
Curva Simétrica:
 = Md = Mo
•
Curva Asimétrica Positiva:
Mo < Md < 
•
Curva Asimétrica Negativa:
 < Md < Mo
Simétrica
Asimétrica Positiva
Asimétrica Negativa
Aparte, pueden variar, de acuerdo a su Kurtosis:
Leptokùrtica
Mesokùrtica
Ing° Luis Castellanos (Versión 1.20)
Platikùrtica
UNEFA. Probabilidades y Estadística.
9
1.13 Ejercicios
•
Sean las medidas de peso de un grupo de personas:
56, 55, 40, 47, 73, 75, 81, 60, 65, 53, 52, 43, 56, 69, 67, 55, 52, 43, 52, 56, 69,
56.
Con los datos agrupados halle:
ƒ
Media, Media Geométrica, Mediana, Modo, Desviación Estándar,
Varianza
ƒ
Grafique Polígono de Frecuencias, Histograma de Frecuencias e
Histograma de Frecuencias Acumuladas
ƒ
Determine si la gráfica es Simétrica o Asimétrica (Positiva o Negativa)
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
10
2 Teoremas de Probabilidades.
2.1
Definiciones.
•
Tipos de Modelos:
o Determinísticos (Ej. v =
d
)
t
o Probabilísticos (Ej. Lanzamiento de dados)
•
Experimento Aleatorio: registra los resultados al azar, que ocurren en un
estudio planificado o en una investigación científica. Ej.: lanzar una moneda.
•
Datos Iniciales: información registrada en la forma en que se recoge, ya
sean cuentas o mediciones. Ej.: cara, sello, cara, cara.
•
Cualquier recolección de información debe tener un propósito específico y
ser seguido por acciones.
•
Sugerencias para la Recolección de Datos:
o Registrar claramente el origen de los datos
o Registrar para usar los datos fácilmente
o Si se van a registrar datos de manera continua, se pueden preparar y
usar formatos para ello
•
Métodos de Recolección de Datos:
o Entrevistas
o Cuestionarios
o Observación Directa
o Experimentos Estadísticos
•
Conjunto: agrupación de elementos que comparten una propiedad común.
•
Espacio Muestral: conjunto de todos los resultados posibles de un
experimento aleatorio (s).
o Cada resultado se llama elemento, o miembro del Espacio Muestral, o
Punto Muestral.
o El Espacio Muestral puede ser Finito o Infinito.
•
Ejemplo:
o Sea el lanzamiento de una moneda Æ
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
ƒ
11
s = { cara, sello }
o Ciudades con más de 1 millón de Habitantes Æ
ƒ
s = { x / x es ciudad con Población > 1.000.000 }
o Puntos (x,y) dentro de un círculo de radio 2 y centro en el origen Æ
ƒ
•
s = { (x,y) / x2 + y2 ≤ 4 }
Ejercicios:
o Halle el Espacio Muestral al tirar un Dado.
o Halle el Espacio Muestral al seleccionar 3 piezas al azar en un
proceso de producción. Cada pieza se inspecciona y clasifica como
Defectuosa (D) o No Defectuosa (N).
•
Suceso o Evento: cualquier subconjunto del Espacio Muestral (A).
o Ejemplo: Determine el evento al lanzar el dado y observar números
pares que salen.
ƒ
•
A = { 2, 4, 6 }
Evento Simple: contiene sólo un elemento del Espacio Muestral.
o Ejemplo: A = { t / t < 5 } del S = { t / t ≥ 0 }
o (Donde t es la vida en años de un componente electrónico. A es el
evento de que falle antes del 5to año).
•
Conjunto Vacío: subconjunto del Espacio Muestral que no contiene
elementos (Ø).
•
Evento Compuesto: proviene de la unión de dos o más eventos simples.
o Ejemplo.
ƒ
Tomemos el evento de sacar corazón de un Mazo de Cartas.
•
ƒ
A = { corazón } del S = { corazón, pica, trébol, diamante }
Ahora tomemos el evento de sacar una carta roja del mismo
mazo:
•
•
B = { corazón, diamante } (B = { corazón o diamante })
Eventos Mutuamente Excluyentes o Exclusivos: cuando su intersección
es Conjunto Vacío.
o Sean A = { 2, 4, 6 }; B = { 1, 3, 5 }; C = { 1, 2 }
ƒ
A ∩ C = { 2 } ; B ∩ C = { 1 }; A ∩ B = Ø
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
12
Repaso:
o Intersección (∩): evento que contiene todos los elementos comunes a
A y a B (A ∩ B).
o Unión (U): evento que contiene todos los elementos que pertenecen a
A, a B, o a ambos. (A U B).
•
Complemento de un Evento A con respecto a S: es el conjunto de todos
los elementos de S que no están en A (A’).
o Ejemplo. Sea Q el evento de que una persona seleccionada al azar en
un salón de clases fume. Entonces Q’ es el evento de que la persona
No Fume.
2.2
Principio de Enumeración o Conteo.
•
Si una operación se puede efectuar en n1 formas, y si para cada una de ellas
se puede efectuar una segunda operación en n2 formas, y si para cada una
de las dos primeras se puede efectuar una tercera operación en n3 formas, y
así sucesivamente, entonces la secuencia de k operaciones se podrá realizar
n3
en n1.n2.n3. … nk formas.
n2
n1
o Ejemplo: ¿Cuántos almuerzos que contengan Sopa, Seco, Postre y
Jugo, se pueden preparar si se puede escoger entre cuatro (04)
sopas, tres (03) secos, cinco (05) postres y cuatro (04) jugos?
ƒ
k = 4.3.5.4. Æ k = 240 almuerzos
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
2.3
13
Principio de Adición
• T = n1 + n2
n1
n2
•
Frecuentemente nos interesamos en un Espacio Muestral que contenga
como elementos a todos los órdenes o arreglos posibles de un grupo de
objetos.
o Permutaciones Æ importa el orden
o Combinaciones Æ no importa el orden
•
Permutaciones de n elementos:
o
•
n!
( n − r )!
n
P c = ( n − 1)!
Permutaciones de n elementos en k clases:
o
•
n Pr =
Permutaciones en forma circular:
o
•
P n = n!
Permutaciones de n elementos tomados r a la vez:
o
•
n
n Pk =
n!
n1! n2 ! n3!...nk !
Combinaciones de n elementos tomados r a la vez:
o
nC r=
n!
r!( n − r )!
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
14
Ejemplos:
o Consideremos las letras a, b, c. ¿Cuántos objetos distintos se pueden
obtener si las agrupamos en 3 letras?
P 3 = 3!→ 3 P 3 = 3.2.1→ 3 P 3 = 6
ƒ
3
ƒ
S = { abc, acb, bca, cab, bac, cba }
o Consideremos las letras a, b, c, d. ¿Cuántos objetos distintos se
pueden obtener, si las agrupamos en 2 letras?
ƒ
4 P2=
4!
4.3.2!
→4 P2=
→ 4 P 2 = 12
( 4 − 2)!
2!
o Consideremos a cuatro (4) jugadores de cartas. ¿Cuántas formas
distintas de ubicar a los jugadores se pueden obtener?
ƒ
4
P c = ( 4 − 1)!→ 4 P c = 3!→ 4 P c = 3.2.1→ 4 P c = 6
o ¿En cuántas formas diferentes pueden arreglarse 3 bombillos rojos, 4
bombillos amarillos y 2 bombillos azules en una extensión navideña de
9 bombillos?
ƒ
9 Pk =
9!
→ 9 P k = 1.260
3!4!2!
o ¿De cuántas formas se pueden alojar 7 ingenieros en un cuarto triple y
en dos cuartos dobles de un Hotel?
ƒ
7 Pk =
7!
→ 7 P k = 210
3!2!2!
o Consideremos a 8 alumnos. ¿Cuántos comités de 3 alumnos se
pueden formar?
ƒ
8 C 3=
8!
→ 8 C 3 = 56
3!(8 − 3)!
o ¿De cuántas formas puede salir el billete ganador de un Kino?
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
ƒ
2.4
15
25 C15 =
25!
→ 25 C 15 = 3.268 .760
15!( 25 − 15)!
Probabilidad de un Evento
• La Probabilidad de cualquier evento A es la suma de los pesos de todos los
puntos muestrales en A, con valor entre 0 y 1.
o 0 ≤ p(A) ≤ 1
•
Un peso cercano a 0 indica que el evento tiene poca posibilidad de ocurrir, y
un peso cercano a 1 indica que tiene mucha posibilidad de ocurrir.
•
Otra definición de Probabilidad: número que se le asigna a un evento que
determinará las veces que el mismo puede ocurrir.
•
P( A) =
n
N
•
P ( A) =
A
S
•
Si un evento puede ocurrir de a maneras, y deja de ocurrir de b maneras,
siendo todos los casos posibles, P ( A) =
a
a+b
•
p + q = 1 (probabilidad de ocurrencia + probabilidad de no ocurrencia)
•
Ejemplo:
o Probabilidad que al lanzar un dado salga un “2”.
ƒ
S = { 1, 2, 3, 4, 5, 6 } ; A = { 2 }
ƒ
1
5
p(2) = ; q(2) =
6
6
o Probabilidad que al lanzar dos monedas salga una cara.
ƒ
S = { cc, cs, ss, sc } ; A = { cs, sc }
ƒ
p( A) =
2
1
; p( A) =
4
2
o Si se sacan tres (3) cartas de un mazo de barajas españolas, ¿cuál es
la probabilidad que éstas sean as, dos y tres?
ƒ
Primero se halla el número de maneras que pueden salir 3
cartas de 40:
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
16
40!
→ 40 C 3 = 9.880
3!( 40 − 3)!
ƒ
40 C 3 =
ƒ
S = { 9.880 maneras } ; A = { 4 ases, 4 dos, 4 tres }
ƒ
p( A) =
4.4.4
; p( A) = 0,0065
9.880
o Si se saca una carta de un mazo de barajas, ¿cuál es la probabilidad
que la carta sea diamante?
2.5
ƒ
S = { 52 } ; A = { 13 }
ƒ
p( A) =
13
; p( A) = 0,25
52
Teorema de Probabilidad Completa (Teorema Aditivo):
•
En dos eventos mutuamente excluyentes A y B, A tiene p1 probabilidades de
ocurrir, y B tiene p2 probabilidades de ocurrir. La probabilidad de ocurrir A o
B es igual a p1 + p2.
o P(A U B) = P(A) + P(B)
o P(A+B) = P(A) + P(B)
•
Ejemplo: Si tenemos en una caja 12 bolas blancas, 10 bolas azules y 8 bolas
rojas, ¿cuál es la probabilidad de que al sacar una bola, ésta sea blanca o
roja?
2.6
12
8
; P (r ) =
30
30
o
P(b) =
o
P(b + r ) =
12 8
20
+
→ P(b + r ) =
→ P(b + r ) = 0,66
30 30
30
Teorema de Probabilidad Compuesta (Teorema de Multiplicación)
• Si un evento A tiene p1 probabilidades de ocurrir y otro evento B tiene p2
probabilidades de ocurrir, simultáneamente o después de A, entonces la
probabilidad de ocurrir A y B es igual a p1. p2.
o P(A ∩ B) = P(A). P(B)
o P(AB) = P(A). P(B)
Eventos Independientes
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
17
o P(AB) = P(A).P(B/A)
Probabilidad Condicional
Eventos Independientes
o P(BA) = P(B).P(A/B)
•
Eventos Independientes: ocurre un evento sin importar el resultado del
evento anterior.
•
Eventos Dependientes: la probabilidad de ocurrencia de un evento depende
de la ocurrencia del evento anterior.
•
Ejemplo:
o Si tenemos en una caja 12 bolas blancas, 10 bolas azules, y 8 bolas
rojas, ¿cuál es la probabilidad de que al realizar dos extracciones de la
caja, la primera sea blanca y la segunda roja?
2.7
12
8
; P(r ) =
30
30 − 1
o
P(b) =
o
P (br ) =
12 8
. → P(br ) = 0,1103
30 29
Probabilidad Condicional
• Es la probabilidad de que ocurra un evento B cuando se conoce que ha
ocurrido un evento A. P(B/A).
o
•
P ( B / A) =
P( A ∩ B ) P( AB)
=
P( A)
P( A)
Probabilidad Condicional
Eventos Dependientes
Ejemplo:
o Sea la probabilidad de que aumenten las ventas de carros el próximo
mes p(A) = 0,40. Sea la probabilidad de que aumenten las ventas de
repuestos el próximo mes p(R) = 0,50. Sea p(AR) = 0,10. Calcule la
probabilidad que aumente “A” dado que aumentará “R”, y la
probabilidad que aumente “R” dado que aumentó “A”.
P( A / R) =
P( RA)
→
P( R)
P( A / R) =
0,10
→
0,50
P ( A / R) = 0,20
Ing° Luis Castellanos (Versión 1.20)
P ( R / A) =
P( AR)
→
P( A)
P ( R / A) =
0,10
→
0,40
P ( A / R) = 0,25
UNEFA. Probabilidades y Estadística.
2.8
18
Teorema de Bayes
•
Se emplea para conocer las probabilidades de causas que hayan actuado
sobre sucesos ya constatados.
•
Enunciado: si un suceso puede ser originado por varias causas, las cuales a
priori son igualmente probables, la probabilidad de que el suceso sea debido
a
una
determinada
causa
es
igual
a
la
probabilidad
compuesta
correspondiente a dicha causa, dividida entre la suma de las probabilidad
compuestas, según las cuales el suceso pudiere derivarse de todas y cada
una de ellas.
o
P( Ak / B) =
P( Ak ).P( B / Ak )
n
∑ P( A )P( B / A )
i =1
o
P( Bk / A) =
i
P( Bk ).P( A / Bk )
n
∑ P( B )P( A / B )
i =1
•
i
i
i
Ejemplo:
o Se tienen 3 cajas:
ƒ
A1 Æ 5 bolas blancas + 2 bolas negras
ƒ
A2 Æ 6 bolas blancas + 5 bolas negras
ƒ
A3 Æ 8 bolas blancas + 3 bolas negras
o Se saca una bola blanca. ¿Cuál es la probabilidad de que sea de la
primera caja?
1
= 0,3333
3
ƒ
p( A1 ) = p ( A2 ) = p( A3 ) =
ƒ
P( A1 / B) =
ƒ
1 5
.
55
3 7
P( A1 / B) =
→ P( A1 / B) =
→ P( A1 / B) = 0,3595
1 5 1 6 1 8
153
. + . + .
3 7 3 11 3 11
P( A1 ).P( B / A1 )
P( A1 ) P( B / A1 ) + P( A2 ) P( B / A2 ) + P( A3 ) P( B / A3 )
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
2.9
19
Ejercicios
• Encuentre la Probabilidad de que en el lanzamiento sencillo de un dado,
resulte un número menor a 4.
•
Las probabilidades de que un marido y su esposa estén vivos durante 20
años a partir de ahora está dada por 0.8 y 0.9 respectivamente. Encuentre la
posibilidad de que en 20 años:
o Ambos estén vivos
o Ninguno esté vivo
o Al menos uno de ellos esté vivo
•
Se saca al azar una carta de un mazo de 52 cartas. Encuentre la
probabilidad de que la carta sea:
o J de Corazones (J♥)
o 3 de Trébol (3♣) ó 6 de Diamantes (6♦)
o Un Corazón (♥)
o Cualquier carta que no sea Corazón.
o Ni 4 ni Trébol (♣)
•
Se saca al azar una bola de una caja que contiene 6 bolas rojas, 4 blancas y
5 azules. Determine la probabilidad de que la bola sea:
o Roja
o Blanca
o Azul
o No Roja
o Roja o Blanca
•
Un dado balanceado se lanza dos (2) veces. Encuentre la probabilidad de
obtener 4, 5 ó 6 en el primer lanzamiento, y 1, 2, 3 ó 4 en el segundo
lanzamiento.
•
Determine la Probabilidad de obtener 3 “seis” al lanzar 5 veces un dado
balanceado
•
Se sacan 2 cartas de un mazo de 52 cartas. Encuentre la probabilidad de
que ambas cartas sean Ases.
o Con reemplazo
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
20
o Sin reemplazo
•
Sea un mazo de 52 cartas, y un jugador de “Blackjack” desea saber la
probabilidad de tener “Blackjack”:
o Con 2 cartas
o Con 3 cartas
o Con 4 cartas
•
¿De cuántas maneras se pueden ordenar 5 personas en una rueda de
reconocimiento de testigos?
•
¿De cuántas maneras se pueden sentar 10 personas en una banca, si sólo
hay 4 puestos disponibles?
•
¿De cuántas maneras posibles se pueden sentar 7 personas alrededor de
una mesa redonda, si
o Se pueden sentar en cualquier lugar?
o 2 personas en particular no se pueden sentar juntas?
•
¿De cuántas maneras se puede formar un comité de 5 personas a partir de
un grupo de 9?
•
Se va a formar un comité de 2 matemáticos y 3 físicos a partir de 5
matemáticos y 7 físicos. ¿De cuántas maneras se puede hacer si
o Se puede incluir cualquier matemáticos y cualquier físico?
o Un físico en particular debe estar en el comité?
o Dos matemáticos en particular no pueden pertenecer al comité?
•
Empleando Teorema de Bayes:
o La Caja 1 tiene 3 metras rojas y 2 metras azules. La Caja 2 tiene 2
metras rojas y 8 metras azules. Se lanza una moneda balanceada. Si
se obtiene cara, se saca una metra de la Caja 1. Si se obtiene sello, se
saca una metra de la Caja 2.
o Si no se revela si se obtiene Cara o Sello, pero se dice que se sacó
una metra roja, ¿Cuál es la probabilidad de que la metra haya sido
sacada de la Caja1?
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
21
3 Variable Aleatoria y Función de Probabilidades.
3.1
Definiciones varias.
• Variable: cualquier característica de cada elemento de una población o muestra.
•
Algunas Clasificaciones:
o Variables Cualitativas: miden cualidades (género, etc.)
o Variables Cuantitativas: se miden a través de cantidades cuantificables
(estatura, peso, etc.)
o Variables dependientes: aquella cuyo resultado es afectado por el efecto
producido por otra variable
o Variables Independientes: aquella cuyo valor no depende de otra
variable.
•
Variable Aleatoria: es la función cuyo valor es un número real determinado por
cada elemento en el Espacio Muestral. Se usa letra mayúscula para
representarla, y letra minúscula para representar sus resultados.
•
Espacio Muestral Discreto: contiene una cantidad finita de posibilidades.
•
Variable Aleatoria Discreta: variable aleatoria definida sobre un Espacio
Muestral Discreto.
•
Espacio Muestral Continuo: contiene una cantidad infinita de posibilidades.
•
Variable Aleatoria Continua: variable aleatoria definida sobre un Espacio
Muestral Continuo. También se llama Función de Densidad.
•
Generalmente las Variables Aleatorias Discretas representan datos contados, y
las Continuas datos medidos (alturas, pesos, temperaturas, distancias).
•
Ejemplo:
o De una caja que contiene 4 bolas rojas y 3 blancas, se toman
sucesivamente 2 bolas sin reemplazarlas. Los resultados posibles z los
valores y de la Variable Aleatoria Z (Nº de bolas rojas) es:
z
ƒ
RR Æ
2
ƒ
RB Æ
1
ƒ
BR Æ
1
ƒ
BB Æ
0
Z = { 2, 1 , 1, 0 }
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
22
o Se conduce una investigación para medir las distancias que recorre un
vehículo con 5 litros de gasolina (W).
3.2
Función de Distribución de Probabilidad de una Variable Aleatoria Discreta.
• La Función ƒ(x) es una función de probabilidad de la Variable Aleatoria X si,
para cada x resultado posible:
o ƒ(x) ≥ 0
o ∑ ƒ(x) = 1
o P(X = x) = ƒ(x)
•
Ejemplo:
o Encuentre la distribución de Probabilidad de la suma de los números
cuando se lanzan 2 dados.
ƒ
x
2
3
4
5
6
7
8
9
10
11
12
ƒ(x)
1/36
2/36
3/36
4/36
5/36
6/36
5/36
4/36
3/36
2/36
1/36
ƒ
3.3
2 dados pueden caer en 6x6 = 36 formas.
ƒ(x) =
x −1
36
x≤7
13 − x
36
x>7
Distribución Acumulativa de una Variable Aleatoria Discreta
•
F(x) = P(X≤x) =
•
Ejemplo:
∑ f (t )
t≤x
o F(2) = ƒ(2) = 1/36
o F(3) = ƒ(2) + ƒ(3) = 3/36
o F(4) = ƒ(2) + ƒ(3) + ƒ(4) = 3/36
o …
o F(12) = ƒ(2) + ƒ(3) + ƒ(4) + … + ƒ(12) = 36/36
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
23
Histograma de Probabilidad
0,2
0,15
0,1
0,05
0
2
•
3
4
5
6
7
8
9
10
11
12
9
10
11
12
Histograma de Distribución Acumulada Discreta
1,2
1
0,8
0,6
0,4
0,2
0
3.4
2
3
4
5
6
7
8
Función o Distribución de Probabilidad de una Variable.
• La función ƒ(x) es una función de Probabilidad de la Variable Aleatoria Continua
X (Función de Densidad), definida en R, si:
o ƒ(x) ≥ 0; ∀x ∈ R
∞
o
∫ f ( x)dx = 1
−∞
b
o P(a<X<b) =
∫ f ( x)dx
a
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
24
Ejemplo:
o Sea X, con una Función de Densidad:
ƒ
ƒ
ƒ(x) =
x2/3
;
-1 < x < 2
0
;
en otro valor
Verifique si ƒ(x) es función de Probabilidad y halle P(0≤X≤1).
x2
x3
∫−1 3 dx = 9
2
1
1
2
•
•
∫
0
3.5
x2
x3
dx =
3
9
=
8 1
+ =1
9 9
=
1
9
−1
0
Distribución Acumulativa de una Variable Aleatoria Continua.
x
•
F ( x) = P( X ≤ x) =
∫ f (t )dt
−∞
•
Ejemplo:
t2
t3
o F ( x) = ∫ dt =
3
9
−1
x
3.6
x
−1
x 3+ 1
=
9
Ejercicios.
•
Se lanza una moneda dos veces. Halle la Función de Probabilidad y la Función
de Densidad de X (N° de Caras).
•
Se lanza una moneda tres veces. Halle la Función de Probabilidad y la Función
de Densidad de X (N° de Caras).
•
Una caja tiene 5 metras blancas y 3 metras negras. Si se sacan 2 metras al
azar, sin reemplazo, y X indica el número de metras blancas, halle la Función de
Probabilidad y la Función de Densidad de X.
•
Sea X una Variable Aleatoria que indica el número de Ases al retirar 4 cartas al
azar de un mazo de 52 barajas. Halle la Función de Probabilidad y la Función de
Densidad de X.
•
Halle la constante “c” de manera que la siguiente función sea una Función de
Densidad:
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
o ƒ(x) =
25
c x2
;
0<x<3
0
;
en otro valor
o Halle P(1<X<2)
•
Una Variable Aleatoria X tiene la siguiente Función de Densidad:
o ƒ(x) =
c x2
;
0≤x≤2
cx
;
2<x<3
0
;
en otro valor
o Halle c
o Halle P(X>2)
o Halle P( ½ < X < 3/2 )
•
La Función de Distribución de una Variable Aleatoria X está dada por:
o ƒ(x) =
c x3
;
0≤x<3
1
;
x≥3
0
;
x<0
o Si P(X=3) = 0, halle c
o Halle P(1<X<2)
•
Sea X una Variable Aleatoria con Función de Densidad:
o ƒ(x) =
cx
;
0≤x≤2
0
;
en otro valor
o Halle c
o Halle P(1/2 < X < 3/2)
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
26
4 Esperanza Matemática
4.1
Definiciones Varias.
• El Valor Esperado, o la Esperanza Matemática, de una Variable
Aleatoria X, con una Función de Probabilidad ƒ(x) es:
o E(X) = ∑ x ƒ(x) (X Discreta)
∞
∫ xf ( x)dx
o E(X) =
(X Continua)
−∞
•
Ejemplo:
o Calcule
la
Esperanza
de
los
siguientes
Experimentos
Aleatorios:
ƒ
Dos monedas se lanzan 16 veces al aire, donde X es el
número de caras por lanzamiento. X = { 0, 1, 2 }. Se
obtienen 0, 1 y 2 caras, 4, 7 y 5 veces respectivamente.
•
ƒ
⎛ 4⎞ ⎛ 7⎞ ⎛ 5⎞
E ( X ) = ⎜ 0. ⎟ + ⎜1. ⎟ + ⎜ 2. ⎟ → E ( X ) = 1,06
⎝ 16 ⎠ ⎝ 16 ⎠ ⎝ 16 ⎠
Sea X la vida en horas de una válvula electrónica. La
Función de Densidad de Probabilidad es:
ƒ(x) =
20.000
;
x3
x > 100
0;
x ≤ 100
∞
∞
•
20.000
E ( X ) = ∫ x.
dx →E ( X ) = ∫ 20.000 x − 2 dx →
3
x
100
100
•
20.000
20.000 ⎛ 20.000 ⎞
→ E( X ) = −
−⎜−
E( X ) = −
⎟
∞
x 100
⎝ 100 ⎠
•
E(X) = 200
∞
•
Sea X una variable aleatoria con distribución de probabilidad ƒ(x). El
valor esperado de la función g(X) es:
o E[g(X)] = ∑ g(x) ƒ(x) (X Discreta)
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
27
∞
o E[g(X)] =
∫ g (x ) f ( x)dx
(X Continua)
−∞
•
Ejemplo:
o Calcule
la
Esperanza
de
los
siguientes
Experimentos
Aleatorios:
ƒ
Sea
X
una
variable
aleatoria
con
la
siguiente
distribución de probabilidad:
x
0
1
2
3
ƒ(x)
1/3
1/2
0
1/6
Encuentre el valor de Y = (X – 1)2
ƒ
•
E[(X – 1)2] = ∑ (X – 1)2 ƒ(x)
•
E[(X – 1)2] = (– 1)2 (1/3) + (0)2 (1/2) + (1)2 (0) + (2)2 (1/6)
•
E[(X – 1)2] = 1
Sea X una variable aleatoria con función de densidad:
ƒ(x) =
x2/3
;
-1 < x < 2
0
;
en otro valor
Encuentre el valor de g(X) = 2X -1
2
•
4.2
4.3
2
(2 x − 1) x 2
1
3
E (2 X − 1) = ∫
dx = ∫ (2 x 3 − x 2 )dx =
3
3 −1
2
−1
Propiedades o Leyes de la Esperanza Matemática.
• E (aX + b) = a E(X) + b Æ a y b constantes
•
E [ƒ(X) ± g(X)] = E [ƒ(X)] ± E [g(X)]
•
E [ƒ(X,Y) ± g(X,Y)] = E [ƒ(X,Y)] ± E [g(X,Y)]
•
E (X,Y) = E (X) . E (Y)
Varianza de una Variable Aleatoria
• La varianza de una variable aleatoria X está dada por:
o σ2 = E (X2) - µ2
•
Ejemplo:
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
28
o Calcule la varianza de X, donde X es el número de Ingenieros
de Sistema en un comité de tres personas seleccionadas al
azar entre un grupo de cuatro Ingenieros de Sistema y tres
Ingenieros Mecánicos.
ƒ
3
3-x
4
x
f(x) =
7
3
4.4
ƒ
E(X) = (0)(1/35)+(1)(12/35)+(2)(18/35)+(3)(4/35)
ƒ
E(X) = 1,7
ƒ
E(X2) = (0)(1/35)+(1)(12/35)+(4)(18/35)+(9)(4/35)
ƒ
E(X2) = 24/7
ƒ
σ2 = 24/7 – (12/7)2 Æ σ2 = 24/49
Teorema de Chebyshev.
•
La varianza de una variable aleatoria indica acerca de la variabilidad
de las observaciones con respecto a la media.
•
Si una variable aleatoria tiene una varianza o desviación estándar
pequeña, se puede esperar que la mayoría de los valores estén
agrupados alrededor de la media.
•
Por ello, la probabilidad de que una variable aleatoria tome un valor
dentro de cierto intervalo, alrededor de la media, es mayor que para
una variable similar con una desviación estándar mayor.
•
Si se considera a la probabilidad en términos de área (bajo la curva),
en una distribución continua con una desviación estándar pequeña
que tenga la mayor parte de su área cercana a µ.
•
Un valor mayor de σ indica una mayor variabilidad, y por lo tanto se
espera que el área estará más extendida.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
29
El matemático ruso Chebyshev descubrió que hay una relación entre
la desviación estándar y la fracción del área que se encuentra entre
dos valores cualesquiera, simétricos con respecto a la media:
•
Teorema de Chebyshev:
o La probabilidad de que cualquier variable aleatoria X caiga
dentro de k desviaciones estándar de la media, es al menos (1
– 1/k2).
o P ( µ - k σ < X < µ + k σ ) ≥ 1 - 1 / k2
•
Ejemplo:
o Una variable aleatoria X tiene una media µ=8, una varianza
σ2=9,
y
una
distribución
de
probabilidad
desconocida.
Encuentre P (-4 < X < 20).
4.5
ƒ
P (-4<X<20) = P ( 8 – (4)(3) < X < 8 + (4)(3)) ≥ 1 - 1 / 42
ƒ
P (-4 < X < 20) ≥ 15/16.
Ejercicios.
•
Se rifan 200 premios de Bs. 1.000, 20 premios de Bs. 2.000 y 5
premios de Bs. 5.000. Suponiendo que se elaboran y venden 10.000
tickets, ¿cuál es el precio justo por cada ticket (sin incluir ganancia)?
•
En un juego de apuesta, un hombre recibe Bs 5.000 si al tirar 3
monedas al aire se obtienen todas caras o todas sellos, y paga Bs.
3.000 si resultan 1 ó dos caras. ¿Cuál es la ganancia esperada?
•
Un hombre, al invertir en una mercancía, puede tener una ganancia
de Bs. 3.000.000 en un año con una probabilidad de 0,3, o puede
perder Bs. 1.000.000 con una probabilidad de 0,7 en el mismo lapso.
¿Cuál es su Esperanza Matemática?
•
Un hombre desea asegurar su vehículo en Bs. 20 millones. La
Compañía de Seguros estima que una Pérdida Total puede ocurrir
con una probabilidad de 0,002; una pérdida del 50% con una
probabilidad de 0,01 y una pérdida del 25% con una probabilidad de
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
30
0,1. Si se ignoran las demás pérdidas parciales, ¿que prima anual
debe cobrar la aseguradora para tener una ganancia del 10%?
•
Suponga que X es una Variable Aleatoria con media igual a 100 y
desviación estándar igual a 5.
o Halle la conclusión que se puede derivar de la Desigualdad de
Chebyshev para k=2 y k=3
o Estime la posibilidad de que X se encuentre entre 100 ± 20.
o Encuentre un intervalo [a,b] alrededor de la media, para el cual
la probabilidad de que X se encuentre en el intervalo sea por lo
menos de 99%.
•
Sea X una variable aleatoria con media igual a 40 y desviación
estándar igual a 5. Use la Desigualdad de Chebyshev para encontrar
un valor b para el cual P(40 – b ≤ X ≤ 40 + b) ≥ 0,95.
•
Sea X una variable aleatoria continua con media igual a 80 y
desviación estándar desconocida. Use la desigualdad de Chebyshev
para encontrar un valor de σ para el cual P(75 ≤ X ≤ 85) ≥ 0,95.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
31
5 Distribuciones de Probabilidad
5.1
Distribución Binomial.
• Es una Distribución Discreta, llamada también Distribución de
Bernoulli. Sus frecuencias son proporcionales a los términos del
Binomio de Newton o Binomio de Pascal.
•
Propiedades:
o El experimento consta de n intentos repetidos.
o Cada intento tiene un resultado que puede ser éxito o fracaso.
o La probabilidad de un éxito, indicado por p, permanece
constante.
o Las repeticiones del ensayo son independientes.
•
Variable Aleatoria Binomial:
o Es el número de éxitos en n ensayos de un Experimento
Binomial.
•
Ecuación:
o b( x; n; p) =
•
n
x
px.qn-x; x = 0, 1, 2, …, n
n = N° ensayos
p = Probab. éxito
Media o Esperanza:
o =n.p
•
Aplicación:
o En experimentos que pueden arrojar dos resultados posibles.
•
Ejemplo:
o La probabilidad de que cierto componente resista una prueba
de impacto es de ¾. Encuentre la probabilidad de que
exactamente 2 de los 4 componentes siguientes la resistan.
p = 3/4 ; q = ¼ ; x = 2; n = 4
b (2, 4, ¾) =
4
2
3
4
2
1
4
2
Æ b (2, 4, ¾) = 0,21094
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
5.2
32
Distribución de Poisson
•
Distribución Discreta.
•
Propiedades de un Experimento de Poisson:
o El número de éxitos que ocurren en un intervalo de tiempo o en
una región especificada son independientes de los que ocurren
en cualquier otro intervalo de tiempo o región del espacio
disjuntos.
o La probabilidad de un solo éxito que ocurre durante un intervalo
de tiempo muy corto o en una pequeña región, es proporcional
a la duración del intervalo de tiempo o al tamaño de la región, y
no depende del número de éxitos que ocurran fuera de este
intervalo de tiempo o región.
o La probabilidad de que ocurra más de un éxito en dicho
intervalo de tiempo corto o de caer en dicha región pequeña, es
insignificante.
•
Variable Aleatoria de Poisson:
o Es el número X de éxitos en un Experimento de Poisson.
•
Ecuación:
e −u µ x
o p ( X, µ ) =
x!
•
µ = promedio de éxitos en
intervalo de tiempo o región
e = 2,71828
Aplicación:
o Se emplea cuando se trata de un suceso de probabilidad muy
pequeña en cada observación y se desea obtener la
probabilidad de que suceda cierto número de veces en un gran
número de observaciones.
o También se llama Ley de los Sucesos Raros.
•
Ejemplo:
o En un experimento, el promedio de partículas radioactivas que
pasan por un contador durante 1 milisegundo es de 4. ¿Cuál es
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
33
la probabilidad de que 6 partículas pasen por el contador en 1
milisegundo dado?
ƒ
X = 6, µ = 4
e −4 4 6
o p ( 6, 4 ) =
Æ p ( 6, 4 ) = 0,1042
6!
5.3
Distribución Normal
•
Distribución Continua. Su nombre se debe a que al principio, se
consideraba que todos los fenómenos en su estado normal debían
seguir esta Distribución. Fue desarrollada por De Moivre en 1733, y
luego por Gauss.
•
Propiedades de un Experimento Normal:
o Las fuerzas causales que afectan los sucesos individuales
deben
ser
numerosas
y
aproximadamente
de
igual
ponderación.
o Las fuerzas causales deben ser independientes unas de otras.
o Existe equilibrio entre las desviaciones por encima y por debajo
de la media.
o La curva originada es simétrica.
•
Teorema del Límite Central:
o La Distribución de una Media Muestral de una población que
tiene una varianza finita, tiende a distribuirse normalmente a
medida que el tamaño de la muestra tiende hacia el infinito.
•
Variable Aleatoria Normal:
o Tiene una Distribución en forma de campana (de Gauss)
•
Ecuación:
o p ( x, µ , σ ) =
1
2πσ
e
⎛ 1 ⎞⎛ x − µ ⎞
⎜ − ⎟⎜
⎟
⎝ 2 ⎠⎝ σ ⎠
2
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
34
Aplicación:
o Se
emplea
comúnmente
en
fenómenos
biológicos
y
antropológicos.
•
Área bajo la Curva Normal:
o El área limitada por las ordenadas x = x1 ∧ x = x2 es igual a la
probabilidad de que la Variable Aleatoria X tome un valor entre
x = x1 ∧ x = x2.
x2
P ( x1 < X < x2 ) =
1
∫ n( x, µ ,σ )dx ≈
2πσ
x1
x2
∫e
⎛ 1 ⎞⎛ x − µ ⎞
⎜ − ⎟⎜
⎟
⎝ 2 ⎠⎝ σ ⎠
2
dx
x1
o Como quiera que la Distribución Normal es continua, se deben
transformar todas las observaciones de cualquier Variable
Aleatoria en un nuevo conjunto de observaciones de una
Variable Aleatoria Normal con media cero y varianza 1,
mediante la transformación:
Z=
X −µ
σ
o Con ello se obtiene que
z2
P ( x1 < X < x2 ) = P ( z1 < Z < z2 ) =
∫ n( z,0,1)dz
z1
o Con los valores de zn, se pueden emplear las Tablas de Datos.
•
Ejemplo:
o Dada una Distribución Normal con µ = 50 y σ = 10, encuentre la
probabilidad de que X tome un valor entre 45 y 62.
z1 =
45 − 50
⇒ z1 = −0,5
10
z2 =
62 − 50
⇒ z 2 = 1,2
10
P ( 45 < X < 62 ) = P ( -0,5 < Z < 1,2 ) =
= P (Z < 1,2 ) – P (Z < 0,5) = 0,8849 – 0,3085 = 0,5764.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
5.4
35
Ejercicios
•
Aplique Distribución Binomial para calcular:
o Probabilidad de que al lanzar 3 veces una moneda balanceada
aparezcan:
ƒ
3 caras
ƒ
2 sellos y 1 cara
ƒ
Al menos 1 cara
o Probabilidad de que en una familia de 4 hijos haya:
ƒ
Al menos 1 varón
ƒ
Al menos 1 varón y al menos 1 hembra
ƒ
(Probabilidad de nacimiento de varón Æ pv = 0,5).
o Si el 20% de los tornillos producidos por una máquina son
defectuosos. Determine la probabilidad de que de 4 tornillos
escogidos al azar:
ƒ
1 sea defectuoso
ƒ
0 sean defectuosos
ƒ
Menos de 2 sean defectuosos
o Probabilidad de obtener, al menos una vez, un total de 7 en 3
lanzamientos de un par de dados balanceados.
•
Aplique Distribución de Poisson para calcular (µ = n x p):
o El 10% de las herramientas producidas son defectuosas. Encuentre
la probabilidad de que en una muestra de 10 herramientas,
seleccionadas al azar, exactamente 2 sean defectuosas.
o Sea la probabilidad de que una persona tenga una mala reacción a
la inyección de determinado suero es 0,001. Determine la posibilidad
de que de cada 2.000 individuos:
ƒ
3 tengan mala reacción
ƒ
Más de 2 tengan mala reacción
o 10 personas por hora en promedio utilizan una oficina de información
al público. Cuál es la probabilidad de que:
ƒ
6 ó menos usen el servicio
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
ƒ
12 ó más lo usen en una hora
ƒ
Nadie lo use.
36
Aplique Distribución Normal para calcular:
o El peso promedio de 500 estudiantes varones en cierta universidad
es de 151 libras, y la desviación estándar es de 15 libras. Cuántos
estudiantes pesan:
ƒ
Entre 120 y 155 libras
ƒ
Más de 185 libras
o La media del diámetro interior de una muestra de 200 empaques es
de 0,502 cms y la desviación estándar es de 0,005 cms. El propósito
para el cual se hicieron estos empaques permite un máximo de
tolerancia en el diámetro de 0,496 a 0,508 cms., o de lo contrario se
considera que los mismos son defectuosos. Determine el porcentaje
de empaques defectuosos producidos.
o La vida útil de los cauchos de un autobús es de 50.000 Kms en
promedio, con una desviación estándar de 4.200 Kms. Cuál es la
probabilidad que uno de estos cauchos dure:
ƒ
Menos de 38.000 Kms.
ƒ
Entre 55.000 y 60.000 Kms.
ƒ
Más de 45.000 Kms.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
Ing° Luis Castellanos (Versión 1.20)
37
UNEFA. Probabilidades y Estadística.
38
6 Distribución en el Muestreo
6.1
Teoría del Muestreo
• Concepto:
o Es la rama de la Estadística, que trata de los métodos y teorías
para seleccionar muestras, del uso de los datos obtenidos a
partir de las muestras para estimar características de la
población, y de la evaluación de los estimadores.
•
Criterios para la Selección de una Muestra:
o Que la muestra represente a la población
o Que el costo de la selección de la muestra sea pequeño
o Que los estimadores de las características de la población a
partir de la muestra sean precisos.
•
Ventajas del Muestreo:
o Reducción de costos
o Reducción de trabajo
o Mayor rapidez
o Atención individual
o Mayores posibilidades de obtener la información
o Mayor exactitud
•
Limitaciones en el uso del Muestreo:
o Se usa cuando se requieren datos para áreas o grupos
pequeños de la población
o Se usa cuando se requieren datos en instantes regulares de
tiempo y se quieren medir cambios pequeños entre períodos
consecutivos
o Los costos de una encuesta por muestreo son muy altos
(selección de muestra, control, significancia, etc.).
•
Categorías del Muestreo:
o Muestreo Simple al Azar: Permite a cada muestra posible una
probabilidad igual de ser elegida, y a cada elemento de la
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
39
población completa una oportunidad igual de ser incluido en la
muestra.
o Muestreo Sistemático: los elementos que se muestran se
seleccionan de la población en un intervalo uniforme que se
mide con respecto al tiempo, orden o espacio.
o Muestreo Estratificado: la población se divide en grupos
homogéneos o estratos, y los elementos dentro de cada estrato
se seleccionan al azar.
o Muestreo por Agrupación: la población se divide en grupos y
se selecciona una muestra aleatoria de cada grupo.
•
Concepto de Estadístico:
o Un valor calculado a partir de una muestra, se llama
“Estadístico”.
o Medida que se calcula para describir la característica de una
sola muestra (, s, s2, p).
o El Estadístico varía de acuerdo a la muestra, y por lo tanto, es
una variable aleatoria que depende de la muestra aleatoria
observada.
o La Distribución de Probabilidad de una Estadístico se llama
Distribución Muestral.
n
ƒ
Media Muestral (No agrupada): x =
•
∑
i =1
xi
n
Dadas las observaciones 20, 27 y 25, halle la
Media Muestral.
20 + 27 + 25
⇒ x = 24
3
~
Mediana Muestral:
(n es impar)
x = X n +1
o
ƒ
x =
2
X
=
Ing° Luis Castellanos (Versión 1.20)
n
2
+ X
2
n
+1
2
(n es par)
UNEFA. Probabilidades y Estadística.
•
40
Dadas las observaciones 8, 3, 9, 5, 6, 8, 5, halle
la Mediana Muestral.
o 3, 5, 5, 6, 8, 8, 9 (n = 7)
o ~
x = X 7 +1 ⇒ ~
x = X4 ⇒ ~
x = 6
2
•
Dadas las observaciones 10, 8, 4 y 7, halle la
Mediana Muestral.
o 4, 7, 8, 10 (n = 4)
X
ƒ
o
~
x =
o
⇒~
x=
4
2
+ X
4
+1
2
2
X
x =
⇒ ~
2
+ X3
⇒
2
7+8
⇒~
x = 7,5
2
Modo Muestral: Valor que se repite con mayor
frecuencia
•
Dadas las observaciones, Halle el Modo:
o 2, 4, 4, 5, 6, 6, 6, 7, 7, 8 Æ Mo= 6
o 3, 4, 4, 4, 4, 6, 7, 7, 8, 8, 8, 8, 9 Æ
Mo1 = 4; Mo2 = 8 (Bimodal)
ƒ
Rango Muestral: r = Xn – X1
ƒ
Varianza Muestral: considera la posición de cada
∑ (x
observación con respecto a la media. S 2 =
n
o S
ƒ
2
=
( )
n
n∑ x − ∑ (x i )
i =1
2
i
2
i =1
n(n − 1)
Desviación o Error Estándar: S = S 2
Ing° Luis Castellanos (Versión 1.20)
i =1
)
2
n
i
−x
n −1
UNEFA. Probabilidades y Estadística.
41
o Dadas 2 compañías que envasan Jugo de Naranja. Haga un
análisis estadístico de las muestras observadas:
A
B
A
B
75
86
74
69
80
80
Æ
75
71
74
69
Datos
80
80
83
71
Ordenados
83
86
86
94
86
94
A = 79,6; B = 80,0
~
x A = 80,0; ~
x B = 80,0
MoA = MoB = Ø
Hasta acá, esos datos no aportan mucha información, y
ambas muestras tienen resultados muy parecidos. Analicemos
ahora el Rango y la Dispersión.
rA = 12; rB = 25
5.31786 − 398 2
S =
⇒ S A2 = 26,3 ;
5.4
2
A
S B2 =
5.32434 − 400 2
⇒ S B2 = 108,5
5.4
SA = 5,1284; SB = 10,4163
La Compañía A tiene un contenido más uniforme que la
Compañía B (tiene menos dispersión y menos rango o
picos).
•
Concepto de Parámetros:
o Medida que se calcula para describir la característica de una
población completa (µ, σ, σ 2, P).
•
Estadísticos y Parámetros
Muestral
Poblacional
Media

µ
Desviación
S
σ
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
6.2
42
Distribución Muestral de Media Aritmética
• La aproximación normal para  será confiable para n≥30. Si n<30, la
aproximación será confiable ssi la población se aproxima a Población
Normal.
•
Z=
x−µ
σ
n
•
Ejemplo:
o Una firma eléctrica fabrica bombillos, cuya vida se distribuye en
forma normal aproximadamente, con Media de 800 hrs y
Desviación Estándar de 40 hrs. ¿Cuál es la probabilidad de que
una muestra aleatoria de 16 bombillos tenga vida promedio
inferior a 775 hrs?
Z=
ƒ
75 − 800
⇒ Z = −2,5
40
16
P(<775) = P(Z< -2,5) = 0,0062
ƒ
6.3
Distribución Muestral de Media Aritmética con Dos Muestras
•
Z=
(x
1
)
− x 2 − (µ1 − µ 2 )
σ 12
n1
•
+
σ 22
n2
Ejemplo:
o Los Monitores para PC de la Compañía A tienen una vida
media de 6,5 años y una Desviación Estándar de 0,9 años. Los
de la Compañía B tienen una vida media de 6 años y una
Desviación Estándar de 0,8 años. ¿Cuál es la probabilidad de
que una muestra aleatoria de 36 monitores del fabricante A
tenga una vida media de la menos 1 año mayor que la vida
media de una muestra de 49 monitores de la Compañía B?
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
43
A
B
µ
6,5
6,0
σ
0,9
0,8
n
36
49
1 - 2 = 1
Z=
(1) − (0,5) ⇒ Z = 2,646
0,189
P(1 - 2 ≥1) = (Z > 2,2,646) = 1 - (Z < 2,2,646) = 0,0041
6.4
Distribución Muestral χ2 / Chi 2 / Ji 2
(n − 1)S 2
•
χ2 =
•
Ejemplo:
σ2
(con n-1 Grados de Libertad <GL>)
o Un fabricante de Baterías para carros garantiza que su
producto durará, en promedio, 3 años con una Desviación
Estándar de 1 año. Si 5 de las Baterías tienen duraciones de
1.9, 2.4, 3.0, 3.5, y 4.2 años, ¿qué tan cierta será esa garantía
de duración?
ƒ
n = 5; σ2 = 1
ƒ
S2 =
5.(48,26) − 15 2
⇒ S 2 = 0,815
5.4
ƒ
χ2 =
(5 − 1).0,815 ⇒ χ 2 = 3,26
ƒ
Con 4GL Æ 3,26 є [0.484,11.143]
1
α
6.5
con 4GL
є [0.025,0.975] (95% de los datos)
Distribución “t” de Student
• Fue publicada por W.S. Gosset (irlandés), en 1908, bajo el seudónimo
“Student”.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
T=
44
X −µ
(Variable Aleatoria)
S
n
•
Distribución “t”:
o
h(t ) =
Γ[(v + 1) / 2] ⎛ t
⎜⎜1 +
v
Γ(v / 2) π .v ⎝
2
⎞
⎟⎟
⎠
⎛ v +1 ⎞
−⎜
⎟
⎝ 2 ⎠
o v Æ Grados de Libertad ( v = n – 1)
∞
o Función Gamma Æ
Γ(α ) = ∫ xα −1e x dx
0
•
Aplicación:
o En problemas que tienen que ver con inferencia acerca de la media
de la población o en problemas que implican muestras comparativas.
o 95% de los valores de una Distribución “t” caen entre -t0,025 y t0,025.
Un valor por debajo de -t0,025 o por encima de t0,025 es motivado
generalmente por mala definición de µ, o que sea improbable dicho
valor.
•
Ejemplo:
o Encuentre k tal que P (k < T < -1,761) = 0,045 para una muestra de
15 elementos.
V = 15 – 1 Æ v = 14
Por tabla Æ 1,761 corresponde a t0,005 Æ - t0,005 = - 1,761
0,045 = 0,05 - α
Æ α
= 0,005
t0,005 = 2,977
- t0,005 = - 2,977
P ( -2,977 < T < -1,761 ) = 0,045
•
Otro ejemplo:
o Un Ingeniero Químico afirma que el rendimiento medio de la
Población de cierto proceso en lotes de de 500 gr. por mm de
materia prima. Para verificar, muestrea 25 lotes cada mes. Si el
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
45
valor de t calculado cae entre - t0,005 y t0,005 queda satisfecho
con su afirmación. ¿Qué conclusión extraería de una muestra
con una media de 518 gr. x mm y una Desviación Estándar
Muestral de 40 gr.?
ƒ
v = 25 – 1 Æ v = 24
ƒ
S = 40;  = 518; n = 25; µ = 500
ƒ
Por tabla Æ t0,05 = 1,711, para v = 24
ƒ
t=
518 − 500
⇒ t = 2,25
40
25
ƒ
Por tabla Æ 2,25 corresponde aproximadamente a t0,02
o t0,015. El Proceso produce un mejor producto del que
se piensa.
6.6
Distribución F (de Fischer)
U
v1
• F=
V
v2
U y V son Variables Aleatorias
independientes con Distribuciones χ2
con v1 y v2 GL
v1
•
⎛v ⎞
Γ [(v1 + v 2 ) / 2 ]⎜⎜ 1 ⎟⎟
⎝ v2 ⎠
Γ ⎛⎜ v1 ⎞⎟.Γ ⎛⎜ v 2 ⎞⎟
⎝ 2⎠ ⎝ 2⎠
h(f) =
0
•
2
.
f
⎛ v1 ⎞
⎜⎜ −1 ⎟⎟
⎝ 2 ⎠
⎛ v1 f
⎜⎜ 1 +
v2
⎝
⎞
⎟⎟
⎠
v1 + v 2
2
;0<f<∞
; en cualquier otro caso
Aplicación:
o En situaciones de dos muestras para extraer inferencias acerca
de las varianzas de población. De hecho, la Distribución “f” se
llama también la Distribución de Razón de Varianzas.
•
Ejemplo:
o Se toman dos muestras y se hallan sus estadísticos para
comparar , S2 y S.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
6.7
46
Ejercicios
•
Empleando la Distribución χ2 calcule:
o Suponga que los tiempos requeridos por un cierto autobús para
alcanzar uno de sus destinos en una ciudad grande forman una
Distribución Normal con una desviación estándar de 1 minuto.
Si se elige al azar una muestra de 17 tiempos, encuentre la
probabilidad de que la varianza muestral sea mayor que 2.
o Los siguientes son los pesos en gramos de 10 paquetes de
semillas distribuidas por la Compañía Acme: 46.4, 46.1, 45.8,
47.0, 46.1, 45.9, 45.8, 46.9, 45.2, y 46.0. Encuentre un
Intervalo de Confianza de 95% para la Varianza de todos los
paquetes de semilla.
•
Empleando la Distribución t de Student calcule:
o Un fabricante de bombillos anuncia que su producto alumbrará
en promedio durante 500 horas. Para mantener este promedio,
prueba 25 bombillos cada mes. Si el valor t calculado cae entre
–t0,05 y t0,05, ¿queda satisfecho con su publicidad? ¿Qué
conclusión debe sacar de una muestra que tiene media de 518
horas y desviación estándar de 40 horas?
•
Empleando la Distribución F de Fischer calcule:
o Si
S 12 y
S 22 son
las
Varianzas
de
Muestras
Aleatorias
independientes de tamaño n1 = 8 y n2 = 12, de poblaciones
normales
P(
S 12
S 22
con
σ 12
=
σ 22 .
Determine
la
probabilidad
> 1,26 )=?.
o Si tomamos 2 muestras independientes de tamaño n1 = 6 y n2 =
10 de 2 poblaciones normales con la misma varianza
poblacional. Halle b tal que: P(
S 12
S 22
≤ b ) = 0,95.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
47
7 Teoría de la Estimación
7.1
Generalidades.
• Inferencia Estadística: métodos por los que se realizan inferencias o
generalizaciones acerca de una población. Puede ser:
o Estimación
o Prueba de Hipótesis
•
Espacio de Decisión: conjunto de todas las decisiones posibles que
pueden tomarse en un problema de estimación.
•
La Estimación conlleva a determinar o inferir parámetros poblacionales,
en base a estadísticas muestrales. Puede ser:
o Puntual
o Por Intervalo
7.2
Estimación Puntual o Local
• Una estimación puntual de algún parámetro de la población ϑ es un
solo valor ϑ de una Estadística Θ.
•
Por ejemplo, el valor  de la Estadística , que se calcula a partir de la
muestra de tamaño n, es una estimación puntual del parámetro
poblacional µ.
•
No se espera que un estimador realice la estimación sin error o
exactamente, pero sí que no esté muy alejado.
•
Estimador Insesgado: una Estadística Θ es un estimador insesgado del
parámetro ϑ si µΘ = E ( Θ ) = ϑ
o (Si la Distribución Muestral tiene una media igual al parámetro
estimado).
•
Varianza de un Estimador Puntual: si consideramos todos los posibles
estimadores insesgados de algún parámetro ϑ, el de menor varianza se
llama el estimador más eficiente de ϑ.
•
Ejemplo:
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
48
o Si Θ1 y Θ2 son estimadores insesgados del mismo parámetro
poblacional ϑ, se elegiría el estimador cuya distribución muestral
tuviera la menor varianza. Si σ2Θ1 < σ2Θ2, decimos que Θ1 es un
estimador más eficiente de ϑ que Θ2.
7.3
Estimación por Intervalos
•
Es un intervalo de anchura finita, centrado en la estimación puntual
del parámetro, que se espera contenga el verdadero valor del
parámetro
ϑ–E<ϑ< ϑ+E
ϑI < ϑ < ϑS
•
El intervalo estimado indica, por su longitud, la precisión de la
estimación puntual.
•
El intervalo calculado se llama Intervalo de Confianza (IC) del (1- α )
100%. La fracción (1- α ) es el Coeficiente o Grado de Confianza.
Los extremos ϑI y ϑS son los Límites de Confianza Inferior y
Superior.
o P(ΘI < ϑ < ΘS ) = 1 – α
o Si α = 0,05, tenemos un IC de 95%.
o Si α = 0,01, tenemos un IC de 99%.
•
7.4
Es preferible un IC corto pero con alto grado de confianza.
Error Muestral
•
Es un error o variación entre Estadísticas de Muestra debido al azar,
o diferencias entre cada Muestra y la Población, y entre varias
Muestras (E).
o E = σx Z
o σx =
σ
n
Sx =
σ
n −1
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
7.5
49
Estimación de la Media
•
P ( - Z α
•
Ejemplo:
σ
2
n
< µ <  + Zα
σ
2
n
) = (1- α )
o En una población, considerada con tendencia normal, se ha
hecho un estudio muestral (n=15) donde el rendimiento o
promedio de vida útil de los bombillos es de  = 9000 horas,
con una desviación S = 610 hrs. De estudios anteriores, se
toma que la Desviación Poblacional σ = 500 hrs. Determine la
Media Poblacional, considerando IC de 90% y 95%.
ƒ
ƒ
Método 1:
•
n = 15;  = 9000; S = 610; σ = 500
•
σx =
σ
n
⇒σx =
500
15
⇒ σ x = 129,1hrs
•
IC1 = 90% Æ P(0,90) Æ Z = 1,65
•
E1 = 129,1 x 1,65 Æ E1 = 213
•
LI1 = 9000 – 213 Æ LI1 = 8787
•
LS1 = 9000 + 213 Æ LS1 = 9243
•
8833 ≤ µ1 ≤ 9167
•
IC2 = 95% Æ P(0,95) Æ Z = 1,96
•
E2 = 129,1 x 1,96 Æ E2 = 253
•
LI2 = 9000 – 253 Æ LI2 = 8747
•
LS2 = 9000 + 253 Æ LS2 = 9253
•
8787 ≤ µ2 ≤ 9213
Método 2:
•
IC 90%
P(9000–Z0,05
500
15
< µ < 9000+ Z0,05
500
15
) = 0,90
P (9000 – 213 < µ < 9000 + 213) = 0,90
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
50
P(8787 < µ < 9213) = 0,90
•
IC 95%
500
P(9000–Z0,05/2
15
<µ<9000+ Z0,05/2
500
15
) = 0,95
P (9000 – 253 <µ< 9000 + 253) = 0,95
P(8747 < µ < 9253) = 0,95
•
IC 99%
P(9000–Z0,005
500
15
<µ<9000+ Z0,005
500
15
) = 0,99
P (9000 – 333 <µ< 9000 + 333) = 0,99
P(8667 < µ < 9333) = 0,99
8667
8747
8787
9213
90%
95%
99%
7.6
¿Cómo se calcula el tamaño de una Muestra?
•
⎛ Zα σ ⎞
n=⎜ 2 ⎟
⎜ error ⎟
⎝
⎠
•
Ejemplo:
2
o IC = 95%; σ = 0,3
2
o
•
IC con σ desconocida (con “t” de Student)
o
•
⎛ 1,96 x0,3 ⎞
n=⎜
⎟ ⇒ n = 138,3
⎝ 0,05 ⎠
x − tα
S
2
n
< µ < x + tα
S
2
n
Ejemplo:
Ing° Luis Castellanos (Versión 1.20)
9253
9333
UNEFA. Probabilidades y Estadística.
51
o El contenido de 7 contenedores similares de Ácido Sulfúrico
son: 9,8; 10,2; 10,4; 9,8; 10,0; 10,2; 9,6 litros. Encuentre la
Media en un IC de 95%.
7.7
ƒ
 = 10,0; S = 0,283
ƒ
10,0 – 2,477 (0,283/√7) < µ < 10,0 + 2,477 (0,283/√7)
ƒ
9,74 < µ < 10,26
Límite de Tolerancia
• En una Distribución Normal, los datos están agrupados de acuerdo a
las siguientes proporciones:
o  ± s Æ 68,27% (Zona Normal)
o  ± 2 s Æ 95,45%
o  ± 3 s Æ 99,73%
•
Ello nos ofrece un Límite de Tolerancia, de acuerdo a los Porcentajes
requeridos. Como no siempre se tiene a mano el valor σ, se emplea:
o X ± k.S
•
Siendo k el valor tomado de la tabla de Factores de Tolerancia para
Distribuciones Normales.
•
Ejemplo:
o Una Máquina produce piezas de metal de forma cilíndrica. Se
toma una muestra de estas piezas y se encuentran los
diámetros 1.01; 0.97; 1.03; 1.04; 0.99; 0.98; 0.99; 1.01 y 1.03
cms. Encuentre los Límites de Tolerancia del 99% que
contendrán el 95% de las piezas, en una Distribución Normal.
ƒ
 = 1,0056
ƒ
S = 0,0245
ƒ
1,0056 ± 0,1115
ƒ
( 0,8941 ; 1,1171)
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
7.8
52
Distinción entre Límites de Confianza y Límites de Tolerancia
• El Intervalo de Confianza sirve cuando interesa hallar la Media Poblacional.
El Intervalo de Tolerancia sirve para precisar dónde caen las observaciones
individuales.
7.9
Estimación de la Varianza
•
Si S2 es la Varianza de una Muestra Aleatoria de tamaño n de una
Población Normal, un Intervalo de Confianza de (1- α ) 100% para σ2 es:
o
•
(n − 1)s 2
χ α2
<σ 2 <
(n − 1)s 2
2
χ 12−α
2
Ejemplo:
o A continuación se muestran los pesos de 10 paquetes de semillas:
46,4; 46,1; 45,8; 47,0; 46,1; 45,9; 45,8; 46,9; 45,2;46,0. Encuentre un
IC de 95% para la Varianza, suponiendo una Distribución Normal.
n∑ x i2 − (∑ x i )
2
(10 x 21273,12) − (461,2)
⇒ S 2 = 0,286
10(9)
2
ƒ
S =
ƒ
Si IC = 95%, α = 0,05, para V = 9 GL Æ
2
n(n − 1)
⇒ S2 =
•
χ α2 = χ 02, 025 = 19,023; χ 02,975 = 2700
•
0,135 < σ2 < 0,953
2
7.10 Ejercicios
•
Se ha calculado que la media y la desviación estándar, para los promedios
de puntuación de una muestra aleatoria de 36 estudiantes, son 2.6 y 0.3
respectivamente. Encuentre la media poblacional con un 90, 95 y 99% de
Intervalo de Confianza.
•
Una empresa eléctrica fabrica bombillos que tienen una vida con una
Distribución aproximadamente Normal que tiene una desviación estándar
de 40 horas. Si una muestra de 30 bombillos tiene una vida promedio de
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
53
780 horas, encuentre la media poblacional con un Intervalo de Confianza
del 96%.
•
Las estaturas de una Muestra Aleatoria de 50 estudiantes mostró una
media de 174.5 cms y una desviación estándar de 6.9 cms. Halle la media
poblacional con un Intervalo de Confianza del 98%.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
54
8 Ensayos de Hipótesis y Significación
8.1
Hipótesis Estadística
•
Aseveración o conjetura con respecto a una o más poblaciones.
•
La prueba de una Hipótesis Estadística sobre toda la Población nos dará la
verdad o falsedad de la misma.
•
Ello es poco práctico, por lo cual se escogerá una muestra aleatoria
“Significativa”.
•
La aceptación de una Hipótesis simplemente implica que los datos no dan
suficiente evidencia para rechazarla.
8.2
Hipótesis Nula (H0)
•
Es cualquier Hipótesis que deseamos probar.
•
Su rechazo conduce a la aceptación de una Hipótesis Alternativa (H1).
•
Una Hipótesis Nula con respecto a un Parámetro Poblacional siempre se
establecerá de modo que especifique un valor exacto del parámetro (Ej. H0
Æ p = 0,5), mientras que la Hipótesis Alternativa puede tomar uno o varios
valores (H1 Æ p≠ 0,5; p < 0,5; p > 0,5). (Si H1 toma un valor, se habla de
Hipótesis con una Cola. Si puede tomar dos valores, se habla de dos
colas).♠
8.3
♠
Prueba de Hipótesis Estadística
•
Error Tipo I: Se rechaza H0 cuando es Verdad.
•
Error Tipo II: Se acepta H0 cuando es Falsa.
•
Al probar cualquier Hipótesis Estadística, hay cuatro situaciones posibles:
H0 es Verdad
H0 es Falsa
Aceptar H0
Correcto
Error Tipo II
Rechazar H0
Error Tipo I
Correcto
Con dos colas, se usa α/2. Con una cola se usa α.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
55
La probabilidad de cometer un error Tipo I se denomina nivel de
significancia (α).
•
La probabilidad de cometer un error Tipo II (β) no puede calcularse a
menos que se plantee una Hipótesis Alternativa específica.
•
Ejemplo:
o Una vacuna contra la gripe sólo es eficaz un 25% a los 2 años. Para
probar si una vacuna nueva ofrece mayor protección, se inoculan 20
personas al azar. Si 9 ó más personas rebasan ese lapso sin
contraer gripe, la nueva vacuna es superior a la actual. Plantee y
compruebe la Hipótesis dada.
ƒ
H0 : p = ¼ (25%)
ƒ
H1 : p > ¼
ƒ
α = P (error Tipo I)
•
α = P(X ≥ 9  p = ¼ ) (una cola)
•
α=
20
∑ b( x;20; 1 4)
x =9
•
α=1-
8
∑ b( x;20; 1 4)
x =0
ƒ
•
α = 1 – 0,9591
•
α = 0,0409
β = P (error Tipo II) (Tomemos H1 Æ p = ½ )
•
β = P (X < 9  p = ½ )
•
β=
8
∑ b( x;20; 1 2)
x =0
•
ƒ
β = 0,2517
A medida que H1 se aproxima a la unidad, β disminuye hacia
cero.
•
β = P (error Tipo II) (Tomemos H1 Æ p = 0,7 )
•
β = P (X < 9  p = 0,7 )
•
β=
8
∑ b( x;20;0,7)
x =0
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
•
ƒ
56
β = 0,0051
Los valores por encima del valor que divide las 2 regiones
(valor crítico) constituyen la región crítica. Los menores
constituyen la región de aceptación.
ƒ
•
x = 8,5 Æ Valor crítico
•
x ≥ 8,5 Æ Región Crítica
•
x ≤ 8,5 Æ Región de Aceptación
Si la estadística X cae en la región crítica, se rechaza H0 a
favor de H1.
ƒ
•
Si cae en la zona de aceptación, H0 se acepta.
Otro Ejemplo:
o Considere la Hipótesis Nula de que el Peso Promedio de los
estudiantes varones de una Universidad es de 68 Kgr., contra la
Hipótesis alternativa de que no es igual a 678 Kgr. Supóngase σ =
3,6, y una muestra n = 36.
ƒ
H0 : µ = 68
ƒ
H1 : µ ≠ 68 ( con µ < 68 ó µ > 68) (2 colas).
ƒ
σx =
ƒ
σ
n
⇒σx =
3,6
36
⇒ σ x = 0,6
Se escoge una Región Crítica arbitraria:
α/2
α/2
67
µ = 68
69
ƒ
α = P ( < 67  H0 es verdad) + P ( > 69  H0 es verdad)
ƒ
Siendo entonces 1 = 67 y 2 = 69.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
57
ƒ
z1 =
67 − 68
⇒ z1 = - 1,67
0,6
ƒ
z2 =
69 − 68
⇒ z2 = 1,67
0,6
ƒ
α = P(Z < -1,67) + P(Z > 1,67)
ƒ
α = 2 P(Z < -1,67)
ƒ
α = 0,0950
ƒ
El 9,5% de las muestras de tamaño 36 conducirá al rechazo
de µ = 68, cuando H0 es verdadera.
•
Para reducir α, se puede aumentar el tamaño de la muestra o ampliar la
región de aceptación.
•
Ejercicio:
o Haga el Ejercicio Anterior, pero con n = 64.
8.4
Prueba de Medias y Varianzas
•
Se debe probar la Hipótesis de que la media µ de una población, con
varianza σ2 conocida, sea igual a un valor especificado µ0 contra la
alternativa de que la media no es igual a µ0.
o H0 : µ = µ0
o H1 : µ ≠ µ0
σ2
•
Sea la variable aleatoria  con media µ = µ y varianza σ x2 =
•
Si se emplea un nivel de significancia de α, se deben encontrar dos valores
n
.
críticos 1 y 2, tales que el intervalo 1 <  < 2, defina la región de
aceptación y  < 1 y  > 2 constituyan la región crítica, empleando:
o
z=
x − µ0
σ
n
•
Se hallan los valores críticos de Z correspondientes a 1 y 2. De la
población se extrae una muestra aleatoria de tamaño α y se calcula la
media de la muestra . Si  cae en la región de aceptación 1 <  < 2, se
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
58
concluye que µ = µ0. De lo contrario, se rechaza H0 y se acepta H1 : µ ≠
µ0 .
•
Ejemplo:
o Un fabricante de artículos deportivos ha inventado una nueva cuerda
sintética para pescar, con una resistencia media de 8 Kg. a la ruptura
y una desviación estándar de 0,5 Kg. Pruebe la Hipótesis de que µ =
8 Kg contra la alternativa de que µ ≠ 8 Kg, si se toma una muestra
aleatoria de 50 cuerdas y se encuentra que tienen una resistencia
media a la ruptura de 7,8 Kg. Emplee nivel de significancia de 0,01.
ƒ
H0 : µ = 8 Kg
ƒ
H1 : µ ≠ 8 Kg
ƒ
α = 0,01
ƒ
(α/2 = 0,005)
ƒ
z1 = - 2,58
ƒ
z2 = 2,58
ƒ
Por lo tanto, -2,58 < Z < 2,58
ƒ
 = 7,8 Kg
ƒ
n = 50
ƒ
z=
ƒ
-2,828 no pertenece al intervalo [-2,58; 2,58], por lo tanto se
7,8 − 8
0,5
50
⇒ z = −2,828
rechaza H0. Se concluye que la resistencia a la ruptura
promedio no es igual a 8 Kg sino menor.
• Otra manera de efectuar una Prueba de Hipótesis es aplicando la
Distribución “t” de Student, con la fórmula:
o T=
x − µ0
; v = n -1
S
n
• Ejemplo:
o El tiempo promedio empleado para inscribir a los alumnos de una
Universidad ha sido de 50 minutos con una desviación estándar de
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
59
10 minutos. Se está ensayando un nuevo procedimiento de
inscripción a través de computadores. Si una muestra aleatoria de 12
estudiantes obtiene un tiempo promedio en inscribirse de 42 minutos
con una desviación estándar de 11,9 minutos con el nuevo sistema.
Prueba la Hipótesis de que la media de la población es ahora menor
de 50, usando un nivel de significancia de: a) 0,05 b) 0,01.
ƒ H0 : µ = 50 min
ƒ H1 : µ < 50 min
ƒ S = 11,9 min
ƒ  = 42
ƒ n = 12; v = 11 GL
α1=0,05
ƒ
α2=0,01
ƒ T < - 1,796
ƒ
T < - 2,718
ƒ
ƒ T=
ƒ
x − µ0
42 − 50
⇒T =
⇒ T = −2,33
11,9
S
n
12
α1=0,05
ƒ Se rechaza H0
8.5
ƒ
α2=0,01
ƒ
Se acepta H0
Ejercicios
• Para probar la hipótesis de que una moneda es balanceada, se debe
adoptar la regla de decisión: (1) aceptar la hipótesis si el número de caras
en una muestra sencilla de 100 lanzamientos está entre 40 y 60 inclusive,
(2) rechazar la hipótesis en otros casos.
o Encuentre la probabilidad de rechazar la Hipótesis cuando en
realidad es correcta.
•
El fabricante de un medicamento patentado sostiene que tiene una eficacia
del 90% en aliviar cierta alergia durante un período de 8 horas. En una
muestra de 200 personas con dicha alergia, el medicamento mejoró a 160
personas.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
60
o Determine si la afirmación del fabricante es verdad, usando un nivel
de significancia de 0,001.
•
Se calculó que el tiempo de vida promedio de una muestra de 100
bombillos fluorescentes producidos por una compañía es de 1570 horas,
con una desviación estándar de 120 horas. Si µ es el tiempo de vida
promedio de todos los bombillos producidos por la compañía, pruebe la
Hipótesis µ = 1600 horas en contra de una Hipótesis Alterna µ ≠ 1600
horas, usando un nivel de significancia de
o 0,05
o 0,01
•
La resistencia al rompimiento de los cables producidos por un fabricante
tienen media de 1800 libras y desviación estándar de 100 libras. Se afirma
que con ayuda de una técnica nueva introducida en el proceso, se puede
aumentar dicha resistencia. Para probar esa afirmación, se probó una
muestra de 50 cables y se encontró que la resistencia promedio al
rompimiento es de 1850 libras. ¿Se acepta la Hipótesis con significancia de
0,001?
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
61
9 Análisis de Correlación y Regresión
9.1
Análisis de Regresión para dos variables
ƒ
Definición
o El Análisis de Regresión busca hallar la relación que existe entre dos
ó más variables. Al graficar los puntos correspondientes a todas las
variables, se obtiene un Diagrama de Dispersión. La Curva que
aproxima los datos se conoce como Curva de Aproximación o Curva
de Ajuste. Esa curva puede ser lineal o no lineal.
y
.
.
.
.
.
.
....
y
.. .
....
x
x
Regresión Lineal
Regresión No Lineal
o Uno los principales propósitos de la Curva de Ajuste es estimar una
de las variables (la variable dependiente) a partir de la otra (variable
independiente).
Ese
proceso
de
estimación
se
denomina
“Regresión”.
o Regresión Lineal significa que la Media de Y|x está relacionada
linealmente con x, y que la ecuación que las relaciona es la de la
recta en su forma usual dada por:
ƒ
µ Y|x = α + β x
donde α y β son parámetros por estimar a partir de los datos de la
muestra. Indicando a sus estimaciones por a y b respectivamente, la
respuesta estimada ŷ se obtiene de la línea de regresión muestral:
ƒ
ŷ=a+bx
o En la Regresión No Lineal se utiliza la ecuación de parábola:
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
ƒ
62
y = a + b x + c x2
o Regresión Simple considera sólo una Variable Independiente.
o Regresión Múltiple considera más de una Variable Independiente,
normalmente dos (2). Usa la ecuación:
ƒ
z=a+bx+cy
o Generalmente la Regresión se calcula mediante el Método de
Mínimos Cuadrados.
ƒ
Cálculo
o La Regresión a calcular será la Regresión Lineal Simple, con dos
valores, mediante las fórmulas (Ecuaciones Normales):
ƒ
ƒ
∑ y = a.n + b∑ x
∑ x. y = a∑ x + b∑ x
2
o Luego de desarrollar las ecuaciones, se obtiene:
ƒ
n∑ xy − (∑ x )(∑ y )
ƒ
b=
ƒ
=a+bÆa=-b
n∑ x 2 − (∑ x )
2
Selección de un Modelo de Regresión
o Todo lo señalado anteriormente se basa en el supuesto que el
modelo escogido es el correcto, donde y está relacionada
efectivamente con x. No se puede esperar que la predicción de la
respuesta sea buena si hay varias variables independientes, no
consideradas en el modelo, que afectan la respuesta y están
variando en el sistema. De igual manera, la predicción será
inadecuada si la estructura verdadera que relaciona a y con x es
extremadamente no lineal en el rango de las variables consideradas.
o Con frecuencia se usa el modelo de Regresión Lineal Simple, a
pesar que se sabe que el modelo no es exactamente lineal o de que
la estructura verdadera es desconocida. Esta aproximación es
bastante acertada, sobre todo cuando el rango de x es angosto. Así,
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
63
el modelo usado se convierte en una función de aproximación, que
se espera sea una representación adecuada de la región de interés.
ƒ
Ejemplo:
o
I
xi
yi
Dados los siguientes datos experimentales:
1
1.5
4.8
2
1.8
5.7
3
2.4
7.0
4
3.0
8.3
5
3.5
10.9
6
3.9
12.4
7
4.4
13.1
8
4.8
13.6
9
5.0
15.3
Estime la línea de Regresión Lineal.
ƒ
•
n=9
•
•
 = 3,3667
•
∑ y = 91,1
∑ xy = 345,09
•
 = 10,1222
•
∑x
•
∑ x = 30,3
2
= 115,11
9.(345,09) − (30,3)(91,1)
⇒ b = 2,9303
2
9.(115,11) − (30,3)
ƒ
b=
ƒ
a = 10,1222 – (2,9303)(3,3667) Æ a = 0,2568
ƒ
ŷ = 0,2568 + 2,9303 x
Significación Estadística de la Regresión
o Un Diagrama de Dispersión es una representación gráfica de los
puntos de datos para una muestra en particular. Si se escoge una
muestra diferente o se agranda la muestra original, se obtendrá
seguramente un Diagrama de Dispersión diferente. Y cada Diagrama
originará Rectas (o Curvas) de Regresión diferentes (aunque no
deben ser muy diferentes si las muestras se toman de la misma
población).
o La dispersión de puntos alrededor de la Recta (o Curva) de
Regresión indica que para un valor particular de x, hay varios valores
de y distribuidos alrededor de la Recta (o Curva). Por lo tanto, de ese
concepto de distribución se desprende que hay conexión entre la
Recta o Curva y la probabilidad.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
64
o La conexión se suministra al introducir las variables aleatorias X y Y,
las cuales pueden asumir valores muestrales diferentes x y y,
respectivamente.
o Dada la función de densidad conjunta o función de probabilidad,
f(x,y), de dos variables aleatorias X y Y, entonces existe una Recta
(o Curva) de Regresión de Mínimos Cuadrados de Y en X dada por
ƒ
y = g(x) = E (Y|X=x), siempre y cuando X y Y tengan varianza
finita, y se cumple que E {[Y-g(X)]2} = un mínimo.
9.2
Análisis de Correlación para dos variables
ƒ
Definición
o Al
hablar
de
Regresión,
se
ha
supuesto
que
la
variable
independiente x está controlada y que, en consecuencia, no es una
variable aleatoria. Dentro de ese contexto, x se llama frecuentemente
variable matemática, la cual, en el proceso muestral, se mide con un
error despreciable e insignificante.
En muchas aplicaciones en
técnicas de Regresión, es más realista suponer que tanto X como Y
son variables aleatorias y que las mediciones {(xi,yi); i = 1, 2, …, n}
son observaciones tomadas de una función de densidad conjunta
ƒ(x,y).
ƒ
Cálculo
o Formalmente, el Coeficiente de Correlación Muestral se halla:
ƒ
r=
S xy
SxS y
[∑ (x − x )(y − y )]
∑ (x − x ) ∑ (y − y )
o r=
2
2
o Otra manera de expresarlo es a través del Coeficiente de
Determinación:
∑ (y − y )
=
∑ (y − y )
2
ƒ
r
2
est
2
•
⇒
(var iación _ exp licada )
(var iación _ total )
La Variación total se compone de Variación Explicada
(tiende a seguir patrones definidos por la recta de
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
65
regresión de mínimos cuadrados) y Variación No
Explicada
(se
comporta
de
manera
aleatoria
o
impredecible).
El Coeficiente r2 se puede interpretar como la relación
•
de la variación total que se explica por la recta de
regresión de mínimos cuadrados.
•
El Coeficiente r mide que tan bien se ajusta la recta de
regresión
de
mínimos
cuadrados
a
los
datos
muestrales.
Si r2 = 1 o r = ±1, se dice que hay Correlación Lineal
•
Perfecta
o
Regresión
Lineal
Perfecta
(respectivamente).
o El Coeficiente de Correlación Poblacional se halla:
2
σ xy
σ2
2 σX
=
o ρ=
β
2
2
σY
σY
σ xσ y
ƒ
ρ = 1−
ƒ
Los valores de ρ = ±1 ocurren cuando σ2 = 0, y existe una
relación perfecta entre las dos variables.
ƒ
Los valores cercanos a cero (0) indican poca o nula
correlación.
ƒ
Los valores cercanos a +1 implica relación lineal perfecta con
pendiente positiva.
ƒ
Los valores cercanos a -1 implica relación lineal perfecta con
pendiente negativa.
ƒ
El Coeficiente de Correlación Poblacional ofrece una medida
de qué tan bien se ajusta la Curva de Regresión de una
Población dada, a los datos de la Población.
ƒ
Significación Estadística de la Correlación
o El Coeficiente de Correlación de la Población debe ser una medida
de qué tan bien se ajusta una Recta o Curva de Regresión de una
Población dada a los datos de dicha Población.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
ƒ
66
Ejemplo:
o Dadas las estaturas de los Padres y de sus Hijos Mayores en
pulgadas (x,y respectivamente):
i
xi
yi
1
65
68
2
63
66
ƒ
3
67
68
4
64
65
5
68
69
6
62
66
7
70
68
8
66
65
9
68
71
10
67
67
11
69
68
12
71
70
Estime la línea de Regresión Lineal y Halle el Coeficiente de
Correlación.
n∑ xy − (∑ x )(∑ y )
•
b=
•
=a+bÆa=-b
•
∑x = 800; ∑y = 811; ∑x.y = 54107; ∑x2 = 53418
•
 = 66,667;  = 67,583
•
b = 0,4764
•
a = 35,8248
•
ŷ = 35,8248 + 0,4764 x (Recta de Regresión)
•
∑(x-).(y-) = 40,3333; ∑(x-)2 = 84,6667; ∑(y-)2 =
n∑ x 2 − (∑ x )
2
38,9167
9.3
[∑ (x − x )(y − y )]
∑ (x − x ) ∑ (y − y )
•
r=
•
r = 0,7027
2
2
(Muy cercano a 1)
Ejercicios
ƒ
Dados los siguientes datos experimentales:
i
xi
yi
1
1
1
2
3
2
3
4
4
4
6
4
5
8
5
6
9
7
7
11
8
8
14
9
o Estime la línea de Regresión Lineal, Grafique el Diagrama de
Dispersión y Halle el Coeficiente de Correlación.
ƒ
En un Estudio de Correlación entre la Precipitación Pluvial y de la
contaminación del aire arrastrada, se obtuvieron los siguientes datos (x,y
respectivamente):
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
i
xi
yi
1
4.3
126
2
4.5
121
67
3
5.9
116
4
5.6
118
5
6.1
114
6
5.2
118
7
3.8
132
8
2.1
141
9
7.5
108
o Estime la línea de Regresión Lineal, Grafique el Diagrama de
Dispersión y halle el Coeficiente de Correlación.
ƒ
Se hizo un estudio sobre la cantidad de azúcar transformada en cierto
proceso, a varias temperaturas (y, x respectivamente):
i
xi
yi
1
1.0
8.1
2
1.1
7.8
3
1.2
8.5
4
1.3
9.8
5
1.4
9.5
6
1.5
8.9
7
1.6
8.6
8
1.7
10.2
9
1.8
9.3
10
1.9
9.2
11
2.0
10.5
o Estime la línea de Regresión Lineal, Grafique el Diagrama de
Dispersión y Halle el Coeficiente de Correlación.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
68
10 Bibliografía
•
KUME,
Hitoshi:
“Herramientas
Estadísticas
Básicas
para
el
Mejoramiento de la Calidad”. Ed Norma. Bogotá, 1992.
•
RIVAS G, Ernesto: “Estadística General”. UCV. Caracas, 1985.
•
SPIEGEL, SCHILLER & SRINIVASAN: “Probabilidad y Estadística”. Ed
McGraw Hill. Serie Schaum. México, 2005.
•
WALPOLE & MYERS: “Probabilidad y Estadística para Ingenieros”. 2da
Edición. Ed Interamericana. México 1984.
•
WALPOLE, MYERS & MYERS: “Probabilidad y Estadística para
Ingenieros”. Editorial Pearson. México 1999.
Ing° Luis Castellanos (Versión 1.20)
UNEFA. Probabilidades y Estadística.
11 Anexos
11.1 Áreas bajo la Curva Normal
Ing° Luis Castellanos (Versión 1.20)
69
UNEFA. Probabilidades y Estadística.
11.2 Valores Críticos de la Distribución χ2.
Ing° Luis Castellanos (Versión 1.20)
70
UNEFA. Probabilidades y Estadística.
11.3 Valores Críticos de la Distribución t
Ing° Luis Castellanos (Versión 1.20)
71
UNEFA. Probabilidades y Estadística.
11.4 Sumas de Distribución Binomial
Ing° Luis Castellanos (Versión 1.20)
72
UNEFA. Probabilidades y Estadística.
11.5 Factores de Tolerancia para Distribuciones Normales
Ing° Luis Castellanos (Versión 1.20)
73
UNEFA. Probabilidades y Estadística.
Ing° Luis Castellanos (Versión 1.20)
74
UNEFA
“Excelencia Educativa”