Download ESTADÍSTICA INFERENCIAL

Document related concepts
no text concepts found
Transcript
ESTADÍSTICA INFERENCIAL
ESTADÍSTICA INFERENCIAL
Sesión No. 6
Nombre:
Distribuciones
de
probabilidad
para
variables
aleatorias continuas
Contextualización
Las variables aleatorias discretas son aquellas que toman estrictamente valores
enteros, por lo que generalmente se aplican en procesos probabilísticos de
conteo. Por su parte, las variables aleatorias continuas no se restringen a
valores enteros, sino que pueden asumir, además de éstos, valores decimales
comprendidos entre valores enteros, es decir, pueden tomar cualquier valor de
manera continua que se encuentre entre valores discretos. En términos
matemáticos, los valores discretos se denominan numerables, mientras que a
los valores continuos se les conoce como no numerables.
1
ESTADÍSTICA INFERENCIAL
Introducción al Tema
En esta sesión se estudiarán distribuciones de probabilidad de variables
aleatorias continuas, específicamente la distribución normal, así como su
aproximación a la distribución binomial, dando el conocimiento del uso de sus
formulas y las diferencias que caracterizas a cada una de estas, sabiendo como
y donde se pueden aplicar para tener un resultado mas preciso.
Al conocer estos elementos también podrás apreciar la forma en que se grafican
éstas y los atributos con los que cuenta cada una de estas representaciones, es
importante tener nociones de bases matemáticas para determinar un
conocimiento completo sobre la estadística y la forma en que se explotan los
datos que encontramos presentes.
2
ESTADÍSTICA INFERENCIAL
Explicación
Variables aleatorias continuas. Definición de variable aleatoria
continua
Sea ε un experimento y Ώ su respectivo espacio muestral asociado. A la función
(o relación) X, que asigna un número real X(ω) a cada elemento ω (letra griega
omega, en minúscula) que pertenece a Ώ, se le denomina variable aleatoria
continua si X(ω) puede tomar valores continuos, es decir, valores decimales que
se encuentran entre valores discretos o enteros a, b.
En este sentido, el
conjunto {a ≤X ≤b} es un suceso o evento de Ώ. Si la distribución de probabilidad
de la variable aleatoria se rige por una función f, 1 entonces la probabilidad de
que la variable aleatoria X tome un valor entre los números a y b se denota
como P(a ≤X ≤b) y equivale al área bajo la curva de f entre x = a y x = b.
Área que puede obtenerse mediante el cálculo de
la siguiente integral:
P(a ≤X ≤b)=
Este concepto se explicará más adelante en esta
misma sesión, sin embargo, cabe aclarar que no
es necesario tener conocimientos de cálculo
integral para su manejo pues existen tablas que permiten realizar cálculos de
probabilidad sin tener que desarrollar una integral. Al igual que las variables
aleatorias
discretas,
las
continuas
cumplen
con
dos
características
fundamentales:
•
(x) 0
La probabilidad de ocurrencia de un evento en particular es mayor
o igual que cero.
x)dx=1 La suma de las probabilidades de ocurrencia de todos los posibles
eventos del espacio muestral es igual a la unidad o al cien por ciento.
3
ESTADÍSTICA INFERENCIAL
4
Distribución normal de probabilidad
Al estudiar alguna característica particular de diversos fenómenos naturales y
sociales, se dice que asumen un comportamiento normal aquellos que
concentran la mayoría de las observaciones cercanas a un valor promedio y la
minoría en valores extremos. Por ejemplo:
•
Al medir la estatura de un grupo de personas de la misma edad, la
mayoría de ellas tiene una estatura muy cercana a un cierto valor
promedio.
•
Al pesar a un grupo de personas de la misma edad, la mayoría de ellas
tienen un peso muy cercano a un cierto valor promedio.
•
Si se mide el coeficiente intelectual de un grupo de personas de la misma
edad, la mayoría de ellas tienen un coeficiente muy cercano a un cierto
valor promedio.
La distribución normal tiene una representación gráfica en forma de campana,
frecuentemente denominada campana de Gauss en honor al célebre matemático
alemán Karl F. Gauss, quien realizó importantes aportaciones al estudio de la
distribución normal. Esta representación gráfica se caracteriza por ser una curva
simétrica respecto al eje y.
En la gráfica se observa que los valores
de una distribución normal tienden a
acumularse en el centro y a disminuir
en
los
extremos.
La
función
de
distribución de probabilidad normal está
dada por:
ESTADÍSTICA INFERENCIAL
Definición de distribución normal
Sea X una variable aleatoria. La expresión:
Significa que X se distribuye como una normal, con parámetros μ (letra griega
mu) y σ (letra griega sigma), donde:
•
X=Variable aleatoria.
•
μ=Media poblacional.
•
•σ=Desviación estándar poblacional.
Una vez que se sabe que un fenómeno tiene una distribución normal y se
conoce la media y la desviación estándar poblacionales, puede entonces
calcularse la probabilidad de ocurrencia de ciertos eventos; por ejemplo, la
probabilidad de que al seleccionar a una persona de un grupo de individuos de
la misma edad:
•
Su estatura sea menor que un valor dado.
•
Su estatura sea mayor que un valor dado.
•
Su estatura se encuentre entre dos valores determinados.
Área bajo la curva de una distribución normal
Como ya se mencionó, el cálculo de probabilidad de ocurrencia de eventos
asociados a una variable aleatoria con distribución normal equivale a calcular el
área bajo la curva normal delimitada por ciertos valores. Por ejemplo, la
Secretaría de la Defensa Nacional lleva un registro de todos los jóvenes que
prestan su servicio militar. Considerando que sus edades son muy similares,
puede resultar de interés que al seleccionar a uno de ellos:
• Su estatura sea menor que un valor x1, lo que se denota como P( X ≤x1 )
• Su estatura sea mayor que un valor x2, lo que se denota como P( X ≤x2 )
5
ESTADÍSTICA INFERENCIAL
• Su estatura se encuentre entre los valores x1 y x2, lo que se denota como
P(x1≤X≤x2). Esto significaría calcular el área bajo la curva mediante las
siguientes integrales:
Por la complejidad de estos cálculos, se ha optado por desarrollar tablas de
distribución normal de las cuales podrían tomarse directamente los valores de
estas integrales.
6
ESTADÍSTICA INFERENCIAL
Conclusión
Con la representación grafica se puede conocer de una forma mas precisa el
actuar de los elementos que se estudian, es decir, con las áreas sombreadas
dentro de una grafica se puede conocer lo que abarca o lo que no, dando la
oportunidad de conocer los elementos que se buscan o a los que se desea dar
una presencia mas amplia.
Para lograr graficar se tiene que conocer la forma de resolver integrales y los
elementos que pueden determinarse con estas operaciones. Se requiere del
conocimiento de la prioridad de elementos para que los resultados no se alteren,
es decir, saber si primero se multiplica, se suma, se resta o multiplica, y tener los
conocimientos necesarios en los despejes de ecuaciones para facilitar la
resolución y graficación de los mismos.
7
ESTADÍSTICA INFERENCIAL
Normalización y cálculo de probabilidad
Para calcular probabilidades de ocurrencia de eventos asociados a una
distribución normal es importante considerar dos propiedades fundamentales:
•
El área total bajo la curva normal es igual a uno.
•
La curva es simétrica respecto a la media, por lo que el área de cada
mitad corresponde al cincuenta por ciento.
Para realizar el cálculo de probabilidades con
una distribución normal es necesario trasladar
los datos originales del fenómeno objeto de
estudio a una escala común o estándar. Una
variable aleatoria estandarizada se denota con la
literal z y se obtiene mediante la siguiente
operación de estandarización o normalización:
Donde:
• z = Variable aleatoria estandarizada.
• x = Valor de la variable aleatoria a estandarizar.
• μ = Media poblacional.
• σ = Desviación estándar poblacional.
El valor de z obtenido en el paso anterior se distribuye como una normal con
media μ=0 y σ=1, es decir, X =N(0,1) , con lo que ya es posible utilizar las tablas
de distribución normal para calcular la probabilidad de ocurrencia de eventos
que pueden manifestarse de la siguiente forma:
8
ESTADÍSTICA INFERENCIAL
Que corresponden siguientes expresiones:
Probabilidad de que un valor a sea menor o igual que le valor z. Donde a, z, z1 y
z2 son variables estandarizadas. Asimismo, por simetría, se tienen las siguientes
equivalencias:
9
ESTADÍSTICA INFERENCIAL
10
Que corresponden a las siguientes expresiones:
Donde a, z, z1 y z2 son variables estandarizadas.
Ejemplos
El coeficiente intelectual (IQ) es un valor obtenido a partir de una prueba que
mide las habilidades cognitivas o inteligencia de una persona en relación a su
grupo de edad, el cual se expresa en una escala estándar para que el valor
promedio de un grupo sea igual a 100. Esto significa que una persona con un
IQ
de 115 puntos está por encima del promedio de las personas de su edad,
mientras que otra con un
IQ
de 65 está por debajo del promedio. Dado que el
IQ
se distribuye como una normal, pueden calcularse algunas probabilidades de
interés.
Supóngase que X es una variable aleatoria asociada al iq de alumnos de una
universidad. Si X se distribuye como una normal con media μ=100 y desviación
estándar σ= 16, es decir, XN(100,16),, calcular mediante tablas de distribución
normal las siguientes probabilidades:
1. Probabilidad de que el iq de un alumno sea mayor a 80 puntos, es decir,
P(80≤x).
ESTADÍSTICA INFERENCIAL
2. Probabilidad de que el iq de un alumno sea mayor a 105 puntos, es decir,
P(105≤x).
3. Probabilidad de que el iq de un alumno sea menor que 80 puntos, es decir,
P(x≤80).
4. Probabilidad de que el iq de un alumno sea menor que 105 puntos, es
decir, P(x≤105).
Soluciones
1. De acuerdo a los datos del problema, se tiene que μ=100, σ=16 y x=80.
Entonces se procede a normalizar el valor de x:
Este valor transforma la expresión P(80≤x) a su equivalente normalizada
P(z≤a),en donde z=−1.25.Esto significa que se debe calcular P(−1.25≤a).
Entonces:
11
ESTADÍSTICA INFERENCIAL
2. Normalizando los datos tenemos que:
Que puede redondearse a 0.31. Este valor transforma
a su equivalente normalizada: P(z≤
la expresión P (105≤x)
r, se debe
calcular P(0.31≤a). Entonces, P(0.31≤a)=0.5−P(0≤a≤0.31). Utilizando las tablas
de distribución normal se obtiene que P(0≤a≤0.31)=0.1217,por lo que
P(0.3≤1a)=0.5−0.1217=0.3783 que equivale a 37.83% de probabilidad.
3. Normalizando datos se tiene que:
12
ESTADÍSTICA INFERENCIAL
Este valor se transforma en la expresión P(x≤80) a su equivalente normalizada
P(a≤z), donde z=−1.25, es decir, se procede a calcular P(a≤−1.25) .
En consecuencia, P(a≤−1.25)=0.5−P(0≤a≤1.25). A través de las tablas de
distribución normal se obtiene que P(a≤
=0.1056,entonces
P(a≤−1.25)=0.5 −P(0≤a≤1.25) que equivale a 10.56% de probabilidad.
4. Al normalizar los datos obtenemos que:
Que puede redondearse a 0.31. Este valor permite transformar la expresión
P(x≤105) a su equivalente normalizada P(a≤z), donde Z=0.3125. Esto significa
que
se
debe
calcular
P(a≤0.31).
Consecuentemente,
P(a≤0.31)=0.5+P(0≤a≤0.31). Utilizando las tablas de distribución normal, se tiene
que P(0≤a≤0.31)=0.1217, por lo que P(a≤0.31)=0.5+0.1217=0.6217 que equivale
a 62.17% de probabilidad.
Aproximación normal de probabilidades binomiales
La distribución binomial P(X= k)= b(k;n,p) puede acercarse notablemente a la
distribución normal cuando n es grande y ni p ni q tienen valores cercanos a cero,
donde:
• n=Número de ensayos o repeticiones del experimento.
• k = Número de éxitos.
• p= Probabilidad de éxito.
13
ESTADÍSTICA INFERENCIAL
• q= Probabilidad de fracaso.
Para calcular probabilidades aproximando la distribución normal a la binomial se
tiene que:
µ = np
Por ejemplo, si se lanza una moneda 14 veces, calcular la probabilidad P de que
el número de águilas que aparezcan se encuentre entre tres y seis. De los datos
del ejemplo tenemos que:
Si X representa el número de águilas, se debe calcular P (3≤X ≤6) . Dado que la
distribución normal se define sobre variables aleatorias continuas, debemos
expresar los valores discretos, esto es, enteros, en una forma continua o decimal,
con lo que la expresión discreta P(3≤X ≤6) puede transformarse en la expresión
continua P(2.5 ≤X ≤6.5) . Entonces, se procede a estandarizar los valores 2.5 y
6.5:
En consecuencia, P(2.5 ≤x ≤6.5) se transforma en su equivalente normalizada
P(−2.41≤a≤0.27)=0.4920+0.1064=0.5984 ó 59.84%.
14
ESTADÍSTICA INFERENCIAL
Actividad de Aprendizaje
Instrucciones: en base a lo visto anteriormente, resuelve los siguientes
elementos.
Supóngase que X es una variable aleatoria asociada al IQ de alumnos de una
universidad. Si X se distribuye como una normal con media µ= 100 y desviación
estándar =10, es decir, X N(100,10) , calcula mediante tablas de distribución
normal las siguientes probabilidades:
1. Probabilidad de que el IQ de un alumno sea mayor a 80 puntos, es decir,
P(80 ≤x) .
2. Probabilidad de que el IQ de un alumno sea mayor a 105 puntos, es decir,
P(105 ≤x) .
3. Probabilidad de que el IQ de un alumno sea menor a 80 puntos, es decir, P(x
≤80).
4. Probabilidad de que el IQ de un alumno sea menor a 105 puntos, es decir, P(x
≤105).
5. Probabilidad de que el IQ de un alumno se encuentre entre 105 y 110 puntos,
es decir, P(105 ≤x ≤110) .
15
ESTADÍSTICA INFERENCIAL
Bibliografía
García, M. (2005). Introducción a la teoría de la probabilidad. México: Fondo de
Cultura Económica.
Hernández, A. y O. Hernández (2003). Elementos de probabilidad y estadística.
México: Sociedad Matemática Mexicana.
Meyer, P. (1986). Probabilidad y aplicaciones estadísticas. E.U.: Addison-Wesley
Iberoamericana.
Ulloa, V. y V. Quijada (2006). Estadística aplicada a la comunicación. México:
UNAM.
—— (2007). Estadística básica con Excel. México: UNAM.
Lipschutz, S. (1988). Probabilidad. México: McGraw-Hill.
16