Download Distribución Normal o gaussiana

Document related concepts

Muestra estadística wikipedia , lookup

Intervalo de confianza wikipedia , lookup

Distribución t de Student wikipedia , lookup

Estimación estadística wikipedia , lookup

Error estándar wikipedia , lookup

Transcript
Distribución Normal o
gaussiana

La distribución normal o Gaussiana es la
más importante y la de mayor uso de
todas las distribuciones de probabilidad

Una distribución normal de media
μ y desviación típica σ se designa
por N(μ, σ). Su gráfica es la campana de
Gauss:
Definición

Se dice que una variable aleatoria X se
encuentra normalmente distribuida si su
función de densidad está dada por

El 99% de los datos se encuentra entre el
promedio y 3 desviaciones estandar
Calculo de probabilidades
distribución normal
Ejemplo
Se sabe que la longitud de las alas extendidas
de un tipo de ave rapaz es una variable
aleatoria que sigue una distribución Normal,
de media 120 cm. y desviación típica 8 cm.
X → N (120; 8)
Calcúlese la probabilidad de que la longitud
de un ave elegida al azar sea:
 a.- Mayor de 130 cm
 b.- Menor de 100 cm
 c.- Esté comprendido entre 110 y 130 cm

Distribución Normal Típica
La forma anterior de calculo de
probabilidad resulta muy difícil de calcular,
 Ante lo cual se realiza un cambio de
parámetro y se cambia la variable x por la
variable z y se pasa de la distribucón
normal general a la distribución normal
tipica


Una variable aleatoria continua, X, sigue
una distribución normal de parámetros =
µ= 0 y σ = 1

Y su función de densidad es:

µ =0 y σ = 1

Por lo tanto debemos realizar el cambio
de variable
Calculo de probabilidad
distribución normal tipificada
Suponga que x tiene una distribución
normal con normal µ =10 y σ = 2
 Calcular
 P(x<13)
 P(x>9)
 P(6≤x≤14)

Ejemplo
Se sabe que la longitud de las alas extendidas
de un tipo de ave rapaz es una variable
aleatoria que sigue una distribución Normal,
de media 120 cm. y desviación típica 8 cm.
X → N (120; 8)
Calcúlese la probabilidad de que la longitud
de un ave elegida al azar sea:
 a.- Mayor de 130 cm
 b.- Menor de 100 cm
 c.- Esté comprendido entre 110 y 130 cm

Muestreo
Población
 Es un conjunto finito o infinito de
elementos cuyas características se desean
estudiar

Muestra
 Subconjunto de la población
Muestreo
 Procedimiento para obtener una muestra
Parámetros
Son ciertos valores numéricos fijos que
pueden describir las características de una
población (promedio, varianza,
proporción)
Inferencia estadística
Es un tipo de inferencia inductiva que
permite generalizar las conclusiones
obtenidas en una muestra de la población
a todos los elementos de la población.
 La generalización de las conclusiones
obtenidas en una muestra a toda la
población está sujeta a riesgos por cuanto
la muestra se debe seleccionar con un
muestreo probabilístico

El estudio de la inferencia estadística se
acostumbra a dividir en 3 partes.
 Estimación puntual
 Estimación por intervalo
 Contraste de hipótesis.

Diseño de muestreo

Es el plan que se llevará a cabo para
seleccionar la muestra, de tal manera que
exista un conocimiento bien fundado de
que la muestra sea representativa
Método de selección de la muestra
Existen dos tipos de muestreo: el probabilístico y el
no probabilístico.
Con el muestreo probabilístico, todos los
sujetos tienen la misma probabilidad de
entrar a formar parte del estudio. La elección se
hace al azar.
El no probabilístico es aquel en el que no todos
los sujetos tienen la misma probabilidad de
formar parte de la muestra de estudio.
 Los tipos de muestreo probabilísticos más
utilizados son: aleatorio simple, aleatorio
sistemático, aleatorio estratificado y
aleatorio por conglomerados.

Muestreo aleatorio simple: Muestra
seleccionada de manera que cada
elemento o individuo de la población
tenga las mismas posibilidades de que se
incluya. Por ejemplo, los números del
cartón de los juegos de azar es una
muestra aleatoria imple ya que todos los
números tienen igual probabilidad de salir.
Muestreo aleatorio sistemático: Se
selecciona un punto aleatorio de inicio y
posteriormente se elige cada k-ésimo miembro
de la población. El k se calcula dividiendo el total de
la población por la muestra necesaria: k = N/n
 . Si se tiene una población de 8 000 individuos y el
tamaño de la muestra necesario es de 400, se
seleccionará uno de cada 20, que será la fracción
de muestreo (8 000/400). Para decidir por cuál se
ha de comenzar, se selecciona aleatoriamente, o
por sorteo, un número del 1 al 20, y a partir de
dicho número se va seleccionando a un sujeto de
cada 20.

Muestreo aleatorio estratificado: Una
población se divide en subgrupos según
alguna característica, y se forman los
denominados estratos y se selecciona al azar una
muestra de cada estrato. La estratificación se
suele hacer en función de diferentes variables o
características de interés: género, edad, situación
laboral, etc.
 Por ejemplo, si se desea efectuar una
estratificación por género y se sabe que en la
población la distribución es de 55 mujeres y 45
hombres, por tanto, si el tamaño de la muestra es
de 400, se elegirán aleatoriamente 220 mujeres y
180 hombres.

Definición de intervalo de
confianza

Dada una muestra aleatoria simple
(X1, X2,…, Xn) de una variable
aleatoria X se llama intervalo de
confianza para un parámetro θ, con
nivel o coeficiente de confianza “1-α”,
0< α < 1, a un intervalo aleatorio
(dado que sus extremos dependen de
las muestras elegidas)
Nivel de Confianza.

Probabilidad de que la estimación
efectuada se ajuste a la realidad. Cualquier
información que queremos recoger está
distribuida según una ley de probabilidad
(Gauss o Student), así llamamos nivel de
confianza a la probabilidad de que el
intervalo construido en torno a un
estadístico capte el verdadero valor del
parámetro. (1-α)
Estimación de Intervalos de
confianza para la media
Caso 1
 La muestra es seleccionada de una
población con distribución normal y
varianza poblacional conocida


µ є [ x - z1-α/2 *σ/√n , x + z1-α/2 *σ/√n]
Caso 2

La muestra es seleccionada de una
población que tiene una distribución
cualquiera con media µ y varianza σ2
conocida. En este caso n ≥30

µ є [ x - z1-α/2 *σ/√n , x + z1-α/2 *σ/√n]
Caso 3

La muestra aleatoria es seleccionada de
una población distribuida de manera
normal pero los parámetros σ,µ
(poblacionales) son desconocidos y n≤30

µ є [ x - t1-α/2 (n-1)*s/√n , x +t1-α/2 (n1) *s/√n]
Datos importantes
Muestral
Poblacional
Promedio
Desviación
estandar
varianza
x
µ
s
σ
s²
σ²
Como consecuencia de la falta de gas registrada en la
ciudad de La Plata, en los meses de invierno, la
Empresa Camuzzi - Gas Pampeana decide hacer un
estudio para determinar la cantidad gastada en este
combustible para calefacción casera en un año en
particular. Con tal motivo se selecciona una muestra
de n = 64 hogares de la ciudad. La media muestral del
gasto en gas para calefacción resultó de $83,6. Se sabe
por experiencia que la desviación estándar de la
población es $17,8.
 a) Halle un intervalo de confianza del 95% para el
gasto promedio anual en este tipo de
 combustible en las viviendas de la ciudad de La Plata.
 b) Calcule un intervalo de confianza del 99% para ese
gasto promedio anual.


. Se encuentra que la concentración
promedio de zinc de una muestra de 36
cereales es de 2.6 gramos por miligramo.
Encuentre los intervalos de confianza de
95% y 99% para la concentración media
de zinc en el cereal. Suponga que la
desviación estándar de la población es 0.3
y los datos se distribuyen de manera
normal.

Una muestra aleatoria de 16 cigarrillos de
una cierta marca tiene un contenido
medio de nicotina de 1.6mg. y una
desviación típica de 0.7mg. Suponiendo
que la variable X=“contenido de nicotina
en un cigarrillo”, sigue una distribución
N(µ; σ), obténgase un intervalo de
confianza al 99% � del contenido medio
de nicotina por cigarrillo en esa marca.
Una empresa fabrica bombillas cuya
duración en horas sigue una distribución
N(µ; 200).
 Una muestra aleatoria de 36 bombillas ha
dado una vida media de 7000 horas.
Constrúyase un intervalo de confianza al
nivel del 95%, 99 % � para la vida media
de las bombillas fabricadas por esa fábrica.

Error muestral y tamaño muestral
Error muestral
E=
Tamaño muestral
N=

La desviación típica de la altura de los
habitantes de un país es de 8 cm y los datos
se distribuyen de manera normal . Calcular el
tamaño mínimo que ha de tener una
muestra de habitantes de dicho país para
que el error cometido al estimar la altura
media sea inferior a 1 cm con un nivel de
confianza del 90%

La Consejería de Trabajo planea un estudio
con el interés de conocer el promedio de
horas semanales trabajadas por las mujeres
del servicio doméstico. La muestra será
extraída de una población de 10000 mujeres
que figuran en los registros de la Seguridad
Social y de las cuales se conoce a través de
un estudio piloto que su varianza es de
9.648. Trabajando con un nivel de confianza
de 95% y estando dispuestos a admitir un
error máximo de 0,1, ¿cuál debe ser el
tamaño muestral que empleemos?.
Intervalo de confianza para una
proporción
Intervalo de confianza para una
proporción

Error muestral
E=
Tamaño Muestral

Se quiere estimar el resultado de un
referéndum mediante un sondeo. Para ello
se realiza un muestreo aleatorio simple
con n=100 personas y se obtienen 35% que
votarán a favor y 65% que votarán en contra
(suponemos que no hay indecisos para
simplificar el problema a una variable
dicotómica). Con un nivel de error del 5%,
calcule un intervalo de confianza para la
verdadera proporción de las elecciones.

Tomada al azar una muestra de 500
personas en cierta comunidad, se
encontró que 220 personal leían el
periódico habitualmente. Calcula con un
nivel de confianza de 90%, 95% y 99% el
intervalo en que se encontrará la
verdadera proporción de electores

Una multinacional está estudiando la
posibilidad de instalar un nuevo sistema de
producción en sus empresas; antes de
hacerlo decide consultar a sus trabajadores.
Como no tienen ninguna referencia previa
sobre la opinión de sus empleados, supone
que tal opinión está dividida en partes igual
50% a favor y 50% en contra. Si desea una
fiabilidad del 99% con un error máximo del
4% ¿Cuál debe ser el tamaño mínimo de la
muestra?