Download Estimacion

Document related concepts
no text concepts found
Transcript
Distribución de la Media Muestral
Experimentos de Simulación
Este metodo permite obtener información acerca de la distribución
muestral de una estadísitica. Para realizar el xperimento hay que
especificar
La estadística de interés ( promedio, desviación estándar, etc)
La distribución poblacional
El tamño de la muestra
El número de réplicas
Podemos por ejemplo una población normal con un promedio poblacional
de 8.25 y una desviación estándar de 0.75. Podemos generar 1000
muestras de tamaños 2, 5, 10, 20 y 30. de cada experimento calculamos
la media muestral, la desviación estándar de la media muestral y la
desviación estándar de la muestra.
Se generan los datos
test1<-rnorm(500,8.25, 0.75)
Se genera la matrix donde seran almacenadas las 1000 muestras de tamños diferentes, a
continuación se presenta el caso de n =2
test<-matrix(nrow=1000,ncol=2)
en seguida se toman muestras de tamaño 2
for(i in 1:1000)
{
test[i,]<-sample(test1,2)
}
Se sacan los promedios de cada muestra
mean.size2<-apply(test,1,mean)
se obtiene el promedio de todos los promedios muestrales
mean(mean.size2)
Tips
R-codes For Simulation
(a) Population 1: Right Skewed Distribution We can simulate from a Poisson distribution:
> test1<-rpois(1000,2)
> hist(test1)
> mean(test1)
[1] 2.029
> sd(test1)
[1] 1.382777
(b) Population 1: Obtaining 1000 Samples With Size 2, 3, 6, 10, 20, 100
Here is the case for Size 2. Others are similar.
> test<-matrix(nrow=1000,ncol=2)
> for(i in 1:1000)
{
test[i,]<-sample(test1,2)
}
> mean.size2<-apply(test,1,mean)
> mean(mean.size2)
[1] 2.0945
> sd(mean.size2)
[1] 0.9860487
(c) Population 2: Obtaining 1000 Samples With Size 2, 3, 6, 10, 20, 100 Again,
only the case for size 2 is included.
test<-matrix(nrow=1000,ncol=2)
for(i in 1:1000)
{
test[i,]<-sample(test2,2)
}
mean.size2.norm<-apply(test,1,mean)
> mean(mean.size2.norm)
[1] 99.95793
8
> sd(mean.size2.norm)
[1] 7.199265
(d) Population 1: Plotting Histograms and QQ-plots
par(mfrow=c(3,2))
hist(mean.size2)
hist(mean.size3)
hist(mean.size6)
hist(mean.size10)
hist(mean.size20)
hist(mean.size100)
par(mfrow=c(3,2))
qqnorm(mean.size2)
qqnorm(mean.size3)
qqnorm(mean.size6)
qqnorm(mean.size10)
qqnorm(mean.size20)
qqnorm(mean.size100)
(e) Population 2: Plotting Histograms and QQ-plots
par(mfrow=c(3,2))
hist(mean.size2.norm)
hist(mean.size3.norm)
hist(mean.size6.norm)
hist(mean.size10.norm)
hist(mean.size20.norm)
hist(mean.size100.norm)
par(mfrow=c(3,2))
qqnorm(mean.size2.norm)
qqnorm(mean.size3.norm)
qqnorm(mean.size6.norm)
qqnorm(mean.size10.norm)
qqnorm(mean.size20.norm)
qqnorm(mean.size100.norm)
> twosam <- function(y1, y2) {
n1 <- length(y1); n2 <- length(y2)
yb1 <- mean(y1); yb2 <- mean(y2)
s1 <- var(y1); s2 <- var(y2)
s <- ((n1-1)*s1 + (n2-1)*s2)/(n1+n2-2)
tst <- (yb1 - yb2)/sqrt(s*(1/n1 + 1/n2))
tst
}
With this function defined, you could perform two sample t-tests
 tstat <- twosam(data$male, data$female); tstat
Teorema del Límite Central
Sean
Una muestra aleatoria de una distribución con media
Y varianza
Entonces si n es suficientemente grande
Tiene una distribución Normal aproximada con
Y
También tiene una distribución Normal con
INTERVALOS DE CONFIANZA