Download ciencias ambientales 4o curso estadística

Document related concepts

SPSS wikipedia , lookup

Estimación estadística wikipedia , lookup

Muestra estadística wikipedia , lookup

Intervalo de confianza wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Transcript
CIENCIAS AMBIENTALES
4O CURSO
ESTADÍSTICA
Práctica nº 3
Estimación por punto e Intervalo con SPSS
PRÁCTICA 3
ESTIMACIÓN DE PARÁMETROS ESTADÍSTICOS
Trabajaremos en SPSS con el fichero GRANJA.TXT que se ha colgado en la web, también se ha colgado
una versión para SPSS, es el fichero GRANJA.SAV. Se debe entrar en SPSS y abrir el fichero de tipo
texto separado con tabuladores, llamado GRANJA.TXT, o bien hacer doble clic sobre el fichero
GRANJA.SAV. El fichero contiene tres columnas que corresponden a la producción, color y nº de partos
de cien vacas lecheras. En todo lo que sigue, se considera que los 100 individuos cuyos datos se incluyen
en el fichero son una muestra aleatoria simple de toda la población.
En muchas ocasiones no podemos acceder a toda la población y, para obtener información de ella, hemos
de seleccionar una muestra de la misma. Cuando evaluamos una cantidad relativa a la población a partir
de los datos de una muestra, decimos que realizamos una ESTIMACIÓN. Si el resultado de la estimación
de un parámetro poblacional es una cantidad obtenida de los datos de una muestra, decimos que hemos
realizado una estimación POR PUNTO. Si el resultado es un intervalo de valores que creemos que
contiene al parámetro poblacional, diremos que hemos realizado una estimación POR INTERVALO.
SPSS proporciona varias vías para estimar parámetros, tanto por punto como por intervalo. Un modo
rápido de determinarlos es a través de la opción EXPLORE del menú STATISTICS - SUMARIZE.
El cuadro de diálogo que aparece contiene en la ventana de la izquierda la lista de variables disponibles,
con distintas etiquetas según el tipo de variable de que se trate. Solo se podrán realizar estimaciones para
variables cuantitativas (Variables definidas como de tipo Scale), para seleccionar las variables a estudiar
se marcan en la ventana de la derecha y se pasan a la ventana correspondiente a Dependent List.
Se pueden realizar estimaciones separando los datos por grupos definidos por alguna variable cualitativa
o cuantitativa discreta, seleccionando la variable que definirá los grupos en la ventana de la izquierda y
pasándola a la ventana Factor List.
La línea Label cases by permite definir la variable que contiene las etiquetas que serán mostradas como
rótulos de los casos en los gráficos que se producirán.
Los botones Statistics, Plots y Options, permiten personalizar el análisis que se realizará, eligiendo los
estadísticos que se mostrarán. Los círculos de selección Display permiten elegir si se mostrarán en la
salida solo los resultados numéricos (Statistics), solo los gráficos (Plots) o ambos (Both).
Una vez configuradas las características del análisis, se pulsará el botón Ok para que se lleve a cabo. La
salida aparecerá en un nuevo documento output de SPSS o en el que se hubiese creado anteriormente.
Indique los resultados de las siguientes estimaciones:
1.- Media de producción
a) Estimación por punto de la media de producción en toda la población
b) Estimación mediante un intervalo del 95% de confianza para la media de producción de
toda la población.
Práctica 3, página, 1
2.- Cuasivarianza y cuasidesviación típica de producción.
a) Estimación por punto de la varianza de toda la población
b) La estimación por intervalo para la varianza no la proporciona esta salida de SPSS, pero
podemos construir un intervalo de confianza para la varianza usando las tablas de la
distribución Chi-cuadrado y la fórmula:
 ( n − 1) s 2 ( n − 1) s 2 
I1 −α = 
; 2

2
χ
χ1−α / 2 
α
/
2

2
2
con χ1−α / 2 y χα / 2 las abcisas de una distribución Chi cuadrado con n-1 grados de libertad
que dejan a su derecha un área 1-α/2 y α/2 , respectivamente.
3.- Repita las estimaciones anteriores, pero separando por grupos de animales según color. Construya los
intervalos de confianza para la media con un nivel de confianza del 90%
La estimación por punto de una proporción se puede realizar directamente a través de la opción Statistics.
Sumarize - Frequencies, que permite construir tablas de frecuencias de datos cualitativos o cuantitativos
tratados siempre como discretos. Esta opción no sirve para agrupar datos contínuos en clases. Como la
frecuencia relativa es la proporción de datos de cada categoría presentes en la muestra y el estimador por
punto de una proporción es la proporción muestral, basta con ver dichas frecuencias para saber cuál es la
estimación por punto que se desea.
4.- Transcriba la tabla de frecuencias relativas de la variable Color e indique una estimación por punto
para la proporción de animales de color P y para los que no son de este color.
Para construir un intervalo de confianza para la proporción hay que codificar los datos cualitativos como
1 para la categoría cuya proporción se desea estimar y 0 para las demás. Para realizar esta operación
elegimos la opción RECODE del menú Transform. Esta orden tiene dos opciones: Into same variable o
Into different variable, tomaremos la segunda para no modificar los datos originales, así se creará una
nueva variable cuyo nombre se debe dar y, después de asignar los nuevos valores a los valores antiguos,
se podrá salir pulsando Ok.
5.- Cree una nueva variable con el nombre Codigo_c que asigne un 1 a los animales de color P y 0 a los
demás.
Una vez creada la nueva variable, al ser de tipo numérico con solo ceros y unos, la proporción buscada es
la proporción de unos, que coincidirá con la media de esta nueva variable. Se puede incluir la variable
Codigo_c entre las variables Dependent en el cuadro de diálogo Statistics-Sumariza-Explore y se podrá
comprobar que la media coincide con la proporción de animales de color P que se ha calculado en el
apartado anterior. La estimación por intervalo para esta media es una estimación por intervalo para la
proporción, si bien no es exacto porque se basa en una t de Student, como si los datos 0 y 1 fuesen una
muestra procedente de una distribución Normal, lo que es imposible, pero si el tamaño de la muestra es
suficientemente grande, la aproximación puede ser aceptable.
6.- Utilice el procedimiento indicado para construir un intervalo del 95% de confianza para la proporción
de animales de color P.
BIBLIOGRAFÍA:
M ARTÍN A NDRÉS, A. Y LUNA DEL CASTILLO , J. D.: Bioestadística para ciencias de la Salud. 4ª Edición.
Ediciones Norma. Madrid, 1994.
M ILTON, J.S.: Estadística para Biología y Ciencias de la Salud, 2ª Edición. Interamericana-McGraw Hill.
Madrid, 1994.
STEEL R.G.D., J.H. TORRIE.: Bioestadística: Principios y procedimientos. Mc Graw-Hill, México, 1986.
W ALPOLE , R.E.Y M YERS, R.H. . Probabilidad y Estadística. McGraw Hill, México, 1992.
Práctica 3, página, 2