Download ciencias ambientales 4o curso estadística
Document related concepts
Transcript
CIENCIAS AMBIENTALES 4O CURSO ESTADÍSTICA Práctica nº 3 Estimación por punto e Intervalo con SPSS PRÁCTICA 3 ESTIMACIÓN DE PARÁMETROS ESTADÍSTICOS Trabajaremos en SPSS con el fichero GRANJA.TXT que se ha colgado en la web, también se ha colgado una versión para SPSS, es el fichero GRANJA.SAV. Se debe entrar en SPSS y abrir el fichero de tipo texto separado con tabuladores, llamado GRANJA.TXT, o bien hacer doble clic sobre el fichero GRANJA.SAV. El fichero contiene tres columnas que corresponden a la producción, color y nº de partos de cien vacas lecheras. En todo lo que sigue, se considera que los 100 individuos cuyos datos se incluyen en el fichero son una muestra aleatoria simple de toda la población. En muchas ocasiones no podemos acceder a toda la población y, para obtener información de ella, hemos de seleccionar una muestra de la misma. Cuando evaluamos una cantidad relativa a la población a partir de los datos de una muestra, decimos que realizamos una ESTIMACIÓN. Si el resultado de la estimación de un parámetro poblacional es una cantidad obtenida de los datos de una muestra, decimos que hemos realizado una estimación POR PUNTO. Si el resultado es un intervalo de valores que creemos que contiene al parámetro poblacional, diremos que hemos realizado una estimación POR INTERVALO. SPSS proporciona varias vías para estimar parámetros, tanto por punto como por intervalo. Un modo rápido de determinarlos es a través de la opción EXPLORE del menú STATISTICS - SUMARIZE. El cuadro de diálogo que aparece contiene en la ventana de la izquierda la lista de variables disponibles, con distintas etiquetas según el tipo de variable de que se trate. Solo se podrán realizar estimaciones para variables cuantitativas (Variables definidas como de tipo Scale), para seleccionar las variables a estudiar se marcan en la ventana de la derecha y se pasan a la ventana correspondiente a Dependent List. Se pueden realizar estimaciones separando los datos por grupos definidos por alguna variable cualitativa o cuantitativa discreta, seleccionando la variable que definirá los grupos en la ventana de la izquierda y pasándola a la ventana Factor List. La línea Label cases by permite definir la variable que contiene las etiquetas que serán mostradas como rótulos de los casos en los gráficos que se producirán. Los botones Statistics, Plots y Options, permiten personalizar el análisis que se realizará, eligiendo los estadísticos que se mostrarán. Los círculos de selección Display permiten elegir si se mostrarán en la salida solo los resultados numéricos (Statistics), solo los gráficos (Plots) o ambos (Both). Una vez configuradas las características del análisis, se pulsará el botón Ok para que se lleve a cabo. La salida aparecerá en un nuevo documento output de SPSS o en el que se hubiese creado anteriormente. Indique los resultados de las siguientes estimaciones: 1.- Media de producción a) Estimación por punto de la media de producción en toda la población b) Estimación mediante un intervalo del 95% de confianza para la media de producción de toda la población. Práctica 3, página, 1 2.- Cuasivarianza y cuasidesviación típica de producción. a) Estimación por punto de la varianza de toda la población b) La estimación por intervalo para la varianza no la proporciona esta salida de SPSS, pero podemos construir un intervalo de confianza para la varianza usando las tablas de la distribución Chi-cuadrado y la fórmula: ( n − 1) s 2 ( n − 1) s 2 I1 −α = ; 2 2 χ χ1−α / 2 α / 2 2 2 con χ1−α / 2 y χα / 2 las abcisas de una distribución Chi cuadrado con n-1 grados de libertad que dejan a su derecha un área 1-α/2 y α/2 , respectivamente. 3.- Repita las estimaciones anteriores, pero separando por grupos de animales según color. Construya los intervalos de confianza para la media con un nivel de confianza del 90% La estimación por punto de una proporción se puede realizar directamente a través de la opción Statistics. Sumarize - Frequencies, que permite construir tablas de frecuencias de datos cualitativos o cuantitativos tratados siempre como discretos. Esta opción no sirve para agrupar datos contínuos en clases. Como la frecuencia relativa es la proporción de datos de cada categoría presentes en la muestra y el estimador por punto de una proporción es la proporción muestral, basta con ver dichas frecuencias para saber cuál es la estimación por punto que se desea. 4.- Transcriba la tabla de frecuencias relativas de la variable Color e indique una estimación por punto para la proporción de animales de color P y para los que no son de este color. Para construir un intervalo de confianza para la proporción hay que codificar los datos cualitativos como 1 para la categoría cuya proporción se desea estimar y 0 para las demás. Para realizar esta operación elegimos la opción RECODE del menú Transform. Esta orden tiene dos opciones: Into same variable o Into different variable, tomaremos la segunda para no modificar los datos originales, así se creará una nueva variable cuyo nombre se debe dar y, después de asignar los nuevos valores a los valores antiguos, se podrá salir pulsando Ok. 5.- Cree una nueva variable con el nombre Codigo_c que asigne un 1 a los animales de color P y 0 a los demás. Una vez creada la nueva variable, al ser de tipo numérico con solo ceros y unos, la proporción buscada es la proporción de unos, que coincidirá con la media de esta nueva variable. Se puede incluir la variable Codigo_c entre las variables Dependent en el cuadro de diálogo Statistics-Sumariza-Explore y se podrá comprobar que la media coincide con la proporción de animales de color P que se ha calculado en el apartado anterior. La estimación por intervalo para esta media es una estimación por intervalo para la proporción, si bien no es exacto porque se basa en una t de Student, como si los datos 0 y 1 fuesen una muestra procedente de una distribución Normal, lo que es imposible, pero si el tamaño de la muestra es suficientemente grande, la aproximación puede ser aceptable. 6.- Utilice el procedimiento indicado para construir un intervalo del 95% de confianza para la proporción de animales de color P. BIBLIOGRAFÍA: M ARTÍN A NDRÉS, A. Y LUNA DEL CASTILLO , J. D.: Bioestadística para ciencias de la Salud. 4ª Edición. Ediciones Norma. Madrid, 1994. M ILTON, J.S.: Estadística para Biología y Ciencias de la Salud, 2ª Edición. Interamericana-McGraw Hill. Madrid, 1994. STEEL R.G.D., J.H. TORRIE.: Bioestadística: Principios y procedimientos. Mc Graw-Hill, México, 1986. W ALPOLE , R.E.Y M YERS, R.H. . Probabilidad y Estadística. McGraw Hill, México, 1992. Práctica 3, página, 2