Download DISEÑO DE EXPERIMENTOS
Document related concepts
no text concepts found
Transcript
DISEÑO DE EXPERIMENTOS Conjuntos de reglas para asociar unidades experimentales con tratamientos. Una investigación estadística consta de los siguientes pasos: Identificación del problema y claro establecimiento de los objetivos de la investigación. Formulación de las hipótesis Determinación de la técnica y diseño experimental. Desarrollo del experimento. Aplicación de la técnica estadística a los resultados experimentales. Evaluación de la investigación (Particularmente con otra investigación del mismo tipo o problemas similares). OBJETIVOS DE UN DISEÑO EXPERIMENTAL Es proporcionar la máxima cantidad de información pertinente al problema bajo investigación. Sin embargo también es importante que sea tan simple como sea posible, además es recomendable hacer todo esfuerzo para ahorrar tiempo, dinero, personal y material experimental. Afortunadamente la mayoría de los diseños estadísticos son simples, no solo son fáciles de analizar sino también son eficientes estadísticamente y económicamente. PRINCIPIOS BASICOS DE UN DISEÑO EXPERIMENTAL REPRODUCCION Es la repetición de un experimento básico, que permite obtner en forma mas precisa del estado medio de cualquier factor ALEATORIZACION es la asignación del material experimental como el orden en que se realizan los ensayos se determinación aleatoriamente CONTROL LOCAL permite la utilización de bloques aumentando la precisión del experimento CLASIFICACION DE LOS DISEÑOS EXPERIMENTALES 1.- DISEÑO COMPLETAMENTE ALEATORIZADO a) CON IGUAL NUM. DE OBS. POR TRATAMIENTO b) DESIGUAL NUM. DE OBS. POR TRATAMIENTO 2. MODELO COMPLETAMENTE ALEATORIZADO POR TRATAMIENTOS Y BLOQUES COMPLETOS 3. MODELO COMPLETAMENTE ALEATORIZADO POR TRATMTOS. Y BLOQUES INCOMPLETOS 4. MODELO COMPLETAMENTE ALEATORIZADO POR TRATAMIENTOS Y BLOQUES CON INTERACCION 5. MODELO CUADRADO LATINO 6. MODELO CUADRADO GRECOLATINO 7. MODELOS DE COVARIANZA 8. MODELOS FACTORIALES a) MODELO FACTORIAL 22 b) MODELO FACTORIAL 23 9.- MODELOS DE SUPERFICIE RESPUESTA 1º.- MODELOS DE OPTIMIZACION CLASIFICACION DE LOS DISEÑOS DE EXPERIMENTALES 1.- MODELO DE DISEÑO DE EXPERIMENTO COMPLETAMENTE ALEATORIZADO Es recomendable cuando: La diferencia entre las unidades experimentales es pequeña. El número de tratamiento es pequeño. REALIZACION DEL DISEÑO Cuando se quiere probar "t" tratamientos, deseando repetir el tratamiento n veces, para lo cual se dispone de "nt" unidades experimentales, eligiéndose aleatoriamente n unidades de las nt para aplicar uno de los tratamientos digamos t1, de los nt-n restantes se eligen al azar n unidades para aplicar otro tratamiento digamos t2; y así sucesivamente hasta complementar los "t" tratamientos. Este diseño se representa a través del siguiente modelo: ij j ij Donde: j 1,2,3.......t i 1,2,3..n ij valor de i ésima observacion en el j ésima tratamiento promedio general parametro que denota el efecto del j esimo tratamiento j ij error aleatorio de las ij observaciones PRESENTACION DE DATOS En este modelo los datos se pueden presentar en la siuiente forma: Observación 1 2 . . . n nj Muestra 1 2 3 . . . t Y11 Y21 . . . Yn1 Y12 Y22 . . . Yn2 Y13 Y23 . . . Yn3 . . . . . . . . . Y1t Y2t . . . Ynt n1 n2 n3 . . . . . . nt DESCOMPOSICIÓN DE LA SUMA DE CUADRADOS STC : Suma total de cuadrados corregidos 2 C ij STC = i j C: factor de corrección ( Promedio general) 2 C ij nt i j SCTr : Suma de cuadrados entre tratamientos 2 y .j SCTr C n. j : . j ij i SCE : Suma de cuadrados del error SCE SCT SCTr : CUADRO DE ANALISIS DE VARIANZA FuenteVariac G.L . SC Media Tratamientos Error Total C CMTr=SCTr/(t-1) CMTr/CME SCTr CME=SCE/(N-t) SCE SCT/nt SCT 1 t-1 t(n-1) nt CME F DOCIMA DE HIPOTESIS Este modelo sirve para probar las siguientes hipótesis: Η 0: 1 2 ... t : igualdad de tratamientos Η1: 1 2 ... t : diferencia de tratamientos La docima estadística a usarse en este caso es el cociente F entre CMTr y ECM. La razón es bastante sencilla, En el supuesto que los ij estén distribuidos en forma normal y sean independientes con media 0 o varianza σ2 , el ECM debe ser una estimación insesgada de σ2 si, y solo si Ho. es verdadera, en este caso esperamos que F(t-1), N-t = CMTr/ECM = 1 ó muy cerca a 1, y esperamos que sea significativamente mayor que 1 si Ho. es falsa. METODO DE LA DIFERENCIA MENOS SIGNIFICATIVA Se aplica cuando los tamaños de muestra son iguales y la hipótesis se rechaza. Def. DMS.- Es la diferencia más pequeña que puede existir, entre dos medias muéstrales significativamente diferentes. Para deducir una formula para DMS, recordemos que una dócima para la diferencia entre dos medias muéstrales que se realiza por la estadística: t y1 y 2 y DMS t * ˆ y Además si n1 = n2 se supone que 1=2 estimado y como 2estimado igual al ECM y por otro lado: 2 y n 2 0.5 2 DMS t * ECM n Si tiene que, 0.5 Si Nro de tratamientos = t, entonces =N-t; pero cuando t tiende a 2; t22=F(1, 2) , la formula para la diferencia menos significativa por ultimo se convierte en: nECM F1, N c; DMS 2 0.5 En el análisis de varianza se dice que cualquiera de las dos medias muéstrales de tratamientos difiere significativamente entre si a un nivel dado si su diferencia absoluta es mayor que DMS. Es importante notar que las docimas DMS también se llaman dócimas por pares y sólo se debe emplear cuando la décima F a llevado al rechazo de Ho. Ejemplo 1 Supongamos que una compañía industrial desea comprar una maquina nueva existen 3 marcas diferentes, y se desea determinar si una de ellas es más rápida que las otras en producir un cierto articulo. Se observa los resultados de 5 horas de producción aleatoriamente de cada maquina y los datos se presentan en el cuadro 2.3, Se desea saber: si existe diferencia significativa entre las maquinas en cuanto a su producción. Cuál de las maquinas se debe recomendar para que compre la compañía. CUADRO No. 2.3 VOLUMENES DE PRODUCCION PARA TRES MAQUINAS DURANTE CINCO HORAS Observaciones Total A B C TotaL 1 25 31 24 80 2 30 39 30 99 3 36 38 28 102 4 38 42 25 95 5 31 35 28 94 160 185 135 480 SOLUCION a) Prueba de igualdad de tratamientos: HIPÓTESIS NIVEL DE SIGNIFICACION = 0.05 CALCULO DE LA SUMA DE CUADRADOS SCT C SCTr SCE = 15,810 - 15,360 = 450 = = 15,360 = 15,610 - 15,360 = 250 = 15,810 - 15,610 = 200 CUADRO No. 2.4 CUADRO DE ANALISIS DE VARIANZA Fuente Variación. G.L Media 1 Tratamientos 2 Error 12 Total 15 SUMA DE CUADRADO F CUADRADOS MEDIO 15,360 250 200 15,810 125,00 16,67 7,5 DOCIMA ESTADISTICA.- Con F encontrado en la tabla de la distribución F-DE SNEDECOR con 2 y 12 grados de libertad y a un nivel de significación de 5% nos da un valor de 3.88; comparado con el F experimental dado por: Fexp = CMTr/CME = 7.50 Es decir que Fexp. > Ftab. por consiguiente la hipótesis nula Ho. se rechaza. DECISION. Como Fexp cae en la región de rechazo significa que no existe igualdad de tratamientos. Es decir que existe diferencia significativa en la producción por tipo de máquina. Determinación del mejor Tratamiento: como n1=n2=n3=5, el CME = 16.67 y F ( 1,12):0.01=9.33 luego encontramos que: y1 y2 = 32 – 37 : = 5 < 7.89 No signific. y y = 32 – 27 : = 5 < 7.89 No signific. y2 y3 = 37 – 27 : =10 > 7.89 signific. 1 3 Así, de los tres pares de medias de tratamiento, sólo un par (y2 , y3) difiere significativamente. Permaneciendo las demás constantes por lo tanto la gerencia debe decidir a comprar la segunda maquina en forma exclusiva. PRUEBA DE SIGNIFICANCIA DE DUNCAN Esta prueba tiene en cuenta los ordenes que les toca a los promedios de tratamientos en comparación con el ordenamiento general dado mayores limites de significancia (mayor exigencia) en las comparaciones de tratamiento más apartados en el ordenamiento. Esta prueba puede hacerse aún sin su significancia la prueba F, pero si requiere homogeneidad de varianzas entre los tratamientos. Puede hacerse también si el número de repeticiones de los tratamientos no es igual. PRUEBA DE SIGNIFICACION DE TUKEY Esta prueba no tiene en cuenta los órdenes entre si de los promedios de los tratamientos porque está basada en otro principio que las pruebas anteriores; mientras que en las pruebas de t, DLS y ALS(D), cada comparación entre dos promedios de un DE UN EXPERIMENTTO En la prueba de Tukey sólo se determina una Amplitud Límite de significación, la que representaremos por ALS(T). MODELOS DE DISEÑOS ESPERIMENTALES EN BLOQUES COMPLETAMENTE ALEATORIZADOS Es aplicable cuando las unidades experimentales se pueden reagrupar de modo que sean "homogéneas en cada grupo" que generalmente se denominan bloques. Si el experimento consiste de t tratamientos y r bloques entonces cada bloque constara de t unidades experimentales REALIZACION DEL DISEÑO En cada bloque se elige al azar una unidad experimental para aplicar el tratamiento uno, asi de las t - 1 restantes se seleccionan aleatoriamente para aplicar el tratamiento 2 y asi sucesivamente hasta completar las t unidades experimentales del bloque seleccionado. El modelo: Yij i j eij i = 1,2. . .r j = 1,2. . .t Donde: Yij = observación del i-ésimo bloque en el j ésimo tratamiento. = medida general i= efecto del i-ésimo bloque i = efecto del j-ésimo tratamiento j eij = error aleatorio de las observaciones Yij con distribución normal con media 0 y varianza cuadrado. REPRESENTACION DE LOS DATOS CUADRO No. 2.3 DATOS MUESTRALES DEL MODELO EN BLOQUES COMPLETAMENTE ALEATORIZADOS DESCOMPOSICION DE LA SUMA DE CUADRADOS SCT: Suma total de cuadrados corregidos SCT C 2 ij i j C : Suma de cuadrados debido a la media yij i j C nt 2 SCTr = suma de cuadrados entre tratamientos 2. j SCTr C : . j ij ; i. Yij j i i r SCB: Suma de cuadrados de bloques Yi . SCB i t 2 C SCE : Suma de cuadrados del error SCE STC ( SCTr SCB) CUADRO No. 2.4 : CUADRO DE ANALISIS DE VARIANZA: MODELO EN BLOQUES COMPLETAMENTE ALEATORIZADOS DOCIMACIA Para este modelo, existen dos conjuntos de hipótesis para ser evaluadas: a) Dócima de los efectos de tratamientos: Η 0 τ1 τ 2 . . . τ t 0 Η 1 No todos los τ j son ceros Dócima de los efecto de Bloques: Η 0 1 2 . . . r 0 Η 1 No todos l os i son ceros De acuerdo al cuadro No. 2.4. La relación respecto a los tratamientos dado por F1=cuadrado medio de los tratamientos /cuadrado medio del error, donde F1 está distribuida como una distribución F con v1= (t-1) y v2=(r-1)*(t-1) grados de libertad Ho. es verdadera. Si el valor de F1 excede a F(1)(v1,v2), donde 100 es el nivel de significación elegido, Ho. será rechazada y la conclusión alcanzada será que existe diferencia significativa entre los t tratamientos En el caso de la segunda dócima para probar el efecto de bloques tenemos que F2 está distribuida como una F con v1=r-1 y v2=(r-1)(t1) grados de libertad, si Ho. es verdadera. esto es si F2 excede a.F( 1-)(v1,v 2 ) Donde 100 por ciento es el nivel de significación elegido Ho. será rechazada y la conclusión es que existe diferencia significativa entre los bloques. EJEMPLO ….