|
|
Análisis de Varianza |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Alberto Morillo Alujas, Veterinario Daniel Villalba Mata, Doctor Ingeniero Agrónomo Jaume Feixa Cercós, Ingeniero Técnico Agrícola Tests & Trials, S.L. San Isidro 8 22540 Altorricón. Huesca España IntroducciónEn el anterior capítulo, utilizamos los contrastes de significación para determinar si la media muestral se correspondía con la media de la población, y también los utilizamos para comparar dos medias. En los contrastes para comparar dos medias, las técnicas usadas permitían determinar el efecto de una variable sobre la media de otra variable, por ejemplo, el efecto de incluir harina de pescado en la dieta de los lechones sobre la ganancia media diaria de estos lechones. Tendríamos que aclarar que los estudios estadísticos a menudo comparan más de dos poblaciones. Por tanto, es necesario un método para comparar cualquier número de medias. Las comparaciones múltiplesSiguiendo con el anterior ejemplo, nos podríamos preguntar, por ejemplo, qué efecto tiene sobre la ganancia media diaria de los lechones incluir en la dieta harina de pescado en diferentes cantidades. Planteemos el ejemplo. Se ha distribuido tres dietas a 20 lechones en la etapa de prestarter. La dieta 1 contenía un 0% de harina de pescado, la dieta 2 contenía un 4% de harina de pescado, mientras que la dieta 3 contenía 8% de harina de pescado. Los resultados en cuanto a ganancia media diaria fueron los siguientes.
Calculemos, como hacíamos en el primer capítulo, Algunos de los estadísticos básicos, para empezar a analizar el problema. Siendo los resultados los siguientes: Como podemos comprobar la media de la ganancia media diaria aumenta a medida que aumenta el contenido de harina de pescado de la dieta de los lechones, ya que la media de ganancia media diaria para la dieta con 0% de harina de pescado es de 0,224, para la dieta de 4% es de 0,244, mientras que para la dieta de 8% es de 0,259. Ahora, la pregunta que nos deberíamos hacer es la siguiente, ¿son estadísticamente significativas estas diferencias? La problemática de las comparaciones múltiplesAntes de nada, empecemos dando nombre a las medias de las ganancias medias diarias de los lechones. Para la dieta con 0% de harina de pescado la media será m 1, para la dieta con un 4% de harina de pescado la media la llamaremos m 2, y para la dieta con el 8% de harina de pescado la media será m 3. Si pretendemos comparar estas tres medias podríamos usar varias veces la prueba t de dos muestras que vimos en capítulo anterior, planteando las siguientes hipótesis:
Ha: m 1 ¹ m 2 obtendríamos,
Ha: m 1 ¹ m 3 obtendríamos,
Ha: m 2 ¹ m 3 obtendríamos,
El inconveniente que nos encontramos al hacer estas tres pruebas, es que obtenemos tres valores P (ver capítulo anterior), uno para cada prueba. Esto no nos dice cuál es la probabilidad que otras tres medias muestrales cualquiera estén tan separadas como éstas. Es decir, puede ser que m 1 y m 3 sean estadísticamente distintas si nos fijamos en la comparación de estas dos medias, pero podría ser que no fueran estadísticamente distintas si sabemos que son la media menor y mayor de los tres grupos. En conclusión, no podemos comparar, de una manera categórica, muchas medias de dos en dos, mediante pruebas de significación. El problema de comparar varias medias conjuntamente, es un problema típico de la estadística. Lo resolveremos mediante las pruebas más sencillas del Análisis de varianza, cuya dificultad es mínima aunque mayor que en el caso de los contrastes de significación. Como veremos estas pruebas nos permiten comparar todas las medias conjuntamente. Nos permitirán discernir si hay diferencias significativas entre todas las medias. Una vez detectadas diferencias entre ellas, en un análisis posterior, que en este artículo no nos ocupa, podremos determinar las diferencias entre cada una de las medias por separado. Este último análisis ya se realiza con programas estadísticos especializados, mediante diferentes técnicas, como podrían ser los llamados tests de Duncan, tests de la Mínima Diferencia Significativa, etc. Análisis de Varianza de un factor. Prueba F del Análisis de varianzaUna de las singularidades de la estadística es que uno de los métodos para poder comparar medias se denomine Análisis de la Varianza. El motivo es que esta prueba se lleva a cabo comparando dos tipos de variación. El Análisis de Varianza es un método general para estudiar las fuentes de variación en las respuestas. La comparación de varias medias se llama Análisis de Varianza de un factor. Es de un factor debido a que la variable respuesta, en nuestro ejemplo Ganancia Media Diaria de los lechones, sólo se ve influida por otra variable, en nuestro ejemplo, el contenido de harina de pescado en la dieta. La prueba más sencilla del Análisis de Varianza para comparar varias medias se denomina prueba F. El estadístico F utilizado para comparar varias medias tiene la siguiente forma: F = variación entre medias muestrales / variación entre individuos de la misma muestra El estadístico F sólo puede tomar valores positivos o cero. Será cero cuando las medias sean todas iguales. De hecho, el efecto del azar crea algunas diferencias entre las medias muestrales, aún cuando las medias de las poblaciones son iguales. Así, cuando la hipótesis nula es cierta, esperamos que F tome valores próximos a uno. A medida que las medias muestrales están más separadas entre sí, el valor de F se hace mayor. Los valores grandes de F constituyen una prueba fehaciente en contra de la hipótesis nula, inclinándonos a pensar que la hipótesis correcta es la alternativa, la que contempla que alguna de las medias muestrales no es igual a las demás. No hay una mejor explicación que la que se pueda ver en un ejemplo. De esta manera, sigamos el hilo del ejemplo que planteamos en la introducción. Queremos contrastar la hipótesis nula de que no existen diferencias entre la Ganancia Media Diaria de los lechones para las tres dietas con diferente contenido en harina de pescado. Es decir:
La hipótesis alternativa plantea que sí existe alguna diferencia entre las medias, es decir, no todas las medias son iguales:
La Ha contempla el caso que m 1 = m 2, pero que m 3 tenga un valor diferente, o cualquier otra combinación. El contraste de H0 contra Ha se denomina prueba F del Análisis de varianza. El Análisis de varianza se abrevia comúnmente en ANOVA (Analysis of Variance). Análisis de varianza en ExcelPara proseguir con el Análisis de varianza del ejemplo debemos utilizar el programa Excel. Una vez introducidos los datos del ejemplo, entraremos en la opción Análisis de datos, que estará debidamente activada (en caso contrario, ver capítulos anteriores), del menú Herramientas. A continuación, seleccionaremos la opción Análisis de varianza de un factor como se muestra en la figura 1.
Figura 1. Análisis de varianza de un factor
El resultado de realizar esta operación es el siguiente: Fijémonos principalmente en el estadístico de contraste F, F = 6,779. como dijimos anteriormente a mayor valor de F nos daba una idea que la hipótesis nula no era la correcta. Ahora observemos su probabilidad, que es de 0,0022. Mientras el valor de la probabilidad se sitúe por debajo de 0,05 (el nivel de significación tradicionalmente aceptado), podremos afirmar que existe la evidencia de que los tres tipos de dieta no son iguales, o alguna de las tres dietas es diferente a las demás, es decir, afectan de forma diferente a la Ganancia Media Diaria de los lechones. Estamos en disposición de rechazar la hipótesis y aceptar como cierta la hipótesis alternativa. La prueba F del ANOVA valora la evidencia de que existe alguna diferencia entre las medias poblacionales. En la mayoría de los casos siempre esperamos que esta prueba sea significativa. No emprenderíamos el estudio posterior, comparar una a una cada media, sino encontrásemos diferencias. Si bien parece contradictorio a lo que se ha dicho en el apartado La problemática de las comparaciones múltiples y, debido a que los programas estadísticos no están al alcance de todos, no sería descabellado que, una vez realizada la prueba F, separáramos cada una de las medias mediante contrastes una a una. Eso sí, tendremos que ser conscientes que en cada prueba posterior que realizamos tenemos una probabilidad de error del 5% (si comparamos 7 medias dos a dos en al menos una cometeremos el error de aceptar la Hipótesis alternativa cuando no es cierta) .La prueba F nos sirve como precaución para evitar ser engañados por las variaciones debidas al azar. Análisis de Varianza de varios factoresComo hemos estado viendo en el ejemplo, el único factor que podía perturbar a nuestra variable respuesta, la Ganancia Media Diaria, era el contenido de harina de pescado de la dieta. Este es el caso más sencillo que nos podemos encontrar cuando analicemos unos datos y deseemos comparar medias. Que hubiese sucedido si hubiéramos separado a los lechones en dos mitades y les hubiéramos suministrado dos dietas diferentes en energía, a parte del contenido de harina de pescado. La variable Ganancia Media Diaria ya no sólo estaría influenciada por el factor contenido en harina de pescado, sino que también lo estaría o podría estarlo por la cantidad de energía que aporta la dieta. De hecho, el nivel de factores puede ser muy amplio pero, no se nos escapa, el análisis se complicaría de forma exagerada. El programa Excel permite hacer un Análisis de Varianza hasta dos factores. En la opción Análisis de datos del menú Herramientas, debemos seleccionar la opción Análisis de Varianza de dos factores con varias muestras por grupo. La intención de los autores en esta serie de artículos es proporcionar una serie de herramientas estadísticas básicas, que pueden ser llevadas a cabo, con más o menos dificultad, mediante el programa Excel, que está al alcance de todos. De esta forma, en la página www.testsandtrials.com los lectores encontrarán un ejemplo resuelto y debidamente explicado de un Análisis de Varianza para dos factores. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
© www.exopol.com - mail |