|
|
Cálculo del tamaño muestral (II) |
||||||||||||||||||||||||||||||||||||||||
|
Daniel Villalba Mata, Doctor Ingeniero Agrónomo1 1. Universidad de Lleida. Departamento de Producción animal. Avda. Rovira Roure 191. 25198 Lleida En este capítulo profundizaremos en el cálculo del tamaño muestral. En el capítulo anterior planteamos el concepto de diferencia relevante y diferencia significativa, clave para el cálculo del tamaño muestral, en éste presentaremos el ejemplo del cálculo para un tests estadístico muy utilizado en la experimentación con animales, la comparación de dos proporciones. Pero como siempre, antes de todo, hace falta recordar algún concepto estadístico más. Nivel de riesgo y potencia de un test En los primeros capítulos de esta serie se presentó el contraste de hipótesis, en él se introdujo la descripción de los tipos de error en cualquier contraste. Cuando estamos haciendo el contraste entre dos valores (por ejemplo entre las proporciones de curación de dos tratamientos), y teniendo en cuenta que trabajamos con muestras y no con poblaciones, no podemos asegurar al 100% que los resultados son ciertos, siempre hay una incertidumbre, siempre estamos cometiendo un error. Suponiendo que la hipótesis que queremos comprobar es si la diferencia entre las dos proporciones es igual (hipótesis nula) o diferente (hipótesis alternativa) de cero, los dos errores más importantes que podemos cometer, y que tenemos que mantener dentro de un límite son: 1) Asegurar que la diferencia entre las dos proporciones es diferente de cero cuando en "realidad" no lo es. Queremos que esto ocurra cuanto menos mejor, queremos que la probabilidad de este error sea pequeña (por ejemplo del 5%, 5 de cada 100 veces nos equivocaremos). A este tipo de error se le llama el nivel de riesgo o nivel de significación (α). 2) Asegurar que la diferencia entre las dos proporciones no es igual a cero cuando en "realidad" existen diferencias entre las dos proporciones. Queremos que la probabilidad de detectar diferencias cuando las hay sea lo más alta posible, esta probabilidad denomina Potencia de un test (β) Una vez definidos estos dos parámetros, pasamos a un ejemplo de cálculo de tamaño muestral Diferencia entre proporciones Supongamos que queremos efectuar una prueba para comprobar el efecto de un tratamiento antibiótico experimental sobre la tasa de curación de animales con síntomas de una enfermedad respiratoria comparado con un tratamiento control. ¿Cuántos animales debemos controlar de cada tratamiento? Si recordamos el artículo anterior, lo primero que se debe definir es la variabilidad del parámetro que estamos estudiando. En este caso esta variabilidad es función de las proporciones de curación esperadas de los dos tratamientos (p1 y p2). En segundo lugar es necesario decidir cual es la diferencia entre tratamientos que esperamos detectar (dif=p2-p1), teniendo en cuenta como Así, se puede calcular el tamaño muestral mínimo por grupo (n) para detectar una diferencia determinada (dif) y un nivel de significación α y una potencia β. Para ello se utilizará la ecuación de cálculo del error estándar de la diferencia de dos proporciones (p1 y p2) corregida para tener en cuenta la aproximación de la distribución binomial a la normal que nos proporcionará el valor Zα y Zβ.
Zα y Zβ son los valores que toma la distribución normal para probabilidades α y β. El primer valor es α, por que estamos haciendo un test unilateral (lo que se llama también "de una cola" ), esto es, la hipótesis alternativa realmente es "el tratamiento 2 es superior al 1"). Si efectuáramos un test bilateral (hipótesis alternativa, "el tratamiento 2 es inferior o superior al 1" deberíamos utilizar Zα/2 en las fórmulas. Estos valores se pueden encontrar tabulados en los apéndices de muchos libros de estadística bajo el epígrafe "Probabilidad de hallar un valor al azar de Z=(Y-µ)/σ mayor que los valores tabulados en los márgenes", en éstas se debe buscar el valor de α o β en la tabla y el valor tabulado corresponde a Z. También tenemos al posibilidad de calcularlos con el EXCEL. En concreto Z de cualquier probabilidad se puede obtener tomando el número positivo que aparece como resultado de la función DISTR.NORM.ESTAND.INV, por ejemplo, si α=0.025, la celda resultado de la función =DISTR.NORM.ESTAND.INV(0.025) es -1.95996279, Zα es entonces 1.95996279. Para el caso de una proporción de curación p1= 70% y para detectar una diferencia entre tratamientos del 20% (dif=0.14) con un nivel de significación 0,05 y una potencia de 0,70 el número de animales necesario por grupo es aproximadamente de 96. Es interesante comentar que el tamaño muestral aumenta de forma muy importante en función del nivel de significación y la potencia del test, como ejemplo se presenta la tabla 1 con diferentes escenarios. Tabla 1. Algunos tamaños muestrales para la comparación de proporciones en diferentes escenarios.
Es importante resaltar que para proporciones cercanas al 50% y con niveles de significación bajos y potencias altas el tamaño muestral se dispara de forma importante, por ejemplo imaginemos el coste de controlar las tasas de curación de 535 cerdos por tratamiento. En el próximo capítulo presentaremos el cálculo del tamaño muestral para una diferencia de medias. |
|||||||||||||||||||||||||||||||||||||||||
|
© www.exopol.com - mail |
|||||||||||||||||||||||||||||||||||||||||