IndiceIndice

ExopolAutovacunasDiagnóstico

El estudio del espesor de grasa dorsal en una granja de cerdas: datos frente a gráficos.

Un veterinario nos remitió una serie de datos que obtuvo en una explotación tras la medición del espesor de la grasa dorsal con un aparato Recco destinado para este fin y quiere que le hagamos un estudio descriptivo sobre sus datos.

Nos envió los datos en un fichero de Excel y nos dio la descripción de los valores explicándonos qué era cada una de las variables.

Veamos los problemas que presenta este estudio estadístico, usando solamente el programa Excel que incorpora Microsoft Office.

En primer lugar queremos señalar que Excel no es la mejor herramienta para la recogida de datos. Recomendamos a los lectores la lectura de los artículos sobre bases de datos relacionales que en esta serie hemos publicado.Pero como vamos a usar Excel para el análisis de los datos no es un gran problema el haber recibido los datos en este formato.

Figura 1. Vista del archivo EGDGES.xls donde están los datos originales.

Tenemos tres variables:

  • Nº lact: Ciclo de parto.
  • megd: Espesor de grasa dorsal en mm.
  • gestacio: Estado productivo tomando sólo dos valores: 1-2 TERCIO gest (dos primeros tercios de la gestación) y 3ER TERCIO GEST (último tercio de gestación).

El primer paso es un estudio de los datos para ver si están dentro de los parámetros lógicos y no hay errores. Para ello activamos el análisis de datos de Excel y realizamos un estudio estadístico descriptivo. Para la variable Nº lact obtenemos los siguientes resultados:

Tabla 1. Resultados descriptivos de la variable Nº lact.

Nº lact

Media

4.034

Error típico

0.099

Mediana

4

Moda

5

Desviación estándar

2.161

Varianza de la muestra

4.668

Curtosis

-0.753

Coeficiente de asimetría

0.316

Rango

9

Mínimo

1

Máximo

10

Cuenta

476

Nivel de confianza(95.0%)

0.195

 

¿Con esta tabla estamos seguros de que los datos son correctos?. Sí. Ya que nos informa de que todos los datos están entre 1 y 10 (Máximo y Mínimo) y nos dice que hay 476 datos (Cuenta). El resto de los datos es una descripción de los mismos. El problema viene a la hora de darnos una idea de cómo es la distribución de esta variable sólo con estos datos. Si con los mismos datos confeccionamos un gráfico, probablemente estaremos mejor informados de cómo se distribuye la variable.

Para ello debemos agrupar primero la variable en frecuencias para conocer cuántas cerdas hay en cada ciclo de parto. Creamos dos columnas nuevas denominadas Nº lact y Número. Bajo la variable Nº lact escribimos los ciclos del 0 al 10 e introducimos la fórmula de frecuencia en la casilla G2: {=FRECUENCIA(A2:A477;F2:F11)}. Recordar que la introducción de validación de una fórmula matricial en Excel se realiza activando las teclas Ctrl+May+Enter . Para más información activar la Ayuda de la función FRECUENCIA en Excel.

Obtenemos la tabla de frecuencias y con ella podemos configurar el gráfico:

Gráfico 1. Distribución de la variable Nº lact.

Ahora quizás nos damos una mejor idea de cómo se distribuye la variable Nº lact. Si volvemos a la Tabla 1 ya nos informaba de la forma de la curva con un coeficiente de curtosis negativo (curva desplazada a la izquierda) y una asimetría cercana a 0.

Debemos de realizar el mismo ejercicio con las otras dos variables obteniendo los siguientes resultados:

Tabla 2. Resultados descriptivos de la variable megd (Espesor de grasa dorsal).

megd

Media

16.441

Error típico

0.148

Mediana

16.5

Moda

16.5

Desviación estándar

3.227

Varianza de la muestra

10.415

Curtosis

0.240

Coeficiente de asimetría

0.390

Rango

20.5

Mínimo

9

Máximo

29.5

Suma

7826

Cuenta

476

Nivel de confianza(95.0%)

0.291

 

Como en la ocasión anterior no nos damos una idea muy exacta de cómo tenemos estas cerdas. Para ello confeccionamos de nuevo una tabla de frecuencias estableciendo los límites de 2 en 2 mm obteniendo la siguiente tabla:

Tabla 3. Frecuencia del Espesor de grasa dorsal en intervalos de 2 mm.

megd

Número

Porcentaje

9

3

0.63%

11

15

3.15%

13

62

13.03%

15

90

18.91%

17

131

27.52%

19

86

18.07%

21

51

10.71%

23

25

5.25%

25

11

2.31%

27

1

0.21%

29

0

0.00%

31

1

0.21%

 

Y si lo representamos en gráfico:

Gráfico 2. Frecuencia del Espesor de grasa dorsal.

Al tener también la información de la distribución del Espesor de grasa dorsal por ciclo de parto, podemos estar interesados en conocer si en los diferentes partos la grasa dorsal sigue la misma distribución. Para ello realizamos un análisis de la varianza. Previamente y debido a que hay una cerda con 10 partos, modificamos este valor, dándole a la variable el valor de "Mayor o igual a 9" y además conoceremos primero una descripción de los datos por ciclo de parto.

Recordar que con Excel, podemos realizar este análisis en el menú Herramientas, eligiendo Análisis de datos y clicando en la opción Análisis de varianza de un factor.

Tabla 3. Descripción del Espesor de grasa dorsal según el ciclo de parto.

Ciclo de parto

1

2

3

4

Media

15.7

15.4

15.7

16.5

Error típico

0.3

0.3

0.4

0.4

Mediana

16

15

15.5

16.5

Moda

16.5

14.5

15.5

16.5

Desviación estándar

2.744

2.823

3.319

2.964

Varianza de la muestra

7.528

7.972

11.017

8.785

Curtosis

0.461

0.241

1.464

-0.505

Coeficiente de asimetría

0.092

0.613

0.950

0.214

Rango

14.5

13

17.5

12.5

Mínimo

9

10

9.5

11

Máximo

23.5

23

27

23.5

Suma

1118

1047.5

1064.5

1173.5

Cuenta

71

68

68

71

Nivel de confianza(95.0%)

0.649

0.683

0.803

0.702

 

Ciclo de parto

5

6

7

8

9

Media

16.4

17.4

17.6

19.1

17.2

Error típico

0.4

0.5

0.5

0.6

0.9

Mediana

16.5

17.5

17.5

19

17.25

Moda

17

15.5

16.5

19

#N/A

Desviación estándar

3.239

3.586

3.328

2.832

2.965

Varianza de la muestra

10.493

12.861

11.077

8.023

8.789

Curtosis

-0.288

-0.560

-0.287

9.161

-0.878

Coeficiente de asimetría

0.015

0.148

-0.020

2.434

-0.051

Rango

14

15

14

14.5

9

Mínimo

9

9.5

10.5

15

12.5

Máximo

23

24.5

24.5

29.5

21.5

Suma

1216.5

853

720

401.5

172

Cuenta

74

49

41

21

10

Nivel de confianza(95.0%)

0.750

1.030

1.051

1.289

2.121

 

Tabla 4. Análisis de varianza del Espesor de grasa dorsal por ciclo de parto.

ANÁLISIS DE VARIANZA

Origen de las variaciones

Suma de cuadrados

Gl

Promedio de los cuadrados

Entre grupos

403.5251624

8

50.4406453

Dentro de los grupos

4486.57168

466

9.627836222

Total

4890.096842

474

 

ANÁLISIS DE VARIANZA

F

Probabilidad

Valor crítico para F

5.239042723

0.000003

1.958269991

Este análisis de la varianza nos informa de que existen diferencias significativas entre los diferentes ciclos de parto en cuanto al espesor de grasa dorsal. Pero además a través del coeficiente eta2 que se define como

nos informa de que sólo el 8,25 % de la variabilidad del espesor de la grasa dorsal es explicada por el ciclo de parto.

Podríamos estar interesados en conocer los subgrupos que forman esta distribución, es decir, conocer qué ciclo de parto o cuáles son los diferentes pero para ello deberíamos de usar un programa estadístico con la aplicación de contrastes a priori o a posteriori como los tests de Duncan, Scheffé o Bonferroni.

Con paciencia podemos hacer con Excel múltiples comparaciones usando el test "t de Student" pero deberemos realizar muchas comprobaciones hasta llegar a la verdadera solución.

El archivo original de este caso así como la completa solución podéis encontrarlo en nuestra página web www.testsandtrials.com.

© www.exopol.com - mail