Ejemplo de análisis estadístico de la eficacia de un medicamento


Vamos a suponer que tenemos datos de pacientes que han utilizado una medicación y queremos saber si el medicamento es igualmente efectivo independientemente del sexo y la edad. Este análisis consta de dos partes: primero, aplicamos una ANOVA por separado para sexo Y edad; luego, realizamos un análisis factorial o ANOVA de dos vías para detectar si existen efectos combinados entre estas variables.

Paso 0: Cargar el Conjunto de Datos

Supongamos que el medicamento sirve para tratar la cefalea y los datos se encuentran en un archivo CSV llamado pacientes_cefalea.csv. First, cargamos los datos en R y exploramos su estructura.

# Cargar datos
df_pacientes <- read.csv("pacientes_cefalea.csv")

# Explorar la estructura de los datos
head(df_pacientes)
summary(df_pacientes)

Resultado:

  • head(df_pacientes) muestra las primeras filas del conjunto de datos, incluyendo las columnas Sexo, Edad, Mejoría, Y Grado_Mejoría.
  • summary(df_pacientes) proporciona un resumen estadístico.
> head(df_pacientes)
# A tibble: 6 × 5
     ID Sexo   Edad  Mejoría  Grado_Mejoría
  <dbl> <chr>  <chr> <chr>            <dbl>
1     1 hombre 46-60 Moderada             2
2     2 mujer  46-60 Moderada             2
3     3 hombre 18-30 Completa             3
4     4 mujer  31-45 Completa             3
5     5 mujer  46-60 Nula                 1
6     6 hombre 31-45 Moderada             2
> summary(df_pacientes)
       ID            Sexo               Edad             Mejoría          Grado_Mejoría 
 Min.   :  1.0   Length:171         Length:171         Length:171         Min.   :1.00  
 1st Qu.: 43.5   Class :character   Class :character   Class :character   1st Qu.:2.00  
 Median : 86.0   Mode  :character   Mode  :character   Mode  :character   Median :2.00  
 Mean   : 86.0                                                            Mean   :2.31  
 3rd Qu.:128.5                                                            3rd Qu.:3.00  
 Max.   :171.0                                                            

Primera Parte: ANOVA por Sexo y Edad Separados

Este análisis consiste en evaluar si existen diferencias significativas en la eficacia del medicamento según sexo Y grupo de edad de forma independiente.

Paso 1: Prueba de Levene para Varianzas

Aplicamos la prueba de Levene para asegurarnos de que las varianzas de los grupos sean homogéneas.

library(car)

# Prueba de Levene para homogeneidad de varianzas por sexo
leveneTest(Grado_Mejoría ~ Sexo, data = df_pacientes)
Levene's Test for Homogeneity of Variance (center = median)
       Df F value Pr(>F)
group   1    0.02 0.8877
      169   

# Prueba de Levene para homogeneidad de varianzas por grupo de edad
leveneTest(Grado_Mejoría ~ Edad, data = df_pacientes)
Levene's Test for Homogeneity of Variance (center = median)
       Df F value Pr(>F)
group   3  0.0814   0.97
      167             

Ambos p-valores son mayores a 0.05(0.8877 Y 0.97), por lo que asumimos que las varianzas son homogéneas y podemos usar ANOVA clásica.

Paso 2: ANOVA por Sexo y Edad

ANOVA por Sexo
# ANOVA por Sexo
anova_sexo <- aov(Grado_Mejoría ~ Sexo, data = df_pacientes)
summary(anova_sexo)
             Df Sum Sq Mean Sq F value Pr(>F)
Sexo          1   0.00  0.0047   0.009  0.926
Residuals   169  92.57  0.5477   
  • El valor p es 0.926, lo cual es mayor a 0.05, indicando que no hay diferencias significativas en el grado de mejoría entre hombres y mujeres.
ANOVA por Edad
# ANOVA por Edad
anova_edad <- aov(Grado_Mejoría ~ Edad, data = df_pacientes)
summary(anova_edad)
        Df Sum Sq Mean Sq F value Pr(>F)
Edad          3   0.49  0.1647   0.299  0.826
Residuals   167  92.08  0.5514
  • El valor p es 0.826, también mayor a 0.05, lo cual indica que no hay diferencias significativas en la mejoría entre los distintos grupos de edad.

Segunda Parte: Análisis Factorial (ANOVA de Dos Vías) para Sexo y Edad

Now, realizamos una ANOVA de dos vías para observar no solo los efectos individuales de sexo Y edad, sino también si existe una interacción entre ambos factores.

Explicación del Análisis Factorial

  1. Efecto Principal de Sexo: Indica si el sexo tiene un efecto sobre la mejoría, independientemente de la edad.
  2. Efecto Principal de Edad: Indica si la edad afecta la mejoría, independientemente del sexo.
  3. Interacción Sexo:Edad: Indica si la combinación específica de sexo y edad afecta la eficacia del medicamento. Si este término es significativo, significa que el efecto del medicamento varía en función de la combinación de ambos factores.

Aplicación de la ANOVA de Dos Vías en R

# ANOVA de dos vías para los efectos de Sexo y Edad y su interacción
anova_sexo_edad <- aov(Grado_Mejoría ~ Sexo * Edad, data = df_pacientes)
summary(anova_sexo_edad)
          Df Sum Sq Mean Sq F value Pr(>F)
Sexo          1   0.00  0.0047   0.008  0.928
Edad          3   0.50  0.1652   0.293  0.831
Sexo:Edad     3   0.07  0.0243   0.043  0.988
Residuals   163  92.00  0.5644 

Interpretación de Resultados:

  1. Efectos principales:
  • El p-valor para Sexo (0.928) indica que el sexo no tiene un efecto significativo en la mejoría.
  • El p-valor para Edad (0.831) indica que la edad tampoco tiene un efecto significativo.
  1. Interacción Sexo:Edad: El p-valor de 0.988 sugiere que no hay un efecto de interacción significativo entre sexo y edad.

Pregunta Común: ¿Puede haber Interacción Significativa sin Efectos Principales?

, es matemáticamente posible que una interacción entre factores sea significativa incluso cuando los efectos principales no lo son. Esto ocurre cuando el efecto de uno de los factores depende del nivel del otro. En nuestro caso, sería posible que la combinación específica de sexo y edad revelara un patrón de mejoría (for example, los hombres jóvenes y mujeres mayores responden mejor), aunque el sexo y la edad por sí solos no influyan significativamente.

Esta capacidad de detectar interacciones que no son evidentes a partir de los efectos individuales es una de las ventajas clave de la ANOVA factorial.

Conclusión General

Este análisis demuestra que:

  1. No existen diferencias significativas en la eficacia del medicamento según el sexo o el grupo de edad de los pacientes.
  2. La ANOVA de dos vías confirma que la combinación de sexo y edad tampoco tiene un efecto significativo en la respuesta al tratamiento.
  3. El análisis factorial permite detectar interacciones potencialmente significativas, ofreciendo una perspectiva más profunda y abriendo la posibilidad de hallar efectos específicos de combinaciones de factores.

Este enfoque permite comprender la eficacia general del medicamento y si es consistente en distintos grupos demográficos.

Leave a Comment

Your email address will not be published.