top of page

Prueba de McNemar

Cambios en proporciones de datos categóricos

Prueba de McNemar para productos

Prueba de McNemar para productos

La prueba de McNemar es una prueba estadística utilizada para evaluar cambios o diferencias en proporciones en estudios con datos pareados o relacionados. Es especialmente útil cuando se tiene una tabla de contingencia 2x2 con mediciones repetidas o comparaciones dentro del mismo grupo en dos momentos diferentes o bajo dos condiciones diferentes.


Uso y aplicación de la prueba de McNemar

Esta prueba se suele utilizar en los siguientes casos:

  • Cuando tienes datos apareados, es decir, las mismas unidades de análisis (por ejemplo, personas) son evaluadas en dos condiciones distintas o en dos momentos diferentes.

  • Se usa para verificar si hay un cambio significativo en las proporciones categóricas entre dos situaciones.

Como ejemplos comunes de uso se pueden citar:

  • Pruebas sobre personas: Evaluar si hubo un cambio significativo en las respuestas de las mismas personas antes y después de un tratamiento.

  • Pruebas de productos: Comparar la preferencia de un producto antes y después de una campaña publicitaria.


Hipótesis

  1. Hipótesis nula (H₀): Las proporciones en las dos condiciones comparadas son iguales. No hay cambio significativo entre las dos situaciones.

  2. Hipótesis alternativa (H₁): Las proporciones son diferentes en las dos condiciones comparadas. Hay un cambio significativo entre las dos situaciones.


Tabla de contingencia para McNemar


|                                      | B: Evento ocurrió      | B: Evento no ocurrió | Total  |

|-----------------------|-----------------------|-----------------------|-------|

| A: Evento ocurrió       |             a                       |                   b                |  a + b |

| A: Evento no ocurrió |             c                       |                   d                 | c + d |

| **Total**                       |           a + c                    |                b + d              |  n      |


b y c son los valores que se usan para la prueba de McNemar porque representan los pares discordantes: personas que cambian su respuesta entre las dos condiciones.


Estadístico de McNemar

El estadístico de McNemar se calcula usando la fórmula:

χ² = {(b - c)²} / {b + c}

Donde:

- b son los individuos que cambiaron de "Evento no ocurrió" a "Evento ocurrió".

- c son los individuos que cambiaron de "Evento ocurrió" a "Evento no ocurrió".


Criterio de decisión

  1. Si  χ² calculado** es mayor que el valor crítico para α = 0.05 para 1 grado de libertad, el valor crítico de χ²  es aproximadamente 3.84, se rechaza la hipótesis nula.

  2. Si el valor p es menor que el nivel de significancia α = 0.05, se rechaza la hipótesis nula.


Ejemplo de evolución de productos

Supongamos que estamos evaluando la efectividad de una campaña publicitaria, donde 100 personas indicaron si preferían un producto antes y después de ver un anuncio. Los resultados se organizan en una tabla 2x2:


|                                                        | Prefiere antes | No prefiere antes | Total  |

|----------------------------------|----------------|--------------------|-------|

| Prefiere producto después       |           30           |             20                |   50    |

| No prefiere producto después |           10           |             40                |   50    |

| **Total**                                          |         40           |              60               |   100  |


Aquí, b = 20 y c = 10, por lo que el estadístico de McNemar sería:

χ²  = {(20 - 10)²} / {20 + 10} ={100} / {30} = 3.33

Comparando con el valor crítico 3.84 para alpha = 0.05, vemos que (3.33 < 3.84), por lo que no se rechaza la hipótesis nula. Esto indica que no hubo un cambio significativo en las preferencias después de la campaña.

Los cálculos de este ejemplo están en jupyter notebook en github.


Ventajas y Desventajas de la Prueba de McNemar:


Ventajas

  1. Es fácil de aplicar en situaciones de datos pareados.

  2. No requiere que las frecuencias en las celdas sean muy grandes, como en la prueba Chi-cuadrado tradicional.


Desventajas

Solo se puede utilizar en tablas de contingencia 2x2 con datos pareados.

Si (b + c) es muy pequeño (menor a 25), la prueba exacta de McNemar (una variante de esta prueba) es más adecuada.


Ejemplo de comparación de tratamientos

Se utilizan dos cremas diferentes para tratar el pie de atleta. A cada sujeto con esta infección micótica en ambos pies se le trata un pie con Pedacream y el otro con Fungacream. Los resul tados muestrales se presentan en la tabla correspondiente. Utilice un nivel de significancia de 0.05 y aplique la prueba de McNemar para poner a prueba la hipótesis nula de que las siguientes proporciones son iguales:

●    La proporción de sujetos cuyo pie tratado con Pedacream no se cura y cuyo pie tratado con Fungacream sí se cura.

●    La proporción de sujetos cuyo pie tratado con Pedacream sí se cura y cuyo pie tratado con Fungacream no se cura.


Con base en los resultados, ¿parece que hay una diferencia entre los dos tratamientos? ¿Un tratamiento es mejor que otro?


Requisito:  Los datos son pares de conteos de frecuencias, a partir de sujetos elegidos al azar, y cada observación se puede categorizar de acuerdo con dos variables. (Una variable tiene los valores de “Pedacream” y “Fungacream”, y la otra variable tiene los valores de “curado” y “no curado”). Además, las frecuencias deben ser tales que b+c >= 10. Para la tabla, b=8 y c=   40, de manera que b+c=48, que es mayor 10. Por lo tanto, todos los requisitos se satisfacen. Aunque la tabla podría parecer una tabla de contingencia 2x2, no podemos usar los procedimientos chi-cuadrado ni Fisher, porque se trata de datos apareados (en vez de ser independientes). En su lugar, empleamos la prueba de McNemar.


Hipótesis

  • Hipótesis nula (H₀): No hay diferencia entre los tratamientos. Las proporciones de sujetos cuyos pies se curan con Pedacream y no con Fungacream son iguales a las proporciones de sujetos cuyos pies se curan con Fungacream y no con Pedacream.

  • Hipótesis alternativa (H₁): Hay una diferencia significativa entre los tratamientos, es decir, las proporciones no son iguales.

Después de comparar los conteos de frecuencia, observamos que el estadístico de prueba se calcula de la siguiente manera:

χ² = {(|b-c|)-1)²} / (b+c)

χ² = {(|8-40|)-1)²} / (8+40)

χ² = 20.021


Con un nivel de significancia de 0.05 y grados de libertad dados por gl = 1, vamos a encontrar el valor crítico de x2 = 3.841 para esta prueba de cola derecha. El estadístico de prueba χ² = 20.021 excede al valor crítico x2 = 3.841 , de manera que rechazamos la hipótesis nula. Parece que las dos cremas producen resultados diferentes. Al analizar las frecuencias de 8 y 40, vemos que Pedacream cura muchos más pies que Fungacream, de manera que el tratamiento con Pedacream parece ser más efectivo.

Observe que en el cálculo del estadístico de prueba del ejemplo anterior, no incluimos a los 12 sujetos que se curaron de ambos pies (cada pie tratado con una de las cremas) y tampoco incluimos a los 20 sujetos que no se curaron de ningún pie. En vez de incluir los resultados de curado/curado y los resultados de no curado/no curado, sólo usamos los resultados de curado/no curado y no curado/curado. Es decir, sólo incluimos los resultados de las categorías que son diferentes. A este tipo de categorías diferentes se les denomina pares discordantes.


Los pares discordantes de resultados provienen de pares de categorías en las que ambas categorías son diferentes (como en curado/no curado o no curado/ curado).


Al tratar de determinar si existe una diferencia significativa entre los dos tratamientos con las cremas en la tabla, no nos resultan útiles los sujetos que se curaron de ambos pies, ni tampoco los sujetos que no se curaron de ningún pie. Las diferencias se reflejan en los resultados discordantes de los sujetos que se curaron de un pie y no del otro. Como consecuencia, el estadístico de prueba sólo incluye las dos frecuencias que resultan de los dos pares discordantes (o diferentes) de categorías.


Aplicaciones Comunes

  • Estudios de Casos y Controles: Evaluar la efectividad de un tratamiento comparado con un control.

  • Experimentos con Tratamientos Emparejados: Analizar cambios en proporciones antes y después de un tratamiento.


Precaución

Al aplicar la prueba de McNemar, es importante tener cuidado de usar únicamente las frecuencias de los pares de categorías que son diferentes. No utilice a ciegas las frecuencias en las esquinas superior derecha e inferior izquierda, porque no necesariamente representan los pares discordantes.

bottom of page