top of page

Chi-2, Fisher y McNemar

Evaluación de relaciones de datos categóricos

Pruebas de hipótesis para datos categóricos

Pruebas de hipótesis para datos categóricos

Las pruebas Chi-cuadrado, Fisher, y McNemar comparten algunas características comunes, a pesar de sus diferencias en aplicaciones y suposiciones. A continuación, se detallan los aspectos que tienen en común:


Aspectos comunes

Las tres pruebas son utilizadas para analizar datos categóricos y observar si éstos tienen algún tipo de relación o asociación a partir de una hipótesis nula,  es decir:


  1. Datos Categóricos: Las tres pruebas están diseñadas para trabajar con datos categóricos. Esto significa que se enfocan en analizar frecuencias en categorías específicas, como "sí/no" o "de acuerdo/en desacuerdo", en lugar de trabajar con datos continuos o numéricos.

  2. Evaluación de Asociaciones:  Las tres pruebas tienen el objetivo de evaluar si existe una relación entre variables. En el caso de la prueba Chi-cuadrado y la prueba exacta de Fisher, se evalúa si dos variables categóricas están asociadas o son independientes. La prueba de McNemar, aunque se usa en situaciones de datos pareados, también evalúa si hay un cambio en proporciones, lo cual refleja un tipo de asociación entre dos momentos o condiciones.

  3. Hipótesis Nula Similar:  Todas las pruebas verifican alguna forma de hipótesis nula de no asociación: a) En la Chi-cuadrado y Fisher, la hipótesis nula es que "no hay relación" entre las dos variables. b) En McNemar, la hipótesis nula es que "no hay diferencia" en las proporciones entre dos observaciones emparejadas.

  4. Tablas de Contingencia:  Las tres pruebas trabajan con tablas de contingencia, que resumen las frecuencias observadas en categorías diferentes.  a) Chi-cuadrado y Fisher son más generales y pueden analizar tablas de diversos tamaños (aunque Fisher se usa principalmente para 2x2). b) McNemar se limita a tablas 2x2 pero se aplica a datos emparejados.

  5. Pruebas de Significancia Estadística: Todas son pruebas de significancia estadística, lo que significa que su objetivo es determinar si los patrones observados en los datos son lo suficientemente fuertes para rechazar la hipótesis nula con cierto nivel de confianza (generalmente un nivel de significancia de 0.05).


Diferencias Fundamentales

A pesar de estos puntos en común, difieren en aspectos clave como el tipo de muestra (pareadas o independientes), el tamaño de la muestra adecuado (muestras grandes para Chi-cuadrado, pequeñas para Fisher), y los casos de aplicación específicos (McNemar se usa exclusivamente para datos pareados).


Síntesis de Pruebas Chi-cuadrado, Fisher y McNemar


1. Prueba Chi-cuadrado (χ²):

  • Descripción: Se usa para evaluar si existe una relación entre dos variables categóricas.     

    • Hay dos tipos principales de prueba Chi-cuadrado:

      • Independencia: Evalúa si dos variables son independientes o están asociadas.

      • Bondad de ajuste: Verifica si la distribución observada de una variable categórica coincide con una distribución teórica.

  • Aplicaciones: Se utiliza en tablas de contingencia para comparar frecuencias observadas con frecuencias esperadas bajo una hipótesis nula de independencia.

  • Suposiciones: Requiere tamaños de muestra relativamente grandes, y las frecuencias esperadas deben ser al menos 5 en cada celda de la tabla de contingencia.


2. Prueba exacta de Fisher:

  • Descripción: Es una prueba exacta para analizar tablas de contingencia, normalmente en el contexto de muestras pequeñas. Es una alternativa a la Chi-cuadrado cuando las frecuencias observadas son bajas.

  • Aplicaciones: Se utiliza principalmente cuando las frecuencias esperadas en las celdas son pequeñas, en tablas 2x2.

  • Suposiciones: Es más adecuada para tablas pequeñas y no requiere las mismas suposiciones que la prueba Chi-cuadrado.


3. Prueba de McNemar:

  • Descripción: Es una prueba para datos emparejados que evalúa cambios en proporciones en dos puntos de tiempo o dos condiciones. Se utiliza principalmente para tablas 2x2 con datos pareados.

  • Aplicaciones: Compara proporciones en datos dependientes, como antes y después de una intervención, o entre dos observaciones emparejadas.

  • Suposiciones: Asume que los datos son emparejados y que las observaciones se clasifican en dos categorías (binarias).


Resumen

  1. Chi-cuadrado: es útil para tablas de contingencia con tamaños grandes.

  2. Fisher: es preferible cuando las frecuencias son bajas, en especial en tablas 2x2.

  3. McNemar es específica para analizar datos emparejados y comparar proporciones entre dos observaciones.


En resumen, las tres pruebas se centran en analizar relaciones entre variables categóricas y en probar hipótesis nulas similares de no asociación, pero difieren en cómo y cuándo se aplican dependiendo de las características de los datos.

bottom of page