top of page

Prueba Chi-Cuadrado

Características, tipos y usos. Independencia y bondad de ajuste.

Prueba Chi-Cuadrado

Prueba Chi-Cuadrado

La prueba Chi-cuadrado es una prueba estadística que se utiliza para evaluar si existe una diferencia significativa entre las frecuencias observadas y las frecuencias esperadas en uno o más grupos. Esta prueba es especialmente útil cuando se trabaja con datos categóricos y se utiliza para determinar si las distribuciones de dos variables categóricas son independientes.


Tipos de Prueba Chi-cuadrado

La distribución chi-cuadrado se utiliza mayormente en dos tipos de pruebas:

  1. Prueba Chi-cuadrado de independencia: Se utiliza para evaluar si dos variables categóricas son independientes en una población. Por ejemplo, se puede usar para ver si el sexo y la preferencia de un producto están relacionados.

  2. Prueba Chi-cuadrado de bondad de ajuste: Se utiliza para determinar si una distribución observada se ajusta a una distribución teórica esperada. Por ejemplo, se puede usar para verificar si los resultados de un dado son uniformes.


Supuestos o requisitos

  1. Las observaciones deben ser independientes.

  2. Los datos deben ser categóricos.

  3. Se recomienda que las frecuencias esperadas en cada celda de la tabla de contingencia sean al menos 5 para que la prueba sea válida.


Cálculo de la prueba chi-cuadrado


La estadística Chi-cuadrado se calcula con la siguiente fórmula:

χ² = ∑(Oi - Ei)²/Ei

Donde:

  • Oi = frecuencia observada en la categoría i.

  • Ei = frecuencia esperada en la categoría i.

  • La suma se realiza sobre todas las categorías.


Frecuencias Esperadas

Las frecuencias esperadas se calculan bajo la hipótesis nula. 

Ei = {(total de la fila) x (total de la columna)} / total general 


Proceso de la Prueba Chi-cuadrado


1. Formulación de Hipótesis

   - Hipótesis nula (H₀): No hay asociación entre las variables (son independientes).

   - Hipótesis alternativa (H₁): Hay una asociación entre las variables (no son independientes).


2. Construcción de la Tabla de Contingencia

  • Se organiza la información en una tabla.


3. Cálculo de las Frecuencias Esperadas

  • Se utilizan los totales de filas y columnas para calcular las frecuencias esperadas.


4. Cálculo de la Estadística Chi-cuadrado

  • Se utiliza la fórmula mencionada anteriormente.


5. Determinación de los Grados de Libertad

  • Para una prueba de independencia en una tabla de dimensiones filas por columnas (r x c): 

  Grados de libertad = (r - 1) x (c - 1)

 

6. Comparación con el Valor Crítico

  • Se compara la estadística Chi-cuadrado calculada con el valor crítico de la funcion Chi-cuadrado para los grados de libertad y el nivel de significancia alpha.


7. Conclusión

   - Si χ² calculado > χ² crítico, se rechaza la hipótesis nula.

   - Si χ² calculado ≤ χ² crítico, no se rechaza la hipótesis nula.


Ejemplo

Supongamos que tenemos una tabla de contingencia sobre la preferencia de dos tipos de productos (A y B) entre dos grupos de consumidores (Grupo 1 y Grupo 2):


|                               | Producto A | Producto B | Total |

|-------------------|------------|------------|--------|

| Grupo 1                | 30               | 10               | 40      |

| Grupo 2                | 20               | 40              | 60      |

| Total                     | 50              | 50              | 100      |


1. Calcular frecuencias esperadas

   - Para Grupo 1 y Producto A: 

      E{A1} = 40 x 50 / 100 = 20

 

   - Para Grupo 1 y Producto B: 

      E{B1} = 40 x 50 / 100 = 20

   

   - Este proceso se repite para las demás celdas de la tabla.


2. Calcular χ² usando la fórmula.


3. Comparar con el valor crítico para determinar si hay una relación significativa entre las variables.

  • Valor crítico: 3.84

  • Estadistico: 16.6

  • Valor p: 00000.4

  • Comparación: El estadístico esta muy por arriba del valor p.

  • Interpretación: esto implica que la hipótesis las (frecuencias son intependientes) nula no se cumple.

  • Conclusión: ambos grupos si están relacionados.

  • Este ejemplo se encuentra calculado en jupyter notebook y compartido en github.


Aplicaciones usos y ejemplos

Para ver otros ejemplos de aplicaciones y usos se sugiere la lectura de los apartados de tablas de contingencia y experimentos multinomiales.

Para entender el contexto de esta prueba que es una de las más aplicadas, se recomienda la lectura de bondad de auste, TDC, independencia y homogeneidad.

Finalmente y en cualquier caso se recomienda además la lectura de cuetiones de bondad de ajuste.


En definitiva, la prueba Chi-cuadrado es una herramienta fundamental en análisis de datos categóricos que permite evaluar la relación entre variables y determinar si se pueden considerar independientes o no.

bottom of page