Varianzas de dos muestras
Hipótesis relativas a variaciones de 2 muestras de datos
Pruebas de Hipótesis para inferencias sobre varianzas
Pruebas de Hipótesis relativas a 2 varianzas
Cuando queremos comparar dos grupos o poblaciones, no solo nos interesa si sus medias son diferentes, sino también si sus dispersiones (variabilidades) son similares. Para esto, utilizamos pruebas estadísticas que nos permiten comparar las varianzas de ambas muestras. Si las varianzas son diferentes, debemos tener cuidado al interpretar los resultados de otras pruebas estadísticas.
Las pruebas de hipótesis sobre las varianzas de dos muestras se utilizan para determinar si las varianzas (o dispersión) de dos poblaciones son iguales o si hay una diferencia significativa entre ellas. Este tipo de prueba es importante en muchas aplicaciones estadísticas, especialmente cuando se realizan análisis como la ANOVA o pruebas t, que asumen homogeneidad de varianzas.
¿Por qué es importante comparar varianzas?
Prueba t: Si queremos realizar una prueba t para comparar las medias de dos muestras independientes, uno de los supuestos es que las varianzas de ambas poblaciones sean iguales.
Análisis de varianza (ANOVA): En este análisis, también se asume la homogeneidad de las varianzas.
Diseño experimental: En algunos diseños experimentales, es importante asegurar que las varianzas sean similares entre los grupos para poder interpretar los resultados correctamente.
Tipos de Pruebas para Comparar Varianzas
F de Fisher : para comparar dos varianzas de muestras que son normales o se aproximan.
Levene : para comparar la igualdad de varianzas en muestras que no necesariamente siguen una distribución normal.
Brown-Forsythe : para comparar igualdad de varianzas en muestras no necesariamente normales. Mas robuzta que Levene y menos sensible a la condición de normalidad.
Prueba de Bartlett para comparar más de dos varianzas.
1. Prueba F de Fisher (para comparar dos varianzas)
La prueba F es la herramienta estadística más común para comparar las varianzas de dos muestras independientes.
Hipótesis:
Hipótesis nula (H₀): Las varianzas de las dos poblaciones son iguales: σ₁²=σ₂²
Hipótesis alternativa (H₁): Las varianzas de las dos poblaciones son diferentes: σ₁²≠σ₂²
Procedimiento
Calcular las varianzas muestrales: Se calculan las varianzas de cada una de las muestras.
Calcular el estadístico F: Se divide la varianza más grande entre la varianza más pequeña.
Determinar el valor p: Se utiliza la distribución F para encontrar el valor p correspondiente al estadístico F calculado y a los grados de libertad de cada muestra.
Tomar una decisión: Si el valor p es menor que el nivel de significancia (α), se rechaza la hipótesis nula y se concluye que las varianzas son diferentes.
Requisitos y Supuestos
Normalidad: Las poblaciones de las que se extraen las muestras deben seguir una distribución aproximadamente normal.
Independencia: Las observaciones en cada muestra deben ser independientes entre sí.
Consideraciones importantes:
Normalidad: La prueba F es bastante sensible a la violación del supuesto de normalidad. Si los datos no son normales, se pueden utilizar pruebas no paramétricas como la prueba de Levene. Es sumamente importante estar conscientes de una grave desventaja de este procedimiento: la prueba F para comparar dos varianzas (o desviaciones estándar) poblacionales es muy sensible a las desviaciones que se alejan de la distribución normal.
Tamaño de la muestra: Un tamaño de muestra pequeño puede afectar la potencia de la prueba.
Heterocedasticidad: Si las varianzas son diferentes (heterocedasticidad), se pueden utilizar otras pruebas t que no asuman igualdad de varianzas.
Estadístico de prueba
F=S₁²/S₂²
donde S₁² y S₂² son las varianzas muestrales de las dos muestras. F sigue una distribución F con n₁−1 - 1 y n₂−1 grados de libertad, donde n₁ y n₂ son los tamaños de las muestras.
Decisión
Si el valor p asociado con el estadístico F es menor que el nivel de significancia (α\alphaα), se rechaza la hipótesis nula, indicando que hay una diferencia significativa entre las varianzas.
2. Prueba de Levene
Sirve para comparar la igualdad de varianzas en muestras que no necesariamente siguen una distribución normal
Hipótesis:
Hipótesis nula (H0): Las varianzas son iguales en todos los grupos.
Hipótesis alternativa (H1): Al menos una de las varianzas es diferente.
Estadístico de prueba
La prueba de Levene utiliza la dispersión absoluta de cada valor respecto a la media (o la mediana) de su grupo. Se calcula un estadístico F a partir de estas dispersiones.
Decisión
Si el valor p es menor que α, se rechaza la hipótesis nula, lo que indica que las varianzas son significativamente diferentes.
3. Prueba de Brown-Forsythe
La prueba de Brown-Forsythe es una versión robusta de la prueba de Levene, utilizada para evaluar la igualdad de varianzas en diferentes grupos. Al igual que la prueba de Levene, la prueba de Brown-Forsythe es menos sensible a las desviaciones de la normalidad en los datos, lo que la hace más adecuada cuando las suposiciones de normalidad no se cumplen.
La principal diferencia entre la prueba de Levene y la prueba de Brown-Forsythe radica en la forma en que se mide la dispersión dentro de cada grupo:
Prueba de Levene: Calcula la dispersión utilizando la media de cada grupo.
Prueba de Brown-Forsythe: Utiliza la mediana de cada grupo para medir la dispersión.
Debido a que la mediana es menos sensible a los valores atípicos que la media, la prueba de Brown-Forsythe es más robusta cuando los datos contienen outliers o no siguen una distribución normal.
Por esto, Brown-Forsythe es particularmente útil cuando se sospecha que los datos no cumplen con la suposición de normalidad o cuando hay outliers presentes.
Hipótesis
Hipótesis nula (H0): Las varianzas de los diferentes grupos son iguales.
Hipótesis alternativa (H1): Al menos una de las varianzas es diferente.
Estadístico de prueba
El estadístico de prueba de Brown-Forsythe se calcula de manera similar al de la prueba de Levene, pero utilizando las desviaciones absolutas con respecto a la mediana en lugar de la media. Se realiza un análisis de varianza (ANOVA) sobre estas desviaciones absolutas para obtener el valor del estadístico F.
Decisión
Al igual que en otras pruebas de igualdad de varianzas, si el valor p es menor que el nivel de significancia (α), se rechaza la hipótesis nula, sugiriendo que hay una diferencia significativa en la varianza entre los grupos.
4. Prueba de Bartlett
Permite comparar la igualdad de varianzas entre dos o más grupos asumiendo que los datos siguen una distribución normal.
Hipótesis
Hipótesis nula (H0): Las varianzas son iguales en todos los grupos.
Hipótesis alternativa (H1): Al menos una de las varianzas es diferente.
Estadístico de prueba
La prueba de Bartlett se basa en una transformación logarítmica de las varianzas y sigue una distribución chi-cuadrado.
Decisión
Si el valor p es menor que α, se rechaza la hipótesis nula, lo que sugiere que al menos una de las varianzas es diferente.
5. Conteo de 5
El método del conteo de cinco es una alternativa relativamente sencilla a la prueba F, y no requiere de poblaciones con distribución normal. (Véase “A Quick, Compact, Two-Sample Dispersion Test: Count Five”, de McGrath y Yeh, American Statistician, vol. 59, núm. 1). Si los dos tamaños muestrales son iguales, y una de las muestras tiene al menos cinco de las desviaciones medias absolutas (DMA) más grandes, entonces concluimos que su población tiene una varianza mayor.