Independencia
Pruebas de independencia y homogeneidad

Tabla de contingencia y bondad ajuste
Tal y como se ve en el apartado de Tablas de Contingencia existen distintas pruebas de hipótesis en las que frecuentemente se usan tablas de contingencia y eventualmente distribuciónes chi-cuadradas.
1. Pruebas de independencia
La prueba de independencia busca determinar si dos variables categóricas son independientes entre sí, es decir, si una variable no tiene influencia sobre la otra. Esta prueba se realiza con datos que se organizan en una tabla de contingencia, y se utiliza la prueba Chi-cuadrado de independencia para contrastar si las distribuciones observadas en las categorías son diferentes de lo esperado bajo la hipótesis de independencia.
Sirve para analizar si existe una relación significativa entre dos variables categóricas. Si las variables son independientes, entonces las distribuciones observadas en las categorías deberían ser similares a lo que se esperaría si no existiera ninguna asociación entre las variables.
Ejemplo típico:
Un ejemplo clásico es un estudio que analiza si existe una relación entre el nivel de educación y el tipo de ocupación. Los datos se organizan en una tabla de contingencia donde se categorizan los niveles educativos (primaria, secundaria, universidad) y las ocupaciones (administrativo, técnico, profesional, etc.). La prueba de independencia evalúa si el nivel educativo influye en el tipo de ocupación o si son variables independientes.
Hipótesis en la prueba de independencia:
Hipótesis nula (H₀): Las dos variables son independientes (no hay relación entre ellas).
Hipótesis alternativa (H₁): Las dos variables no son independientes (hay relación entre ellas).
Diferencias esperadas vs observadas:
Frecuencias esperadas: Se calculan suponiendo que las variables son independientes.
Frecuencias observadas: Los datos reales obtenidos.
Si las diferencias entre las frecuencias observadas y esperadas son lo suficientemente grandes (según el valor de Chi-cuadrado y el valor p), se rechaza la hipótesis nula y se concluye que las variables están relacionadas.
2. Pruebas de Homogeneidad:
La prueba de homogeneidad se utiliza para comparar las distribuciones de una variable categórica en diferentes poblaciones o grupos. En este caso, la hipótesis es que las distribuciones de la variable categórica son las mismas en cada grupo.
Sirve para determinar si varios grupos siguen la misma distribución con respecto a una característica categórica. A diferencia de la prueba de independencia, aquí se están comparando múltiples poblaciones o grupos para ver si son homogéneos en cuanto a una variable.
Ejemplo:
Supongamos que queremos comparar si las preferencias de tipos de bebidas (agua, jugo, gaseosa) son las mismas en tres diferentes ciudades. Los datos de cada ciudad se organizan en una tabla de contingencia, y la prueba de homogeneidad evalúa si las distribuciones de preferencias de bebidas son iguales en todas las ciudades o si varían entre ellas.
Hipótesis en la prueba de homogeneidad:
Hipótesis nula (H₀): Las distribuciones de la variable categórica son las mismas en todos los grupos o poblaciones.
Hipótesis alternativa (H₁): Al menos un grupo o población tiene una distribución diferente.
Diferencias esperadas vs observadas:
Frecuencias esperadas: Se calculan asumiendo que las distribuciones son homogéneas en todos los grupos.
Frecuencias observadas: Los datos reales obtenidos en los grupos.
3. Diferencias entre pruebas de independencia y homogeneidad
En la tabla se pueden apreciar las difrencias típicas entre las pruebas de independencia y homogeneidad. Resulta interesante profundizar sobre estas pruebas en el apartado de tablas de contingencia.
4. Conclusión
La prueba de independencia es útil cuando queremos investigar si dos variables categóricas están relacionadas.
La prueba de homogeneidad se utiliza cuando queremos comparar si diferentes grupos o poblaciones tienen la misma distribución para una variable categórica.
Ambas pruebas son muy importantes en análisis de datos categóricos y nos permiten extraer conclusiones significativas sobre la relación o la consistencia de distribuciones en diferentes grupos.
Ejemplo de pruebas de independencia: Cascos de los conductores
Los datos de la tabla corresponden a un estudio retrospectivo (o de casos y controles). La variable de renglón tiene dos categorías: controles y casos. Los sujetos del grupo de control eran motociclistas elegidos al azar en ciertos lugares de la carretera. Los sujetos del grupo de casos eran motociclistas gravemente heridos o fallecidos. La variable de columna se utiliza para el color del casco que usaban. La pregunta importante es la siguiente: ¿El color del casco del motociclista se relaciona de alguna forma con el riesgo de lesiones relacionadas con choques? (Los datos se basan en “Motorcycle Rider Conspicuity and Crash Related Injury: Case-Control Study”, de Wells et al., BMJ USA, vol. 4).
Los calculos están hechos en python en jupyter notebook y están compartidos en gisthub.
Prueba Chi-cuadrado: Utilizando una prueba de Chi-cuadrado, se comparan las frecuencias observadas con las esperadas para ver si las diferencias entre los grupos son significativas.El estadístico Chi-cuadrado calculado y el valor p indican si las diferencias entre las frecuencias de cada tipo de casco son lo suficientemente grandes como para no ser atribuidas al azar.
Si el valor p es menor que el nivel de significancia (por ejemplo, 0.05), rechazamos la hipótesis nula, lo que sugiere que sí hay una relación entre el color del casco y el riesgo de lesiones.
b. Interpretación:
Casco Claro: Parece que los motociclistas que usan cascos claros tienen menos probabilidades de estar involucrados en accidentes graves o fatales (dado que la frecuencia en el grupo "Casos" es menor). Esto sugiere que el uso de cascos claros puede estar asociado con una mayor visibilidad, lo que podría reducir el riesgo de lesiones graves.
Casco Oscuro: El mayor número de "Casos" usando cascos oscuros sugiere una posible relación entre el uso de cascos oscuros y un mayor riesgo de accidentes graves o fatales. Los cascos oscuros pueden hacer a los motociclistas menos visibles para otros conductores, aumentando el riesgo.
Otros colores: Las diferencias no parecen tan significativas para esta categoría.
c. Conclusión:
La prueba estadística muestra que hay una relación significativa entre el color del casco y el riesgo de lesiones. Específicamente, el uso de cascos claros podría estar asociado con una mayor seguridad, mientras que el uso de cascos oscuros podría estar relacionado con un mayor riesgo de lesiones graves o fatales en accidentes de motocicleta.
Recomendación: En función de estos resultados, se podría recomendar a los motociclistas utilizar cascos claros para mejorar su visibilidad y reducir el riesgo de accidentes graves.
Ejemplo de pruebas de homogeneidad: Influecia del género
¿Tiene efecto el género del encuestador en las respuestas de encuesta de varones? En un artículo del U.S. News & World Report acerca de encuestas se afirmó que “en temas sensibles, las personas tienden a dar respuestas ‘aceptables’ en vez de respuestas honestas; sus respuestas podrían depender del género o el origen étnico del entrevistador”. Para sustentar esta aseveración, el Eagleton Institute proporcionó los datos de una encuesta en la cual se preguntó a hombres si estaban de acuerdo con esta afirmación: “El aborto es un asunto privado que la mujer debe decidir sin intervención gubernamental”. Analizaremos el efecto del género sólo en los hombres encuestados. La tabla está basada en estas respuestas de hombres encuestados. Suponga que la encuesta se diseñó de manera que los entrevistadores varones recibieron instrucciones para obtener 800 respuestas de sujetos varo nes, y las entrevistadoras mujeres recibieron instrucciones para obtener 400 respuestas de sujetos varones.
Con el entrevistador hombre las respuestas fueron: 560 están de acuerdo y 240 están en desacuerdo. Con la entrevistadora las respuestas fueron: 308 están de acuerdo y 92 están en desacuerdo.
Las dos variables son:
1. género del entrevistador, y 2. si el sujeto estuvo de acuerdo o en desacuerdo]. Puesto que se trata de una prueba de homogeneidad, ponemos a prueba la aseveración de que las proporciones de respuestas de acuerdo/en desacuerdo son iguales para los sujetos entrevistados por hombres y para los sujetos entrevistados por mujeres. Todos los requisitos se satisfacen, así que procedemos con la prueba de hipótesis.
Puesto que tenemos dos poblaciones separadas (sujetos entrevistados por hombres y sujetos entrevistados por mujeres), probamos la homogeneidad con estas hipótesis:
H0: Las proporciones de las respuestas acuerdo/en desacuerdo son iguales para los sujetos entrevistados por hombres y los sujetos entrevis- tados por mujeres.
H1: Las proporciones son diferentes.
Utilice un nivel de significancia de 0.05 y pruebe la aseveración de que las proporciones de las respuestas de acuerdo/en desacuerdo son las mismas para los sujetos entrevistados por hombres y los sujetos entrevistados por mujeres.
Este ejemplo está calculado en jupyter notebook compartido en github. Explicación de cada paso:
DataFrame: El DataFrame refleja la tabla con las frecuencias observadas.
Prueba Chi-cuadrado: Se realiza la prueba de homogeneidad, imprimiendo el estadístico Chi-cuadrado, el valor crítico, el valor p, los grados de libertad y las frecuencias esperadas.
Mapa de Calor: Un gráfico que muestra las frecuencias observadas usando un mapa de calor con colores, para visualizar mejor las diferencias en las respuestas.
Gráfico de Distribución Chi-cuadrado: Se genera una gráfica de la distribución Chi-cuadrado, mostrando la región crítica (sombreada en rojo), el valor crítico y el estadístico calculado (línea verde).
Estadísticamente se observa que:
Cálculo del estadístico Chi-cuadrado: χ2= 6.864
Grados de libertad: Los grados de libertad se calculan como: gl=(nfilas−1)×(ncolumnas−1)=(2−1)×(2−1)=1gl = 1
Valor crítico y decisión: Para un nivel de significancia α=0.05 y 1 grado de libertad, el valor crítico de χ2 es aproximadamente 3.841. Dado que χ2=6.864 es mayor que el valor crítico de 3.841, rechazamos la hipótesis nula.
Conclusión: Hay suficiente evidencia para concluir que las proporciones de respuestas "de acuerdo" y "en desacuerdo" no son las mismas entre los hombres encuestados por entrevistadores hombres y mujeres. Esto sugiere que el género del entrevistador sí tiene un efecto significativo en las respuestas de los encuestados varones en este caso.

