Hipótesis de 2 Proporciones
Hipótesis relativa a dos proporciones
Hipótesis relativa a dos proporciones
Hipótesis relativa a dos proporciones
Las pruebas de hipótesis para comparar dos proporciones se utilizan cuando se quiere determinar si hay una diferencia significativa entre las proporciones de dos grupos independientes.
Formulación de Hipótesis
1. Hipótesis Nula (H₀): Indica que no hay diferencia en las proporciones de los dos grupos.
Matemáticamente, esto se expresa como:
H₀: p₁ = p₂ o bien H₀: p₁ - p₂ = 0.
donde p₁ y p₂ son las proporciones poblacionales de los dos grupos.
2. Hipótesis Alternativa (H₁): Indica que sí hay una diferencia significativa entre las proporciones.
Dependiendo del contexto, puede ser:
Bilateral (dos colas): Indica que las proporciones son diferentes H₁: p₁≠ p₂ o H₁: p₁ - p₂
Unilateral (una cola): Indica que una proporción es mayor o menor que la otra.
Hipótesis alternativa izquierda: H₁: p₁ < p₂ o H₁: p₁ - p₂ < 0
Hipótesis alternativa derecha: H₁: p₁ > p₂ o H₁: p₁ - p₂ > 0
Estadístico de Prueba
El estadístico de prueba para comparar dos proporciones se basa en la distribución normal y se calcula utilizando la fórmula:
Z=(p^1−p^2)−0/√p^(1−p^)(1/n1+1/n2)
Donde:
p^1 y p^2 son las proporciones muestrales de los dos grupos.
p^ es la proporción combinada, calculada como:
p^=x1+x2/n1+n2
x1 y x2 son los éxitos en las muestras de los grupos 1 y 2, respectivamente.
n1 y n2 son los tamaños de muestra de los grupos 1 y 2, respectivamente.
Regla de Decisión
Bilateral: Rechaza H₀ si ∣Z∣>Zα/2, donde Zα/2 es el valor crítico de Z para un nivel de significancia α.
Unilateral:
Izquierda: Rechaza H₀ si Z < −Zα.
Derecha: Rechaza H₀ si Z > Zα.
Requisitos
Proporciones de dos muestras aleatorias simples que son independientes. (Las muestras son independientes si los valores muestrales seleccionados de una población no están relacionados ni apareados de alguna forma con los valores muestrales seleccionados de la otra población).
2. Para ambas muestras, el número de éxitos es de al menos 5 y el número defracasos es de al menos 5.
Debe notarse que en muchos casos en la practica puede que las muestras sean independientes pero no sean del mismo tamaño por ejemplo. Esto es algo que le da mayor justificación a la realización de este tipo de pruebas.
Ejemplo simple
Supongamos que queremos comparar la proporción de personas que prefieren un nuevo producto en dos mercados diferentes.
Muestra 1: 150 personas encuestadas, 90 prefieren el nuevo producto.
Muestra 2: 200 personas encuestadas, 110 prefieren el nuevo producto.
Las proporciones muestrales son:
p^1 = 90/150 = 0.6, p^2 = 110/200 = 0.55
La proporción combinada:
p^ = (90+110)/(150+200) = 200/350 ≈ 0.571
Estadístico Z:
Z= (0.6−0.55) / √(0.571×(1−0.571)×(1150+1200)
Z≈ 0.941
Si el valor crítico Zα/2 para un nivel de significancia α=0.05 es aproximadamente 1.96, entonces no se rechaza la hipótesis nula porque 0.941 < 1.96.
Conclusión
La prueba no muestra evidencia suficiente para concluir que las proporciones en los dos mercados son diferentes.
Al realizar este ejercicio (compartido en jupiter notebook) con python, se puede usar statsmodels que tiene un método que calcula la diferencia en tre muestras de proporciones.
También puede usarse la distribución normal directamente sin normalizar.
En todos los casos se verifican resultados similares en donde se comprueba que los dos grupos No son significativamente diferentes.
Diferencias con la hipotesis sobre una proporción
Las pruebas de hipótesis se hacen sobre una población o proporción hipotética, que en gran medida asumimos pero no concemos en su totalidad. Mientras que las pruebas entre dos proporciones son aquellas que surgen de la comparación de dos muestras. De aquí surgen las diferencias entre ambos conceptos. En consecuencia:
Pruebas de hipótesis sobre una proporción: Estas pruebas se realizan sobre una proporción hipotética o poblacional, que asumimos como un valor teórico p0p_0p0 en la hipótesis nula, pero que no conocemos completamente. Estamos interesados en ver si la proporción observada en la muestra difiere significativamente de esta proporción hipotética.
Pruebas entre dos proporciones: Estas pruebas comparan dos proporciones muestrales obtenidas de dos muestras diferentes. Aquí, el interés está en determinar si existe una diferencia significativa entre las dos proporciones observadas, lo que puede sugerir una diferencia entre las poblaciones de las cuales provienen las muestras.
Las diferencias que derivan de estos conceptos distintos son:
1. Número de Proporciones:
Una proporción: Comparas una única proporción contra un valor específico.
Dos proporciones: Comparas dos proporciones entre sí para ver si son diferentes.
2. Estadístico de Prueba:
Una proporción: El estadístico Z se basa en la diferencia entre la proporción muestral y la proporción hipotética.
Dos proporciones: El estadístico Z se basa en la diferencia entre las dos proporciones muestrales.
3. Hipótesis Nula y Alternativa:
Una proporción: H₀ establece que la proporción es igual a un valor específico p0.
Dos proporciones: H₀ establece que las dos proporciones son iguales.
Ejemplo Comparativo
Una proporción: Supón que quieres saber si el 60% de los estudiantes en una universidad están a favor de una nueva política. Aquí, compararías la proporción muestral contra el valor p0=0.6
Dos proporciones: Supón que quieres saber si la proporción de estudiantes a favor de la nueva política es diferente en dos universidades. Aquí, compararías las proporciones muestrales de las dos universidades.
Conceptualización de la hipótesis relativas a proporciones
Hipótesis de igualdad o dierencia entre proporciones
Cuando se prueba una hipótesis acerca de dos proporciones poblacionales o cuando se construye un estimado del intervalo de confianza de la diferencia entre dos proporciones poblacionales, ya que estamos analizando la diferencia o similitud entre los grupos en su conjunto.
Es decir, cuando se prueba la hipótesis nula de p1=p2, no hay necesidad de estimar los parámetros individuales p1 y p2, sino que estimamos su valor común con la proporción muestral agrupada que se describe con el estimador de prueba Z de la figura.
Formula del estimador de prueba
Como se ve en la figura la fórmula del estimado de prueba de hipótesis es el cociente entre la diferencia entre las proporciones de las muestras y el error de las mismas.
Si bien las herramientas de la actualidad permiten hacer los cáclulos sin saber de memoria esta formula es importante poder leerla y entenderla para comprender mejor los resultados.
Es por eso que a condinuación se describe el desgloce del numerador y el denominador de esta formula.
Intervalo de confianza p1-p2
Es importante notar que estamos hablando de un intervalo de confianza de una diferencia que puede ser nula o significantiva. Entonces el intervalo de confianza está dado por el rango que va entre esta diferencia menos el error y esta diferencia más el error. Para estos cálculos se utilizan los estimados de p1 y p2, como puede verse en la figura.
Error de proporciones p1 y p2
El error surge de elevar al cuadrado los estimados de p y q sobre el tamaño de sus muestras respectivas, sumarlos y aplicarles la raiz cuadrada. Esto da como resultado la formula del Error de esimaciones de proporciones y que conforma además el denominador de la formula del estimador de proporciones.
Referencias
Ejemplo simple desarrollado en python compartido en github.