Hipótesis sobre Varianza
Hipótesis relativa una desviación estándar o varianza
Hipótesis de una Varianza o Desvío Estandar
Prueba de Hipótesis para la Desviación Estándar o Varianza
La prueba de hipótesis para una desviación estándar o varianza se utiliza para determinar si la variabilidad de una población es igual a un valor especificado o para comparar la variabilidad entre dos o más poblaciones. La prueba se realiza usando la distribución Chi-cuadrado χ2 (chi^2).
Estas pruebas son importantes en diversas aplicaciones, como en la calidad del control de procesos, la investigación científica, y la biología, entre otras.
Por ejemplo:
Control de Calidad: En manufactura, para asegurar que la variabilidad de un proceso de producción se mantenga dentro de límites aceptables.
Investigación Científica: Para comparar la variabilidad entre diferentes grupos o condiciones experimentales.
Biología: Para estudiar la variabilidad genética dentro de una población.
La prueba de hipótesis para la desviación estándar o varianza es una herramienta fundamental en la estadística inferencial, permitiendo hacer inferencias sobre la variabilidad de una población a partir de datos muestrales.
Pasos para Realizar la Prueba
a) Formulación de Hipótesis:
Hipótesis Nula (H0): La varianza de la población es igual a un valor específico H0:(ejemplo: σ2=σ02)
Hipótesis Alternativa (H1): La varianza de la población no es igual a ese valor específico.
Puede ser una prueba de dos colas (ej. σ2≠σ02, o de una cola (ej. σ2>σ02 o σ2<σ02).
b) Estadístico de Prueba:
El estadístico de prueba es:
χ2=(n−1)s2/σ02
donde n es el tamaño de la muestra y s2 es la varianza muestral.
c) Distribución del Estadístico de Prueba:
Bajo la hipótesis nula, el estadístico de prueba sigue una distribución Chi-cuadrado con n−1 grados de libertad.
d) Regla de Decisión:
Se compara el valor del estadístico de prueba con los valores críticos de la distribución Chi-cuadrado correspondientes al nivel de significancia (α) y los grados de libertad.
Si el valor calculado del estadístico de prueba cae en la región crítica, se rechaza la hipótesis nula.
Ejemplo
Supongamos que se quiere verificar si la varianza de una población es 25.
Se toma una muestra de 30 elementos y se calcula una varianza muestral de 20.
Hipótesis:
H0: σ2=25
Ha: σ2≠25 (prueba de dos colas)
Estadístico de Prueba:
χ2=(30−1)⋅20/25
χ2=29⋅20/5
χ2=23.2
Valores Críticos:
Con α=0.05 y n−1= 29 grados de libertad, los valores críticos de la distribución Chi-cuadrado son aproximadamente:
χ(0.025, 29) = 16.047 y χ(0.975, 29) = 45.722
Decisión:
Como el estadístico de prueba χ2=23.2 cae entre los valores críticos (16.047 y 45.722), no se rechaza la hipótesis nula.
No hay suficiente evidencia para decir que la varianza es diferente de 25.
Restricciones para prueba de hipótesis para la Desviación Estándar o Varianza
Como toda metodología esta también tiene sus requisitos para poder ser usada:
La muestra es aleatoria simple.
La población tiene una distribución normal. (Éste es un requisito mucho más estricto que el de una distribución normal cuando se prueban aseveraciones acerca de medias.
Las pruebas de aseveraciones acerca de desviaciones estándar o varianzas no son tan robustas con respecto a formas alejadas de la normalidad, lo que quiere decir que no funcionan muy bien con distribuciones que no tienen una distribución normal. Por consiguiente, la condición de una población distribuida normalmente es un requisito mucho más estricto.
La distribución chi cuadrada se explica en el aparado corrrespondiente, donde se ven las siguientes propiedades importantes.
1. Todos los valores de x2 son no negativos y la distribución no es simétrica
2. Existe una distribución x2 diferente para cada número de grados de libertad
Ejemplo:
El mundo de la industria comparte esta meta común: mejorar la calidad reduciendo la variación. Los ingenieros de control de calidad desean asegurarse de que un producto tenga una media aceptable, pero también quieren producir artículos con una calidad consistente, eliminando los defectos. Este ejemplo se explica a continuación pero se desarrolla en un jupiter notebook en github.
La Newport Bottling Company ha fabricado latas de bebidas de cola con cantidades que tienen una desviación estándar de 0.051 onzas.
Se prueba una nueva máquina embotelladora, y una muestra aleatoria simple de 24 latas produce las cantidades (en onzas) que se listan a continuación. (Las 24 cantidades tienen una desviación estándar de s = 0.039 oz).
Utilizando un nivel de significancia de 0.05:
probar la aseveración de que las latas de bebidas de cola de la nueva máquina tienen cantidades con una desviación estándar menor que 0.051 oz.
11.98, 11.98, 11.99, 11.98, 11.90, 12.02, 11.99, 11.93, 12.02, 12.02, 12.02, 11.98,
12.01, 12.00, 11.99, 11.95, 11.95, 11.96, 11.96, 12.02, 11.99, 12.07, 11.93, 12.05
Primero veamos si se cumplen los requisitos de apliación de este método:
1. La muestra es aleatoria simple: Sí.
2. Sí, se **conoce** el valor de la desviación estándar poblacional 𝞂: Sí.
3. La población se distribuye normalmente. Es lo primero que verificaremos.
Antes de iniciar cualquier procedimiento de prueba de hipótesis,
+ debemos explorar primero el conjunto de datos y
+ verificar que los requisitos de la prueba específica se cumplan.
Para esto es preciso observar a) Estadísticos de la muestra y b) Normalidad
Estadísticos de la muestra:
+ media:11.987
+ desvío estandard:0.039
+ minimo:11.9, máximo: 12.07
+ tamaño de la muestra: 24
Seguidamente se procede al análisis de normalidad de los datos,.
Y realizados 5 test de normalidad se concluye que es aceptable modelar esta muestra con una distribución normal
Objetivo: Hipótesis del gerente de producción
Probar la aseveración de que las latas de bebidas de cola de la nueva máquina tienen cantidades con una desviación estándar menor que antes.
Es decir que el desvío estandar de la maquina nueva (0.039) es signigicativamente menor que el devío de las máquinas viejas (0.051)
Prueba de hipótesis: Para probar la hipótesis que el devío nuevo es menor que el devío viejo.:
comparamos el desvío de viejo (población) con el desvío nuevo (muestra)
vemos dónde se ubica el devío de la muestra en comparación con la región crítica.
esto se logra construyendo el estadístico de la muestra y la región crítica.
H0 y H1: Definimos:
Hipótesis Nula H0: 𝞂 = 0.051
Hipótesis Alternativa H1: 𝞂 < 0.051
Análisis del estadístico de prueba χ2 y la región crítica: Observamos los numeros y la gráfica:
El estadístico de prueba está fuera de la zona crítica del nivel de signifiancia alfa marcada en rosa. El estadístico de prueba es mayor que el valor crítico.
Puede que s = 0.039 haya aparecido como consecuencia del azar o no.. De cualquier forma no es suficiente para considerarlo significativamente menor que el valor antigua de desvío estandar.
Análisis del valor P. De los números y la gráfica:
Con el estadístico de prueba se puede analizar el valor P en contraste con α
El valor P asociado al estadístico de prueba χ2 es mayor que α.
Es la región sobreada de la figura: 5.84% > 5%
El valor P suficientemente alto para hacer aceptable la Hipótesis Nula H0
No se puede rechazar la H0: 𝞂 = 0.051
Conclusiones finales:
No podemos rechazar la hipótesis nula: H0: 𝞂 = 0.051
No hay suficiente evidencia para afirmar que la nueva máquina tiene una desviación estándar menor que 0.051 oz.
Conclusión
Aunque en la práctica puedas visualizar algunos resultados usando gráficos o intervalos de confianza para obtener una intuición, el cálculo y uso del estadístico de prueba es fundamental para una evaluación formal y precisa en cualquier prueba de hipótesis.
Referencias:
Ver ejemplo en: jupiter notebook en github.