top of page

Hipótesis sobre Media

Hipótesis relativa a una una media

Hipótesis relativa a una media

Hipótesis relativa a una media

Una prueba de hipótesis respecto a una media es un procedimiento estadístico que permite determinar si hay suficiente evidencia en una muestra de datos para inferir que una característica de una población (la media) es diferente de un valor específico. Este procedimiento implica formular dos hipótesis opuestas: la hipótesis nula (H0) y la hipótesis alternativa (H1).


Es decir, las hipótesis relativas a una media se utilizan en estadística para hacer inferencias sobre la media de una población. 


Ejemplos que se pueden analizar con hipótesis relativas a una media:

  • ¿El tiempo promedio de hospitalización ha cambiado después de implementar un nuevo protocolo de tratamiento?

  • ¿El nuevo método de enseñanza mejora las calificaciones promedio de los estudiantes en matemáticas?

  • ¿El tiempo promedio de estudio semanal de los estudiantes universitarios ha aumentado desde la implementación de una nueva política académica?

  • ¿La implementación de una nueva herramienta de software ha aumentado la productividad promedio de los empleados?

  • ¿La media de satisfacción del cliente ha mejorado después de una nueva campaña de marketing?

Cuando se prueban aseveraciones acerca de medias poblacionales, en ocasiones se aplica la distribución normal, en otras la distribución t de Student y en algunas no se aplica ninguna de las dos, por lo que debemos utilizar métodos no paramétricos o técnicas bootstrap de muestreo. (Los métodos no paramétricos, que no requieren una distribución en particular,


Pasos para Realizar una Prueba de Hipótesis sobre una Media

a) Formulación de las Hipótesis:

  1. Hipótesis nula (H0): Es la hipótesis que se quiere contrastar y que generalmente afirma que no hay efecto o diferencia. Por ejemplo, H0:μ=μ0, donde μ0 es la media hipotética de la población.

  2. Hipótesis alternativa (H1): Es la hipótesis que se considera si la nula es rechazada. Puede ser:

  • Bilateral: H1:μ≠μ0

  • Unilateral izquierda: H1:μ<μ0

  • Unilateral derecha: H1:μ>μ0

b) Nivel de Significancia (alpha α):

Es la probabilidad de rechazar la hipótesis nula cuando esta es verdadera. 

  • Comúnmente se usan valores como 0.05, 0.01 o 0.10.

c) Cálculo del Estadístico de Prueba:

Dependiendo del tamaño de la muestra y del conocimiento de la desviación estándar poblacional, se utiliza el estadístico z o t.

  • Estadístico z (cuando la desviación estándar poblacional σes conocida y el tamaño de la muestra es grande, n≥3: 

z=xˉ−μ0/(σ/√n)

  • Estadístico t (cuando σ es desconocida y se usa la desviación estándar muestral s, especialmente para muestras pequeñas, n<30n: 

t=xˉ−μ0/(s/√n)

d) Determinación del Valor P:

El valor p es la probabilidad de observar un estadístico de prueba tan extremo o más extremo que el calculado, bajo la hipótesis nula. 

  • Se compara con el nivel de significancia alpha α.

e) Región Crítica y Decisión:

Se define la región crítica (los valores del estadístico de prueba que llevan al rechazo de H0) basada en α.

  1. Bilateral: Rechazar H0 si ∣z∣>zα/2 o ∣t∣>tα/2,n−1

  2. Unilateral izquierda: Rechazar H0 si z < −zα o t < −tα,n−1

  3. Unilateral derecha: Rechazar H0 si z > zα o t > tα,n−1

Ejemplo Simple:

Supongamos que queremos probar si la media de una muestra es diferente de 100 con un nivel de significancia de 0.05. Tenemos una muestra de 30 datos con una media muestral de 105 y una desviación estándar conocida de 15.


I) Ejemplo con Estadístico z

Utilizando python, scipy en jupyter notebook:

# Datos de la muestra

n = 30

sample_mean = 105

population_mean = 100

population_std = 15

alpha = 0.05

# Calculo del estadístico z

z = (sample_mean - population_mean) / (population_std / np.sqrt(n))

# Calculo del valor p (prueba bilateral)

p_value = 2 * (1 - stats.norm.cdf(abs(z)))

Esto da como resultado:

Estadístico z: 1.8257418583505538 Valor p: 0.067889154861829 No rechazar H0: no hay suficiente evidencia para decir que la media es diferente de 100.

ya que el valor p es mayor que alfa.


II) Ejemplo con Estadístico t

En este caso solo usamos el desvío estandar de la muestra ya que se supone que el de la pobalción no lo conocemos y en consecuencia el calculo es más simple porque utiliza menos datos.

Utilizando python, scipy en jupyter notebook:

# Datos de la muestra

sample_std = 15 # desviación estándar muestral en lugar de poblacional

# Calculo del estadístico t

t = (sample_mean - population_mean) / (sample_std / np.sqrt(n))

# Calculo del valor p (prueba bilateral)

p_value = 2 * (1 - stats.t.cdf(abs(t), df=n-1))

Esto da como resultado:

Estadístico t: 1.8257418583505538 Valor p: 0.07820332017206755 No rechazar H0: no hay suficiente evidencia para decir que la media es diferente de 100.


Conclusiones del ejemplo resuelto con z y t

El uso del estadístico de prueba z o t permite estandarizar las pruebas de hipótesis y hacer inferencias precisas sobre la media de una población. Aunque en algunas situaciones específicas se pueden usar los valores directos, el uso de los estadísticos de prueba proporciona un marco consistente y fácil de interpretar para la toma de decisiones estadísticas.


A continuación se comparten dos analisis de aplicación practica de estimaciones de media.


I) Hipótesis relativas a una media cuando se conoce 𝞂

En primer lugar veamos como resolver una hipótesis relativa a una media de una población cuando se conoce el devío estandar a través de un ejemplo practico.


Ejemplo:

Control de calidad  de los dulces  M&M: Un conjunto de datos incluye los pesos de 13 dulces M&M rojos, elegidos al azar de una bolsa que contiene 465 M&M. A continuación se presentan los pesos (en gramos), los cuales tienen una media de x = 0.8635 y una desviación estándar de s =  0.0576 g

0.751,   0.841,   0.856,   0.799,    0.966, 0.859,   0.857,   0.942,   0.873,   0.809,   0.890,   0.878,   0.905

En el empaque se afirma que el peso neto del contenido es 396.9 g, de manera que los M&M deben tener un peso medio de al menos 396.9/465 = 0.8535 g para dar la cantidad anunciada. 

Utilizamos los datos muestrales con un nivel de significancia de 0.05, para probar la aseveración que hizo un gerente de producción de que los M&M tienen en realidad una media mayor que 0.8535 g, de manera que los consumidores están recibiendo más que la cantidad indicada en la etiqueta. 


El análisis y los cálculos se realizan en python en un jupyter notebook que se comparte en github.

Como se ve: 

  • Se trata de una muestra aleatoria simple.

x=  0.8635 g,    s= 0.0576 g


  • Referida a una población:

µ=  0.8535 g,    𝞂= 0.0565 g

Requisitos de la muestra

1. La muestra es aleatoria simple.

2. Se conoce el valor de la desviación estándar poblacional 𝞂.

3. Se satisface una o ambas de las siguientes condiciones:

  • la población se distribuye normalmente o

  •  n > 30.

Antes de iniciar cualquier procedimiento de prueba de hipótesis,  debemos explorar primero  el conjunto de datos y  verificar que los requisitos de la prueba específica se cumplan.

  • Para esto es preciso observar a) Estadísticos de la muestra y b) Normalidad

Luego de realizar los 5 test de normalidad explicados en el apartado de: análisis de normalidad, se comprueba que es aceptable modelar la muestra con una distribución normal.

Hipótesis del gerente de producción

Probar la aseveración que hizo un gerente de producción de que los M&M tienen en realidad una media mayor que 0.8535 g, de manera que los consumidores *están recibiendo más que la cantidad indicada en la etiqueta*.

Prueba de hipótesis

Para probar la hipótesis que los consumidores *están recibiendo más que la cantidad indicada en la etiqueta*: primero comparamos la media de la con la media de la población y luego vemos dónde se ubica la media de la muestra en comparación con la región crítica. Así definimos hipótesis nula y alternativa.

H0 y H1:

  1. Hipótesis Nula H0: µ = 0.854

  2. Hipótesis Alternativa: µ > 0.854


a) Analisis del intervalo de confianza de la población

El IC nos dice con una probabilidad del 95% el rango de valores posibles para la media de la población

Es un primer análisis aproximado:

  • Si el valor de la media de la muestra entre dentro del intevalo de confianza entonces es un valor posible por azar. Se observa aquí que:

    • La media de la muestra está dentro del IC intervalo de confianza del 95%. 

    • La media de la muestra esta pr'oxima a la media de la población

Conclusiones del análisis del intervalo de confianza: Es muy probable que µ = 0.864 haya aparecido como consecuencia del azar. Observando el intervalo de confianza la H0 parece aceptable.


b) Analisis del estadístico de prueba z y la región crítica

Es un análisis más exahustivo que el anterior.

El estadístico de prueba se calcula como z=(xˉ−μ0)/(σ/√n), entonces:

  • Si el estadístico de prueba entra dentro de la región crítica la H0 se rechaza.

  • Si el estadístico de prueba está fuera de la región crítica la H0 no se puede rechazar.

En este caso, el estadístico de la prueba es z = 0.638 y la z critico es z= 1.645, y se observa aquí que:

  • La media de la muestra está fuera de la zona crítica del nivel de signifiancia alfa marcada en lila.

  • La media de la muestra esta proxima a la media de la población y fuera de la zona crítica.

Conclusiones del análisis del estadístico de prueba (Media):  

  • Es muy probable que µ = 0.864 haya aparecido como consecuencia del azar.


c) Análisis del valor P

Con el estadístico de prueba se puede analizar el valor P en contraste con α

Aquí se observa que:

  1. El valor P =26.2% asociado al estadístico de prueba es mucho mayor que α=5%

  2. Es la región sobreada de la figura: 26.2% >> 5% si se observa el grafico en jupiter notebook.

Conclusiones del valor P del estadístico de Prueba: 

  1. El valor P es tan alto que hace aceptable la Hipótesis Nula H0. Por lo tanto, 

  2. No se puede rechazar la H0: µ = 0.854.


Conclusiones finales

  1. En este estudio, una media muestral como 0.8635 puede presentarse fácilmente por azar con una media poblacional de 0.8535.

  2. No existe evidencia suficiente para sustentar la conclusión de que la media poblacional sea mayor que 0.8535, como afirmó el gerente de producción.


II) Hipótesis relativas a una media cuando No se conoce 𝞂

Cuando no se conoce el desvío estándar de la población enonces la distribución normal no es confiable, pero si lo es la distribución t-Student. Entonces si se desconoce 𝞂 conviene usar t-Student.

Cuando se utiliza t-Student es preciso tener en cuenta tanto los requisistos para aplicar la distribución como los datos que tuiliza.

Requisitos de la muestra

  1. La muestra es aleatoria simple.

  2. Se conoce el valor de la desviación estándar poblacional 𝞂. (probablemente se desconoce también n de la población)

  3. Se satisface una o ambas de las siguientes condiciones: (a) la población se distribuye normalmente o (b)  n > 30.

Al desconocer el desvío estandar (y probablemente el tamaño de la población) la distribuclión t-Student utiliza el desvío de la muestra (s) y los grados de libertad. Los grados de livertad equivalen al tamaño de la muestra menos uno. Así el estadistico de la prueba es:

t=(xˉ−μ0)/(s/√n)


Ejemplo:

Utilizamos el mismo ejemplo anterior, sólo que ahora asumimos que desconocemos el desvio y el tamaño de la población.

Control de calidad  de los dulces  M&M: Un conjunto de datos incluye los pesos de 13 dulces M&M rojos, elegidos al azar de una bolsa que contiene 465 M&M. A continuación se presentan los pesos (en gramos), los cuales tienen una media de x = 0.8635 y se desconoce el desvío de la población y el tamño de la muestra.

0.751,   0.841,   0.856,   0.799,    0.966, 0.859,   0.857,   0.942,   0.873,   0.809,   0.890,   0.878,   0.905

En el empaque se afirma que el peso neto del contenido es 396.9 g, de manera que los M&M deben tener un peso medio de al menos 0.8535 g para dar la cantidad anunciada. 

Utilizamos los datos muestrales con un nivel de significancia de 0.05, para probar la aseveración que hizo un gerente de producción de que los M&M tienen en realidad una media mayor que 0.8535 g, de manera que los consumidores están recibiendo más que la cantidad indicada en la etiqueta. 

Este ejemplo se desarrolla en un jupydter notebook que se comparte en github.

H0 y H1: Las hipótesis nula y alternativa no cambian obviamente.

  1. Hipótesis Nula H0: µ = 0.854

  2. Hipótesis Alternativa: µ > 0.854

a) Analisis del intervalo de confianza de la población

En este caso el análisis es analogo al anterior solo que se usa una distribución t en lugar de una normal.

El IC nos dice con una probabilidad del 95% el rango de valores posibles para la media de la población

Es un primer análisis aproximado, y muy parecido al anteriror derivado de la distribución normal.

Los valores de x son 0.730 y 0.977, mientras que  µ > 0.854, es decir que la H1 se encuentra más cerca de la H0 que de las regiones críticas dadas por alfa. Entonces se concluye aquí que: Es muy probable que µ = 0.864 haya aparecido como consecuencia del azar. Observando el intervalo de confianza la H0 parece aceptable.


b) Analisis del estadístico de prueba z y la región crítica

Es un análisis más exahustivo que el anterior.

El estadístico de prueba se calcula como z=(xˉ−μ0)/(s/√n), sobre la distribución t-student, entonces:

Tamaño de la muestra: 13, Grados de libertad: 12 

Estadístico de la muestra: 0.6254044261819193 y Z crítico: 2.179

Se ve que el estadístico de la muestra está mucho mas cerca del cero de la distribución que el Z crítico. Esto significa que el Estadístico de la muestra está fuera de la zona crítica que va de z crítico a infinito. Y al estar fuera de la zona crítica no se puede rechazar la H0.

c) Análisis del valor P

Con el estadístico de prueba se puede analizar el valor P en contraste con α

Aquí se observa que:

  1. El valor P =27.2% asociado al estadístico de prueba es mucho mayor que α=5%

  2. Es la región sobreada de la figura: 27.2% >> 5% si se observa el grafico en jupiter notebook.

Conclusiones del valor P del estadístico de Prueba: 

  1. El valor P es tan alto que hace aceptable la Hipótesis Nula H0. Por lo tanto, 

  2. No se puede rechazar la H0: µ = 0.854.


Conclusiones finales

  1. En este estudio, una media muestral como 0.8635 puede presentarse fácilmente por azar con una media poblacional de 0.8535.

  2. No existe evidencia suficiente para sustentar la conclusión de que la media poblacional sea mayor que 0.8535, como afirmó el gerente de producción.

Conclusiones de ambos métodos

Ambos métodos (normal, y t-Student) nos llevan a las mismas conclusiones.


Referencias


bottom of page