Valor Crítico. Región Crítica.
Valores Infrecuentes.
Valor crítico, Región Crítica
Región Crítica
La región crítica (o región de rechazo) es el conjunto de todos los valores del estadístico de prueba que pueden provocar que rechacemos la hipótesis nula.
La región crítica tiene asociada un áera bajo la curva de distribución.
La región drítica tiene asociado un valor de probabilidad acumulada.
El tamaño del área y el valor de probabilidad dependen del nivel de significancia (α) que se haya seleccionado.
Ejemplo de región crítica de una distribución normal estandar:
En la figura, en la columna izquierda se pueden ver tres regiones críticas correspondientes a un nivel de significancia (α) = 0.05=5%.
En el primer caso (arriba) la región crítica es el conjunto de valores de las dos colas del estimador x > 1.960 y x < -1.960
En el segundo caso (al medio) , la región crítica es el cojunto de valores de la cola derecha del estimador x > 1..645
En el tercer caso (abajo), la región crítica es el conjunto de valores de la cola izquierda del estimados x < -1.645
Nivel de Significancia
El nivel de significancia (denotado por alfa (α)) es la probabilidad de que el estadístico de prueba caiga en la región crítica, cuando la hipótesis nula es verdadera. Si el estadístico de prueba cae en la región crítica, rechazamos la hipótesis nula, de manera que a es la probabilidad de cometer el error de rechazar la hipótesis nula cuando es verdadera. Las opciones comunes para a son 0.05, 0.01 y 0.10, aunque la más común es 0.05.
En la figura, el nivel de significancia se marca en cada caso por una región sombreada.
Valor Crítico
Un valor crítico es cualquier valor que separa la región crítica (donde rechazamos la hipótesis nula) de los valores del estadístico de prueba que no conducen al rechazo de la hipótesis nula. Los valores críticos dependen de la naturaleza de la hipótesis nula, de la distribución muestral que se aplique y del nivel de significancia alfa (α).
Puntuaciones z y valores infrecuentes
Si bien la especificacíón del valor crítico depende de que valores se consideren infrecuentes, suele utilizarse la regla práctica del intervalo para concluir que un valor es “infrecuente” si está a más de 2 desviaciones estándar de la media. Por lo tanto, los valores infrecuentes tienen puntuaciones z menores que -2 y mayores que +2.. Pero esto no es siempre así. Esta es solo una regla rápida y practica. Los valores críticos se definen con más detalle de acuerdo al caso.
Los valores críticos, se determinan según el estudio y sus particularidades. En cada estudio se derinen los valores críticos y los niveles de significancia correspondientes.
Ejemplo de distribución normal estandar
En el ejemplo de la columna izquierda de la figura se observa que para un nivel de significancia α=5%, estammos practicamente en z=x= ±2, por los valores de x = ± 1,96 de la primera distribución, son considerados valores críticos.
Ejemplo de comparación de estaturas:
Si aplicamos este criterio, Lyndon Johnson no tiene una estatura infrecuente cuando lo comparamos con los presidentes del siglo pasado, y Shaquille O’Neal no tiene una estatura infrecuente cuando lo comparamos
con sus compañeros de equipo, ya que ninguno de los dos tiene una estatura con una puntuación z mayor que 2.
Valores comunes: -2 <= z <= 2
Valores infrecuentes z < -2 o z > +2
Ejemplo que si tiene valores infrecuentes:
Si consideramos a los jugadores de básquetbol del equipo de Miami Heat, el jugador más bajo es Damon Jones, quien mide 75 pulgadas. Su puntuación z es 1.52, como se muestra en el siguiente cálculo. (Nuevamente, usamos µ=80.0 pulgadas y s=3.3 pulgadas del equipo de Miami Heat).
Damon Jones: z = (x-µ)/𝞂 = (75-80)/3.3=1.52
Las puntuaciones z son medidas de posición, en el sentido de que describen la localización de un valor (en
términos de desviaciones estándar) en relación con la media. Una puntuación z de 2 indica que un valor está a dos desviaciones estándar por arriba de la media, en tanto que una puntuación z de 3 indica que un valor está a tres desviaciones estándar por debajo de la media. Los cuartiles y los percentiles también son medidas de posición, pero se definen de forma distinta que las puntuaciones z y son útiles para comparar valores dentro del mismo conjunto de datos o entre distintos conjuntos de datos.
Valores críticos para proporciones
El concepto de valor crítico en proporciones es análogo al de medias, solo que cambia el estimador. En las medias el estimador es X̅ mientras que en las proporciones el estimador es pˆ.
Interpretación de valores y regiones críticas
Vamos a desglosar los conceptos de valor crítico y región crítica en el contexto de una prueba de hipótesis.
Valor Crítico
El valor crítico es el punto o puntos en una distribución estadística que separan la región de no rechazo de la región de rechazo. En otras palabras, es el umbral que determina si se rechaza o no la hipótesis nula. Depende del nivel de significancia (α) que elijas para tu prueba.
Región Crítica
La región crítica es el conjunto de valores del estadístico de prueba que llevan a rechazar la hipótesis nula. Está determinada por los valores críticos. Si el valor calculado del estadístico de prueba cae dentro de esta región, se rechaza la hipótesis nula.
Ejemplo
Supongamos que estamos realizando una prueba de hipótesis sobre la media de una población con un nivel de significancia del 5% (α = 0.05) y queremos usar una prueba de dos colas. Queremos determinar si la media de una muestra es significativamente diferente de la media poblacional.
Hipótesis Nula (H₀): La media poblacional es igual a un valor específico (por ejemplo, μ = 100).
Hipótesis Alternativa (H₁): La media poblacional es diferente a ese valor (μ ≠ 100).
El valor crítico se puede encontrar usando la distribución t de Student (si la varianza poblacional es desconocida y el tamaño de la muestra es pequeño) o la distribución normal (si la varianza poblacional es conocida y el tamaño de la muestra es grande). Este ejemplo se desarrolla en python, en un jupyter notebook y se comparte en github.
Así esste ejemplo simula una prueba t de dos colas, muestra la distribución de la muestra, y señala los valores críticos y la región crítica. La interpretación final depende de si el estadístico de prueba cae dentro de la región crítica.