Intervalo de Confianza (IC)
Intervalo de Confianza. Nivel de Confianza. Valor Crítico
Intervalo de confianza. Valor Crítico. Nivel de confianza.
Intervalo de confianza y Nivel de confianza
Podemos decir que un estadístico vale tanto, por ejemplo, una proporción p vale esto o una media muestral xˉ vale aquello. ¿Pero, esto está bien o esta mal? Aunque un estimado puntual es el mejor valor individual para estimar un parámetro poblacional, no nos da ninguna indicación precisa de qué tan bueno es este mejor es- timado.
El intervalo de confianza nos da una idea del nivel de confianza que tiene un determinado estadítico como en el caso anterior. El intervalo de confianza suele llamarse IC. En algunas bibliografías este concepto también se denomina grado de confianza o coeficiente de confianza.
Se comparte a continucación los conceptos de intervalo de convianza para poblaciones infinitas que es el más ampliamente usado y que tiene expresiones matemáticas más sencilla. Luego el lector podrá ampliar este concepto de intervalo de confianza para poblaciones finitas en otro apartado.
Intervalo de confianza
Un intervalo de confianza es un rango de valores, derivado de los datos muestrales, que se utiliza para estimar un parámetro poblacional desconocido. Es decir, se usa para estimar el valor real de un parámetro de la población.
El intervalo de confianza proporciona una estimación del parámetro y una medida de la incertidumbre asociada con esa estimación.
El parametro puede ser por ejemplo xˉ
La medida de incertidumbre se denomina α
La medida de certidumbre se denomina (1-α)
Componentes del Intervalo de Confianza
Estimador puntual: Es el valor calculado a partir de la muestra que se utiliza como mejor estimación del parámetro poblacional. Por ejemplo, la media muestral xˉ es un estimador puntual de la media poblacional μ. Y la proporciónmuestral p̂ es un estimador de la proporción poblacional p.
Margen de error: Es la cantidad que se suma y resta del estimador puntual para obtener el intervalo de confianza. El margen de error depende del nivel de confianza y la variabilidad de los datos.
Nivel de confianza: Es la probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro poblacional. Se expresa como un porcentaje (por ejemplo, 95%, 99%) y refleja la confianza que se tiene en que el intervalo capture el parámetro desconocido.
Nivel de confianza
El nivel de confianza es la probabilidad (1-α), que es la proporción de veces que el intervalo de confianza contiene el parámetro de población, suponiendo que el proceso de estimación se repite un gran número de veces. El nivel de confianza también se llama grado de confianza o coeficiente de confianza.
Margen de Error E
El margen de error E representa la mitad del ancho del intervalo de confianza. Esto es fundamental para entender la precisión de nuestras estimaciones y cómo el margen de error contribuye a la construcción del intervalo de confianza.
Fórmula del Intervalo de Confianza para una Distribución Normal
Como la distribución normal se puede usar para aproximar a otras distribuciones es bueno empezar por entender el intervalo de confianza para la distribución normal.
Para una media poblacional μ con una muestra grande y varianza conocida, el intervalo de confianza al 100(1−α)% se calcula como:
IC = xˉ±Zα/2(σ/sqr(n))
xˉ es la media muestral.
Zα/2 es el valor crítico de la distribución normal estándar correspondiente al nivel de confianza deseado.
σ es la desviación estándar poblacional.
n es el tamaño de la muestra.
Si la varianza poblacional es desconocida y el tamaño de la muestra es pequeño, se usa la distribución t de Student en lugar de la distribución normal, y la fórmula se ajusta en consecuencia.
Ejemplo
Supongamos que tenemos una muestra de 100 personas y queremos estimar la media de su altura. La media muestral (xˉ) es de 170 cm y la desviación estándar (σ) es de 10 cm. Queremos construir un intervalo de confianza del 95%.
El nivel de confianza del 95% corresponde a un Z de aproximadamente 1.96.
El error estándar es σn=10100=1\frac{\sigma}{\sqrt{n}} = \frac{10}{\sqrt{100}} = 1nσ=10010=1.
El intervalo de confianza es:
170±1.96×1
170±1.96
[168.04,171.96]
Esto significa que estamos un 95% seguros de que la verdadera media poblacional de la altura está entre 168.04 cm y 171.96 cm.
Interpretación del intervalo de confianza y el nivel de confianza (1-α)
Veamos que dice y que no dice el intervalo de confianza:
NO: El intervalo de confianza no dice que la probabilidad de que el parámetro poblacional esté dentro del intervalo es 95%.
SI: si repetimos el proceso de muestreo y cálculo del intervalo de confianza muchas veces, aproximadamente el 95% de esos intervalos contendrán el verdadero valor del parámetro poblacional.
Las opciones más comunes para el nivel de confianza son:
90% (con a 0.10),
95% (con a 0.05) y
99% (con a 0.01).
La opción del 95% es la más común puesto que provee un buen equilibrio entre precisión (reflejada en el ancho del intervalo de confianza) y confiabilidad (expresada por el nivel de confianza).
Interpretación del intevalo de confianza y el valor p (proporción)
Nótese que aquí vamos a interpretar la validez o confianza de una proporción y no de una media.
A continuación se presenta un ejemplo de un intervalo de confianza basado en los datos muestrales de 280 ensayos de terapeutas de contacto, donde en el 44% de los ensayos se identifica correctamente la mano elegida:
El intervalo de confianza estimado de 0.95 (o 95%) de la proporción poblacional p es 0.381 < p < 0.497.
Interpretación de un intervalo de confianza
Debemos ser cuidadosos para interpretar los intervalos de confianza correctamente. Existe una interpretación correcta y muchas diferentes y creativas interpretaciones erróneas del intervalo de confianza 0.381 , p , 0.497.
En primer lugar, notese que estamos estimandoa proporción poblacional y no una media. Entonces:
Correcta: “Tenemos una confianza del 95% de que el intervalo de 0.381 a 0.497 realmente contiene el valor verdadero de del parámetro poblacional que estamos estimando.”. Esto significa que si seleccionamos muchas muestras diferentes de tamaño 280 y construimos los intervalos de confianza correspondientes, el 95% de ellos incluirían realmente el valor de la proporción poblacional p. (Note que en esta interpretación correcta, el nivel del 95% se refiere a la tasa de éxitos del proceso, utilizada para estimar la proporción, y no a la proporción de la población en sí).
Errónea: “Existe un 95% de probabilidades de que el valor real de p esté entre 0.381 y 0.497”.
Uso de intervalos de confianza para hacer comparaciones: Advertencia:
Los intervalos de confianza pueden usarse de manera informal para compa- rar conjuntos de datos diferentes, pero el traslape de intervalos de confianza no debe usarse para elaborar conclusiones formales y finales acerca de la igualdad de las proporciones. (Véase “On Judging the Significance of Differences by Examining the Overlap Between Confidence Intervals” de Schenker y Gentleman, American Statistician, vol. 55, núm. 3).
Valores críticos para el intervalo de confianza
Un valor crítico o Z crítico es el número en la línea limítrofe que separa estadísticos muestrales que tienen mayor probabilidad de ocurrir de aquellos que no tienen probabilidad de ocurrir. El número Z(α/2) es un valor crítico, una puntuación z con la propiedad de que separa una área de α/2 en la cola derecha de la distribución normal estándar
Regla del intervalo
La regla empírica del intervalo es una estimación aproximada y muy rápitda del invel de confianza se hace definiendo los intervalos de confianza en función de la cantidad de desvíos estandard. Esta regla establece que las siguientes propiedades se aplican a conjuntos de datos con una distribución aproximadamente normal.
Aproximadamente el 68% de todos los valores están dentro de 1 desviación estándar de la media.
Aproximadamente el 95% de todos los valores están dentro de 2 desviaciones estándar de la media.
Aproximadamente el 99.7% de todos los valores están dentro de 3 desviaciones estándar de la media.
Se repite aquí esta regla para que el lector vea como el intervalo de confianza que se explica aquí para una distribución normal y para aproximar a otras distribuciones, tiene como elemento fundamental en su formula el Z crítico que a su vez es una función de el desvío estandard.
Intervalo de confianza para una Distribución Binomial
El cálculo del intervalo de confianza para una proporción en una distribución binomial puede realizarse utilizando varios métodos. Uno de los métodos más comunes es el método de Wilson, que es preferido sobre el método de aproximación normal especialmente cuando las proporciones son cercanas a 0 o 1 o cuando el tamaño de la muestra no es grande.
Método de Wilson
La fórmula del intervalo de confianza para una proporción p^ usando el método de Wilson es:
p^±z . sqr(p^(1−p^)+z24nn+z2)
p^=x/n es la proporción de éxitos observada.
n es el tamaño de la muestra.
x es el número de éxitos observados.
z es el valor crítico del puntaje z correspondiente al nivel de confianza deseado (por ejemplo, para un nivel de confianza del 95%, z≈1.96).
No se de importancia recordar la formula, pero si obervar que al igual que otras formulas de intervalo de convianza depende del parametro estimado (en este caso la proporcion de éxitos), del tamaño de la muestra y del valor crítico z.
Cálculo del estimado puntual y de E desde un intervalo de confianza binomial simétrico
Algunas veces queremos comprender mejor un intervalo de confianza que podría haberse obtenido de un artículo de una revista, o que podría haberse generado por medio de programas de cómputo o una calculadora. Si ya conocemos los límites del intervalo de confianza, la proporción muestral y el margen de error E se calculan como sigue:
pˆ Estimado puntual de p:
pˆ = (slímite de confianza superior + 1límite de confianza inferior) / 2
Margen de error:
E = límite de confianza superiord - slímite de confianza inferior / 2
Fundamentos del intervalo de confianza
La idea básica que subyace en la construcción de intervalos de confianza se relaciona con el teorema del límite central, que indica que si reunimos muestras aleatorias simples de una población distribuida normalmente, las medias muestrales se distribuyen de manera normal, con media µ y desviación estándar 𝞂. Si reunimos muestras aleatorias simples de tamaño n >= 30 de cualquier población, la distribución de medias muestrales es aproximadamente normal, con media µ y desviación estándar 𝞂. El formato del intervalo de confianza es realmente una variación de la ecuación que ya se usó con el teorema del límite central en donde reemplazamos 𝞂. y luego despejamos µ
Intervalo de confianza para poblaciones finitas
El intervalo de confianza esta relacionad0 con el error y el tamaño de la muestra como se ve al introducirse en el tema.
Pero además existe un factor de corrección de estos indicadores para poblaciones finitas como puede verse en otro apartado a continuación de este.
Intervalo de confianza para 𝞂 desconocida
Por lo visto hata aquí, para construir los intervalos de confianza es preciso conocer el parametro bajo estudio (ej. media o población) y en cualquier caso también es preciso conocer el desvío estandar. Pero también es posible contruir el intervalo de confianza cuando no conocemos la desviación estandard. Esto último se logra con base en la distribución t-Student.
t= X̅−μ/(s/√n)
Como generalmente se desconoce 𝞂 en circunstancias reales, este metodo es muy práctico, y se utiliza con frecuencia. Pero se puede usar bajo ciertas condiciones:
Requisitos de los estimadores y los intervalos de confianza
Los requisitos para calcular estimadores e intervalos de confianza estan explicados en Estimadores y su estudio. Se sugiere ver la explicación de este tema, aunque se resumen a contincuación.
1. La muestra es aleatoria simple.
2. La muestra proviene de una población distribuida normalmente o n > 30.
3. La muestra tiene 𝞂 desconocida pero podemos conocer s.