Distribución de Medias
Distribución de las medias muestrales.
Distribución Muestral de las Medias
Distribución de la media o distribución muestral de las medias
La distribución muestral de la media es la distribución de medias muestrales, donde todas las medias tienen el mismo tamaño muestral n y se obtienen de la misma población.
Características Clave
1. Media de la Distribución Muestral:
La media de la distribución muestral de medias (μXˉ) es igual a la media de la población (μ).
μXˉ=μ
2. Desviación Estándar de la Distribución Muestral (Error Estándar):
La desviación estándar de la distribución muestral de medias (σXˉ) es la desviación estándar de la población (σ) dividida por la raíz cuadrada del tamaño de la muestra (n).
σXˉ=σ/√n
3. Forma de la Distribución Muestral:
Según el Teorema del Límite Central, si el tamaño de la muestra es suficientemente grande, la distribución muestral de medias se aproximará a una distribución normal, independientemente de la forma de la distribución de la población.
Propiedades de la distribución de proporciones muestrales
1. Las medias muestrales tienden a coincidir con el valor de la media poblacional.
Es decir, todas las medias muestrales posibles tienen a ser muy parecidas o igual a la media poblacional.
2. En ciertas condiciones, la distribución de la media muestral puede aproximarse por medio de una distribución normal.
Comprenderemos mejor el concepto de una distribución muestral de la proporción si consideramos algunos ejemplos específicos.
Ejemplo
Supongamos que un investigador quiere estimar la media del colesterol total en la sangre de los adultos de una ciudad. Debido a que es impráctico medir a todos los adultos, el investigador toma varias muestras de la población y calcula la media de cada muestra.
Estudio
Población y Muestra:
Población: Todos los adultos de la ciudad.
Tamaño de muestra: n=100n = 100 adultos.Medición y Cálculo:
Se toman 100 muestras de tamaño 100 cada una.
Para cada muestra, se calcula la media del colesterol total en la sangre.Distribución Muestral:
Se obtienen 100 medias muestrales.
Estas medias muestrales se distribuyen alrededor de la media poblacional del colesterol total.
Según el Teorema del Límite Central, la distribución de estas medias muestrales será aproximadamente normal.
Análisis y respuesta
Este ejemplo se encuentra desarrollado en python en jupyter notebook, compartido en github.
Interpretación del Resultado
Histograma de las Medias Muestrales:
El histograma muestra la frecuencia de las medias muestrales calculadas a partir de 1000 muestras de tamaño 100 extraídas de la población.
Podemos observar una distribución aproximadamente normal centrada en la media poblacional (200200).Función de Densidad de Probabilidad Teórica (PDF):
La línea roja representa la PDF teórica de la distribución normal.
La superposición de la PDF teórica sobre el histograma muestra que la distribución muestral de medias sigue la forma esperada según el Teorema del Límite Central.
Ejemplo: Distribución muestral de las medias del mariscal de campo
Un mariscal de campo lanzó:
1 intercepción en su primer juego,
2 intercepciones en su segundo juego,
5 intercepciones en su tercer juego y después se retiró.
Considere la población consistente en los valores 1, 2, 5.
Observe que dos de los valores de la muestra, de manera que la media en la población es **8/3**.
a. Liste todas las muestras diferentes posibles de tamaño n 2 seleccionadas con reemplazo.
Para cada muestra, calcule la media.
Utilice una tabla para representar la distribución muestral de las medias.
b. Calcule la media de la distribución muestral de las medias.
c. Para la población de 1, 2, 5, la media poblacional es: 8/3.
¿La media de la distribución muestral de las medias también es igual a 8/3?
¿Las medias muestrales coinciden con el valor de la media poblacional?
Es decir, ¿las medias de la muestra tienen una media igual a la mediai poblacional?
Analisis y respuestas
Este ejemplo se encuentra desarrollado en python en jupyter notebook, compartido en github.
Interpretación del resultado
Observe la figura correspondiente a este problema.
a. En la tabla se listan las nueve muestras diferentes posibles de tamaño **n=2** (sample), obtenidas con reemplazo de la población de 1, 2, 5, de tamaño igual a 3.
Esta tabla también contiene:
'sample' : los números (elementos) que componen la muestra.
'mean' : **la media** de la muestra. (observe que varía según los valores de la muestra).
'P(sample)': probabilidad de encontrar una muestra como esta entre todas las muestras posibles. (1/9)
Observe que:
Como existen 9 muestras igualmente probables.
La media de las medias que aparecen en las muestras es igual a 8/3 (2.6666)
Esta es una **media** que se calcula como la **𝜇=∑ 𝑥 / m**, dónde m es la cantidad de muestras.
b. En la tabla se resumen los resultados de las muestras que se pueden tomar.
Esto es porque la media que puede encotrarse al tomar cada muestra puede variar.
En las 9 muestras que se pueden sacar, se pueden encontar medias que varían entre 1 y 5.
En resumen, se pueden tomar 9 muestras distintas:
+ Hay sólo una muestra dónde las medias serán 1, 2 y 5.
+ En dos muestras las medias valdrán 1.5, 3 y 3.5.
Conclusiones
1. El la definición de este problema al ver los datos [1, 2, 5] se observa que la media es 0.66666 o 8/3.
2. En el punto a, al armar la tabla de datos se observa que la media de las medias de las muestras es 8/3.
2. Se revisa la media de las medias y una vez mas se observa que la media de las proporciones es 8/3.
Por lo tanto, **las medias muestrales tienden a coincidir con la media poblacional**
Este es un ejemplo sencillo que prueba una de las principales propiedades de la distribución de medias.
Este ejemplo está desarrollado y compartido en python en mi github.