Poblaciones y muestras

Características de poblaciones y muestras

En el análisis estadístico de datos, generalmente utilizamos datos de algunas muestras seleccionadas para sacar conclusiones sobre la población de la cual se tomaron estas muestras. Un diseño de estudio adecuado debe garantizar que los datos de la muestra sean representativos de la población de la que provienen.

La principal diferencia entre una población y una muestra tiene que ver con cómo se asignan las observaciones al conjunto de datos.

Población: Incluye todos los elementos de un conjunto de datos.
Muestra: Consiste en una o más observaciones tomadas de la población. Es posible extraer más de una muestra de la misma población.

Cuando queremos estimar un parámetro de una población, por ejemplo, el peso de los hombres europeos, típicamente no podemos medir a todos los individuos de esa población. Nos limitamos a investigar una muestra aleatoria (y esperamos que representativa) tomada de este grupo.

Basándonos en una estadística de la muestra —es decir, en el valor correspondiente calculado a partir de los datos de la muestra— usamos la inferencia estadística para determinar lo que podemos saber sobre el parámetro correspondiente en la población.

Parámetro: Es una característica de una población, como la media o la desviación estándar. Con frecuencia se representa con letras griegas.
Estadístico: Es una característica medible de una muestra. Ejemplos de estadísticas incluyen:La media de los datos de la muestra.
El rango de los datos de la muestra.
La desviación de los datos respecto a la media de la muestra.
Distribución muestral: Es la distribución de probabilidad de un estadístico dado, basada en una muestra aleatoria.
Inferencia estadística: Permite hacer una estimación informada sobre un parámetro poblacional, basándonos en un estadístico calculado a partir de una muestra aleatoria de esa población.

1/1