DOF
Grados de libertad
Ejemplo representativo del concepto de dof
El concepto de grados de libertad o degrees of freedom (DOF) es fundamental en estadística, especialmente cuando trabajamos con muestras de datos y estimaciones.
Los grados de libertad son básicamente la cantidad de valores en un cálculo estadístico que pueden variar libremente sin que se violen las restricciones impuestas por el propio cálculo. Es decir, representan cuántos valores en nuestro conjunto de datos pueden ser "libres" al hacer una estimación o al calcular una estadística.
Ejemplo
Supongamos que tienes una muestra de 5 números:
1. 10
2. 15
3. 20
4. 25
5. 30
Si queremos calcular la media de estos números, sumas todos los valores y los divides por 5. Ahora, si decimos que la media de este grupo debe ser exactamente 20, y luego tomamos los primeros cuatro valores de la muestra, el quinto valor ya no puede ser libre. Tendría que ajustarse automáticamente para que el promedio sea 20.
Así que, cuando usamos la muestra para calcular la media, tenemos 4 grados de libertad. Esto es porque los primeros 4 números pueden variar libremente, pero el quinto está restringido por la condición de que el promedio sea 20.
Importancia de los grados de libertad
Los grados de libertad afectan directamente las distribuciones estadísticas y, por lo tanto, la precisión y el ajuste de nuestras estimaciones. Cuantos más grados de libertad tengamos, más confiable suele ser la estimación, porque tenemos más variabilidad. Sin embargo, a medida que los grados de libertad disminuyen (por ejemplo, cuando trabajamos con muestras pequeñas), nuestra estimación se vuelve menos precisa.
Ejemplo en Pruebas de Hipótesis
En pruebas de hipótesis (como la prueba t de Student), los grados de libertad juegan un papel clave. Determinan la forma de la distribución t, y la "forma" cambia dependiendo de cuántos grados de libertad haya. En resumen:
Más grados de libertad (más datos en la muestra): la distribución t se parece más a la normal.
Menos grados de libertad (muestras pequeñas): la distribución t es más ancha y tiene "colas" más gruesas, lo que refleja la mayor incertidumbre.
Fórmula Básica para Grados de Libertad
Una fórmula común que ves en estadística es:
dof = n - 1
donde n es el tamaño de la muestra. Este -1 refleja el hecho de que, al estimar una media, estamos usando un dato del conjunto para ajustarnos a una restricción.
Dinámica de los grados de libertad
El concepto de grados de libertad, que en mecánica parece estar completamente claro, es más difícil de comprender en aplicaciones estadísticas.
En mecánica, una partícula que se mueve en un plano tiene "2 grados de libertad": en cada instante, dos parámetros (las coordenadas x e y) definen la posición de la partícula. Si la partícula se mueve en el espacio, tiene "3 grados de libertad": las coordenadas x, y y z.
En estadística, un grupo de n valores tiene n grados de libertad. Si observamos solo la forma de la distribución de estos valores, podemos restar de cada valor la media de la muestra. Entonces, los datos restantes solo tienen n - 1 grados de libertad.
Esto es más claro en el caso de n = 2: si conocemos el valor de la media y el valor de la primera muestra, entonces podemos calcular el valor de la segunda muestra usando la fórmula: valor2 = 2 × media - valor1. El caso se vuelve más complejo cuando tenemos varios grupos.
En el gráfico se representa el concepto de grados de libertad. En este ejemplo:
Los valores de la muestra están representados por las barras azules, y la media está marcada como una línea roja discontinua.
Los primeros cuatro valores son "libres", y los llamamos grados de libertad (se señala con la etiqueta "Grado de libertad" en azul).
El último valor, marcado en rojo, no es libre, ya que debe ajustarse para que el promedio de toda la muestra sea el correcto.
Este gráfico ilustra cómo, al calcular la media, solo n−1 valores son realmente libres, mientras que uno queda restringido.