Grados de libertad
Los grados de libertad son la combinación del número de observaciones de un conjunto de datos que varían de manera aleatoria e independiente menos las observaciones que están condicionadas a estos valores arbitrarios.
En otras palabras, los grados de libertad son el número de observaciones puramente libres (que pueden variar) cuando estimamos los parámetros.
Principalmente diferenciamos entre los estadísticos que utilizan parámetros poblacionales y muestrales para saber sus grados de libertad. Comentamos las diferencias entre la media y la desviación estándar cuando los parámetros son poblacionales o muestrales:
Parámetros poblacionales y muestrales
- Parámetros poblacionales:
Dado que en las poblaciones no conocemos todos lo valores, los grados de libertad van a ser todos los elementos de la población: N.
Ambos estadísticos permiten que todas las observaciones del conjunto sean aleatorias y, por tanto, cada vez que estimamos el estadístico nos van a salir resultados distintos. Entonces, las las observaciones que tienen pleno derechoa variar son todas las observaciones del conjunto poblacional. En otras palabras, los grados de libertad en este caso son todos los elementos de la población: N. Por este motivo dividimos ambos estadísticos por el tamaño total de la población (N).
- Parámetros muestrales (estimaciones):
En las muestras sí conocemos todos los valores.
Diferenciamos el tamaño de la población (N) con el tamaño de la muestra (n).
Dado que en las muestras sí conocemos todos los valores, no tenemos problema en calcular la media ya que permite que todas las observaciones del conjunto sean aleatorias.
En el caso de la desviación estándar, imponemos una restricción a los grados de libertad: todos los elementos de la muestra (n) y restamos 1 elemento.
Pero… ¿Por qué solo restamos 1 y no 5 o 10 elementos a la muestra (n) ?
Cuantos más elementos restemos, significa que más más información tenemos sobre el parámetro muestral, en este caso, la desviación típica.
Cuanta más información tenemos, menos libertad (grados de libertad) tienen las observaciones de la muestra para tomar valores aleatorios. Cuantos más elementos restemos a la muestra, más limitación estamos imponiendo y menos grados de libertad va a tener el parámetro muestral.
Ejemplo
Suponemos que vamos a Andorra a ver la Ski World Cup Finals porque nos gusta mucho el esquí alpino. Traemos un mapa que nos dice donde se ubican las distintas disciplinas y el nombre de algunos de los competidores pero no se especifica el número de salida de cada participante. Cada vez que dicen el nombre del competidor, nosotros rallamos su nombre. Dado que la lista de competidores es limitada, llegará un punto que vamos a saber el nombre del competidor antes de que lo anuncien por los altavoces.
Analizamos la crónica desde un punto de vista matemático:
- Muestra de tamaño (n) porque solo nos dicen el nombre de algunos de los participantes.
- Cada participante puede salir de manera aleatoria, no importa el orden y no puede volver a competir (combinaciones sin repeticiones).
- El último participante será el elemento conocido (n-1). Entonces, todos los otros participantes pueden salir aleatóriamente menos el último, el cual conocemos con certeza.