Distribución t de Student

3 min

La distribución t de Student o distribución t es un modelo teórico utilizado para aproximar el momento de primer orden de una población normalmente distribuida cuando el tamaño de la muestra es pequeño y se desconoce la desviación típica.

En otras palabras, la distribución t es una distribución de probabilidad que estima el valor de la media de una muestra pequeña extraída de una población que sigue una distribución normal y de la cual no conocemos su desviación típica.

Artículos recomendados: grados de libertad, grados de libertad (ejemplo) y distribución normal. 

Fórmula de la distribución t de Student

Dada una variable aleatoria continua L, decimos que la frecuencia de sus observaciones puede aproximarse satisfactoriamente a una distribución t con g grados de libertad tal que: 

Representación de la distribución t de Student

Función de densidad de una distribución t con 3 grados de libertad (df). 

Como podemos ver, la representación de la distribución t se parece mucho a la distribución normal salvo que la distribución normal tiene las colas más anchas y es más apuntalada. En otras palabras, deberíamos añadir más grados de libertad a la distribución t para que la distribución “crezca” y se parezca más a la distribución normal. 

Especialidad

Y… ¿Por qué es tan especial la distribución t?

Pues porqué a diferencia de la distribución normal que depende de la media y la varianza, la distribución t solo depende de los grados de libertad, del inglés, degrees of freedom (df). En otras palabras, controlando los grados de libertad, controlamos la distribución.

Aplicación de la t de Student

La distribución t se utiliza cuando: 

  • Queremos estimar la media de una población normalmente distribuida a partir de una muestra pequeña. 
  • Tamaño de la muestra es inferior a 30 elementos, es decir, n < 30. 

A partir de 30 observaciones, la distribución t se parece mucho a la distribución normal y, por tanto, utilizaremos la distribución normal.

  • No se conoce la desviación típica o estándar de una población y tiene que ser estimada a partir de las observaciones de la muestra.

Ejemplo

Suponemos que tenemos 28 observaciones de una variable aleatoria G que sigue una distribución t de Student con 27 grados de libertad (df).

Matemáticamente, 

Dado que estamos trabajando con datos reales, siempre habrá un error de aproximación entre los datos y la distribución. En otras palabras, la media, mediana y moda no siempre serán cero (0) o exactamente iguales.

Representamos la frecuencia de cada observación de la variable G mediante un histograma.  

¿La variable aleatoria G puede aproximarse a una distribución t? 

Razones para considerar que la variable G sigue una distribución t: 

  • La distribución es simétrica. Es decir, existe el mismo número de observaciones tanto a la derecha como a la izquierda del valor central. También, que la media y la mediana tienden a aproximarse al mismo valor. La media es aproximadamente cero, media = 0,016. 
  • Las observaciones con más frecuencia o probabilidad están alrededor del valor central. Las observaciones con menos frecuencia o probabilidad se encuentran lejos del valor central.