Valor-p

3 min

El valor-p, del inglés, p-value, es el nivel de significación mínimo no arbitrario con el que podemos rechazar la hipótesis nula (H0) dada una función de distribución y un estadístico de contraste.

En otras palabras, el valor-p, es la probabilidad mínima definida por la distribución con la que podemos rechazar la hipótesis nula (H0) sin necesidad de definir a priori el nivel de significación para el contraste

Si hacen memoria, recordarán que el área bajo la curva de la función de distribución es una probabilidad. Entonces, desde este punto de vista, el valor-p será la probabilidad de observar un estadístico de contraste tan extremo para que la hipótesis nula sea cierta.

Dominio

Dado que el valor-p es una probabilidad, este valor estará comprendido entre 0 y 1. 

No arbitrario

A diferencia de los niveles de significación que estamos más acostumbrados a ver, tales como 1%, 5% y 10%, el valor-p depende de la función de distribución que tenga el estadístico de contraste. Entonces, los niveles de 1%, 5% y 10% los decidimos al principio del contraste. Esta selección se le llama arbitraria. 

Fórmula del p-valor

El valor-p no es un valor único como el valor crítico, sino que dependerá del estadístico. Para diferentes valores del estadístico de contraste, el valor crítico será el mismo. En cambio, para diferentes valores del estadístico de contraste, el valor-p también será distinto, porque el valor-p depende del valor que tome el estadístico de contraste.

Donde, 

  • D, es una variable aleatoria que sigue una distribución determinada. 
  • d, es el valor del estadístico de contraste.

Cálculo 

Es posible calcular el valor-p a mano pero se tendría que disponer de tablas de distribuciones muy precisas, es decir, con muchos decimales porque el valor-p tiende a ser pequeño. La mayoría de programas estadísticos llevan ya incorporado el valor-p y normalmente aparece en el output de resultados de las estimaciones por Mínimos Cuadrados Ordinarios (MCO). Puede parecer difícil de utilizar pero con la práctica es una herramienta muy útil.

Para calcular el valor-p necesitamos:

  • Estadístico de contraste.
  • La distribución del estadístico de contraste y conocer sus parámetros. 

Regla de rechazo

Si valor–p < nivel de significación => Rechazo H0. 

Si valor–p > nivel de significación => No rechazo H0. 

Representación

En el caso de una distribución t de Student con 2 grados de libertad y un estadístico de contraste igual a 3, la probabilidad de encontrar un estadístico tan extremo cuando la hipótesis nula (H0) es cierta es de 4,77%.

En otras palabras, si la hipótesis nula (H0) fuera verdadera, un estadístico tan grande como 3, solo sería observado un 4,77% de las veces. 

¿Por qué se llama valor-p?

El nombre del valor-p tiene su origen en la definición que hace referencia a ser el área bajo la curva de la función de distribución fuera del intervalo de confianza. Entonces, como esa área es la probabilidad mínima de rechazar la hipótesis nula, la “p” de valor-p se refiere a la probabilidad. Y, como el valor-p corresponde a un número, y por tanto, a un valor, la palabra “valor” de valor-p se atribuye a la cifra numérica. En algunos libros podemos encontrar “valor de la probabilidad” refiriéndose al valor-p. A lo mejor, decirle “probabilidad mínima para rechazar la hipótesis nula” era demasiado largo y no albergaba ningún misterio para los estudiantes…