Modelo de probabilidad lineal

2 min

El modelo de probabilidad lineal es un modelo de elección binaria. En este, la esperanza condicional de la variable dependiente es una función lineal, es decir, la relación de la variable dependiente con las variable(s) explicativa(s) es constante.

Para verlo de otra forma, el modelo de probabilidad lineal es un modelo donde tenemos una variable dependiente y otra(s) independiente(s) multiplicada(s) por un(os) coeficiente(s) permanente(s).

Debemos señalar que el modelo de probabilidad lineal es un modelo de elección binaria, es decir, donde la variable dependiente puede tomar dos valores. Estos valores son 1 o 0, para indicar éxito o fracaso, respectivamente.

El modelo de probabilidad lineal se plasma de la siguiente forma:

E (Y |X = x) = Pr(Y = 1|X = x) = p(x) = β0 + β1x

En la ecuación mostrada, se interpreta que la esperanza condicional de Y dado X es igual a β0 + β1x.

En este caso, tomamos la esperanza condicional, pues nos interesa conocer la probabilidad de que un individuo tome una decisión dadas sus características, por ejemplo (o se puede tomar como referencia otra variable independiente).

Desventajas del modelo de probabilidad lineal

Algunas desventajas del modelo de probabilidad lineal son las siguientes:

El modelo de probabilidad lineal puede mostrar heterocedasticidad. Es decir, la varianza de los errores no es igual en todas las observaciones realizadas. En ese caso, se utilizan errores estándar.
No puede asumirse que los errores presentan una distribución normal.
La variable dependiente puede tomar solo dos valores.
Se asume que las variables independientes y la dependiente tienen una relación lineal, es decir, la tasa de cambio siempre es la misma. Sin embargo, pudiera ser más acertado construir un modelo donde la velocidad de cambio aumente en cuanto Y alcanza un valor mayor, y suceda lo contrario cuando Y disminuya.

Dados estos inconvenientes, existen los modelos logit y probit.

Ejemplo de modelo de probabilidad lineal

Se puede construir un modelo de probabilidad lineal, por ejemplo, donde la variable dependiente sea si la persona tiene actualmente, o no, un trabajo formal que haya mantenido durante u año o más tiempo. Las variables independientes podrían ser el nivel de estudios o grado de instrucción, el sexo y la edad.

En el ejemplo mostrado, la variable dependiente será 1 o 0, pero se debe interpretar cualitativamente, más allá de su valor numérico. Así, 1 significa que la persona sí tiene un trabajo formal que se ha mantenido durante más de 1 año, y 0 sería la situación en la que esto no ocurre.