Variable ficticia

3 min

Una variable ficticia es una variable utilizada para explicar valores cualitativos en un modelo de regresión.

Los modelos de regresión intentan explicar una variable en función de otras. Por ejemplo, el salario de una persona en función de su edad, su educación y su experiencia. Estas variables se pueden cuantificar. La edad de una persona, la educación y la experiencia se pueden cuantificar en número de años. Pero ¿Qué ocurre cuando tenemos variables qué no se pueden cuantificar? Por ejemplo el color de pelo, el país en el que vive o el sexo. La solución a este problema está en las variables ficticias. Son variables que suelen toman valores binarios. Esto es, valor cero o uno.

Por ejemplo, la variable sexo, hemos dicho, es una variable cualitativa. Para incluirla en un modelo de regresión hay que crear una variable ficticia. A la variable le llamaremos «mujer» tal que:

Mujer = 1 ( si el individuo es mujer)

Mujer = 0 (si el individuo no es mujer, es decir, es hombre)

En este caso, «hombre» se considera categoría de referencia o grupo base.

Existen dos tipos de variables ficticias. Por una parte están las variables ficticias aditivas y, por otra parte, están las variables ficticias multiplicativas.

Variable ficticia aditiva

Una variable ficticia aditiva recoge un cambio fijo. Dicho cambio afecta tan solo al término constante de la ecuación. Por ejemplo, un modelo que pretende explicar el salario en función del sexo y de los años de educación. Podemos poner la ecuación tomando como referencia a los hombres (segunda ecuación) o tomando como referencia a las mujeres (primera ecuación):

La representación gráfica de las ecuaciones sería:En el caso de que los hombres tengan salarios superiores, tomando una variable ficticia aditiva el modelo quedaría representando como la imagen anterior.

En su caso, si las mujeres tuvieran salarios superiores a los hombres, tomando una variable ficticia aditiva, el modelo quedaría representado gráficamente como la imagen anterior.

La diferencia cuantitativa entre la línea azul (hombres) y la línea naranja (mujeres) será igual al valor de la variable «Mujeres» u «Hombres» según el modelo escogido. En este caso, el de las variables ficticias aditivas, la diferencia salaria no depende del nivel de estudios. Es decir, la diferencia salarial depende única y exclusivamente del sexo.

Variable ficticia multiplicativa

Una variable ficticia multiplicativa recoge un cambio en la pendiente de las ecuaciones de hombres y mujeres. Siguiendo con el ejemplo expuesto anteriormente tenemos que:

Gráficamente, una posible representación sería:

En este caso, el modelo nos estaría indicando dos cosas. En primer lugar que los salarios de las mujeres son inferiores a los de los hombres. Y, en segundo lugar, que un año de educación adicional se paga mejor hombres que a mujeres. Lo anterior, lo sabemos porque la pendiente de la línea azul (hombres) es mayor que la pendiente de la línea naranja (mujeres).

Si un año de educación adicional fuera mejor pagado a las mujeres, entonces la pendiente de la línea naranja (mujeres) sería mayor. Y, la línea azul (hombres) estaría por debajo.