Errores de especificación

4 min

Los errores de especificación de un modelo econométrico se refieren a los distintos fallos que pueden cometerse a la hora de seleccionar y tratar un conjunto de variables independientes para explicar una variable dependiente.

Cuando se construye un modelo este tiene cumplir la hipótesis de especificación correcta. Esta se basa en que las variables explicativas seleccionadas para el modelo son aquellas que son capaces de explicar a la variable independiente. Por lo cual se asume que no hay ninguna variable independiente (x) que pueda explicar a la variable independiente (y) y que de esta manera se habrían elegido las variables que permiten el planteamiento del modelo correcto.

Errores de especificación del modelo

Existen una serie de errores en la especificación del modelo que se podrían agrupar en tres grandes grupos:

Grupo 1: La forma funciona no esta especificada de forma correcta

  • Omisión de variables relevantes: Imaginemos que queremos explicar el retorno de las acciones de la empresa Y. Para ello seleccionamos como variables independientes el PER, la capitalización bursátil y el valor en libros. Si el capital flotante (free float) está correlacionado con alguna de las variables contenidas en el modelo, el error de nuestro modelo estaría correlacionado con las variables incluidas en el modelo. Esto provocaría que los parámetros estimados por el modelo fueran insesgados e inconsistentes. Con lo cual, los resultados de las predicciones y los distintos tests realizados al modelo no serían válidos.
  • Variables que han de ser transformadas: La hipótesis del modelo de regresión, asume que la variable dependiente está linealmente relacionada con las variables independientes. Sin embargo en muchas ocasiones la relación entre estas no es lineal. Si no se hace la transformación necesaria en la variable independiente el modelo no tendrá el ajuste correcto. Como ejemplos de transformación de variables independientes tenemos la toma de logaritmos, la raíz cuadrada o elevar al cuadrado entre otras.
  • Mala recogida de los datos de la muestra: Los datos de las variables independientes han de ser consistentes con el tiempo, es decir, no pueden haber cambios estructurales de las variables independientes. Imaginemos que queremos explicar la variación del PIB en el país X utilizando como variables independientes el consumo y la inversión. Supongamos que se descubre un yacimiento de petróleo en ese país en tierras estatales y el gobierno decide suprimir los impuestos. Esto podría suponer un cambio en los hábitos de consumo del país que a partir de esa fecha se mantuviera de forma indefinida en el tiempo. En este caso deberíamos de recoger dos series temporales distintas y estimar dos modelos. Uno modelo antes del cambio y otro después. Si agrupáramos los datos en una sola muestra y estimáramos un modelo, tendríamos un modelo mal especificado y las hipótesis, contrastes y predicciones serían incorrectas.

Grupo 2: Las variables independientes están correlacionadas con el termino de error en series temporales

  • Utilización de la variable dependiente con retardo como variable independiente: Utilizar una variable con un retardo es utilizar los datos de esa misma variables pero medidos un período anterior. Supongamos que estamos usando el modelo anterior del PIB como variable dependiente. Agreguemos al modelo, además del consumo y la inversión, el PIB del año anterior (PIBt-1). Si el PIB del año anterior está correlacionado serialmente con el error, los coeficientes estimados estarían sesgados y no serían inconsistentes. Esto de nuevo invalidaría todos los contrastes de hipótesis, predicciones etc.
  • Predecir el pasado: Cuando medimos una variable, tenemos siempre que coger el período anterior al que deseamos estimar. Supongamos que nuestra variable dependiente son los retornos de la acción X y nuestra variable independiente es el PER. Supongamos además que estamos cogiendo el dato final de febrero. Si usamos esto en nuestro modelo, concluiremos que la acción con mayor PER al final de febrero fue la que mayores retornos tuvo a finales de febrero. La correcta especificación del modelo supone tomar los datos de principios del período para predecir los datos posteriores y no al revés como en el caso anterior. A esto se le llama, predecir el pasado.
  • Medir la variable independiente con error: Supongamos que nuestra variable independiente es el retorno de una acción y una de nuestras variables independientes es el tipo de interés nominal. Recordemos que el tipo de interés nominal es el tipo de interés más la inflación. Como el componente de la inflación del tipo de interés nominal no es observable en el futuro, estaríamos midiendo la variable con error. Para medir correctamente el tipo de interés, tendríamos que usar el tipo de interés esperado y que este tuviera en cuenta la inflación esperada y no la actual.