Suma de cuadrados de los residuos (SCE)

3 min

La suma de cuadrados de los residuos (SCE) es la parte de la variabilidad de la variable dependiente que no conseguimos explicar con el modelo. Es la parte que nuestro conjunto de variables independiente no consigue explicar de la variable dependiente.

En palabras más simples, la suma de cuadrados de los residuos (SCE) representa con una cifra lo que un modelo no es capaz de explicar. Es utilizada como citaremos más tarde para calcular el coeficiente de determinación o la tabla ANOVA.

También se le conoce como suma de cuadrados residual. Es exactamente lo mismo, dicho con otras palabras.

Fórmula de la suma de cuadrados de los residuos

Su fórmula de cálculo es la siguiente:

yi = Valores observados de la variable dependiente

ŷ = Valores estimados por el modelo

Como la fórmula indica, esta se calcula como el sumatorio de los cuadrados de la diferencia entre los valores observados de la variable dependiente (valores recogidos de la realidad) y los valores estimados por el modelo (valores calculados por el modelo). Para saber hacer este cálculo es imprescindible conocer el operador sumatorio.

La suma de cuadrados de los residuos (SCE) en profundidad

Cuando se construye un modelo econométrico, se pretende explicar el cambio de una variable dependiente o explicada con un conjunto de variables independientes. El cambio total de la variable dependiente se puede descomponer en dos partes:

  • La parte que explican las variables independientes
  • La parte que las variables independientes o explicativas no son capaces de explicar

La suma de los residuos al cuadrado, por lo tanto, es la parte que las variables independientes no son capaces de explicar sobre la variabilidad de la variable dependiente.

La suma de los residuos al cuadrado, la suma total de cuadrados y la suma total de cuadrados forman lo que se conoce como el modelo ANOVA. Mediante este modelo se puede descomponer la variabilidad de la variable independiente en parte explicada y no explicada por este. De esta manera se puede realizar un análisis más profundo sobre esta variabilidad y poner a prueba el poder predictivo del modelo.

Con lo cual, la suma de los residuos al cuadrado la podríamos expresar como sigue:

SCE = STC – SCR

SCE = Suma de cuadrados residual

STC = Suma total de cuadrados

SCR = Suma de cuadrados de la regresión

Es decir, la suma de cuadrados residual es igual a la suma total de cuadrados menos la suma de cuadrados de la regresión.

¿Para qué sirve la suma de cuadrados de los residuos (SCE)?

La suma de cuadrados de los residuos se utiliza tanto en estadística, como en econometría para distintos cálculos. A continuación se citan algunos ejemplos:

  • Cálculo del coeficiente de determinación o R cuadrado: El coeficiente de determinación es el porcentaje de la variación total de la variable dependiente explicada por la o las variables independientes. El redactor recomienda:
  • Cálculo del estadístico F: La parte del denominador del estadístico F es la suma de cuadrados de la regresión dividida entre el número total de coeficientes utilizados en la regresión.
  • En la tabla ANOVA: La tabla ANOVA se utiliza para analizar el poder explicativo de una regresión. Una tabla ANOVA se utiliza para descomponer la variabilidad del modelo en la parte explicada por este (SCR) y la parte no explicada (SCE). ANOVA es un acrónimo del inglés que significa “analysis of variance” que en español sería algo así como «análisis de la varianza».