Varianza

3 min

La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones.

También se puede calcular como la desviación típica al cuadrado. Dicho sea de paso, entendemos como residuo a la diferencia entre el valor de una variable en un momento y el valor medio de toda la variable.

Antes de ver la fórmula de la varianza, debemos decir que la varianza en estadística es muy importante. Ya que aunque se trata de una medida sencilla, puede aportar mucha información sobre una variable en concreto.

Fórmula para calcular la varianza

La unidad de medida de la varianza será siempre la unidad de medida correspondiente a los datos pero elevada al cuadrado. La varianza siempre es mayor o igual que cero. Al elevarse los residuos al cuadrado es matemáticamente imposible que la varianza salga negativa. Y de esa forma no puede ser menor que cero.

Donde

  • X: variable sobre la que se pretenden calcular la varianza
  • xi: observación número i de la variable X. i puede tomará valores entre 1 y n.
  • n: número de observaciones.
  • : Es la media de la variable X.

O lo que es lo mismo:

¿Por qué se elevan al cuadrado los residuos?

La razón por la que los residuos se elevan al cuadrado es sencilla. Si no se elevasen al cuadrado, la suma de residuos sería cero. Es una propiedad de los residuos. Así pues para evitarlo, tal como ocurre con la desviación típica se elevan al cuadrado. El resultado es la unidad de medida en la que se miden los datos pero elevada al cuadrado.

Por ejemplo, si tuviésemos datos sobre los salarios de un conjunto de personas en euros, el dato que arroja la varianza sería en euros cuadrados. Para que tenga sentido la interpretación calcularíamos la desviación típica y pasaríamos el dato a euros.

  1. Desviación -> (2-3) = -1
  2. Desviación -> (4-3) = 1
  3. Desviación -> (2-3) = -1
  4. Desviación -> (4-3) = 1
  5. Desviación -> (2-3) = -1
  6. Desviación -> (4-3) = 1

Si sumamos todas las desviaciones el resultado es cero.

¿Qué diferencia existe entre la varianza y la desviación típica?

Una cuestión que se podría plantear, y con razón, sería la diferencia entre varianza y desviación típica. En realidad, vienen a medir lo mismo. La varianza es la desviación típica elevada al cuadrado. O al revés, la desviación típica es la raíz cuadrada de la varianza.

La desviación típica se hace para poder trabajar en las unidades de medida iniciales. Claro que, como es normal, uno puede preguntarse, ¿de qué sirve tener como concepto la varianza? Bien, aunque la interpretación del valor que arroja no nos da demasiada información, su cálculo es necesario para obtener el valor de otros parámetros.

Para calcular la covarianza necesitamos la varianza y no la desviación típica, para calcular algunas matrices econométricas se utiliza la varianza y no la desviación típica. Es una cuestión de comodidad a la hora de trabajar con los datos en según qué cálculos.

Ejemplo de cálculo de la varianza

Vamos a acuñar una serie de datos sobre salarios. Tenemos cinco personas, cada uno con un salario diferente:

Juan: 1.500 euros

Pepe: 1.200 euros

José: 1.700 euros

Miguel: 1.300 euros

Mateo: 1.800 euros

La media del salario, la cual necesitamos para nuestro cálculo, es de ((1.500 + 1.200 + 1.700 + 1.300 + 1.800) /5) 1.500 euros.

Dado que la fórmula de la varianza en su forma desglosada se formula como sigue:

Obtendremos que se debe calcular tal que:

El resultado es de 52.000 euros al cuadrado. Es importante recordar que siempre que calculamos la varianza tenemos las unidades de medida al cuadrado. Para pasarlo a euros, en este caso tendríamos que realizar la desviación típica. El resultado aproximado sería de 228 euros. Esto quiere decir que, en media, la diferencia entre los salarios de las distintas personas será de 228 euros.

José Francisco López

Hola, gracias por comentar y por exponer el comentario.

La varianza, como concepto, nunca se debe dividir entre n-1. El nombre con el que se denomina a la fórmula de la varianza cuandos se divide entre n-1 es 'Cuasivarianza'. Para ser más precisos, aunque para simplificar no lo hemos indicado en el artículo, deberíamos diferenciar entre N y n. N es el tamaño de la población. La varianza se divide siempre entre N. Mientras en la cuasivarianza debemos dividir entre n-1, donde 'n' es el tamaño de la muestra.

Esperamos haberle ayudado. Un placer recibirte en Economipedia.

Accede para responder

Mayra

Hola, me queda una duda con respecto a tu respuesta. Dices que en esta varianza se debe dividir siempre entre N, pero la fórmula está con n… Me podrías explicar por fa. Mil gracias.

Accede para responder

Hugo

Gracias por sus explicaciones. Quisiera que me ayuden a encontrar la forma de obtener el error en una proyección a partir de una serie histórica y mediante mínimos cuadrados Entendiendo que la proyección estimación.

Gracias

Accede para responder

jose antonio pacheco martinez

Me quede con una duda; en el resultado del ejercicio dice: 52.000 Euros al cuadrado, pero al elevarlo nos da otro resultado. no debería ser raíz cuadrada? solo asi se llega al resultado. GRACIAS.

Accede para responder

Jose

Buenos días,

Excelente artículo, ¡muchas gracias! Tengo un par de dudas, ¡ojalá me puedas ayudar! 🙂

1.ª En la parte "¿Por qué se elevan al cuadrado los residuos?" aparece una representación gráfica de los puntos que representan los sueldos. Calculando la varianza, tendríamos que da 1 pero, y aquí viene la duda, ¿ese 1 qué significa en esa representación gráfica? Es decir, ese uno, ¿es el área que describen los puntos o qué representa?

2.ª Entonces, ¿la desviación típica es la diferencia media de los datos con la media? ¿Es eso?

¡¡¡MUCHÍSIMAS GRACIAS!!!

Accede para responder

José Francisco López

Hola Jose,

Muchas gracias por la mención. Te contesto por partes:

1. Ese 1 puede ser cualquier cosa. Este es un ejemplo general que no tiene interpretación concreta. Imagina algo que pueda ser 1 o -1 como la temperatura durante unas horas determinadas.

2. Lo que dices se llama desviación media y es diferente de la desviación típica. La desviación media es la media de los residuos, mientras que la desviación típica es la raíz cuadrada de la varianza. Puedes leer más sobre ello aquí: https://economipedia.com/definiciones/desviacion-tipica.html

Gracias por comentar y un saludo por parte del equipo de Economipedia 🙂

Accede para responder

Guillermo Westreicher

Hola,

Las respuestas son:

1) 9,64
2) 0,0041
3) 65,81

Ojo, hemos utilizado la fórmula del artículo que permite calcular la varianza de la población. Cuando se trata de la varianza de una muestra se divide entre el número de elementos menos 1 (n-1). Gracias por tu consulta.

Saludos

Accede para responder

Antony Mateo

Muchas gracias, soy estudiante de farmacia y bioquímica, y quería saber como interpretar la varianza y desviación típica respecto al tiempo en horas, de una actividad farmacológica y créanme que su ejemplo me ayudo un montón. Muchas gracias y éxitos.

Accede para responder

José Antonio Ludeña

Hola Maribel,

Muchas gracias por tu pregunta. La varianza sería 3.6 y la desviación estándar 1.8973.

Espero haberte ayudado.

Un saludo de parte de todo el equipo de Economipedia 🙂

Accede para responder

José Antonio Ludeña

Hola Cristian,

Muchas gracias por tu pregunta. No puedo ayudarte porque tendría que ver el proceso que has seguido para obtener ese resultado. Como puedes comprobar el cálculo en nuestro ejemplo es correcto.

Un saludo de parte de too el equipo de Economipedia 🙂

Accede para responder