Medidas de variabilidad: definición, cuáles son y ejemplos

¿Qué son las medidas de variabilidad?
Las medidas de variabilidad, también llamadas medidas de dispersión, son indicadores estadísticos que señalan cuán cercanos o alejados se encuentran los datos de su media aritmética. Si los datos están cercanos a la media, la distribución está concentrada, y si están lejos, se trata entonces de una distribución dispersa.
Hay muchas medidas de variabilidad, entre las más conocidas están:
- Rango
- Desviación media
- Varianza
- Desviación estándar
Estas medidas complementan a las medidas de tendencia central y son necesarias para comprender la distribución de los datos obtenidos y extraer de ellos la mayor cantidad de información posible.
Rango
El rango o recorrido mide la amplitud de un conjunto de datos. Para determinar su valor se halla la diferencia entre el dato de mayor valor xmáx y el de menor valor xmín:
R = xmáx – xmín
Si los datos no están sueltos sino agrupados por intervalo, entonces el rango se calcula mediante la diferencia entre el límite superior del último intervalo y el límite inferior del primer intervalo.
Cuando el rango es un valor pequeño significa que todos los datos están bastante cercanos entre sí, pero un rango grande señala que hay mucha variabilidad. Es evidente que, aparte del límite superior y el límite inferior de los datos, el rango no toma en cuenta los valores entre ellos, por lo que no es recomendable utilizarlo cuando el número de datos es grande.
Sin embargo resulta una medida inmediata de calcular y tiene las mismas unidades de los datos, por ello es fácil interpretarla.
Ejemplo de rango
A continuación se tiene la lista con el número de goles marcados durante el fin de semana, en las ligas de fútbol de nueve países:
40, 32, 35, 36, 37, 31, 37, 29, 39
Se trata de un conjunto de datos sin agrupar. Para encontrar el rango se procede a ordenarlos de menor a mayor:
29, 31, 32, 35, 36, 37, 37, 39, 40
El dato con el mayor valor es 40 goles y el de menor valor es 29 goles, por lo tanto el rango es:
R = 40−29 = 11 goles.
Puede considerarse que el rango es pequeño comparado con el dato de valor mínimo, que es 29 goles, por lo que se puede suponer que los datos no tienen gran variabilidad.
Desviación media
Esta medida de variabilidad se calcula a través del promedio de los valores absolutos de las desviaciones respecto a la media. Denotando la desviación media como DM, para datos no agrupados, la desviación media se calcula mediante la siguiente fórmula:
Donde n es el número de datos de que se dispone, xi representa a cada dato y x̄ es el promedio, el cual se determina sumando todos los datos y dividiendo entre n:
La desviación media permite conocer, en promedio, en cuantas unidades los datos se desvían de la media aritmética y tiene la ventaja de tener las mismas unidades que los datos con los que se trabaja.
Ejemplo de desviación media
Según los datos del ejemplo de rango, el número de goles marcados es:
40, 32, 35, 36, 37, 31, 37, 29, 39
Si se desea encontrar la desviación media DM de estos datos, es necesario calcular primero la media aritmética x̄:
Y ahora que se conoce el valor de x̄, se procede a encontrar la desviación media DM:
= 2.99 ≈ 3 goles
Por lo tanto se puede afirmar que, en promedio, los datos se alejan aproximadamente en 3 goles del promedio que es 35 goles, y como se advierte, es una medida bastante más precisa que el rango.
Varianza
La desviación media es una medida de variabilidad mucho más fina que el rango, pero como se calcula a través del valor absoluto de las diferencias entre cada dato y la media, no ofrece mayor versatilidad desde el punto de vista algebraico.
Por ello se prefiere la varianza, que corresponde al promedio de la diferencia cuadrática de cada dato con la media y se calcula mediante la fórmula:
En esta expresión, s2 denota la varianza, y como siempre xi representa a cada uno de los datos, x̄ es la media y n el total de datos.
Cuando se trabaja con una muestra en vez de la población, se prefiere calcular la varianza así:
En todo caso, varianza se caracteriza por ser siempre una cantidad positiva, pero al ser el promedio de las diferencias cuadráticas, es importante observar que no tiene las mismas unidades que las de los datos.
Ejemplo de varianza
Para calcular la varianza de los datos de los ejemplos de rango y desviación media, se procede a sustituir los valores correspondientes y a realizar la sumatoria indicada. En este caso se escoge dividir entre n–1:
= 13.86
Desviación estándar
La varianza no tiene la misma unidad que la de la variable en estudio, por ejemplo, si los datos vienen en metros, la varianza resulta en metros cuadrados. O en el ejemplo de los goles sería en goles al cuadrado, que no tiene sentido.
Por ello se define la desviación estándar, también llamada desviación típica, como la raíz cuadrada de la varianza:
s = √s2
De esta forma se obtiene una medida de variabilidad de los datos en las mismas unidades que estos, y cuanto menor sea el valor de s, más agrupados están los datos alrededor de la media.
Tanto la varianza como la desviación estándar son las medidas de variabilidad a escoger cuando la media aritmética es la medida de tendencia central que mejor describe el comportamiento de los datos.
Y es que la desviación estándar tiene una importante propiedad, conocida como el teorema de Chebyshev: al menos el 75% de las observaciones se encuentran en el intervalo definido por x̄ ± 2s. En otras palabras, un 75% de los datos está, a lo sumo, a una distancia igual a 2s alrededor de la media.
Asimismo, al menos un 89% de los valores están a una distancia de 3s de la media, un porcentaje que puede ampliarse, siempre que se disponga de muchos datos y estos sigan una distribución normal.

Figura 2.- Si los datos siguen una distribución normal, el 95.4 de ellos se encuentra a dos desviaciones estándar a ambos lados de la media. Fuente: Wikimedia Commons.
Ejemplo de desviación estándar
La desviación estándar de los datos presentados en los ejemplos anteriores es:
s = √s2 = √13.86 = 3.7 ≈ 4 goles