Curtosis

3 min

La curtosis es una medida estadística que determina el grado de concentración que presentan los valores de una variable alrededor de la zona central de la distribución de frecuencias. También es conocida como medida de apuntamiento.

Cuando medimos una variable aleatoria, por lo general, los resultados que tienen una mayor frecuencia son los que se sitúan en torno a la media de la distribución. Imaginemos la altura de los alumnos de una clase. Si la altura media de la clase es 1,72 cm, lo más normal es que las alturas del resto de los alumnos estén en torno a este valor (con cierto grado de variabilidad, pero sin ser esta demasiado grande). Si esto sucede, se considera que la distribución de la variable aleatoria se distribuye con normalidad. Pero dada la infinidad de variables que se pueden medir, esto no siempre sucede así.

Existen algunas variables que presentan un mayor grado de concentración (menor dispersión) de los valores en torno a su media y otras, por el contrario, presentan un menor grado de concentración (mayor dispersión) de sus valores en torno a su valor central. Por tanto, la curtosis nos informa de lo apuntada (mayor concentración) o lo achatada (menor concentración) que es una distribución.

Tipos de curtosis

Dependiendo del grado de curtosis, tenemos tres tipos de distribuciones:

1. Leptocúrtica: Existe una gran concentración de los valores en torno a su media (g2>3)

2. Mesocúrtica: Existe una concentración normal de los valores en torno a su media (g2=3).

3. Platicúrtica: Existe una baja concentración de los valores en torno a su media (g2<3).

Medidas de curtosis según los datos

Dependiendo de la agrupación o no de los datos, se utiliza una fórmula u otra.

Datos sin agrupar:

Datos agrupados en tablas de frecuencias:

Datos agrupados en intervalos:

Ejemplo de cálculo de curtosis para datos sin agrupar

Supongamos que queremos calcular la curtosis de la siguiente distribución:

8,5,9,10,12,7,2,6,8,9,10,7,7.

Primero calculamos la media aritmética (µ), que sería 7,69.

A continuación, calculamos la desviación típica, que sería 2,43.

Tras tener estos datos y para comodidad en el cálculo, se puede realizar una tabla para calcular la parte del numerador (cuarto momento de la distribución). Para el primer cálculo sería: (Xi-µ)^4 = (8-7,69)^4 = 0,009.

Datos(Xi-µ)^4
80,0090
552,5411
92,9243
1028,3604
12344,3330
70,2297
21049,9134
68,2020
80,0090
92,9243
1028,3604
70,2297
70,2297
N = 13∑ = 1.518,27

Una vez tenemos esta tabla hecha, simplemente tendríamos que aplicar la fórmula expuesta con anterioridad para tener la curtosis.

g2 = 1.518,27/13*(2,43)^4 = 3,34

En este caso dado que g2 es mayor que 3, la distribución sería leptocúrtica, presentando un mayor apuntamiento que la distribución normal.

Exceso de curtosis

En algunos manuales la curtosis se presenta como exceso de curtosis. En este caso esta se compara directamente con la de la distribución normal. Dado que la distribución normal tiene curtosis 3, para obtener el exceso, solo habría restarle 3 a nuestro resultado.

Exceso de curtosis = g2-3 = 3,34-3 = 0,34.

La interpretación del resultado en este caso, sería la siguiente:

g2-3 > 0 -> distribución leptocúrtica.

g2-3 = 0 -> distribución mesocúrtica (o normal).

g2-3 < 0 -> distribución platicúrtica.

José Francisco López

Hola Rodrigo, como la media aritmetica es 7,69(µ), y Xi es el dato en cuestión, lo que hacemos para el primer dato que es 8:

(Xi-µ)^4 = (8-7,69)^4 = 0,009.

Para el segundo dato que Xi es 5:

(Xi-µ)^4 = (5-7,69)^4 = 52,5411

Esperamos que la duda quede resuelta. Saludos y gracias por el comentario.

PD: Hemos añadido gracias al comentario un ejemplo de cálculo de la tabla en este artículo.

Accede para responder

José Francisco López

Hola Rodrigo,

En realidad la curtosis, simplificando las incógnitas se calcula como –> Curtosis = m^4/s^4. Es decir, el cuatro momento de la distribución entre la desviación típica elevada a 4. Dado que excel utiliza en su cálculo la cuasi-desviación típica (en excel es DESVEST.M o DESVEST dependiendo de la versión) al hacer todo el desarrollo, el resultado final es diferente. La fórmula que utiliza excel queda como:

[[(n*(n+1))/((n-1)*(n-2)*(n-3))]*[Sumatorio((x-media)/varianza))^4]]-[(3*((n-1)^2))/((n-2)*(n-3))]

En el soporte de excel, puedes encontrar más información respecto a esta fórmula. Espero que te sirva de utilidad.

Saludos

PD: En cualquier caso, los manuales de estadística descriptiva muestran la fórmula tal como hemos indicado nosotros.

Accede para responder

José Francisco López

Hola Luis,

A veces Excel utiliza fórmulas con ligeras variaciones. Suele estar relacionado con realizar el cálculo sobre la muestra o sobre la población.

Un saludo y gracias por comentar.

Accede para responder