Definición de frecuencia acumulada
Frecuencia es el número de veces que se reitera un suceso en un determinado periodo de tiempo. Lo acumulado, por otra parte, es la suma, el rejunte o la reunión de diversos elementos.
En cuanto a la idea de frecuencia acumulada, el concepto aparece en el ámbito de la estadística, donde se entiende la frecuencia como la cantidad de veces que un cierto evento se repite en una muestra o en un experimento.
Este número de repeticiones se conoce como frecuencia absoluta. Si se divide la frecuencia absoluta por el tamaño de la muestra, obtenemos la frecuencia relativa.
A partir de estos datos, podemos calcular dos tipos de frecuencia acumulada: la frecuencia absoluta acumulada y la frecuencia relativa acumulada.
La frecuencia absoluta acumulada (en ocasiones llamada simplemente frecuencia acumulada) señala la cantidad de frecuencias absolutas para la totalidad de los eventos que, en un listado ordenado, son menores o idénticos que un determinado valor.
Tomemos el caso de los goles anotados por un futbolista a lo largo de cinco años. Estos datos constituyen la muestra estadística:
14, 12, 14, 11, 15
La frecuencia absoluta de 14, por ejemplo, es 2, ya que el 14 aparece 2 veces en la muestra. Esto quiere decir que el deportista marcó 14 goles en 2 temporadas diferentes en los últimos cinco años. El cálculo de la frecuencia absoluta acumulada para dicho valor (14) es 4: hay 4 valores en la muestra que son iguales o menores que 14.
Otra frecuencia acumulada que podemos calcular es la frecuencia relativa acumulada. En este caso, tenemos que dividir la frecuencia absoluta acumulada por el total de la muestra. Retomando el ejemplo anterior, como la frecuencia absoluta acumulada de 14 es 4 y el total de números de la muestra estadística es 5, la frecuencia relativa acumulada es 0,8.
Con el objetivo de formular la distribución de este concepto en una ecuación matemática sin caer en el uso de una tabla, es posible adaptarla a lo que se denomina distribución de probabilidad acumulativa. En los ámbitos de la estadística y la probabilidad, se habla de distribución de probabilidad para hacer referencia a una función que se aplica sobre una variable y le da a los sucesos que se definen sobre ella diferentes probabilidades de que tengan lugar.
Gracias al uso de una ecuación matemática en lugar de una tabla también es más fácil interpolar y extrapolar valores. Se entiende por interpolación, dentro del análisis numérico, al proceso que da como resutado una serie de puntos a partir de un conjunto de puntos discreto. Con respecto a la extrapolación, por otra parte, se trata de la estimación que supera los límites de la observación, o sea que es más incierta que la interpolación y conlleva un mayor riesgo de fallo.
Es importante señalar que al extrapolar una distribución de frecuencia acumulada pueden surgir errores tales como que no siga la distribución de probabilidad una vez superado el rango observado. En este marco tenemos diferentes métodos para llevar a cabo el mismo proceso, como ser la distribución normal, la exponencial, la de Gumbel y la de Pareto.
Otra opción consiste en la introducción de discontinuidad entre los datos, algo que puede ser muy beneficioso si los valores extremos y la cola de la distribución se alejan de la masa mediana. Una de las aplicaciones de este método se encuentra en el análisis de las precipitaciones cuando el clima cambia de comportamiento según la influencia de las corrientes.
Dicho todo esto, queda claro que llevar a cabo una predicción basados en la distribución de frecuencias acumuladas acarrea un cierto margen de error que no siempre es aceptable. Para reducir al mínimo los resultados inútiles se recomienda evitar aquellos casos en los cuales las condiciones de los rangos de datos a comparar son muy diferentes.