Distribución de Poisson
La distribución de Poisson es una distribución de probabilidad discreta que modeliza la frecuencia de eventos determinados durante un intervalo de tiempo fijado a partir de la frecuencia media de aparición de dichos eventos.
En otras palabras, la distribución de Poisson es una distribución de probabilidad discreta que, tan solo conociendo los eventos y su frecuencia media de ocurrencia, podemos saber su probabilidad.
Expresión de la distribución de Poisson
Dada una variable aleatoria discreta X decimos que su frecuencia se puede aproximar satisfactoriamente a una distribución de Poisson, tal que:
A diferencia de la distribución normal, la distribución de Poisson solo depende de un parámetro, mu (marcado en amarillo).
Mu informa del número esperado de eventos que ocurrirán en un intervalo de tiempo fijado. Cuando se habla de algo “esperado” tenemos que redirigirlo a pensar en la media. Por tanto, mu es la media de la frecuencia de los eventos.
Tanto la media como la varianza de esta distribución son mu, estrictamente positiva.
Representación
Dada una distribución de Poisson con media 2, la distribución de probabilidad de densidad es la siguiente:
La función solo está definida en valores enteros de x.
No todas las distribuciones de probabilidad de densidad de Poisson tendrán el mismo aspecto aunque mantengamos igual la muestra. Si cambiamos la media, es decir, el parámetro del que depende la función, también cambiará la función.
Función de densidad de probabilidad (fdp)
Esta función se entiende como la probabilidad de que la variable aleatoria X tome un valor concreto x. Es la exponencial de la media negativa multiplicada por la media elevada a la observación y todo dividido por el factorial de la observación.
Como está indicado, para conocer la probabilidad de cada observación, tendremos que sustituir en la función todas las observaciones. En otras palabras, x es un vector de dimensión n que contiene todas las observaciones de la variable aleatoria X. La media también sería un vector pero de una dimensión, tal que:
Una vez ya tenemos las probabilidades calculadas, junto con las observaciones ya podemos dibujar la distribución de densidad de probabilidad.
Historia
El nombre de esta distribución proviene de su creador, Siméon-Denis Poisson (1781-1840), un matemático y filósofo francés, que quería modelar la frecuencia de eventos durante un intervalo de tiempo fijado. También participó en perfeccionar la ley de los grandes números.
Aplicación
La distribución de Poisson se utiliza en el campo de riesgo operacional con el objetivo de modelar las situaciones en que se produce una pérdida operacional. En riesgo de mercado se emplea el proceso de Poisson para los tiempos de espera entre transacciones financieras en bases de datos de alta frecuencia. También, en riesgo de crédito se tiene en cuenta para modelar el número de quiebras.
Ejemplo
Suponemos que estamos en temporada de invierno y queremos ir a esquiar antes de diciembre. La probabilidad que abran las estaciones de esquí antes de diciembre es del 5%. De las 100 estaciones de esquí, queremos saber la probabilidad de que la estación de esquí más cercana abra antes de diciembre. La valoración de esta estación de esquí es de 6 puntos.
Los inputs necesarios para calcular la función de probabilidad de densidad de la Poisson son el conjunto de datos y mu:
- Conjunto de datos = 100 estaciones de esquí.
- Mu = 5% * 100 = 5 es el número de estaciones de esquí esperado dado el conjunto de datos.
Entonces, la estación más cercana tiene una probabilidad de 14,62% de que abra antes de diciembre.