Estadística

Distribución de Poisson: fórmulas, ecuaciones, modelo, propiedades


La distribución de Poisson es una distribución de probabilidades discreta, mediante la cual se puede conocer la probabilidad de que, dentro de una muestra de tamaño grande y durante un cierto intervalo, ocurra un evento cuya probabilidad es pequeña.

Con frecuencia, la distribución de Poisson se puede utilizar en lugar de la distribución binomial, siempre y cuando se cumplan las siguientes condiciones descritas: muestra grande y probabilidad pequeña.

Siméon-Denis Poisson (1781‐1840) creó esta distribución que lleva su nombre, muy útil cuando se trata de sucesos impredecibles. Poisson publicó sus resultados en 1837, un trabajo de investigación sobre la probabilidad de ocurrencia de las sentencias penales erróneas.

Posteriormente otros investigadores adaptaron la distribución en otros ámbitos, por ejemplo, el número de estrellas que podían hallarse en un cierto volumen del espacio, o la probabilidad de que un soldado muriese a causa de la coz de un caballo.

Índice del artículo

Fórmula y ecuaciones

La forma matemática de la distribución de Poisson es la siguiente:

μ (también a veces denotado como λ) es la media o parámetro de la distribución

– Número de Euler: e = 2.71828

– La probabilidad de obtener y = k es P

k es el número de éxitos 0, 1,2,3…

n es el número de pruebas o eventos (el tamaño de la muestra)

Las variables aleatorias discretas, como su nombre lo indica, dependen del azar y únicamente toman valores discretos: 0, 1, 2, 3, 4…, k.

La media de la distribución viene dada por:

La varianza σ, que mide la dispersión de los datos, es otro parámetro importante. Para la distribución de Poisson es:

σ=μ

Poisson determinó que cuando n → ∞,  y p  → 0, la media μ –también llamada valor esperado– tiende a una constante:

μ → constante

Importante: p es la probabilidad de ocurrencia del evento tomando en cuenta la población total, mientras que P (y) es la predicción de Poisson sobre la muestra.

Modelo y propiedades

La distribución de Poisson tiene las siguientes propiedades:

-El tamaño de la muestra es grande: n →  ∞.

-Los sucesos o eventos considerados son independientes entre sí y ocurren aleatoriamente.

-La probabilidad P de que cierto suceso y ocurra durante un periodo de tiempo concreto es muy pequeña: P→  0.

-La probabilidad de que ocurra más de un suceso en el intervalo de tiempo es 0.

-El valor promedio se aproxima a una constante dada por: μ = n.p (n es el tamaño de la muestra)

-Puesto que la dispersión σ es igual a μ, a medida que esta adopta valores más grandes, la variabilidad también se hace mayor.

-Los sucesos deben estar distribuidos uniformemente en el intervalo de tiempo usado.

-El conjunto de posibles valores del suceso y es: 0,1,2,3,4….

-La suma de i variables que siguen una distribución de Poisson, es también otra variable de Poisson. Su valor promedio es la suma de los valores promedio de dichas variables.

Diferencias con la distribución binomial

La distribución de Poisson difiere de la distribución binomial en los siguientes aspectos importantes:

-La distribución binomial es afectada tanto por el tamaño de la muestra n como por la probabilidad P, pero la distribución de Poisson solamente es afectada por la media μ.

-En una distribución binomial, los posibles valores de la variable aleatoria y son 0,1,2,…,N, en cambio en la distribución de Poisson no hay límite superior para dichos valores.

Ejemplos

Poisson aplicó inicialmente su famosa distribución a casos legales, pero a nivel industrial, uno de sus primeros usos fue en la fabricación de cerveza. En este proceso se utilizan cultivos de levadura para la fermentación.

La levadura consiste de células vivas, cuya población es variable en el tiempo. En la fabricación de la cerveza se necesita agregar la cantidad necesaria, por ello es preciso conocer la cantidad de células que hay por unidad de volumen.

Durante la II Guerra Mundial se utilizó la distribución de Poisson para saber si los alemanes estaban apuntando realmente a Londres desde Calais, o simplemente disparando al azar. Esto era importante para que los aliados determinaran cuan buena era la tecnología de la que disponían los nazis.

Aplicaciones prácticas

Las aplicaciones de la distribución de Poisson se refieren siempre a conteos en el tiempo o conteos en el espacio. Y como la probabilidad de ocurrencia es pequeña, también se la conoce como “ley de los sucesos raros”.

He aquí un listado de eventos que caen en alguna de estas categorías:

-Registro de las partículas en un decaimiento radiactivo, que al igual que el crecimiento de células de levadura, es una función exponencial.

-Número de visitas a una determinada web.

-Llegada de personas a una fila para pagar o ser atendidos (teoría de las colas).

-Cantidad de autos que pasan por un cierto punto de una carretera, durante un intervalo de tiempo dado.

-Mutaciones sufridas en una determinada cadena de ADN luego de recibir una exposición a la radiación.

-Número de meteoritos de diámetro mayor a 1 m caídos en un año.

-Defectos por metro cuadrado de una tela.

-Cantidad de células sanguíneas en 1 centímetro cúbico.

-Llamadas por minuto a una central telefónica.

-Chispas de chocolate presentes en 1 kg de masa para pastel.

-Número de árboles infectados por cierto parásito en 1 hectárea de bosque.

Obsérvese que estas variables aleatorias representan la cantidad de veces que sucede un evento durante un período de tiempo fijo (llamadas por minuto a la central telefónica), o una región dada del espacio (defectos de una tela por metro cuadrado).

Dichos eventos, como ya se ha establecido, son independientes del tiempo que haya pasado desde la última ocurrencia.

Aproximando la distribución binomial con la distribución de Poisson

La distribución de Poisson es una buena aproximación a la distribución binomial siempre y cuando:

-El tamaño de la muestra sea grande: n ≥ 100

-La probabilidad p es pequeña: p ≤ 0,1

μ esté en el orden de: np ≤ 10

En tales casos la distribución de Poisson es una excelente herramienta, ya que la distribución binomial puede llegar a ser complicada de aplicar en estos casos.

Ejercicios resueltos

Ejercicio 1

Un estudio sismológico determinó que durante los últimos 100 años, hubo 93 terremotos grandes en todo el mundo, de al menos 6.0 en la escala de Richter –logarítmica-. Supongamos que la distribución de Poisson es un modelo adecuado en este caso. Hallar:

a) El promedio de ocurrencia de grandes terremotos al año.

b) Si P(y) es la probabilidad de que ocurran y terremotos durante un año seleccionado al azar, hallar las siguientes probabilidades:

P(0), P(1), P (2), P (3), P (4), P (5), P (6) y P (7).

c) Los verdaderos resultados del estudio son los siguientes:

47 años (0 terremotos)

– 31 años (1 terremotos)

– 13 años (2 terremotos)

– 5 años (3 terremotos)

– 2 años (4 terremotos)

–  0 años (5 terremotos)

– 1 años (6 terremotos)

– 1 años (7 terremotos)

¿Cómo se comparan estos resultados con los obtenidos en el inciso b? ¿Es la distribución de Poisson una buena elección para modelar estos eventos?

Solución a)

a) Los terremotos son sucesos cuya probabilidad p es pequeña y estamos considerando un período restringido de tiempo, de un año. El promedio de terremotos es:

μ = 93 / 100 terremotos/año = 0.93 terremotos por año.

Solución b)

b) Para calcular las probabilidades solicitadas, se sustituyen valores en la fórmula dada al comienzo:

y = 2

μ = 0.93

e = 2.71828

Es bastante menor que P(2).

Los resultados se listan a continuación:

P (0) = 0.395, P (1) = 0.367, P (2) = 0.171, P (3) = 0.0529, P (4) = 0.0123, P (5) = 0.00229, P (6) = 0.000355, P (7) = 0.0000471.

Por ejemplo, podríamos decir que hay una probabilidad de 39.5 % de que no ocurra ningún gran terremoto en un año dado. O que hay 5,29 % de que ocurran 3 grandes terremotos en dicho año.

Solución c)

c) Se analizan las frecuencias, multiplicando por n=100 años:

39.5; 36.7; 17.1 ; 5.29 ; 1.23 ; 0.229 ; 0.0355  y 0.00471.

Por ejemplo:

– Una frecuencia de 39.5 indica que, en 39.5 de 100 años ocurren 0 terremotos grandes, podríamos decir que está bastante cerca al resultado real de 47 años sin ningún gran terremoto.

Comparemos otro resultado de Poisson con los resultados reales:

– El valor obtenido de 36.7 significa que en un período 37 años hay 1 gran terremoto. El resultado real es que en 31 años hubo 1 gran terremoto, una buena coincidencia con el modelo.

– Se esperan 17.1 años con 2 grandes terremotos y se sabe que en 13 años, que es un valor cercano, hubo en efecto 2 grandes terremotos.

Por lo tanto el modelo de Poisson es aceptable para este caso.

Ejercicio 2

Una compañía estima que el número de componentes que fallan antes de cumplir 100 horas de funcionamiento, sigue una distribución de Poisson. Si el número promedio de fallos es 8 en ese tiempo, encontrar las siguientes probabilidades:

a) Que un componente falle en 25 horas.

b) Falla de menos de dos componentes, en 50 horas.

c) Que fallen por lo menos tres componentes en 125 horas.

Solución a)

a) Se sabe que el promedio de fallas en 100 horas es 8, por lo tanto en 25 horas se espera la cuarta parte de fallos, es decir 2 fallos. Este será el parámetro μ.

Se pide la probabilidad de que falle 1 componente, la variable aleatoria es “componentes que fallan antes de 25 horas” y su valor es y =1. Al sustituir en la función de probabilidad:

Sin embargo, la pregunta es la probabilidad de que fallen menos de dos componentes en 50 horas, no que fallen exactamente 2 componentes en 50 horas, por lo tanto hay que sumar las probabilidades de que:

-Ninguno falle

-Falle solamente 1

P (fallen menos de 2 componentes) = P (0) + P (1)

P (fallen menos de 2 componentes) = 0.0183+0.0732 =0.0915

c) Que fallen por lo menos 3 componentes en 125 horas, significa que pueden fallar 3, 4, 5 o más en dicho tiempo.

La probabilidad que ocurra al menos uno de entre varios sucesos es igual a 1, menos la probabilidad que no ocurra ninguno de los sucesos.

-El suceso que se busca es que fallen 3 o más componentes en 125 horas

-Que no ocurra el suceso significa que fallan menos de 3 componentes, cuya probabilidad es: P(0)+P(1)+P(2)

El parámetro μ de la distribución en este caso es:

 μ = 8  + 2 = 10 fallos en 125 horas.

P (fallen 3 o más componentes) = 1- P(0)- P(1)- P(2) =

Referencias

  1. MathWorks. Distribución de Poisson. Recuperado de: es.mathworks.com
  2. Mendenhall, W. 1981. Estadística para Administración y Economía. 3ra. edición. Grupo Editorial Iberoamérica.
  3. Stat Trek. Teach yourself Statistics. Poisson Distribution. Recuperado de: stattrek.com,
  4. Triola, M. 2012. Elementary Statistics. 11th. Ed. Pearson Education.
  5. Wikipedia. Poisson distribution. Recuperado de: en.wikipedia.org