Distribución de Poisson
La distribución de Poisson modela el número de eventos que ocurren en un intervalo fijo de tiempo o espacio, cuando los eventos se producen de forma independiente y a una tasa media constante. Se usa ampliamente en teoría de colas, ingeniería de fiabilidad, epidemiología y telecomunicaciones.
Definición
Una variable aleatoria \(X\) sigue una distribución de Poisson con parámetro \(\lambda > 0\), escrita \(X \sim \text{Poisson}(\lambda)\), si:
\[P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0, 1, 2, \ldots\]
donde \(\lambda\) es el número esperado de eventos en el intervalo, \(k\) es el recuento observado y \(e \approx 2{,}71828\) es el número de Euler.
La distribución de Poisson requiere tres condiciones:
- Los eventos ocurren de forma independiente: un evento no hace que otro sea más o menos probable.
- La tasa media \(\lambda\) es constante a lo largo del intervalo.
- Dos eventos no pueden ocurrir exactamente en el mismo instante (sin eventos simultáneos).
Función de masa de probabilidad y CDF
La PMF da la probabilidad de exactamente \(k\) eventos. La CDF los acumula:
\[F(k) = P(X \leq k) = \sum_{i=0}^{k} \frac{\lambda^i e^{-\lambda}}{i!}\]

Figure 1: A medida que lambda aumenta, la distribución de Poisson se desplaza a la derecha y se vuelve más simétrica
Propiedades
Para \(X \sim \text{Poisson}(\lambda)\):
- Valor esperado (media)
\[E(X) = \lambda\]
- Varianza
\[\text{Var}(X) = \lambda\]
La media y la varianza son iguales. Esta es la característica definitoria de la distribución de Poisson y la base para comprobar si los datos siguen esta distribución.
- Asimetría
\[\text{Asimetría} = \frac{1}{\sqrt{\lambda}}\]
La distribución está sesgada a la derecha para \(\lambda\) pequeño y se vuelve progresivamente más simétrica a medida que \(\lambda\) crece.
- Curtosis
\[g_2 = \frac{1}{\lambda}\]
- Moda
\(\lfloor \lambda \rfloor\) si \(\lambda\) no es un entero. Si \(\lambda\) es un entero, tanto \(\lambda\) como \(\lambda - 1\) son modas.
- Función cuantil
No existe expresión cerrada. La calcula numéricamente la mayoría del software.
Ejemplo paso a paso
El servicio de urgencias de un hospital recibe una media de 8 pacientes por hora durante los turnos de noche. Sea \(X \sim \text{Poisson}(8)\).
Probabilidad de exactamente 5 llegadas en una hora:
\[P(X = 5) = \frac{8^5 e^{-8}}{5!} = \frac{32768 \times 0{,}000335}{120} \approx 0{,}0916\]
Aproximadamente un 9,2% de probabilidad de exactamente 5 llegadas.
Probabilidad de 10 o más llegadas (turno sobrecargado):
\[P(X \geq 10) = 1 - P(X \leq 9) = 1 - F(9) \approx 1 - 0{,}717 = 0{,}283\]
Casi el 28% de los turnos de noche tendrán 10 o más llegadas.
Llegadas esperadas y desviación típica:
\[E(X) = 8, \qquad \text{SD}(X) = \sqrt{8} \approx 2{,}83\]
- Centro de llamadas: una línea de soporte recibe una media de 12 llamadas por hora. \(X \sim \text{Poisson}(12)\). Probabilidad de exactamente 10 llamadas: \(P(X=10) \approx 0{,}105\).
- Errores en servidor: un servidor registra una media de 2 errores por día. \(X \sim \text{Poisson}(2)\). Probabilidad de cero errores: \(P(X=0) = e^{-2} \approx 0{,}135\).
- Desintegración radiactiva: un contador Geiger registra una media de 3 partículas por segundo. \(X \sim \text{Poisson}(3)\). Probabilidad de 5 o más: \(P(X \geq 5) \approx 0{,}185\).
Supuestos y limitaciones
⚠️ Sobredispersión: cuando Var(X) > E(X)
La distribución de Poisson asume \(\text{Var}(X) = E(X)\). En la práctica, los datos de recuento suelen mostrar sobredispersión: la varianza es mayor que la media. Esto ocurre cuando los eventos no son verdaderamente independientes (los casos de enfermedad se agrupan en hogares, los accidentes se concentran en ubicaciones concretas) o cuando \(\lambda\) varía entre observaciones.
Si ajustas un modelo de Poisson y detectas sobredispersión, usa la distribución binomial negativa en su lugar. Ignorar la sobredispersión lleva a errores estándar demasiado pequeños y p-valores demasiado optimistas.
⚠️ La tasa debe ser constante en el intervalo
La distribución de Poisson asume que (\lambda) es constante. Si la tasa varía con el tiempo (más llamadas por la mañana que por la noche, más accidentes con lluvia), un único modelo de Poisson no es apropiado. Considera dividir el intervalo, usar un proceso de Poisson no homogéneo, o incluir covariables en un modelo de regresión de Poisson.
La distribución de Poisson como aproximación a la Binomial
Cuando \(n\) es grande y \(p\) es pequeño, la distribución binomial se aproxima bien mediante una Poisson con \(\lambda = np\):
\[\text{Binomial}(n, p) \approx \text{Poisson}(np) \quad \text{cuando } n \text{ grande, } p \text{ pequeño}\]
Una regla práctica habitual: \(n \geq 20\) y \(p \leq 0{,}05\).
Una fábrica produce 10.000 componentes al día. Cada uno tiene una probabilidad de 0,03% de ser defectuoso, de forma independiente. El modelo exacto es (X \sim \text{Binomial}(10000;, 0{,}0003)), pero la aproximación de Poisson (X \sim \text{Poisson}(3)) da probabilidades prácticamente idénticas y es mucho más sencilla de usar.
\(P(X = 0) = e^{-3} \approx 0{,}050\) (Poisson) frente a \(0{,}0497\) (Binomial exacta). El error de aproximación es despreciable.
💡 Relación con otras distribuciones
- Binomial: la Poisson es el límite de la Binomial\((n, p)\) cuando \(n \to \infty\) y \(p \to 0\) con \(np = \lambda\) fijo.
- Aproximación normal: para \(\lambda\) grande, \(\text{Poisson}(\lambda) \approx \mathcal{N}(\lambda, \lambda)\).
- Binomial negativa: úsala cuando los datos muestren sobredispersión (\(\text{Var}(X) > E(X)\)).
- Exponencial: si los eventos siguen un proceso de Poisson con tasa \(\lambda\), el tiempo entre eventos consecutivos sigue una distribución Exponencial\((\lambda)\).