Función de masa de probabilidad
La función de masa de probabilidad (PMF) asigna una probabilidad a cada valor posible de una variable aleatoria discreta. A diferencia de la PDF para variables continuas, la PMF da probabilidades directamente, no densidades: puedes leer la probabilidad de cualquier resultado directamente de la función.
Definición
La función de masa de probabilidad de una variable aleatoria discreta \(X\) es una función \(p(x)\) que da la probabilidad de cada resultado posible:
\[ p(x) = P(X = x) \]
Una función \(p(x)\) es una PMF válida si y solo si:
- \(p(x) \geq 0\) para todo \(x\).
- \(\sum_{x} p(x) = 1\) (las probabilidades suman 1 sobre todos los valores posibles).
⚠️ PMF vs PDF: una diferencia fundamental
Con una PMF, las probabilidades se leen directamente: (p(3) = P(X = 3)) es una probabilidad. Con una PDF, (f(3)) es una densidad, no una probabilidad, y puede ser mayor que 1. Las probabilidades a partir de una PDF requieren integrar sobre un intervalo. Nunca sumes una PDF ni integres una PMF: la herramienta debe corresponder al tipo de variable.
PMF más habituales
Distribución binomial
Modela el número de éxitos en \(n\) ensayos independientes, cada uno con probabilidad \(p\) de éxito:
\[p(x) = \binom{n}{x} p^x (1-p)^{n-x} \quad \text{para } x = 0, 1, \ldots, n\]
Una fábrica produce piezas con una tasa de defectos del 20%. Se inspecciona un lote de 10 piezas. Sea (X) = número de piezas defectuosas, (X \sim \text{Binomial}(10;, 0{,}2)).
- \(P(X = 0) = \binom{10}{0}(0{,}2)^0(0{,}8)^{10} \approx 0{,}107\): aproximadamente el 11% de los lotes no tiene defectos.
- \(P(X = 2) = \binom{10}{2}(0{,}2)^2(0{,}8)^8 \approx 0{,}302\): el resultado más probable.
- \(P(X \geq 4) = 1 - P(X \leq 3) \approx 1 - 0{,}879 = 0{,}121\): alrededor del 12% de los lotes tiene 4 o más defectos.
Distribución de Poisson
Modela el número de eventos que ocurren en un intervalo fijo de tiempo o espacio, cuando los eventos se producen a una tasa media constante \(\lambda\) y de forma independiente entre sí:
\[p(x) = \frac{\lambda^x e^{-\lambda}}{x!} \quad \text{para } x = 0, 1, 2, \ldots\]
Una sucursal bancaria recibe una media de 3 clientes por minuto en horas punta. Sea (X) = número de clientes en un minuto, (X \sim \text{Poisson}(3)).
- \(P(X = 0) = \frac{3^0 e^{-3}}{0!} = e^{-3} \approx 0{,}050\): 5% de probabilidad de que no llegue ningún cliente en un minuto.
- \(P(X = 3) = \frac{3^3 e^{-3}}{3!} = \frac{27 e^{-3}}{6} \approx 0{,}224\): resultado más probable.
- \(P(X > 5) = 1 - P(X \leq 5) \approx 1 - 0{,}916 = 0{,}084\): alrededor del 8% de probabilidad de que lleguen 6 o más clientes.
Distribución geométrica
Modela el número de ensayos necesarios para obtener el primer éxito, cuando cada ensayo tiene probabilidad \(p\) de éxito:
\[p(x) = (1-p)^{x-1} p \quad \text{para } x = 1, 2, 3, \ldots\]
Un comercial cierra una venta con probabilidad 0,3 en cada llamada, de forma independiente. Sea (X) = número de llamadas hasta la primera venta.
- \(P(X = 1) = 0{,}3\): 30% de probabilidad de cerrar en la primera llamada.
- \(P(X = 3) = (0{,}7)^2 \times 0{,}3 = 0{,}147\): alrededor del 15% de probabilidad de necesitar exactamente 3 llamadas.
- \(P(X > 5) = (0{,}7)^5 \approx 0{,}168\): alrededor del 17% de probabilidad de necesitar más de 5 llamadas.
Figure 1: PMF de tres distribuciones discretas habituales: Binomial(10; 0,2), Poisson(3) y Geométrica(0,3)
Relación con la CDF
La CDF de una variable aleatoria discreta se obtiene sumando la PMF:
\[F(x) = P(X \leq x) = \sum_{t \leq x} p(t)\]
A la inversa, para dos valores consecutivos cualesquiera \(x_{i}\) y \(x_{i+1}\):
\[p(x_i) = F(x_i) - F(x_{i-1})\]
Se puede recuperar la PMF a partir de la CDF tomando diferencias, igual que se recupera la PDF a partir de la CDF mediante derivación.
💡 Elegir la distribución discreta adecuada
- Número fijo de ensayos, cada uno éxito/fracaso: Binomial.
- Número de eventos en un intervalo fijo de tiempo o espacio, a una tasa media constante: Poisson.
- Número de ensayos hasta el primer éxito: Geométrica.
- Número de ensayos hasta el \(k\)-ésimo éxito: Binomial negativa.
- Muestreo sin reemplazamiento de una población finita: Hipergeométrica.