Función de masa de probabilidad

La función de masa de probabilidad (PMF) asigna una probabilidad a cada valor posible de una variable aleatoria discreta. A diferencia de la PDF para variables continuas, la PMF da probabilidades directamente, no densidades: puedes leer la probabilidad de cualquier resultado directamente de la función.

Definición

La función de masa de probabilidad de una variable aleatoria discreta \(X\) es una función \(p(x)\) que da la probabilidad de cada resultado posible:

\[ p(x) = P(X = x) \]

Una función \(p(x)\) es una PMF válida si y solo si:

  • \(p(x) \geq 0\) para todo \(x\).
  • \(\sum_{x} p(x) = 1\) (las probabilidades suman 1 sobre todos los valores posibles).

⚠️ PMF vs PDF: una diferencia fundamental

Con una PMF, las probabilidades se leen directamente: (p(3) = P(X = 3)) es una probabilidad. Con una PDF, (f(3)) es una densidad, no una probabilidad, y puede ser mayor que 1. Las probabilidades a partir de una PDF requieren integrar sobre un intervalo. Nunca sumes una PDF ni integres una PMF: la herramienta debe corresponder al tipo de variable.

PMF más habituales

Distribución binomial

Modela el número de éxitos en \(n\) ensayos independientes, cada uno con probabilidad \(p\) de éxito:

\[p(x) = \binom{n}{x} p^x (1-p)^{n-x} \quad \text{para } x = 0, 1, \ldots, n\]

PMF binomial: control de calidad

Una fábrica produce piezas con una tasa de defectos del 20%. Se inspecciona un lote de 10 piezas. Sea (X) = número de piezas defectuosas, (X \sim \text{Binomial}(10;, 0{,}2)).

  • \(P(X = 0) = \binom{10}{0}(0{,}2)^0(0{,}8)^{10} \approx 0{,}107\): aproximadamente el 11% de los lotes no tiene defectos.
  • \(P(X = 2) = \binom{10}{2}(0{,}2)^2(0{,}8)^8 \approx 0{,}302\): el resultado más probable.
  • \(P(X \geq 4) = 1 - P(X \leq 3) \approx 1 - 0{,}879 = 0{,}121\): alrededor del 12% de los lotes tiene 4 o más defectos.

    Example icon

Distribución de Poisson

Modela el número de eventos que ocurren en un intervalo fijo de tiempo o espacio, cuando los eventos se producen a una tasa media constante \(\lambda\) y de forma independiente entre sí:

\[p(x) = \frac{\lambda^x e^{-\lambda}}{x!} \quad \text{para } x = 0, 1, 2, \ldots\]

PMF de Poisson: llegada de clientes

Una sucursal bancaria recibe una media de 3 clientes por minuto en horas punta. Sea (X) = número de clientes en un minuto, (X \sim \text{Poisson}(3)).

  • \(P(X = 0) = \frac{3^0 e^{-3}}{0!} = e^{-3} \approx 0{,}050\): 5% de probabilidad de que no llegue ningún cliente en un minuto.
  • \(P(X = 3) = \frac{3^3 e^{-3}}{3!} = \frac{27 e^{-3}}{6} \approx 0{,}224\): resultado más probable.
  • \(P(X > 5) = 1 - P(X \leq 5) \approx 1 - 0{,}916 = 0{,}084\): alrededor del 8% de probabilidad de que lleguen 6 o más clientes.

    Example icon

Distribución geométrica

Modela el número de ensayos necesarios para obtener el primer éxito, cuando cada ensayo tiene probabilidad \(p\) de éxito:

\[p(x) = (1-p)^{x-1} p \quad \text{para } x = 1, 2, 3, \ldots\]

PMF geométrica: primera venta

Un comercial cierra una venta con probabilidad 0,3 en cada llamada, de forma independiente. Sea (X) = número de llamadas hasta la primera venta.

  • \(P(X = 1) = 0{,}3\): 30% de probabilidad de cerrar en la primera llamada.
  • \(P(X = 3) = (0{,}7)^2 \times 0{,}3 = 0{,}147\): alrededor del 15% de probabilidad de necesitar exactamente 3 llamadas.
  • \(P(X > 5) = (0{,}7)^5 \approx 0{,}168\): alrededor del 17% de probabilidad de necesitar más de 5 llamadas.

    Example icon
PMF de tres distribuciones discretas habituales: Binomial(10; 0,2), Poisson(3) y Geométrica(0,3)

Figure 1: PMF de tres distribuciones discretas habituales: Binomial(10; 0,2), Poisson(3) y Geométrica(0,3)

Relación con la CDF

La CDF de una variable aleatoria discreta se obtiene sumando la PMF:

\[F(x) = P(X \leq x) = \sum_{t \leq x} p(t)\]

A la inversa, para dos valores consecutivos cualesquiera \(x_{i}\) y \(x_{i+1}\):

\[p(x_i) = F(x_i) - F(x_{i-1})\]

Se puede recuperar la PMF a partir de la CDF tomando diferencias, igual que se recupera la PDF a partir de la CDF mediante derivación.

💡 Elegir la distribución discreta adecuada

Una guía rápida para reconocer qué distribución aplica:

  • Número fijo de ensayos, cada uno éxito/fracaso: Binomial.
  • Número de eventos en un intervalo fijo de tiempo o espacio, a una tasa media constante: Poisson.
  • Número de ensayos hasta el primer éxito: Geométrica.
  • Número de ensayos hasta el \(k\)-ésimo éxito: Binomial negativa.
  • Muestreo sin reemplazamiento de una población finita: Hipergeométrica.