Función de distribución acumulada
La función de distribución acumulada (CDF) da la probabilidad de que una variable aleatoria tome un valor menor o igual a un punto concreto. Funciona para cualquier tipo de variable aleatoria y es la base para calcular probabilidades, generar muestras aleatorias y definir cuantiles.
Definición
La función de distribución acumulada de una variable aleatoria \(X\) se define como:
ℹ️ CDF de una variable aleatoria
\[ F(x) = P(X \leq x), \quad \text{para todo } x \in \mathbb{R} \]
La CDF acumula probabilidad desde \(-\infty\) hasta \(x\). Está definida para cualquier número real \(x\), no solo para los valores donde \(X\) tiene probabilidad positiva.
Propiedades de la CDF
Toda CDF, independientemente del tipo de variable aleatoria, cumple las siguientes propiedades:
- Límites: \(\lim_{x \to -\infty} F(x) = 0\) y \(\lim_{x \to +\infty} F(x) = 1\).
- No decreciente: si \(a < b\) entonces \(F(a) \leq F(b)\).
- Acotada: \(0 \leq F(x) \leq 1\) para todo \(x\).
- Continua por la derecha: \(\lim_{h \to 0^+} F(x+h) = F(x)\).
- Probabilidad en un intervalo: \(P(a < X \leq b) = F(b) - F(a)\).
La última propiedad es la más útil en la práctica: se puede calcular la probabilidad de cualquier intervalo con solo dos evaluaciones de la CDF.
CDF para variables aleatorias discretas
Para una variable aleatoria discreta con valores posibles \(x_1 < x_2 < \cdots\) y probabilidades \(p_i = P(X = x_i)\), la CDF es:
ℹ️ CDF para variables discretas
\[ F(x) = \sum_{x_i \leq x} p_i \]
La CDF de una variable discreta es una función escalonada: permanece constante entre valores consecutivos y da un salto en cada \(x_i\) igual exactamente a \(p_i\).
Se lanza una moneda equilibrada dos veces. Sea (X) = número de caras. La PMF es:
- \(P(X = 0) = 0{,}25\), \(P(X = 1) = 0{,}50\), \(P(X = 2) = 0{,}25\)
La CDF es:
- \(F(x) = 0\) para \(x < 0\)
- \(F(x) = 0{,}25\) para \(0 \leq x < 1\)
- \(F(x) = 0{,}75\) para \(1 \leq x < 2\)
- \(F(x) = 1{,}00\) para \(x \geq 2\)
Así, \(P(X \leq 1) = 0{,}75\): hay un 75% de probabilidad de obtener como máximo una cara.
Figure 1: CDF de una Binomial(10; 0,5): función escalonada que salta en cada valor posible
⚠️ En variables discretas, P(X < x) ≠ P(X ≤ x)
Para variables aleatorias discretas, las desigualdades estrictas y no estrictas no son equivalentes:
\[P(X < 2) = F(1) = 0{,}75 \neq P(X \leq 2) = F(2) = 1{,}00\]
La diferencia es exactamente \(P(X = 2) = 0{,}25\). Esta distinción desaparece para variables continuas, donde \(P(X = x) = 0\) para cualquier punto, pero para variables discretas importa y es una fuente habitual de errores en exámenes.
CDF para variables aleatorias continuas
Para una variable aleatoria continua con función de densidad de probabilidad \(f(x)\), la CDF es:
ℹ️ CDF para variables continuas
\[ F(x) = \int_{-\infty}^{x} f(t)\, dt \]
La CDF es una curva suave y no decreciente que va de 0 a 1. La relación entre PDF y CDF es:
\[f(x) = \frac{d}{dx} F(x)\]
La PDF es la derivada de la CDF, y la CDF es la integral de la PDF.
Figure 2: CDF de N(0,1): el área sombreada entre -1 y 1 es igual a F(1) - F(-1) ≈ 0,683
El tiempo de respuesta de un servidor web sigue una distribución exponencial con media 200 ms, por lo que (\lambda = 1/200).
La CDF es \(F(x) = 1 - e^{-x/200}\) para \(x > 0\).
- Probabilidad de responder en menos de 100 ms: \(F(100) = 1 - e^{-0{,}5} \approx 0{,}393\)
- Probabilidad de responder en menos de 500 ms: \(F(500) = 1 - e^{-2{,}5} \approx 0{,}918\)
- Probabilidad de tardar entre 100 y 500 ms: \(F(500) - F(100) \approx 0{,}918 - 0{,}393 = 0{,}525\)
Las tres respuestas se obtienen con dos evaluaciones de la CDF.
La CDF inversa: función cuantil
La función cuantil (o CDF inversa) es \(F^{-1}(p)\): da el valor \(x\) tal que \(F(x) = p\).
\[Q(p) = F^{-1}(p) = \inf\{x : F(x) \geq p\}\]
Así se definen formalmente los percentiles y cuantiles. La mediana es \(Q(0{,}5)\), el primer cuartil es \(Q(0{,}25)\), etc.
💡 La función cuantil es esencial para la simulación
CDF para variables aleatorias mixtas
Las variables aleatorias mixtas tienen una CDF que combina saltos (del componente discreto) con tramos suaves (del componente continuo). La CDF sigue siendo continua por la derecha y no decreciente, pero no es ni una función escalonada pura ni una curva suave.
Una póliza de seguro paga cero con probabilidad 0,6 (no se presenta ninguna reclamación) y una cantidad positiva que sigue una distribución exponencial en caso contrario. La CDF es:
- \(F(0) = 0{,}6\) (salto de 0,6 en cero)
- \(F(x) = 0{,}6 + 0{,}4(1 - e^{-\lambda x})\) para \(x > 0\) (crecimiento exponencial suave)
La CDF parte de 0, salta a 0,6 en \(x = 0\) y luego aumenta suavemente hasta 1.