Función de densidad de probabilidad
La función de densidad de probabilidad (PDF) describe cómo se distribuye la probabilidad entre los posibles valores de una variable aleatoria continua. La PDF en sí no es una probabilidad, pero su integral sobre cualquier intervalo da la probabilidad de que la variable caiga en ese intervalo.
Definición
Una función \(f(x)\) es la función de densidad de probabilidad de una variable aleatoria continua \(X\) si:
\[ P(a \leq X \leq b) = \int_{a}^{b} f(x)\, dx \quad \text{para cualquier } a \leq b \]
En términos simples: la probabilidad de que \(X\) caiga entre \(a\) y \(b\) es el área bajo la curva de \(f(x)\) desde \(a\) hasta \(b\).
Figure 1: Probabilidad como área bajo la curva: P(-1 ≤ X ≤ 1) ≈ 0,683 para una distribución normal estándar
⚠️ f(x) no es una probabilidad: puede ser mayor que 1
Esta es la confusión más frecuente sobre las PDF. El valor (f(x)) es una densidad, no una probabilidad. Las probabilidades se obtienen integrando, no evaluando (f(x)) directamente.
Como consecuencia, no hay límite superior para \(f(x)\): una distribución uniforme en \([0; 0{,}1]\) tiene \(f(x) = 10\) en todo ese intervalo, y es perfectamente válido. La integral sigue siendo 1:
\[\int_0^{0{,}1} 10\, dx = 10 \times 0{,}1 = 1\]
La única restricción es \(f(x) \geq 0\) y \(\int_{-\infty}^{\infty} f(x)\, dx = 1\).
Propiedades de la PDF
Una función \(f(x)\) es una PDF válida si y solo si:
- \(f(x) \geq 0\) para todo \(x\).
- \(\int_{-\infty}^{\infty} f(x)\, dx = 1\).
De la definición se derivan propiedades adicionales:
- \(P(X = x) = 0\) para cualquier punto individual (la integral sobre un solo punto es cero).
- \(P(a \leq X \leq b) = P(a < X \leq b) = P(a \leq X < b) = P(a < X < b)\): las desigualdades estrictas y no estrictas son equivalentes para variables continuas.
💡 Cómo comprobar si una función es una PDF válida
PDF más habituales
Distribución normal
La distribución más importante en estadística. Su PDF es:
\[f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]
La curva en forma de campana es simétrica alrededor de \(\mu\). No existe una expresión cerrada para su integral, por lo que las probabilidades se calculan numéricamente o mediante tablas.
Distribución exponencial
Modela tiempos de espera y vidas útiles de sistemas con tasa de fallo constante:
\[f(x) = \lambda e^{-\lambda x} \quad \text{para } x \geq 0\]
El parámetro \(\lambda > 0\) es la tasa. La media es \(1/\lambda\).
Distribución uniforme
Todos los valores en \([a, b]\) son igualmente probables:
\[f(x) = \frac{1}{b-a} \quad \text{para } a \leq x \leq b\]
La distribución continua más sencilla. Su integral de \(a\) a \(b\) da \((b-a) \cdot \frac{1}{b-a} = 1\).
Figure 2: Tres funciones de densidad de probabilidad habituales: normal (izquierda), exponencial (centro) y uniforme (derecha)
Calcular probabilidades a partir de la PDF
Ejemplo 1: distribución uniforme
Un autobús llega a una parada con un tiempo de espera distribuido uniformemente entre 0 y 10 minutos. ¿Cuál es la probabilidad de esperar entre 2 y 6 minutos?
La PDF es \(f(x) = 1/10\) para \(0 \leq x \leq 10\).
\[P(2 \leq X \leq 6) = \int_2^6 \frac{1}{10}\, dx = \frac{1}{10} \times (6-2) = 0{,}4\]
Hay un 40% de probabilidad de esperar entre 2 y 6 minutos.
Ejemplo 2: distribución exponencial
Una llamada de atención al cliente dura un tiempo exponencialmente distribuido con media 5 minutos (\(\lambda = 0{,}2\)). ¿Cuál es la probabilidad de que la llamada dure menos de 3 minutos?
\[P(X \leq 3) = \int_0^3 0{,}2\, e^{-0{,}2x}\, dx = \left[-e^{-0{,}2x}\right]_0^3 = 1 - e^{-0{,}6} \approx 0{,}451\]
Aproximadamente el 45% de las llamadas terminan en los primeros 3 minutos.
¿Es (f(x) = 2x) para (0 \leq x \leq 1) (y cero en otro caso) una PDF válida?
Comprueba la no negatividad: \(2x \geq 0\) para \(x \in [0,1]\). ✓
Comprueba la normalización: \[\int_0^1 2x\, dx = \left[x^2\right]_0^1 = 1 - 0 = 1 \checkmark\]
Sí, es una PDF válida. Asigna más probabilidad a los valores cercanos a 1 que a los cercanos a 0.
¿Cuánto vale \(P(0{,}5 \leq X \leq 1)\)?
\[P(0{,}5 \leq X \leq 1) = \int_{0{,}5}^1 2x\, dx = \left[x^2\right]_{0{,}5}^1 = 1 - 0{,}25 = 0{,}75\]
Relación con la CDF
La PDF y la CDF son dos caras de la misma moneda:
\[F(x) = \int_{-\infty}^x f(t)\, dt \qquad \text{y} \qquad f(x) = \frac{d}{dx}F(x)\]
La CDF es la integral de la PDF; la PDF es la derivada de la CDF. Dada una de las dos, siempre se puede obtener la otra (siempre que \(F\) sea diferenciable).