Función de distribución conjunta
La función de distribución conjunta extiende el concepto de la CDF a dos variables simultáneamente. Da la probabilidad de que tanto \(X\) como \(Y\) caigan por debajo de umbrales especificados al mismo tiempo, y es la base para calcular cualquier probabilidad que involucre un par de variables aleatorias.
Definición
La función de distribución conjunta (CDF conjunta) de dos variables aleatorias \(X\) e \(Y\) es:
\[ F_{X,Y}(x, y) = P(X \leq x,\ Y \leq y) \]
Da la probabilidad de que \(X\) tome un valor como máximo \(x\) y \(Y\) tome un valor como máximo \(y\), simultáneamente.
Propiedades
La CDF conjunta siempre satisface:
- No decreciente: \(F_{X,Y}(x,y)\) es no decreciente tanto en \(x\) como en \(y\) por separado.
- Límites en la frontera:
- \(\lim_{x \to -\infty} F_{X,Y}(x,y) = 0\) para cualquier \(y\) fijo.
- \(\lim_{y \to -\infty} F_{X,Y}(x,y) = 0\) para cualquier \(x\) fijo.
- \(\lim_{x \to \infty,\, y \to \infty} F_{X,Y}(x,y) = 1\).
- Continua por la derecha en ambos argumentos.
- Recuperación de marginales: hacer tender un argumento a \(+\infty\) da la CDF marginal de la otra variable:
\[F_X(x) = \lim_{y \to \infty} F_{X,Y}(x,y), \qquad F_Y(y) = \lim_{x \to \infty} F_{X,Y}(x,y)\]
⚠️ La CDF conjunta da probabilidades de esquina, no de rectángulo
(F_{X,Y}(x,y)) es la probabilidad del cuadrante inferior izquierdo ((-\infty, x] \times (-\infty, y]). Para obtener la probabilidad de un rectángulo (P(a < X \leq b,\ c < Y \leq d)), se necesita la fórmula de inclusión-exclusión:
\[P(a < X \leq b,\ c < Y \leq d) = F_{X,Y}(b,d) - F_{X,Y}(a,d) - F_{X,Y}(b,c) + F_{X,Y}(a,c)\]
Es el análogo bidimensional de \(P(a < X \leq b) = F(b) - F(a)\).
Caso discreto
Para variables discretas, la CDF conjunta se obtiene sumando la PMF conjunta sobre todos los pares \((x', y')\) con \(x' \leq x\) e \(y' \leq y\):
\[F_{X,Y}(x,y) = \sum_{x' \leq x} \sum_{y' \leq y} P(X = x',\ Y = y')\]
La PMF conjunta se puede recuperar a partir de la CDF conjunta usando la fórmula de diferencias bidimensional:
\[p_{X,Y}(x,y) = F_{X,Y}(x,y) - F_{X,Y}(x-1,y) - F_{X,Y}(x,y-1) + F_{X,Y}(x-1,y-1)\]
Usando la PMF conjunta de la sección anterior:
| \(Y=1\) | \(Y=2\) | \(Y=3\) | |
|---|---|---|---|
| \(X=0\) | 0,15 | 0,10 | 0,05 |
| \(X=1\) | 0,05 | 0,20 | 0,15 |
| \(X=2\) | 0,02 | 0,08 | 0,20 |
Calculando \(F_{X,Y}(1, 2) = P(X \leq 1,\ Y \leq 2)\):
\[F_{X,Y}(1,2) = p(0,1) + p(0,2) + p(1,1) + p(1,2) = 0{,}15 + 0{,}10 + 0{,}05 + 0{,}20 = 0{,}50\]
Tabla completa de la CDF conjunta:
| \(y=1\) | \(y=2\) | \(y=3\) | |
|---|---|---|---|
| \(x=0\) | \(0{,}15\) | \(0{,}25\) | \(0{,}30\) |
| \(x=1\) | \(0{,}25\) | \(0{,}55\) | \(0{,}70\) |
| \(x=2\) | \(0{,}27\) | \(0{,}65\) | \(1{,}00\) |
Cada celda acumula todas las probabilidades conjuntas del rectángulo superior izquierdo hasta ese punto.
Figure 1: CDF conjunta como mapa de calor: los valores se acumulan desde la esquina superior izquierda, alcanzando 1 en la inferior derecha
Caso continuo
Para variables continuas, la CDF conjunta es la integral doble de la PDF conjunta:
\[F_{X,Y}(x,y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f_{X,Y}(x', y')\, dy'\, dx'\]
La PDF conjunta se recupera diferenciando:
\[f_{X,Y}(x,y) = \frac{\partial^2 F_{X,Y}(x,y)}{\partial x\, \partial y}\]
Figure 2: CDF conjunta de dos variables normales estándar independientes: la superficie sube de 0 en la esquina inferior izquierda a 1 en la superior derecha
Sean (X) e (Y) variables normales estándar independientes. ¿Cuánto vale (P(-1 \leq X \leq 1,\ 0 \leq Y \leq 1))?
Usando la fórmula de inclusión-exclusión y el hecho de que \(F_{X,Y}(x,y) = F_X(x) \cdot F_Y(y)\) para variables independientes:
\[P(-1 \leq X \leq 1,\ 0 \leq Y \leq 1) = [F_X(1) - F_X(-1)] \times [F_Y(1) - F_Y(0)]\]
\[= [0{,}841 - 0{,}159] \times [0{,}841 - 0{,}500] = 0{,}683 \times 0{,}341 \approx 0{,}233\]
Aproximadamente el 23% de las observaciones caen en ese rectángulo.
Independencia mediante la CDF conjunta
\(X\) e \(Y\) son independientes si y solo si su CDF conjunta se factoriza:
\[F_{X,Y}(x,y) = F_X(x) \cdot F_Y(y) \quad \text{para todo } x, y\]
Esto es equivalente a la factorización de la PMF o la PDF conjunta, pero expresado en términos de CDF. El ejemplo continuo anterior usa esto directamente: como \(X\) e \(Y\) son normales independientes, \(F_{X,Y}(x,y) = \Phi(x)\cdot\Phi(y)\).