Variables aleatorias unidimensionales

Una variable aleatoria es una función que asigna un valor numérico a cada resultado de un experimento aleatorio. Las variables aleatorias unidimensionales asignan esos resultados a un único número real, que es el caso más habitual en probabilidad y estadística introductoria.

Definición

Informalmente, una variable aleatoria es una forma de convertir los resultados de un experimento aleatorio en números. Lanza un dado: asigna del 1 al 6 a cada cara. Mide la altura de una persona: regístrala en centímetros. En ambos casos, tienes una regla que asocia cada resultado posible con un número.

Formalmente, dado un espacio de probabilidad \((\Omega, \mathcal{A}, P)\), una variable aleatoria es una función medible:

\[X: \Omega \rightarrow \mathbb{R}\]

tal que para cualquier conjunto de Borel \(B \subseteq \mathbb{R}\):

\[X^{-1}(B) = \{\omega \in \Omega \mid X(\omega) \in B\} \in \mathcal{A}\]

Esta condición de medibilidad garantiza que tenga sentido hablar de la probabilidad de que \(X\) tome valores en cualquier intervalo o conjunto.

Variables aleatorias en la práctica

  • Lanzar un dado equilibrado: \(\Omega = \{1,2,3,4,5,6\}\), \(X(\omega) = \omega\). La variable es el resultado del lanzamiento.
  • Lanzar una moneda 10 veces: \(X\) = número de caras. El espacio muestral tiene \(2^{10}\) resultados, pero \(X\) los asigna todos a \(\{0, 1, \ldots, 10\}\).
  • Medir el tiempo de espera en un centro de llamadas: \(X\) = tiempo en segundos hasta que se responde la llamada. \(X\) puede tomar cualquier valor real positivo.

Example icon

La distinción clave entre variables aleatorias es si el conjunto de valores posibles es numerable o no.

Variables aleatorias discretas

Una variable aleatoria es discreta cuando solo puede tomar un conjunto finito o infinito numerable de valores, típicamente enteros.

Función de masa de probabilidad (PMF)

La función de masa de probabilidad asigna una probabilidad a cada valor posible:

\[ P(X = x_i) = p_i, \quad \text{con } \sum_{i} p_i = 1 \text{ y } p_i \geq 0 \]

Función de distribución acumulada (CDF)

La función de distribución acumulada da la probabilidad de que \(X\) tome un valor menor o igual que \(x\):

\[F(x) = P(X \leq x) = \sum_{x_i \leq x} p_i\]

Para variables discretas, la CDF es una función escalonada: permanece constante entre valores consecutivos y da un salto en cada valor posible de \(X\).

PMF (izquierda) y CDF (derecha) de una distribución Binomial(10; 0,5)

Figure 1: PMF (izquierda) y CDF (derecha) de una distribución Binomial(10; 0,5)

Variable aleatoria discreta: número de piezas defectuosas

Una fábrica produce lotes de 10 piezas. Cada pieza es defectuosa con probabilidad 0,3, de forma independiente. El número de piezas defectuosas (X \sim \text{Binomial}(10;, 0{,}3)).

  • \(P(X = 0) = 0{,}028\): probabilidad de que no haya piezas defectuosas.
  • \(P(X = 2) = 0{,}233\): resultado más probable.
  • \(P(X \leq 3) = F(3) = 0{,}650\): el 65% de los lotes tiene 3 o menos defectos.

    Example icon

Variables aleatorias continuas

Una variable aleatoria es continua cuando puede tomar cualquier valor dentro de un intervalo (o unión de intervalos). Medidas como el tiempo, la temperatura o el peso son naturalmente continuas.

Función de densidad de probabilidad (PDF)

Para variables continuas, los valores individuales tienen probabilidad cero. En su lugar, las probabilidades se definen sobre intervalos a través de la función de densidad de probabilidad \(f(x)\):

\[ P(a \leq X \leq b) = \int_{a}^{b} f(x)\, dx, \quad \text{con } \int_{-\infty}^{\infty} f(x)\, dx = 1 \text{ y } f(x) \geq 0 \]

La PDF en sí no es una probabilidad: \(f(x)\) puede superar 1. Es una densidad, y solo su integral sobre un intervalo da una probabilidad.

Función de distribución acumulada (CDF)

La CDF para una variable aleatoria continua es:

\[F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t)\, dt\]

A diferencia del caso discreto, la CDF continua es una función suave y no decreciente. La relación entre PDF y CDF es:

\[f(x) = \frac{d}{dx} F(x)\]

La PDF es la derivada de la CDF.

PDF (izquierda) y CDF (derecha) de una distribución normal estándar N(0,1)

Figure 2: PDF (izquierda) y CDF (derecha) de una distribución normal estándar N(0,1)

⚠️ Para variables continuas, P(X = x) = 0 siempre

Esta es la fuente de confusión más habitual al pasar de lo discreto a lo continuo. Para una variable aleatoria continua, la probabilidad de tomar cualquier valor exacto es cero:

\[P(X = 2{,}5) = \int_{2{,}5}^{2{,}5} f(x)\, dx = 0\]

Esto no significa que el valor sea imposible. Significa que en una distribución continua, las probabilidades solo tienen sentido sobre intervalos, no en puntos individuales. Como consecuencia, para variables continuas \(P(X \leq x) = P(X < x)\): la distinción entre desigualdades estrictas y no estrictas desaparece.

Propiedades de la CDF

La CDF \(F(x)\) siempre cumple estas propiedades, tanto si la variable es discreta como continua:

  • \(\lim_{x \to -\infty} F(x) = 0\) y \(\lim_{x \to +\infty} F(x) = 1\).
  • \(F\) es no decreciente: si \(a < b\) entonces \(F(a) \leq F(b)\).
  • \(F\) es continua por la derecha: \(\lim_{h \to 0^+} F(x+h) = F(x)\).
  • \(P(a < X \leq b) = F(b) - F(a)\).

La CDF es el lenguaje universal para describir cualquier variable aleatoria, discreta o continua.

Variables aleatorias mixtas

Algunas variables aleatorias no son ni puramente discretas ni puramente continuas. Una variable aleatoria mixta tiene una distribución con un componente discreto (probabilidad positiva en puntos concretos) y un componente continuo (densidad sobre un intervalo).

Variable aleatoria mixta: importe de una reclamación de seguro

Una póliza de seguro no paga nada si no se presenta ninguna reclamación, y paga una cantidad positiva y continua en caso contrario. Sea (X) el importe de la reclamación:

  • \(P(X = 0) = 0{,}6\): el 60% de los asegurados no presenta ninguna reclamación (masa puntual en cero).
  • Para \(X > 0\): \(X\) sigue una distribución exponencial (componente continuo).

Esta es una variable aleatoria mixta: tiene una masa puntual en 0 y una densidad continua para valores positivos. Su CDF tiene un salto de 0,6 en cero y luego crece de forma suave para valores positivos.

Example icon

💡 ¿Qué tipo de variable tienes?

En la práctica, pregúntate: ¿puede la variable tomar solo valores separados específicos (recuentos, categorías codificadas como números), o puede tomar cualquier valor dentro de un rango (mediciones, tiempos, precios)? Si la respuesta es recuentos o categorías, es discreta. Si son mediciones, continua. Si hay una probabilidad positiva en un punto concreto más un rango continuo (como “tiempo hasta el fallo, con probabilidad de fallo inmediato”), mixta.