Distribución gamma

La distribución gamma es una distribución continua flexible que generaliza la exponencial. Mientras la exponencial modela el tiempo de espera hasta el primer evento, la gamma modela el tiempo de espera hasta el \(k\)-ésimo evento en un proceso de Poisson.

Definición

Una variable aleatoria \(X\) sigue una distribución gamma con parámetro de forma \(k > 0\) y parámetro de tasa \(\lambda > 0\), escrita \(X \sim \text{Gamma}(k, \lambda)\), si su PDF es:

\[f(x) = \frac{\lambda^k x^{k-1} e^{-\lambda x}}{\Gamma(k)}, \quad x > 0\]

donde \(\Gamma(k) = \int_0^\infty t^{k-1} e^{-t}\, dt\) es la función gamma. Para enteros positivos, \(\Gamma(k) = (k-1)!\). Por ejemplo, \(\Gamma(3) = 2! = 2\) y \(\Gamma(5) = 4! = 24\).

Una parametrización equivalente usa el parámetro de escala \(\theta = 1/\lambda\):

\[f(x) = \frac{x^{k-1} e^{-x/\theta}}{\Gamma(k)\, \theta^k}, \quad x > 0\]

⚠️ Parametrización: tasa vs escala: comprueba tu software

La distribución gamma tiene dos formas habituales de parametrización:

  • Tasa (\(\lambda\)): R usa dgamma(x, shape = k, rate = lambda). Media \(= k/\lambda\).
  • Escala (\(\theta = 1/\lambda\)): R también acepta dgamma(x, shape = k, scale = theta). Media \(= k\theta\).

El módulo scipy.stats.gamma de Python usa la forma \(k\) y la escala \(\theta\). Verifica siempre qué convención usa tu fuente antes de calcular probabilidades.

Función de densidad de probabilidad y CDF

La CDF se expresa mediante la función gamma incompleta inferior:

\[F(x) = \frac{\gamma(k,\, \lambda x)}{\Gamma(k)}\]

donde \(\gamma(k, u) = \int_0^u t^{k-1} e^{-t}\, dt\). No existe forma cerrada para \(k\) general; las probabilidades se calculan numéricamente.

PDF y CDF de la distribución gamma para distintos parámetros de forma y tasa

Propiedades

Para \(X \sim \text{Gamma}(k, \lambda)\):

  1. Valor esperado (media)

\[E(X) = \frac{k}{\lambda}\]

  1. Varianza

\[\text{Var}(X) = \frac{k}{\lambda^2}\]

  1. Asimetría

\[\text{Asimetría} = \frac{2}{\sqrt{k}}\]

La distribución está sesgada a la derecha para \(k\) pequeño y se vuelve progresivamente más simétrica a medida que \(k\) crece. Para \(k\) grande, la gamma se aproxima a una distribución normal.

  1. Curtosis

\[g_2 = \frac{6}{k}\]

  1. Moda

\[\text{Moda} = \frac{k-1}{\lambda} \quad \text{para } k \geq 1\]

Para \(k < 1\), la distribución es monótonamente decreciente y la moda es 0.

  1. Función cuantil

No existe forma cerrada; se calcula numéricamente.

Casos especiales

La distribución gamma unifica varias distribuciones importantes:

  • Exponencial: \(\text{Gamma}(1, \lambda) = \text{Exp}(\lambda)\). El tiempo de espera hasta el primer evento.
  • Erlang: \(\text{Gamma}(k, \lambda)\) con \(k\) entero positivo. El tiempo de espera hasta el \(k\)-ésimo evento en un proceso de Poisson con tasa \(\lambda\).
  • Chi-cuadrado: \(\text{Gamma}(\nu/2,\, 1/2) = \chi^2(\nu)\). Fundamental en contrastes de hipótesis e intervalos de confianza.
Suma de exponenciales

Si \(X_1, X_2, \ldots, X_k\) son variables aleatorias \(\text{Exp}(\lambda)\) independientes, su suma:

\[S = X_1 + X_2 + \cdots + X_k \sim \text{Gamma}(k, \lambda)\]

Esta es la interpretación más intuitiva: si cada evento requiere un tiempo de espera exponencial, el tiempo total hasta que se producen \(k\) eventos sigue una distribución gamma.

Example icon

Ejemplo paso a paso

Un equipo de soporte técnico resuelve incidencias una a una. Cada incidencia requiere un tiempo exponencialmente distribuido con media 4 horas (\(\lambda = 1/4\)). ¿Cuál es la distribución del tiempo total para resolver 3 incidencias?

\(X \sim \text{Gamma}(3,\, 1/4)\) (equivalentemente, \(\text{Gamma}(k=3, \theta=4)\)).

Tiempo total esperado:

\[E(X) = \frac{3}{1/4} = 12 \text{ horas}\]

Varianza y desviación típica:

\[\text{Var}(X) = \frac{3}{(1/4)^2} = 48 \text{ horas}^2, \qquad \text{SD}(X) = \sqrt{48} \approx 6{,}93 \text{ horas}\]

Probabilidad de resolver las 3 incidencias en menos de 10 horas:

\[F(10) = P(X \leq 10) \approx 0{,}456\]

Calculado numéricamente: pgamma(10, shape = 3, rate = 1/4) en R.

Probabilidad de tardar más de 15 horas:

\[P(X > 15) = 1 - F(15) \approx 1 - 0{,}677 = 0{,}323\]

Aproximadamente el 32% de las sesiones de tres incidencias tardarán más de 15 horas.

Modelización de precipitaciones

Las precipitaciones mensuales (en mm) de una región siguen una distribución \(\text{Gamma}(3;\, 0{,}1)\) (media \(= 30\) mm, SD \(\approx 17{,}3\) mm).

  • Probabilidad de menos de 20 mm: pgamma(20, shape = 3, rate = 0.1) \(\approx 0{,}323\).
  • Mediana de precipitaciones: qgamma(0.5, shape = 3, rate = 0.1) \(\approx 26{,}5\) mm.

La gamma se usa frecuentemente para precipitaciones porque siempre es positiva, está sesgada a la derecha y es flexible en su forma.

Example icon

💡 Relación con otras distribuciones

  • Exponencial: \(\text{Gamma}(1, \lambda)\).
  • Chi-cuadrado: \(\text{Gamma}(\nu/2,\, 1/2)\), base de muchos contrastes de hipótesis.
  • Aproximación normal: para \(k\) grande, \(\text{Gamma}(k, \lambda) \approx N(k/\lambda,\, \sqrt{k}/\lambda)\).
  • Beta: si \(X \sim \text{Gamma}(\alpha, 1)\) e \(Y \sim \text{Gamma}(\beta, 1)\) son independientes, entonces \(X/(X+Y) \sim \text{Beta}(\alpha, \beta)\).
  • Gamma inversa: si \(X \sim \text{Gamma}(k, \lambda)\), entonces \(1/X\) sigue una gamma inversa, usada como distribución a priori para la varianza en estadística bayesiana.