Rango en estadística

El rango es la medida de dispersión más sencilla: simplemente la diferencia entre el valor más grande y el más pequeño de un conjunto de datos. Es fácil de calcular e interpretar, pero tiene una debilidad crítica que lo hace poco fiable en muchas situaciones reales.

Definición

El rango \(R\) de un conjunto de datos \(X\) con \(n\) observaciones es:

\[ R = \max(X) - \min(X) \]

Mide la dispersión total de los datos de un extremo al otro.

Gráfico de puntos mostrando el rango entre los valores mínimo y máximo

Propiedades

  • No negativo: \(R \geq 0\). Vale cero solo cuando todos los valores son idénticos.
  • Sensible a los outliers: un único valor extremo cambia completamente el rango, independientemente de cómo se distribuya el resto de los datos.
  • Solo usa dos valores: el rango ignora todo lo que hay entre el mínimo y el máximo. Dos conjuntos de datos con distribuciones muy distintas pueden tener exactamente el mismo rango.
  • Transformación de escala: si \(Y = aX + b\) con \(a > 0\), entonces \(R(Y) = a \cdot R(X)\). Sumar una constante no cambia el rango.

⚠️ El rango no dice nada sobre lo que hay en medio

Considera estos dos conjuntos de datos:

  • \(A = (1, 1, 1, 1, 1, 1, 1, 1, 1, 100)\)
  • \(B = (1, 12, 23, 34, 45, 56, 67, 78, 89, 100)\)

Ambos tienen un rango de 99. Pero el conjunto A tiene 9 valores agrupados en 1 con un outlier extremo, mientras que el B está distribuido uniformemente por todo el rango. El rango no puede distinguir entre estas dos situaciones tan distintas.

Ejemplos

Ejemplo 1: rango de temperatura diaria

Una estación meteorológica registra las siguientes temperaturas horarias (°C) a lo largo de un día:

\[x = (12, 14, 15, 18, 22, 26, 28, 27, 24, 20, 17, 13)\]

El rango es: \(R = 28 - 12 = 16°C\).

Esto indica que las temperaturas variaron 16 grados a lo largo del día, lo cual es inmediatamente útil para decidir qué ropa ponerse o cómo planificar actividades al aire libre.

Ejemplo 2: el problema del outlier

Una startup tiene 8 empleados con los siguientes salarios anuales (en miles de USD):

\[x = (32, 35, 36, 38, 40, 41, 42, 210)\]

El rango es \(R = 210 - 32 = 178\), lo que sugiere una dispersión salarial enorme. Pero 7 de los 8 empleados ganan entre 32k y 42k. El rango de 178k está determinado por completo por el salario del CEO.

Gráfico de puntos mostrando cómo un outlier infla el rango salarial

En este caso, el rango intercuartílico (IQR) sería una medida mucho más informativa: se centra en el 50% central de los datos e ignora ambos extremos.

Ejemplo 3: mismo rango, distribuciones distintas

Ambos conjuntos tienen el mismo rango (9), pero distribuciones completamente distintas

Figure 1: Ambos conjuntos tienen el mismo rango (9), pero distribuciones completamente distintas

Cuándo usar el rango

A pesar de sus limitaciones, el rango es útil en situaciones concretas:

  • Exploración rápida: cuando necesitas una idea aproximada y rápida de cuánto se dispersan los datos.
  • Control de procesos: en fabricación y control de calidad, el rango de muestras pequeñas se usa en los gráficos de control (llamados gráficos R) para monitorizar la variabilidad del proceso en tiempo real.
  • Límites naturales: cuando el mínimo y el máximo tienen significado por sí mismos, como el rango de temperatura diaria en una previsión meteorológica o el rango máximo-mínimo de precios en los mercados financieros.

💡 Usa el rango junto con otras medidas

El rango es más útil como complemento de otras medidas, no como resumen único. Repórtalo junto con la media o la mediana para dar contexto, y considera el IQR cuando los outliers sean un problema. Si alguien te da solo el rango de un conjunto de datos, sabes muy poco sobre la distribución real.