Pasos de un contraste de hipótesis

Los pasos de un contraste de hipótesis son los mismos en todos los contrastes: plantear las hipótesis, fijar \(\alpha\), elegir el contraste, calcular el estadístico y el p-valor, decidir e interpretar. Lo que cambia entre contrastes es la fórmula del estadístico y la distribución de referencia. Este post trabaja tres ejemplos completos para mostrar cómo aplicar los pasos en la práctica.

Los seis pasos

Todo contraste de hipótesis sigue la misma estructura:

1. Plantear \(H_0\) y \(H_1\): define qué se contrasta y la dirección de la alternativa.

2. Fijar \(\alpha\): elige el nivel de significación antes de ver los datos. Valores habituales: 0,05 y 0,01.

3. Elegir el contraste y calcular el estadístico: selecciona el contraste adecuado para tu tipo de datos y tamaño muestral, y calcula el estadístico del contraste a partir de la muestra.

4. Calcular el p-valor: la probabilidad de observar un estadístico al menos tan extremo como el calculado, asumiendo que \(H_0\) es verdadera.

5. Decidir: si \(p \leq \alpha\), rechaza \(H_0\). Si \(p > \alpha\), no rechaza \(H_0\).

6. Interpretar en contexto: traduce la decisión estadística en una conclusión práctica.

El resto del post aplica estos pasos a tres ejemplos reales.

Ejemplo 1: contraste t de una muestra

Una empresa de logística afirma que su tiempo de entrega medio es de 48 horas. Una organización de defensa del consumidor muestrea 25 envíos y obtiene \(\bar{x} = 51{,}3\) horas y \(S = 8{,}4\) horas.

Paso 1: hipótesis

\[H_0: \mu = 48 \quad \text{frente a} \quad H_1: \mu > 48 \quad \text{(unilateral, cola derecha)}\]

La organización sospecha que las entregas tardan más de lo declarado, por lo que la alternativa es unilateral a la derecha.

Paso 2: nivel de significación

\[\alpha = 0{,}05\]

Paso 3: estadístico del contraste

\(\sigma\) poblacional desconocida y \(n = 25\): se usa el contraste \(t\) de una muestra.

\[t = \frac{\bar{x} - \mu_0}{S/\sqrt{n}} = \frac{51{,}3 - 48}{8{,}4/\sqrt{25}} = \frac{3{,}3}{1{,}68} \approx 1{,}964\]

Paso 4: p-valor

Con \(gl = 24\) y contraste unilateral a la derecha:

\[p = P(T_{24} > 1{,}964) \approx 0{,}031\]

Pasos 5 y 6: decisión e interpretación

Como \(p = 0{,}031 < 0{,}05\), rechazamos \(H_0\).

Hay evidencia significativa al nivel del 5% de que el tiempo de entrega medio real supera las 48 horas. Los datos sugieren que la afirmación de la empresa está infravalorada.

Distribución t con la región de rechazo para un contraste unilateral a la derecha mostrando el estadístico observado

Ejemplo 2: contraste z de una proporción

Una plataforma de comercio electrónico afirma que su proceso de pago tiene una tasa de abandono del carrito del 70%. Un analista muestrea 200 sesiones y observa 152 abandonos (76%).

Paso 1: hipótesis

\[H_0: p = 0{,}70 \quad \text{frente a} \quad H_1: p \neq 0{,}70 \quad \text{(bilateral)}\]

Paso 2: nivel de significación

\[\alpha = 0{,}05\]

Paso 3: estadístico del contraste

Comprobación: \(np_0 = 200 \times 0{,}70 = 140 \geq 10\) y \(n(1-p_0) = 60 \geq 10\). Se usa el contraste z para proporciones.

\[z = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}} = \frac{0{,}76 - 0{,}70}{\sqrt{0{,}70 \times 0{,}30/200}} = \frac{0{,}06}{0{,}0324} \approx 1{,}852\]

Paso 4: p-valor

Bilateral: \(p = 2 \times P(Z > 1{,}852) = 2 \times 0{,}032 = 0{,}064\).

Pasos 5 y 6: decisión e interpretación

Como \(p = 0{,}064 > 0{,}05\), no rechazamos \(H_0\).

Los datos no aportan evidencia significativa al nivel del 5% de que la tasa de abandono difiera del 70% declarado. Los datos son compatibles con la afirmación de la plataforma, aunque el resultado está en el límite (\(p = 0{,}064\)). Una muestra más grande daría una respuesta más definitiva.

¿Qué cambia con α = 0,10?

Si el analista hubiera fijado \(\alpha = 0{,}10\) en lugar de \(\alpha = 0{,}05\), el valor crítico sería \(z_{0{,}05} = 1{,}645\). Como \(z = 1{,}852 > 1{,}645\), se rechazaría \(H_0\) al nivel del 10%.

Esto ilustra por qué \(\alpha\) debe elegirse antes de ver los datos. Ajustar \(\alpha\) después de calcular el p-valor para lograr la conclusión deseada es p-hacking.

Example icon

Ejemplo 3: contraste t de dos muestras

Un ensayo clínico compara la reducción de la presión arterial (mmHg) entre dos tratamientos. Tratamiento A (\(n_1 = 30\)): \(\bar{x}_1 = 12{,}4\), \(S_1 = 4{,}2\). Tratamiento B (\(n_2 = 28\)): \(\bar{x}_2 = 10{,}1\), \(S_2 = 5{,}1\).

Paso 1: hipótesis

\[H_0: \mu_1 - \mu_2 = 0 \quad \text{frente a} \quad H_1: \mu_1 - \mu_2 \neq 0 \quad \text{(bilateral)}\]

Paso 2: nivel de significación

\[\alpha = 0{,}05\]

Paso 3: estadístico del contraste (Welch)

Las varianzas difieren (\(S_1 \neq S_2\)), por lo que se usa el contraste \(t\) de Welch.

\[\text{EE} = \sqrt{\frac{4{,}2^2}{30} + \frac{5{,}1^2}{28}} = \sqrt{0{,}588 + 0{,}929} = \sqrt{1{,}517} \approx 1{,}232\]

\[t = \frac{12{,}4 - 10{,}1}{1{,}232} \approx 1{,}867\]

Grados de libertad de Satterthwaite: \(gl \approx 52\).

Paso 4: p-valor

\[p = 2 \times P(T_{52} > 1{,}867) \approx 2 \times 0{,}034 = 0{,}068\]

Pasos 5 y 6: decisión e interpretación

Como \(p = 0{,}068 > 0{,}05\), no rechazamos \(H_0\).

Los datos no aportan evidencia significativa al nivel del 5% de que los dos tratamientos difieran. Sin embargo, \(p = 0{,}068\) está próximo al umbral: el estudio puede tener poca potencia. Con muestras más grandes, la diferencia observada de 2,3 mmHg podría alcanzar la significación.

Distribución t bilateral con regiones de rechazo mostrando el estadístico del contraste para la comparación de dos muestras

💡 Elegir el contraste adecuado para tus datos

Una guía rápida de los contrastes más habituales:

  • Una muestra, continua, \(\sigma\) desconocida: contraste \(t\) de una muestra.
  • Dos muestras independientes, continua: contraste \(t\) de Welch (por defecto) o \(t\) con varianza combinada (si se asumen varianzas iguales).
  • Muestras pareadas: contraste \(t\) pareado sobre las diferencias.
  • Una proporción: contraste \(z\) para proporciones (cuando \(np_0 \geq 10\) y \(n(1-p_0) \geq 10\)).
  • Dos proporciones: contraste \(z\) para la diferencia de proporciones.
  • Datos categóricos, bondad de ajuste o independencia: contraste chi-cuadrado.
  • Tres o más medias de grupos: ANOVA.