Test t pareado
El test t pareado compara dos medidas relacionadas calculando la diferencia para cada sujeto y aplicando un test t de una muestra a esas diferencias. Al eliminar la variabilidad entre sujetos, es más potente que el test t de dos muestras cuando el emparejamiento es efectivo.
¿Por qué el análisis pareado?
Cuando los mismos sujetos se miden dos veces (antes/después, izquierda/derecha, dos tratamientos en diseño cruzado), las dos observaciones dentro de cada par están correlacionadas. Un test t de dos muestras ignora esta correlación e incluye la variabilidad entre sujetos en el error estándar, dificultando la detección del efecto del tratamiento.
El test t pareado calcula \(d_i = X_{i,2} - X_{i,1}\) para cada sujeto y contrasta \(H_0: \mu_d = 0\) usando un test t de una muestra sobre los \(d_i\). La variabilidad entre sujetos desaparece del análisis.
Hipótesis
| Test | \(H_0\) | \(H_1\) |
|---|---|---|
| Bilateral | \(\mu_d = 0\) | \(\mu_d \neq 0\) |
| Unilateral derecho | \(\mu_d = 0\) | \(\mu_d > 0\) |
| Unilateral izquierdo | \(\mu_d = 0\) | \(\mu_d < 0\) |
De forma más general, el test puede evaluar \(H_0: \mu_d = \delta_0\) para cualquier diferencia hipotética \(\delta_0\) (habitualmente 0).
Estadístico del test
Dados \(n\) pares con diferencias \(d_i = X_{i,2} - X_{i,1}\):
\[\bar{d} = \frac{1}{n}\sum d_i, \qquad S_d = \sqrt{\frac{\sum(d_i - \bar{d})^2}{n-1}}\]
\[t = \frac{\bar{d} - \delta_0}{S_d / \sqrt{n}}\]
Bajo \(H_0\), \(t \sim t(n-1)\). Esto es idéntico a la fórmula del test t de una muestra aplicado a las diferencias.
⚠️ Analizar datos pareados como muestras independientes malgasta potencia
Si aplicas un test t de dos muestras a datos pareados, el error estándar incluye la variabilidad entre sujetos que se cancela en el análisis pareado. El resultado es un IC más amplio y un p-valor menos significativo, pudiendo pasar por alto un efecto real.
El error inverso también existe: tratar muestras independientes como pareadas (emparejando observaciones arbitrariamente) también es incorrecto e infla los grados de libertad. Adecua siempre el análisis al diseño del estudio.
Ejemplos
Ejemplo 1: presión arterial antes y después de la medicación (bilateral)
Diez pacientes tienen la presión arterial sistólica medida antes y después de 4 semanas de tratamiento:
| Paciente | Antes | Después | \(d_i\) |
|---|---|---|---|
| 1 | 152 | 141 | -11 |
| 2 | 148 | 139 | -9 |
| 3 | 165 | 158 | -7 |
| 4 | 143 | 138 | -5 |
| 5 | 156 | 143 | -13 |
| 6 | 160 | 152 | -8 |
| 7 | 149 | 145 | -4 |
| 8 | 158 | 148 | -10 |
| 9 | 144 | 139 | -5 |
| 10 | 162 | 155 | -7 |
\(\bar{d} = -7{,}9\) mmHg, \(S_d = 2{,}88\) mmHg.
Estadístico del test:
\[t = \frac{-7{,}9 - 0}{2{,}88/\sqrt{10}} = \frac{-7{,}9}{0{,}911} \approx -8{,}673\]
P-valor (bilateral, \(gl = 9\)): \(p = 2 \times P(T_9 \leq -8{,}673) < 0{,}001\).
Decisión: rechazamos \(H_0\). La medicación reduce significativamente la presión arterial.

Ejemplo 2: nuevo programa de formación (unilateral derecho)
Ocho empleados completan una evaluación de rendimiento antes y después de un programa de formación. Puntuaciones (después - antes): \(+8, +5, +12, +3, +9, +6, +4, +7\).
\(\bar{d} = 6{,}75\), \(S_d = 2{,}87\).
Hipótesis: \(H_0: \mu_d = 0\) frente a \(H_1: \mu_d > 0\) (la formación mejora las puntuaciones).
Estadístico del test:
\[t = \frac{6{,}75}{2{,}87/\sqrt{8}} = \frac{6{,}75}{1{,}015} \approx 6{,}650\]
P-valor (unilateral derecho, \(gl = 7\)): \(p = P(T_7 \geq 6{,}650) < 0{,}001\).
Decisión: rechazamos \(H_0\). El programa de formación mejoró significativamente las puntuaciones de rendimiento.
Ganancia de potencia por el emparejamiento
El test t pareado es más potente que el test t de dos muestras cuando la correlación intrasujeto es positiva (es decir, los sujetos que puntúan alto antes también tienden a puntuar alto después). La varianza de las diferencias es:
\[\text{Var}(d_i) = \sigma_1^2 + \sigma_2^2 - 2\rho\sigma_1\sigma_2\]
Cuando \(\rho > 0\), \(\text{Var}(d_i) < \sigma_1^2 + \sigma_2^2\), que es lo que usa el test t de dos muestras. Cuanto mayor es la correlación intrasujeto, mayor es la ventaja en potencia del diseño pareado.
Realizar el test en R
before <- c(152, 148, 165, 143, 156, 160, 149, 158, 144, 162)
after <- c(141, 139, 158, 138, 143, 152, 145, 148, 139, 155)
# Test t pareado
t.test(after, before, paired = TRUE, alternative = "two.sided")
# Equivalente: test t de una muestra sobre las diferencias
t.test(after - before, mu = 0, alternative = "two.sided")
Ambas llamadas dan resultados idénticos. La salida incluye \(\bar{d}\), \(t\), \(gl\), p-valor y un IC al 95% para \(\mu_d\).
💡 Cuándo usar el test t pareado
Usa el test t pareado cuando:
- Los mismos sujetos se miden dos veces (antes/después, dos condiciones).
- Los sujetos están emparejados por diseño (gemelos, casos y controles emparejados).
- Cada observación del grupo 1 está vinculada de forma natural a una del grupo 2.
Usa el test t de dos muestras (Welch) cuando los sujetos de los dos grupos son distintos y no hay emparejamiento natural. En caso de duda: ¿puedes calcular \(d_i = X_{i,2} - X_{i,1}\) de forma significativa para cada unidad? Si la respuesta es sí, usa el pareado.