Test de normalidad de Shapiro-Wilk
El test de Shapiro-Wilk es el más potente para contrastar la normalidad en muestras pequeñas y medianas. Compara los estadísticos de orden observados con lo que predice una distribución normal, y resume el acuerdo en un único estadístico \(W\) entre 0 y 1.
Hipótesis
\(H_0\): los datos provienen de una población con distribución normal.
\(H_1\): los datos no provienen de una población con distribución normal.
Se rechaza \(H_0\) cuando \(p \leq \alpha\). No rechazar \(H_0\) no prueba la normalidad: significa que los datos son compatibles con la normalidad al nivel de significación elegido.
El estadístico W
El estadístico del contraste es:
\[W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n}(x_i - \bar{x})^2}\]
donde \(x_{(i)}\) son los valores muestrales ordenados y \(a_i\) son coeficientes derivados de los valores esperados de los estadísticos de orden de una distribución normal estándar. El denominador es proporcional a la varianza muestral.
\(W\) oscila entre 0 y 1. Un valor próximo a 1 indica que los cuantiles observados se ajustan bien a los cuantiles normales. Valores pequeños de \(W\) indican desviaciones de la normalidad.
El p-valor se obtiene comparando \(W\) con su distribución exacta (calculada por Shapiro y Wilk mediante simulación), no a partir de una tabla estándar.
Ejemplos
Ejemplo 1: datos con distribución normal

Los puntos siguen de cerca la diagonal y \(W \approx 1\): no hay evidencia contra la normalidad.
Ejemplo 2: datos con asimetría positiva

Los puntos se curvan hacia afuera de la diagonal en la cola superior (asimetría positiva). \(W\) está muy por debajo de 1 y \(p < 0{,}05\): se rechaza la normalidad.
Interpretación de W y el p-valor
Una forma útil de leer el resultado:
- \(W > 0{,}95\) y \(p > 0{,}05\): fuerte compatibilidad con la normalidad.
- \(W\) entre 0,90 y 0,95 y \(p > 0{,}05\): desviación leve, probablemente no problemática para los contrastes paramétricos robustos.
- \(W < 0{,}90\) o \(p \leq 0{,}05\): desviación significativa de la normalidad. Inspecciona el gráfico Q-Q para entender la naturaleza de la desviación (asimetría, colas pesadas, valores atípicos).
El gráfico Q-Q siempre aporta más información que el p-valor solo: muestra dónde se alejan los datos de la normalidad, no solo si lo hacen.
⚠️ Muestras grandes: el contraste se vuelve demasiado sensible
Para \(n > 100\), Shapiro-Wilk detecta desviaciones triviales de la normalidad que no tienen consecuencias prácticas para los contrastes paramétricos. Un conjunto de datos con \(n = 500\) puede dar \(W = 0{,}993\) y \(p = 0{,}012\), rechazando la normalidad aunque los datos sean esencialmente normales para cualquier propósito práctico.
Para muestras grandes, confía en el gráfico Q-Q y considera la robustez del contraste que vas a aplicar después. El contraste \(t\) y el ANOVA son bastante robustos frente a desviaciones leves de la normalidad cuando \(n\) es grande, gracias al TCL.
⚠️ Muestras pequeñas: el contraste tiene poca potencia
Para \(n < 15\), Shapiro-Wilk raramente rechaza \(H_0\) aunque los datos sean claramente no normales. Un resultado no significativo con muestras pequeñas es evidencia débil de normalidad. De nuevo, el gráfico Q-Q es esencial.
Realizar el contraste en R
El contraste está integrado en R base y no requiere paquetes adicionales:
shapiro.test(x)
La salida da \(W\) y el p-valor. Para una evaluación completa de la normalidad, complementa con un gráfico Q-Q:
qqnorm(x)
qqline(x)
El test de Shapiro-Wilk en R está limitado a muestras de entre 3 y 5.000 observaciones. Para \(n > 5{.}000\), usa el contraste de Anderson-Darling del paquete nortest: nortest::ad.test(x).
💡 Cuando se rechaza la normalidad: qué hacer a continuación
Rechazar \(H_0\) no significa automáticamente que los contrastes paramétricos sean inválidos. Considera:
- La robustez del contraste siguiente: los contrastes \(t\) y ANOVA son bastante robustos frente a desviaciones leves de la normalidad para \(n \geq 30\).
- Transformaciones: las transformaciones logarítmica, raíz cuadrada o Box-Cox a menudo normalizan datos con asimetría positiva.
- Alternativas no paramétricas: Wilcoxon de rangos con signo en lugar del \(t\) de una muestra, Mann-Whitney en lugar del \(t\) de dos muestras, Kruskal-Wallis en lugar del ANOVA.
- Métodos bootstrap: los intervalos de confianza y contrastes basados en remuestreo no requieren el supuesto de normalidad.
El objetivo no es conseguir un resultado no significativo en el test de Shapiro-Wilk, sino usar un método adecuado para la distribución real de tus datos.