INICIO

Test de normalidad de Shapiro-Wilk

El test de Shapiro-Wilk es el más potente para contrastar la normalidad en muestras pequeñas y medianas. Compara los estadísticos de orden observados con lo que predice una distribución normal, y resume el acuerdo en un único estadístico \(W\) entre 0 y 1.

Hipótesis

\(H_0\): los datos provienen de una población con distribución normal.

\(H_1\): los datos no provienen de una población con distribución normal.

Se rechaza \(H_0\) cuando \(p \leq \alpha\). No rechazar \(H_0\) no prueba la normalidad: significa que los datos son compatibles con la normalidad al nivel de significación elegido.

El estadístico W

El estadístico del contraste es:

\[W = \frac{\left(\sum_{i=1}^{n} a_i x_{(i)}\right)^2}{\sum_{i=1}^{n}(x_i - \bar{x})^2}\]

donde \(x_{(i)}\) son los valores muestrales ordenados y \(a_i\) son coeficientes derivados de los valores esperados de los estadísticos de orden de una distribución normal estándar. El denominador es proporcional a la varianza muestral.

\(W\) oscila entre 0 y 1. Un valor próximo a 1 indica que los cuantiles observados se ajustan bien a los cuantiles normales. Valores pequeños de \(W\) indican desviaciones de la normalidad.

El p-valor se obtiene comparando \(W\) con su distribución exacta (calculada por Shapiro y Wilk mediante simulación), no a partir de una tabla estándar.

Ejemplos

Ejemplo 1: datos con distribución normal

Gráfico Q-Q e histograma para datos con distribución normal con el resultado del test de Shapiro-Wilk

Los puntos siguen de cerca la diagonal y \(W \approx 1\): no hay evidencia contra la normalidad.

Ejemplo 2: datos con asimetría positiva

Gráfico Q-Q e histograma para datos con asimetría positiva mostrando la desviación de la normalidad en el test de Shapiro-Wilk

Los puntos se curvan hacia afuera de la diagonal en la cola superior (asimetría positiva). \(W\) está muy por debajo de 1 y \(p < 0{,}05\): se rechaza la normalidad.

Interpretación de W y el p-valor

Una forma útil de leer el resultado:

\(W > 0{,}95\) y \(p > 0{,}05\): fuerte compatibilidad con la normalidad.
\(W\) entre 0,90 y 0,95 y \(p > 0{,}05\): desviación leve, probablemente no problemática para los contrastes paramétricos robustos.
\(W < 0{,}90\) o \(p \leq 0{,}05\): desviación significativa de la normalidad. Inspecciona el gráfico Q-Q para entender la naturaleza de la desviación (asimetría, colas pesadas, valores atípicos).

El gráfico Q-Q siempre aporta más información que el p-valor solo: muestra dónde se alejan los datos de la normalidad, no solo si lo hacen.

⚠️ Muestras grandes: el contraste se vuelve demasiado sensible

Para \(n > 100\), Shapiro-Wilk detecta desviaciones triviales de la normalidad que no tienen consecuencias prácticas para los contrastes paramétricos. Un conjunto de datos con \(n = 500\) puede dar \(W = 0{,}993\) y \(p = 0{,}012\), rechazando la normalidad aunque los datos sean esencialmente normales para cualquier propósito práctico.

Para muestras grandes, confía en el gráfico Q-Q y considera la robustez del contraste que vas a aplicar después. El contraste \(t\) y el ANOVA son bastante robustos frente a desviaciones leves de la normalidad cuando \(n\) es grande, gracias al TCL.

⚠️ Muestras pequeñas: el contraste tiene poca potencia

Para \(n < 15\), Shapiro-Wilk raramente rechaza \(H_0\) aunque los datos sean claramente no normales. Un resultado no significativo con muestras pequeñas es evidencia débil de normalidad. De nuevo, el gráfico Q-Q es esencial.

Realizar el contraste en R

El contraste está integrado en R base y no requiere paquetes adicionales:

shapiro.test(x)

La salida da \(W\) y el p-valor. Para una evaluación completa de la normalidad, complementa con un gráfico Q-Q:

qqnorm(x)
qqline(x)

El test de Shapiro-Wilk en R está limitado a muestras de entre 3 y 5.000 observaciones. Para \(n > 5{.}000\), usa el contraste de Anderson-Darling del paquete nortest: nortest::ad.test(x).

💡 Cuando se rechaza la normalidad: qué hacer a continuación

Rechazar \(H_0\) no significa automáticamente que los contrastes paramétricos sean inválidos. Considera:

La robustez del contraste siguiente: los contrastes \(t\) y ANOVA son bastante robustos frente a desviaciones leves de la normalidad para \(n \geq 30\).
Transformaciones: las transformaciones logarítmica, raíz cuadrada o Box-Cox a menudo normalizan datos con asimetría positiva.
Alternativas no paramétricas: Wilcoxon de rangos con signo en lugar del \(t\) de una muestra, Mann-Whitney en lugar del \(t\) de dos muestras, Kruskal-Wallis en lugar del ANOVA.
Métodos bootstrap: los intervalos de confianza y contrastes basados en remuestreo no requieren el supuesto de normalidad.

El objetivo no es conseguir un resultado no significativo en el test de Shapiro-Wilk, sino usar un método adecuado para la distribución real de tus datos.