Test chi-cuadrado de Pearson

El test chi-cuadrado de Pearson determina si dos variables categóricas están asociadas o si su distribución por categorías es la que cabría esperar por azar. Es uno de los tests más utilizados en estadística, y aparece en todo tipo de estudios, desde ensayos clínicos hasta investigaciones de mercado.

¿Qué es el test chi-cuadrado de Pearson?

Cuando se tienen dos variables categóricas y se quiere saber si están relacionadas, el test chi-cuadrado es la herramienta estándar. La idea es sencilla: si no hay asociación entre las variables, la distribución de una debería ser aproximadamente la misma en todas las categorías de la otra. El test compara lo que se ha observado realmente con lo que se esperaría ver bajo ese supuesto de independencia.

El estadístico del test es:

\[ \chi^2 = \sum_{i} \frac{(O_i - E_i)^2}{E_i} \]

donde \(O_i\) es la frecuencia observada en la celda \(i\) y \(E_i\) es la frecuencia esperada bajo la hipótesis nula de independencia.

Bajo la hipótesis nula, este estadístico sigue una distribución chi-cuadrado con grados de libertad:

\[df = (r - 1)(c - 1)\]

donde \(r\) es el número de filas y \(c\) el número de columnas de la tabla de contingencia.

Hipótesis

  • \(H_0\): las dos variables son independientes (no hay asociación).
  • \(H_1\): las dos variables están asociadas.

El test es siempre unilateral en el sentido de que valores grandes de \(\chi^2\) (cuando las frecuencias observadas difieren mucho de las esperadas) llevan al rechazo de \(H_0\).

Frecuencias esperadas

Bajo la hipótesis nula de independencia, la frecuencia esperada para cada celda es:

\[E_{ij} = \frac{\text{Total fila}_i \times \text{Total columna}_j}{n}\]

donde \(n\) es el tamaño total de la muestra. Esta fórmula proviene directamente de la definición de independencia en probabilidad: si \(X\) e \(Y\) son independientes, \(P(X = i, Y = j) = P(X = i) \cdot P(Y = j)\).

Ejemplo paso a paso

Un estudio de salud pública recoge datos de 200 personas, registrando su hábito tabáquico y si desarrollaron cáncer de pulmón:

Cáncer de pulmón: Sí Cáncer de pulmón: No Total fila
Fumador 70 30 100
No fumador 20 80 100
Total columna 90 110 200
Frecuencias observadas: los fumadores muestran una proporción de cáncer de pulmón mucho mayor que los no fumadores

Figure 1: Frecuencias observadas: los fumadores muestran una proporción de cáncer de pulmón mucho mayor que los no fumadores

Paso 1: calcular las frecuencias esperadas.

\[E_{11} = \frac{100 \times 90}{200} = 45, \quad E_{12} = \frac{100 \times 110}{200} = 55\]

\[E_{21} = \frac{100 \times 90}{200} = 45, \quad E_{22} = \frac{100 \times 110}{200} = 55\]

Cáncer: Sí Cáncer: No
Fumador \(O=70\), \(E=45\) \(O=30\), \(E=55\)
No fumador \(O=20\), \(E=45\) \(O=80\), \(E=55\)

Paso 2: calcular el estadístico del test.

\[\chi^2 = \frac{(70-45)^2}{45} + \frac{(30-55)^2}{55} + \frac{(20-45)^2}{45} + \frac{(80-55)^2}{55}\]

\[\chi^2 = \frac{625}{45} + \frac{625}{55} + \frac{625}{45} + \frac{625}{55} = 13{,}89 + 11{,}36 + 13{,}89 + 11{,}36 = 50{,}50\]

Paso 3: determinar los grados de libertad y el valor crítico.

\[df = (2-1)(2-1) = 1\]

Para \(df = 1\) y un nivel de significación de \(\alpha = 0{,}05\), el valor crítico es \(\chi^2_{0{,}05,\, 1} = 3{,}84\).

Paso 4: conclusión.

Como \(50{,}50 \gg 3{,}84\), rechazamos \(H_0\). Hay evidencia estadística sólida de una asociación entre el hábito tabáquico y la incidencia de cáncer de pulmón.

Distribución chi-cuadrado con 1 gl: el estadístico observado (50,5) cae muy lejos en la región de rechazo

Figure 2: Distribución chi-cuadrado con 1 gl: el estadístico observado (50,5) cae muy lejos en la región de rechazo

Un segundo ejemplo: preferencia de producto por género

Un equipo de marketing encuesta a 150 clientes sobre su producto preferido (A, B o C), divididos por género:

Producto A Producto B Producto C Total
Hombre 30 25 20 75
Mujer 20 35 20 75
Total 50 60 40 150

Frecuencias esperadas (p. ej. \(E_{11} = 75 \times 50 / 150 = 25\)):

Producto A Producto B Producto C
Hombre 25 30 20
Mujer 25 30 20

\[\chi^2 = \frac{(30-25)^2}{25} + \frac{(25-30)^2}{30} + \frac{(20-20)^2}{20} + \frac{(20-25)^2}{25} + \frac{(35-30)^2}{30} + \frac{(20-20)^2}{20}\]

\[\chi^2 = 1{,}00 + 0{,}83 + 0 + 1{,}00 + 0{,}83 + 0 = 3{,}67\]

\[df = (2-1)(3-1) = 2, \quad \chi^2_{0{,}05,\, 2} = 5{,}99\]

Como \(3{,}67 < 5{,}99\), no rechazamos \(H_0\). No hay evidencia significativa de que la preferencia de producto dependa del género en esta muestra.

Interpretar 'no rechazar H₀'

No rechazar la hipótesis nula no significa que las variables sean definitivamente independientes. Significa que los datos no aportan suficiente evidencia para concluir que están asociadas, dado el tamaño muestral y el nivel de significación elegidos. Con una muestra mayor, el mismo patrón de diferencias podría volverse estadísticamente significativo.

Example icon

Supuestos y limitaciones

⚠️ La regla de las frecuencias esperadas: mínimo de 5 por celda

El test chi-cuadrado de Pearson requiere que todas las frecuencias esperadas sean al menos 5. Si alguna celda tiene una frecuencia esperada inferior a 5, la aproximación chi-cuadrado falla y el p-valor deja de ser fiable. En ese caso, usa el test exacto de Fisher, que es válido para cualquier tamaño muestral y es la opción estándar para muestras pequeñas o tablas con celdas escasas.

Otros supuestos a comprobar:

  • Independencia de las observaciones: cada individuo debe aparecer en exactamente una celda. Los datos pareados o de medidas repetidas requieren tests distintos.
  • Muestreo aleatorio: los datos deben provenir de una muestra aleatoria de la población de interés.
  • Variables categóricas: el chi-cuadrado funciona con categorías nominales u ordinales, no con mediciones continuas.

⚠️ Asociación no implica causalidad

Un test chi-cuadrado significativo indica que las dos variables están asociadas en la muestra. No dice nada sobre la dirección del efecto, el tamaño del efecto, ni si una variable causa la otra. En el ejemplo del tabaco y el cáncer de pulmón, el test confirma la asociación, pero el vínculo causal requiere evidencia mucho más sólida proveniente del diseño del estudio, no del estadístico del test por sí solo.

💡 Medir la fuerza de la asociación

El estadístico chi-cuadrado indica si existe una asociación, pero no su fuerza. Para tablas 2×2, usa la phi (\(\phi\)): \(\phi = \sqrt{\chi^2 / n}\), que va de 0 a 1. Para tablas más grandes, usa la V de Cramér: \(V = \sqrt{\chi^2 / (n \cdot \min(r-1, c-1))}\). Ambas miden el tamaño del efecto de forma independiente al tamaño muestral.