V de Cramér
El test chi-cuadrado de Pearson indica si una asociación entre dos variables categóricas es estadísticamente significativa. La V de Cramér indica cuán fuerte es esa asociación. Necesitas ambas.
Definición
La V de Cramér es una medida de la fuerza de asociación entre dos variables categóricas. Se deriva del estadístico chi-cuadrado y se normaliza para que siempre esté entre 0 y 1, independientemente del tamaño de la tabla de contingencia:
\[ V = \sqrt{\frac{\chi^2}{n \cdot (\min(r, c) - 1)}} \]
donde \(\chi^2\) es el estadístico chi-cuadrado de Pearson, \(n\) es el número total de observaciones, \(r\) es el número de filas y \(c\) el número de columnas de la tabla de contingencia.
- \(V = 0\): no hay asociación entre las variables.
- \(V = 1\): asociación perfecta (conocer una variable determina completamente la otra).
El denominador \(\min(r, c) - 1\) escala el estadístico de forma adecuada para tablas de distintos tamaños, por eso la V de Cramér es preferible a medidas más simples cuando la tabla tiene más de dos categorías en alguna de sus dimensiones.
Interpretación
Cohen (1988) propuso criterios para interpretar la V de Cramér que dependen de los grados de libertad \(df = \min(r,c) - 1\):
| \(df\) | Pequeño | Mediano | Grande |
|---|---|---|---|
| 1 | 0,10 | 0,30 | 0,50 |
| 2 | 0,07 | 0,21 | 0,35 |
| 3 | 0,06 | 0,17 | 0,29 |
| 4 | 0,05 | 0,15 | 0,25 |
Estos umbrales importan porque un \(V = 0{,}25\) en una tabla 2×2 es un efecto mediano-grande, mientras que el mismo valor en una tabla 5×5 es un efecto grande. Usar un único umbral universal para todos los tamaños de tabla es incorrecto.
Figure 1: V de Cramér para tablas de contingencia simuladas: desde asociación casi nula (azul) hasta asociación fuerte (rojo)
⚠️ Un test chi-cuadrado significativo no implica una asociación fuerte
Con muestras grandes, incluso una asociación real muy pequeña produce un estadístico chi-cuadrado muy significativo. Un estudio con (n = 10{.}000) puede dar (p < 0{,}001) con (V = 0{,}05), lo que es un efecto despreciable. Calcula siempre la V de Cramér junto al test chi-cuadrado, y reporta siempre tanto el p-valor como el tamaño del efecto.
Ejemplo paso a paso
Usando los datos de tabaco y cáncer de pulmón del post sobre chi-cuadrado:
| Cáncer de pulmón: Sí | Cáncer de pulmón: No | Total | |
|---|---|---|---|
| Fumador | 70 | 30 | 100 |
| No fumador | 20 | 80 | 100 |
| Total | 90 | 110 | 200 |
Del cálculo anterior, \(\chi^2 = 50{,}50\), \(n = 200\), \(r = 2\), \(c = 2\).
\[V = \sqrt{\frac{50{,}50}{200 \cdot (\min(2,2) - 1)}} = \sqrt{\frac{50{,}50}{200 \cdot 1}} = \sqrt{0{,}2525} \approx 0{,}502\]
Para una tabla 2×2 (\(df = 1\)), los criterios de Cohen son: pequeño = 0,10, mediano = 0,30, grande = 0,50. Un valor de \(V \approx 0{,}50\) indica una asociación grande entre el hábito tabáquico y el cáncer de pulmón en esta muestra.
Ejemplo 2: nivel educativo y preferencia de voto
Una encuesta a 300 votantes recoge el nivel educativo (3 categorías) y el partido político preferido (4 categorías). Tras construir la tabla de contingencia, el estadístico chi-cuadrado es \(\chi^2 = 24{,}7\).
\[V = \sqrt{\frac{24{,}7}{300 \cdot (\min(3,4) - 1)}} = \sqrt{\frac{24{,}7}{300 \cdot 2}} = \sqrt{\frac{24{,}7}{600}} \approx 0{,}203\]
Para una tabla 3×4 (\(df = \min(3,4) - 1 = 2\)), los criterios de Cohen son: pequeño = 0,07, mediano = 0,21, grande = 0,35. Un valor de \(V \approx 0{,}20\) está próximo al efecto mediano, lo que sugiere una asociación moderada entre el nivel educativo y la preferencia de voto.
Coeficiente phi vs V de Cramér
El coeficiente phi (\(\phi\)) es el caso especial de la V de Cramér para tablas 2×2:
\[\phi = \sqrt{\frac{\chi^2}{n}}\]
Para tablas 2×2, \(\min(r,c) - 1 = 1\), por lo que \(\phi = V\). Para tablas mayores de 2×2, phi ya no está acotada por 1 y pierde su interpretabilidad. La V de Cramér generaliza correctamente el coeficiente phi a cualquier tamaño de tabla.
💡 Qué medida usar
⚠️ La V de Cramér está sesgada con muestras pequeñas
Con muestras pequeñas ((n < 100)) o tablas con celdas escasas, la V de Cramér tiende a sobreestimar la asociación real en la población. Bergsma (2013) propuso una versión corregida del sesgo que se usa en estas situaciones. Si la muestra es pequeña, comprueba si tu software ofrece la versión corregida antes de reportar (V).