INICIO

Eventos independientes

Dos eventos son independientes cuando saber que uno ha ocurrido no aporta ninguna información sobre si el otro ha ocurrido. La independencia es una propiedad del modelo probabilístico, no solo del contexto físico, y debe verificarse en lugar de asumirse.

Definición

Los eventos \(A\) y \(B\) son independientes si y solo si:

\[P(A \cap B) = P(A) \times P(B)\]

Una condición equivalente: \(A\) y \(B\) son independientes si y solo si \(P(A \mid B) = P(A)\), es decir, saber que \(B\) ha ocurrido no cambia la probabilidad de \(A\). Ambas formulaciones dicen lo mismo.

Para que \(n\) eventos \(A_1, A_2, \ldots, A_n\) sean mutuamente independientes, la regla del producto debe cumplirse para todo subconjunto:

\[P(A_i \cap A_j) = P(A_i)P(A_j) \quad \text{para todo } i \neq j\] \[P(A_i \cap A_j \cap A_k) = P(A_i)P(A_j)P(A_k) \quad \text{para todo } i < j < k\] \[\vdots\] \[P(A_1 \cap \cdots \cap A_n) = P(A_1) \cdots P(A_n)\]

Todas las \(2^n - n - 1\) condiciones deben cumplirse simultáneamente.

Cómo verificar la independencia

El test formal es directo: calcula \(P(A \cap B)\), \(P(A)\) y \(P(B)\), y comprueba si \(P(A \cap B) = P(A) \times P(B)\).

Verificar la independencia: interacción con correos electrónicos

Un análisis de 1.000 suscriptores de correo electrónico encuentra:

	Hizo clic	No hizo clic	Total
Abrió el correo	180	220	400
No lo abrió	120	480	600
Total	300	700	1.000

Sea \(A\) = abrió el correo, \(C\) = hizo clic.

\[P(A) = 400/1000 = 0{,}40, \quad P(C) = 300/1000 = 0{,}30\] \[P(A \cap C) = 180/1000 = 0{,}18\]

Test: \(P(A) \times P(C) = 0{,}40 \times 0{,}30 = 0{,}12 \neq 0{,}18\)

Los eventos no son independientes: los suscriptores que abrieron el correo tienen mucha más probabilidad de hacer clic que los que no lo abrieron. \(P(C \mid A) = 180/400 = 0{,}45 \neq 0{,}30 = P(C)\).

Verificar la independencia: dos máquinas

Una fábrica tiene dos máquinas en líneas separadas sin componentes compartidos. La máquina A falla con probabilidad 0,04 y la máquina B con probabilidad 0,03. En 10.000 días de producción, ambas fallaron en 12 días.

\[P(A \cap B) = 12/10000 = 0{,}0012\] \[P(A) \times P(B) = 0{,}04 \times 0{,}03 = 0{,}0012 \checkmark\]

Los fallos son independientes, lo cual es coherente con que las máquinas no comparten componentes ni causas comunes.

Mapa de calor comparando frecuencias observadas y esperadas bajo independencia para dos tablas de contingencia

En el panel izquierdo (independientes), las frecuencias observadas y esperadas coinciden: todas las celdas se acercan al blanco (cociente \(\approx 1\)). En el panel derecho (dependientes), la celda superior izquierda (tanto \(A\) como \(B\)) es azul (observado > esperado) mientras que la inferior izquierda (no \(A\), pero \(B\)) es roja (observado < esperado), revelando la estructura de dependencia.

Conceptos erróneos habituales

Independencia vs incompatibilidad

⚠️ Los eventos incompatibles con probabilidad positiva nunca son independientes

Si \(A\) y \(B\) son mutuamente excluyentes (\(A \cap B = \emptyset\)), entonces \(P(A \cap B) = 0\). Para que fueran independientes necesitaríamos \(P(A) \times P(B) = 0\), lo que requiere que al menos uno tenga probabilidad cero.

Intuitivamente: si \(A\) y \(B\) no pueden ocurrir los dos, saber que \(A\) ocurrió te indica de inmediato que \(B\) no ocurrió. Eso es lo contrario de la independencia.

Ejemplo: en una sola petición a un servidor, los eventos “tiempo de respuesta inferior a 100 ms” y “tiempo de respuesta superior a 500 ms” son mutuamente excluyentes. Si sabes que la respuesta fue rápida, sabes que no fue lenta. Son máximamente dependientes, no independientes.

Independencia vs correlación cero

⚠️ Correlación cero no implica independencia

Dos variables aleatorias (o eventos) pueden estar incorreladas y seguir siendo dependientes. El ejemplo clásico: sea \(X \sim \text{Uniforme}(-1, 1)\) e \(Y = X^2\). Entonces \(\text{Cov}(X, Y) = 0\) (correlación cero), pero \(Y\) está completamente determinada por \(X\): son máximamente dependientes.

Para eventos en particular: dos eventos pueden tener \(P(A \cap B) \neq P(A) \times P(B)\) aunque su “correlación” coloquial parezca baja. Usa siempre el test formal de independencia, no la intuición sobre la correlación.

Independencia par a par vs independencia mutua

Tres eventos pueden ser independientes dos a dos pero no mutuamente independientes. Un ejemplo clásico (Bernstein):

Considera dos lanzamientos de una moneda equilibrada. Define:

\(A\) = el primer lanzamiento es cara.
\(B\) = el segundo lanzamiento es cara.
\(C\) = exactamente uno de los lanzamientos es cara.

Entonces \(P(A) = P(B) = P(C) = 0{,}5\), y:

\(P(A \cap B) = 0{,}25 = P(A)P(B)\) ✓
\(P(A \cap C) = 0{,}25 = P(A)P(C)\) ✓
\(P(B \cap C) = 0{,}25 = P(B)P(C)\) ✓

Pero \(P(A \cap B \cap C) = 0 \neq 0{,}5^3 = 0{,}125\). Los tres eventos son independientes par a par pero no mutuamente independientes.

Ejemplos reales

Fiabilidad de un sistema

Un sistema crítico tiene tres servidores de respaldo independientes. Cada servidor está disponible con probabilidad 0,95. El sistema funciona si al menos un servidor está disponible.

\[P(\text{todos fallan}) = (1 - 0{,}95)^3 = 0{,}05^3 = 0{,}000125\]

\[P(\text{sistema funciona}) = 1 - 0{,}000125 = 0{,}999875\]

La independencia está justificada aquí porque los servidores están físicamente separados y no comparten fuente de alimentación ni componentes de red.

Ensayo clínico con dos variables de resultado

Un ensayo clínico mide dos variables: reducción de la presión arterial (\(A\)) y reducción del colesterol (\(B\)). Tras el análisis:

\[P(A) = 0{,}60, \quad P(B) = 0{,}45, \quad P(A \cap B) = 0{,}27\]

Test: \(P(A) \times P(B) = 0{,}60 \times 0{,}45 = 0{,}27 = P(A \cap B)\)

Las dos variables de resultado son independientes en este ensayo: si un paciente responde en la presión arterial, eso no aporta información sobre su respuesta en el colesterol. Este hallazgo tiene implicaciones para el mecanismo de acción del fármaco.

Seguridad de contraseñas

Una contraseña debe superar tres comprobaciones de seguridad independientes: longitud (\(L\)), caracteres especiales (\(C\)) y que no aparezca en una lista conocida (\(N\)). Cada comprobación se supera con probabilidad 0,8 de forma independiente.

\[P(\text{supera todas}) = 0{,}8^3 = 0{,}512\]

\[P(\text{falla al menos una}) = 1 - 0{,}512 = 0{,}488\]

Casi la mitad de todas las contraseñas falla al menos una comprobación.

💡 ¿Cuándo es razonable asumir independencia?

La independencia es una elección de modelización. Es razonable cuando:

Los eventos surgen de procesos físicamente separados sin componentes ni causas compartidas.
Las observaciones se extraen aleatoriamente de una población grande (muestreo con reemplazamiento, o sin reemplazamiento de una población muy grande).
Los ensayos se repiten en condiciones idénticas y sin interacción entre ellos.

No es razonable cuando los eventos comparten una causa común (dos máquinas del mismo lote), cuando los resultados se influyen mutuamente (una enfermedad que se propaga entre personas en contacto) o cuando se muestrea sin reemplazamiento de una población pequeña.