INICIO

Ley de la probabilidad total

La ley de la probabilidad total expresa la probabilidad de un evento como una media ponderada de sus probabilidades condicionadas en todos los escenarios posibles. Es la herramienta que convierte una probabilidad compleja y difícil de calcular en una suma de probabilidades condicionadas más sencillas.

Definición

Sean \(A_1, A_2, \ldots, A_n\) una partición del espacio muestral \(\Omega\): los eventos son mutuamente excluyentes (\(A_i \cap A_j = \emptyset\) para \(i \neq j\)) y exhaustivos (\(A_1 \cup A_2 \cup \cdots \cup A_n = \Omega\)). Para cualquier evento \(B\):

\[P(B) = \sum_{i=1}^{n} P(B \mid A_i) \cdot P(A_i)\]

La intuición: \(B\) solo puede ocurrir a través de uno de los escenarios \(A_i\). La probabilidad total de \(B\) es la suma de las probabilidades de que \(B\) ocurra a través de cada escenario, ponderada por la probabilidad de cada escenario.

Diagrama que muestra el evento B intersectando tres particiones A1, A2 y A3 del espacio muestral

El diagrama muestra a \(B\) cortando las tres celdas de la partición. La probabilidad total de \(B\) es la suma de las tres intersecciones sombreadas, cada una ponderada por la probabilidad de su celda.

⚠️ La partición debe ser exhaustiva y mutuamente excluyente

La ley solo funciona cuando \(A_1, \ldots, A_n\) cubren realmente todos los resultados posibles y no se solapan. Dos errores habituales:

Olvidar un escenario: si una fábrica tiene tres proveedores pero solo se condiciona sobre dos, la fórmula da el resultado incorrecto.
Categorías solapadas: si un paciente puede pertenecer a dos categorías de enfermedad simultáneamente, los \(A_i\) no son mutuamente excluyentes y la fórmula sobrecontabiliza.

Verifica siempre: ¿suman 1 los \(A_i\)? \(\sum_i P(A_i) = 1\) es una comprobación necesaria.

Caso de dos escenarios

La partición más sencilla es \(\{A, A^c\}\). La ley se reduce a:

\[P(B) = P(B \mid A) \cdot P(A) + P(B \mid A^c) \cdot P(A^c)\]

Esta es la forma que aparece con más frecuencia en los tests diagnósticos y los problemas de clasificación.

Test diagnóstico

Una enfermedad afecta al 2% de la población (\(P(E) = 0{,}02\)). Un test tiene:

Sensibilidad: \(P(+ \mid E) = 0{,}95\).
Especificidad: \(P(- \mid E^c) = 0{,}90\), por lo que \(P(+ \mid E^c) = 0{,}10\).

¿Qué fracción de la población da positivo?

\[P(+) = P(+ \mid E) \cdot P(E) + P(+ \mid E^c) \cdot P(E^c)\] \[= 0{,}95 \times 0{,}02 + 0{,}10 \times 0{,}98 = 0{,}019 + 0{,}098 = 0{,}117\]

Aproximadamente el 11,7% de la población da positivo, aunque solo el 2% tiene realmente la enfermedad. Este es el denominador necesario para aplicar el teorema de Bayes y obtener \(P(E \mid +)\).

Tres o más escenarios

Fabricación: tres proveedores

Una empresa obtiene componentes de tres proveedores:

El proveedor A suministra el 50% de los componentes, con una tasa de defectos del 3%.
El proveedor B suministra el 30%, con una tasa de defectos del 5%.
El proveedor C suministra el 20%, con una tasa de defectos del 8%.

¿Cuál es la tasa de defectos global?

\[P(\text{defecto}) = 0{,}03 \times 0{,}50 + 0{,}05 \times 0{,}30 + 0{,}08 \times 0{,}20\] \[= 0{,}015 + 0{,}015 + 0{,}016 = 0{,}046\]

La tasa de defectos global es del 4,6%. Nótese que el proveedor C aporta 0,016 al total a pesar de suministrar solo el 20% de los componentes, porque su tasa de defectos es mucho mayor.

Abandono de clientes: tres segmentos

Un servicio de suscripción tiene tres segmentos de clientes:

Usuarios premium (25% de la base): tasa de abandono mensual del 5%.
Usuarios estándar (50% de la base): tasa de abandono mensual del 15%.
Usuarios gratuitos (25% de la base): tasa de abandono mensual del 40%.

Tasa de abandono mensual global:

\[P(\text{abandono}) = 0{,}05 \times 0{,}25 + 0{,}15 \times 0{,}50 + 0{,}40 \times 0{,}25\] \[= 0{,}0125 + 0{,}075 + 0{,}10 = 0{,}1875\]

El 18,75% de todos los usuarios abandona cada mes. El nivel gratuito por sí solo representa \(0{,}10/0{,}1875 \approx 53\%\) de todos los usuarios que se van, aunque solo represente el 25% de la base.

Conexión con el teorema de Bayes

La ley de la probabilidad total es el denominador del teorema de Bayes. Combinando ambos:

\[P(A_i \mid B) = \frac{P(B \mid A_i) \cdot P(A_i)}{P(B)} = \frac{P(B \mid A_i) \cdot P(A_i)}{\displaystyle\sum_{j=1}^{n} P(B \mid A_j) \cdot P(A_j)}\]

La ley de la probabilidad total calcula \(P(B)\) para que el teorema de Bayes pueda actualizar las probabilidades de cada escenario \(A_i\) tras observar \(B\).

Aplicando ambas juntas: ¿qué proveedor envió la pieza defectuosa?

Usando el ejemplo de los proveedores anterior, se encuentra un componente defectuoso. ¿Cuál es la probabilidad de que viniera del proveedor C?

\[P(C \mid \text{defecto}) = \frac{P(\text{defecto} \mid C) \cdot P(C)}{P(\text{defecto})} = \frac{0{,}08 \times 0{,}20}{0{,}046} = \frac{0{,}016}{0{,}046} \approx 0{,}348\]

Aunque C solo suministra el 20% de los componentes, es responsable de aproximadamente el 35% de los defectos. La ley de la probabilidad total (0,046) es el ingrediente clave que hace posible este cálculo.

💡 Cuándo usar la ley de la probabilidad total

Úsala cuando:

\(P(B)\) es difícil de calcular directamente pero \(P(B \mid A_i)\) se conoce para cada escenario.
Tienes una mezcla de subpoblaciones con distintas tasas (tasas de defectos por proveedor, abandono por segmento, sensibilidad del test por estado de enfermedad).
Necesitas el denominador para el teorema de Bayes.

La ley es esencialmente una media ponderada: la probabilidad global de \(B\) es la media de las probabilidades condicionadas, ponderada por la probabilidad de cada condición.