Intervalo de confianza para una proporción

El intervalo de confianza para una proporción estima el rango de valores plausibles para la verdadera proporción poblacional \(p\). El intervalo de Wald estándar funciona bien para muestras grandes con \(p\) no demasiado extremo, pero el intervalo de Wilson es más fiable en general.

El intervalo de Wald

La fórmula más común para un IC al \((1-\alpha)\) para una proporción es el intervalo de Wald:

\[\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\]

donde \(\hat{p} = x/n\) es la proporción muestral y \(z_{\alpha/2}\) es el valor crítico de la normal estándar (1,96 para el 95%).

El margen de error es \(z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n}\).

Distribución muestral de la proporción muestral con el intervalo de confianza al 95% destacado

El intervalo de Wilson

El intervalo de Wilson funciona mejor que el de Wald cuando \(n\) es pequeño o \(p\) está cerca de 0 o 1. Su fórmula es:

\[\frac{\hat{p} + \frac{z^2}{2n} \pm z\sqrt{\frac{\hat{p}(1-\hat{p})}{n} + \frac{z^2}{4n^2}}}{1 + \frac{z^2}{n}}\]

donde \(z = z_{\alpha/2}\). Para una confianza del 95%, \(z = 1{,}96\).

⚠️ El intervalo de Wald puede fallar gravemente para n pequeño o p extremo

El intervalo de Wald requiere \(n\hat{p} \geq 10\) y \(n(1-\hat{p}) \geq 10\) para que la aproximación normal sea adecuada. Cuando estas condiciones no se cumplen:

  • Para \(\hat{p} = 0\) o \(\hat{p} = 1\), el intervalo de Wald colapsa a un único punto con amplitud cero, lo que es claramente incorrecto.
  • Para \(n\) pequeño y \(p\) cerca de 0 o 1, la cobertura real puede ser mucho menor que el nominal 95%.

El intervalo de Wilson evita estos problemas y se recomienda como opción por defecto en la mayoría de los contextos aplicados. Para \(n\) muy pequeño, el intervalo exacto de Clopper-Pearson (basado en la distribución binomial) es la opción más conservadora.

Comparación de los intervalos de Wald y Wilson al 95% para distintos valores de p con n=20

Ejemplos paso a paso

Ejemplo 1: tasa de defectos en fabricación

Una fábrica inspecciona 150 componentes y encuentra 12 defectuosos. Construye un IC al 95% para la tasa de defectos.

\[\hat{p} = \frac{12}{150} = 0{,}080, \qquad n = 150\]

Comprobación: \(n\hat{p} = 12 \geq 10\) y \(n(1-\hat{p}) = 138 \geq 10\). El intervalo de Wald es adecuado.

\[\text{EE} = \sqrt{\frac{0{,}080 \times 0{,}920}{150}} = \sqrt{0{,}000491} \approx 0{,}0221\]

\[\text{IC} = 0{,}080 \pm 1{,}96 \times 0{,}0221 = 0{,}080 \pm 0{,}043 = (0{,}037;\; 0{,}123)\]

La tasa de defectos se estima en el 8,0% (IC al 95%: 3,7% a 12,3%).

Ejemplo 2: tasa de respuesta en un ensayo clínico

En un ensayo con 80 pacientes, 28 responden al tratamiento. Construye un IC al 95% con ambos métodos.

\[\hat{p} = 28/80 = 0{,}350, \qquad n = 80\]

Intervalo de Wald:

\[\text{EE} = \sqrt{\frac{0{,}35 \times 0{,}65}{80}} \approx 0{,}0533\]

\[\text{IC}_{\text{Wald}} = 0{,}350 \pm 1{,}96 \times 0{,}0533 = (0{,}245;\; 0{,}455)\]

Intervalo de Wilson:

\[\text{centro} = \frac{0{,}350 + 1{,}96^2/160}{1 + 1{,}96^2/80} = \frac{0{,}374}{1{,}048} \approx 0{,}357\]

\[\text{IC}_{\text{Wilson}} \approx (0{,}251;\; 0{,}463)\]

Para este \(n\) y \(p\) moderados, ambos intervalos son similares. El de Wilson es ligeramente más amplio y está desplazado hacia 0,5.

Planificación del tamaño muestral

Para conseguir un margen de error de como máximo \(d\) con confianza \(1-\alpha\), resuelve para \(n\):

\[n \geq \frac{z_{\alpha/2}^2\, \hat{p}(1-\hat{p})}{d^2}\]

Si no se dispone de estimación previa de \(p\), usa \(\hat{p} = 0{,}5\), que maximiza \(\hat{p}(1-\hat{p}) = 0{,}25\) y da el tamaño muestral más conservador (mayor):

\[n \geq \frac{z_{\alpha/2}^2 \times 0{,}25}{d^2}\]

Cálculo del tamaño muestral

Una organización de encuestas quiere estimar una intención de voto con un margen de error de \(\pm 3\%\) al 95% de confianza. No se dispone de estimación previa de \(p\).

\[n \geq \frac{1{,}96^2 \times 0{,}25}{0{,}03^2} = \frac{3{,}8416 \times 0{,}25}{0{,}0009} = \frac{0{,}9604}{0{,}0009} \approx 1{.}068\]

Se necesita una muestra de al menos 1.068 personas. Si una encuesta previa sugería \(p \approx 0{,}35\):

\[n \geq \frac{1{,}96^2 \times 0{,}35 \times 0{,}65}{0{,}03^2} = \frac{3{,}8416 \times 0{,}2275}{0{,}0009} \approx 971\]

Usar la estimación previa ahorra unas 100 entrevistas.

Example icon

💡 Guía práctica para IC de proporciones

  • Usa el intervalo de Wald cuando \(n\hat{p} \geq 10\) y \(n(1-\hat{p}) \geq 10\).
  • Usa el intervalo de Wilson como opción por defecto: funciona en todos los casos y coincide con el de Wald para \(n\) grande.
  • Usa el intervalo exacto de Clopper-Pearson para \(n\) muy pequeño o cuando \(\hat{p} = 0\) o \(\hat{p} = 1\).
  • Para la planificación del tamaño muestral sin estimación previa, usa \(p = 0{,}5\).
  • Informa como: “\(\hat{p} = 0{,}35\) (IC al 95%: 0,25 a 0,46, \(n = 80\))”.