Ejercicio - Chi-cuadrado
Objetivo: Resolver un contraste de bondad de ajuste (chi-cuadrado) frente a una Poisson especificada y practicar cálculo de media y representación gráfica.
Enunciado del problema
Debido al uso de varias herramientas de IA generativa, se ha preguntado a 100 estudiantes cuántas herramientas utilizan cada día y se ha obtenido la siguiente distribución de frecuencias:
Tabla de datos
| \(X_i\) (Herramientas) | 0 | 1 | 2 | 3 | 4 | 5 | 6 o más |
|---|---|---|---|---|---|---|---|
| \(O_i\) (Frecuencia) | 3 | 65 | 15 | 12 | 4 | 0 | 1 |
Tareas a realizar
- a) Realizar la representación gráfica de los datos.
- b) Calcular la media de la muestra.
- c) Contrastar si los datos proceden de una distribución de Poisson con parámetro \(\lambda=2\).
Soluciones
✨ Observación inicial
En la categoría "6 o más" se agrupan todas las observaciones con 6 o más herramientas. Para los cálculos de media y del contraste se tomará, por simplicidad, el valor 6 como representante del grupo "6 o más". Esto es una aproximación habitual; si se conoce la distribución exacta en la cola, conviene usarla.
a) Representación gráfica
Objetivo: visualizar la distribución muestral.
Tabla con barras (escala: barra máxima = 30 caracteres para la categoría con mayor frecuencia).
b) Media muestral
Calculamos la media muestral aproximando "6 o más" por 6.
Sea \(n=100\). Entonces
Calculamos el numerador:
Por tanto
Resultado: la media muestral aproximada es \(\bar{x}=1.53\).
c) Contraste: ¿Poisson(\(\lambda=2\))?
Planteamiento:
- Hipótesis nula \(H_0\): los datos provienen de una Poisson con \(\\lambda=2\).
- Usaremos un contraste de bondad de ajuste chi-cuadrado. Agrupamos las categorías en: \(0,1,2,3,4,\\ge 5\) para asegurar esperados adecuados.
Probabilidades teóricas (Poisson \(\lambda=2\)):
Calculamos las esperanzas teóricas \(E_k = n\,P(X=k)\) para \(k=0,1,2,3,4\) y la cola \(k\ge5\):
Usando \(e^{-2}\approx 0.1353352832\):
Tabla resumen (observadas \(O\), esperadas \(E\), contribución \(\dfrac{(O-E)^2}{E}\)):
| Categoría | \(O\) | \(E\) (aprox.) | \(\dfrac{(O-E)^2}{E}\) (aprox.) |
|---|---|---|---|
| 0 | 3 | 13.5335 | 8.20 |
| 1 | 65 | 27.0671 | 53.13 |
| 2 | 15 | 27.0671 | 5.38 |
| 3 | 12 | 18.0447 | 2.03 |
| 4 | 4 | 9.0224 | 2.80 |
| \(\ge5\) | 1 | 5.2653 | 3.46 |
| Total | 100 | 100 | 74.98 |
El estadístico de prueba chi-cuadrado es
Grados de libertad: \(g-1-m\), donde \(g\) = número de categorías (6) y \(m\) = número de parámetros estimados (0, porque \(\lambda\) está especificado). Así \(df=6-1-0=5\).
Comparación con la tabla: para \(\alpha=0.05\) la cuantía crítica \(\chi^2_{0.05,5}\approx 11.07\). Nuestro estadístico es mucho mayor (\(74.98\)), por lo que rechazamos \(H_0\).
Conclusión: con los datos observados hay evidencia muy fuerte para rechazar que la muestra provenga de una Poisson con \(\lambda=2\) (p-valor muy pequeño, \(p\ll0.001\)).
Comentario final: la mayor discrepancia está en la categoría 1 (observado 65 frente a ~27 esperado), lo que indica un sesgo hacia el uso de exactamente una herramienta por día en la muestra —la Poisson(2) no captura esa concentración.
Referencias relacionadas: UD6 — Contrastes de hipótesis