Distribuciones continuas
Objetivo
✨ Dominar la distribución Normal (piedra angular de la estadística inferencial) y entender cuándo usar otras continuas como Exponencial, Uniforme.
Idea Clave 💡
La Normal es CENTRAL en estadística. Aparece en teoremas límite, intervalos de confianza, contrastes de hipótesis. Muchos procesos reales se distribuyen normalmente por ley natural: alturas, pesos, errores de medida. Dominarla es crítico para el examen.
Distribución Normal (Gaussiana)
Definición Matemática
Parámetros: media μ y desviación típica σ
Función de densidad:
Notación: \(X \sim N(\mu, \sigma^2)\) o \(X \sim N(\mu, \sigma)\)
Gráficamente: Campana simétrica centrada en μ, anchura determinada por σ.
Propiedades Fundamentales
- Simetría: Es simétrica alrededor de μ
- Unimodal: Un único pico en x = μ
- Media = Mediana = Moda = μ
- 68-95-99.7 (Regla Empírica):
- P(μ - σ < X < μ + σ) ≈ 0.68 (68%)
- P(μ - 2σ < X < μ + 2σ) ≈ 0.95 (95%)
- P(μ - 3σ < X < μ + 3σ) ≈ 0.997 (99.7%)
Ejemplo: Alturas de Estudiantes
Altura ~ N(170 cm, 5² cm²)
μ = 170 cm, σ = 5 cm
- 68% entre 165 y 175 cm
- 95% entre 160 y 180 cm
- 99.7% entre 155 y 185 cm
Estandarización (Tipificación)
Transformar cualquier Normal a N(0,1):
Ventajas:
- Una única tabla Z para TODAS las normales
- Z ~ N(0, 1) se llama distribución normal estándar
Ejemplo: Estandarizar Alturas
X ~ N(170, 5²), queremos P(X < 175)
Convertir a Z: $\(Z = \frac{175 - 170}{5} = 1\)$
P(X < 175) = P(Z < 1) ≈ 0.8413 (tabla Z)
Uso de Tabla Z
Tabla Z: Da P(Z < z) para valores z de 0 a 4 aprox.
| z | P(Z < z) |
|---|---|
| 0.00 | 0.5000 |
| 0.50 | 0.6915 |
| 1.00 | 0.8413 |
| 1.96 | 0.9750 |
| 2.00 | 0.9772 |
Críticos para el examen:
- z = 1.96: 95% confianza
- z = 2.576: 99% confianza
- z = 1.645: 90% confianza
Calcular P(a < X < b)
- Estandarizar: \(Z_a = \frac{a-\mu}{\sigma}\), \(Z_b = \frac{b-\mu}{\sigma}\)
- Buscar tabla: P(Z < Z_a) y P(Z < Z_b)
- Restar: P(a < X < b) = P(Z < Z_b) - P(Z < Z_a)
Cuándo Usarla
✅ USA NORMAL SI:
- Variable es continua
- Forma de campana (válida con test normalidad)
- Muchos factores pequeños afectan la variable (teorema central del límite)
- Procesos naturales: alturas, pesos, errores, tiempos
NO USES NORMAL SI:
- ❌ Datos tienen asimetría clara (sesgados)
- ❌ Hay outliers extremos
- ❌ Variable es claramente discreta (aunque n grande puede aproximarse)
- ❌ Rango limitado pero Normal permite negativos (ej: porcentajes de 0-100)
Distribución Exponencial
Definición
Parámetro: λ (tasa, λ > 0)
Función de densidad:
Media y Varianza:
Característica Unique: Sin Memoria
Propiedad de Pérdida de Memoria:
Interpretación: Si un evento no ha ocurrido en s unidades, la probabilidad de ocurrir en las próximas t unidades no depende de s.
Ejemplo: Vida de Componente
Vida útil ~ Exponencial(λ = 0.1 por año)
E[X] = 1/0.1 = 10 años
Si el componente ya ha durado 5 años, la probabilidad de durar 5 años más es igual a la de un componente nuevo durar 5 años (sin memoria).
Cuándo Usarla
✅ USA EXPONENCIAL SI:
- Modelar tiempo hasta un evento (fallo, llegada, degradación)
- Evento sigue proceso Poisson (relación: si conteos ~ Poisson(λ), tiempos entre eventos ~ Exponencial(λ))
- Interés en propiedad sin memoria
Ejemplo: Tiempos de Llegada
Clientes llegan con tasa Poisson λ = 3 por hora
Tiempo entre llegadas ~ Exponencial(λ = 3)
E[tiempo] = 1/3 hora ≈ 20 minutos
Otras Distribuciones Continuas
Distribución Uniforme
Parámetros: a, b (límites del intervalo)
Media: \((a+b)/2\) | Varianza: \((b-a)^2/12\)
Cuándo: Cuando no hay razón para pensar que unos valores son más probables que otros (máxima entropía).
Ejemplo: Hora de Llegada
Bus llega uniformemente entre 14:00 y 14:20
X ~ Uniforme(0, 20 minutos)
Distribución t de Student
Parámetro: grados de libertad (df)
Característica: Similar a Normal, pero con colas más pesadas. Cuando df → ∞, converge a Normal.
Uso: Inferencia con muestras pequeñas (Tema UD3).
Tabla Comparativa: Normal vs Exponencial
| Aspecto | Normal | Exponencial |
|---|---|---|
| Parámetros | μ (media), σ (desv) | λ (tasa) |
| Rango | (-∞, +∞) | [0, +∞) |
| Forma | Campana simétrica | Decreciente |
| Media | μ | 1/λ |
| Varianza | σ² | 1/λ² |
| Sin memoria | NO | SÍ |
| Ejemplo | Alturas, errores | Tiempos hasta fallo |
Diagrama de Decisión: ¿Qué Continua?
graph TD
A["¿Qué tipo de variable?"] -->|Campana simétrica<br/>muchos datos naturales| B["NORMAL<br/>μ, σ"]
A -->|Tiempo hasta evento<br/>sin memoria| C["EXPONENCIAL<br/>λ"]
A -->|Uniforme<br/>sin preferencia| D["UNIFORME<br/>a, b"]
A -->|Pequeña muestra<br/>Inferencia| E["t-STUDENT<br/>df"]
⚠️ Trampas Comunes
Trampa 1: Asumir Normalidad sin comprobar
❌ INCORRECTO: "Precio de casas" → Asumir Normal directamente
✅ CORRECTO: Hacer histograma, Q-Q plot, test Shapiro-Wilk. Los precios suelen ser sesgados (cola larga a la derecha).
Trampa 2: Olvidar estandarizar antes de tabla Z
❌ INCORRECTO: Buscar P(X < 175) directamente en tabla (tabla es solo para Z)
✅ CORRECTO: Primero Z = (175 - 170) / 5 = 1, luego P(Z < 1)
Trampa 3: Confundir Exponencial con Poisson
Poisson: Conteos (n de eventos en intervalo)
Exponencial: Tiempos entre eventos
Relación: Son conjugadas (duales). Si eventos siguen Poisson, tiempos siguen Exponencial.
Trampa 4: Aplicar z = 1.96 sin verificar confianza
El valor z = 1.96 es para 95% de confianza. Otros niveles requieren otros z:
- 90% → z ≈ 1.645
- 99% → z ≈ 2.576
💡 Checklist: Escoger Distribución Continua
Paso a Paso
- ¿Variable es continua? (sí → continúa)
- ¿Qué rango tiene?
- Negativos posibles → Normal
- Solo ≥ 0 → Exponencial, Uniforme, etc.
- ¿Qué forma esperada?
- Campana → Normal
- Decreciente → Exponencial
- Plana → Uniforme
- ¿Necesitas tabla/calculadora?
- Valores z para Normal
- Valores λ para Exponencial
📝 Ejercicios Prácticos
Práctica
- Pesos de adultos ~ N(70, 10²). P(peso < 90)? → Estandarizar y tabla Z
- Vida componente ~ Exp(λ=0.05 por año). P(dure >20 años)? → Usar e^(-λt)
- ¿Qué diferencia hay entre Normal y Exponencial?
📖 Enlaces Relacionados
- Variables aleatorias — Conceptos base
- Distribuciones discretas — Binomial y Poisson
- Estimación e intervalos — Cómo usar Normal en inferencia \(P(X<5)=1-e^{-0.1*5}=1-e^{-0.5}\approx 0.3935\).
Consejo: para normal usa tablas o funciones acumuladas (p.ej. Python scipy.stats).