📋 Resumen Unidad 3: Variables Aleatorias

🎯 Conceptos Clave

Variables Aleatorias (VA): Funciones que asignan valores numéricos a resultados de experimentos aleatorios.

\[X: \Omega \to \mathbb{R}\]

🌳 Árbol de Decisión: Seleccionar Herramientas

flowchart LR
    Start["¿Qué tipo de variable?"] --> Discreta{"DISCRETA<br/>(valores contables)"}
    Start --> Continua{"CONTINUA<br/>(valores infinitos)"}

    Discreta --> D1["¿Necesitas P(X = x)?"]
    Discreta --> D2["¿Necesitas P(X ≤ x)?"]
    Discreta --> D3["¿Necesitas valor promedio?"]
    Discreta --> D4["¿Necesitas dispersión?"]

    D1 --> D1R["Usa: PMF<br/>p_X(x) = P(X = x)"]
    D2 --> D2R["Usa: CDF<br/>F_X(x) = P(X ≤ x)"]
    D3 --> D3R["Usa: Esperanza<br/>E[X] = Σ x·p(x)"]
    D4 --> D4R["Usa: Varianza<br/>Var(X) = E[X²] - (E[X])²"]

    Continua --> C1["¿Necesitas P(X = x)?"]
    Continua --> C2["¿Necesitas P(a < X < b)?"]
    Continua --> C3["¿Necesitas P(X ≤ x)?"]
    Continua --> C4["¿Necesitas valor promedio?"]
    Continua --> C5["¿Necesitas dispersión?"]

    C1 --> C1R["Respuesta: 0<br/>(siempre)"]
    C2 --> C2R["Usa: PDF<br/>P(a < X < b) = ∫[a,b] f(x)dx"]
    C3 --> C3R["Usa: CDF<br/>F_X(x) = P(X ≤ x)"]
    C4 --> C4R["Usa: Esperanza<br/>E[X] = ∫ x·f(x)dx"]
    C5 --> C5R["Usa: Varianza<br/>Var(X) = E[X²] - (E[X])²"]

    style Start fill:#e1f5ff
    style Discreta fill:#fff4e1
    style Continua fill:#e8f5e9
    style D1R fill:#ffe1e1
    style D2R fill:#ffe1e1
    style D3R fill:#ffe1e1
    style D4R fill:#ffe1e1
    style C1R fill:#e1ffe8
    style C2R fill:#e1ffe8
    style C3R fill:#e1ffe8
    style C4R fill:#e1ffe8
    style C5R fill:#e1ffe8

📊 Tabla Rápida de Herramientas

Herramienta	Variable	Cálculo	Uso
PMF	Discreta	$p_X(x) = P(X=x)$	Probabilidad exacta
CDF	Ambas	$F_X(x) = P(X \leq x)$	Probabilidad acumulada
PDF	Continua	$f_X(x) = dF/dx$	Densidad de probabilidad
Esperanza	Ambas	$E[X] = \sum xp(x)$ o $\int xf(x)dx$	Media/valor promedio
Varianza	Ambas	$\text{Var}(X) = E[X^2] - E[X]^2$	Dispersión respecto media
Desv. Típica	Ambas	$\sigma = \sqrt{\text{Var}(X)}$	Dispersión (unidades originales)

🔢 Fórmulas Esenciales

Probabilidad Fundamental

Concepto	Fórmula
Axioma aditividad	$P(A \cup B) = P(A) + P(B) - P(A \cap B)$
Complemento	$P(\overline{A}) = 1 - P(A)$
Condicional	$P(A\\|B) = \frac{P(A \cap B)}{P(B)}$
Independencia	$P(A \cap B) = P(A) \cdot P(B)$ si independientes

Variables Aleatorias

Operación	Fórmula
Linealidad esperanza	$E[aX + b] = aE[X] + b$
Suma esperanzas	$E[X + Y] = E[X] + E[Y]$
Varianza escalada	$\text{Var}(aX) = a^2 \text{Var}(X)$
Suma varianzas	$\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y)$ si independientes
Cálculo varianza	$\text{Var}(X) = E[X^2] - (E[X])^2$

Distribuciones

Distribución	PMF/PDF	Esperanza	Varianza
Bernoulli(p)	$p^x(1-p)^{1-x}$	$p$	$p(1-p)$
Binomial(n,p)	$\binom{n}{x}p^x(1-p)^{n-x}$	$np$	$np(1-p)$
Poisson(λ)	$\frac{λ^x e^{-λ}}{x!}$	$λ$	$λ$
Uniforme(a,b)	$\frac{1}{b-a}$	$\frac{a+b}{2}$	$\frac{(b-a)^2}{12}$
Normal(μ,σ)	$\frac{1}{\sqrt{2πσ^2}}e^{-\frac{(x-μ)^2}{2σ^2}}$	$μ$	$σ^2$

✅ Checklist de Aplicación

Cuando trabajes con variables aleatorias:

[ ] Identificar tipo: ¿Discreta o continua?
[ ] Definir soporte: ¿Cuáles son los valores posibles?
[ ] Elegir función: PMF/PDF, CDF según necesidad
[ ] Calcular medidas: Esperanza y varianza
[ ] Validar: ¿Suma a 1? ¿Está bien acotada?
[ ] Interpretar: ¿Tiene sentido el resultado?
[ ] Aplicar: ¿Qué herramienta de IA usar?

🚀 Flujo de Análisis Típico

flowchart TD
    A["1. DESCRIPCIÓN"] --> A1["Definir variable X,<br/>soporte, tipo"]
    A1 --> B["2. FUNCIÓN DE PROBABILIDAD"]
    B --> B1["Obtener PMF o PDF"]
    B1 --> C["3. MEDIDAS DESCRIPTIVAS"]
    C --> C1["Calcular E[X], Var(X), σ"]
    C1 --> D["4. ANÁLISIS DE RIESGO"]
    D --> D1["Percentiles,<br/>P(X > umbral), etc."]
    D1 --> E["5. APLICACIÓN IA/ML"]
    E --> E1["• Inicializar pesos (Xavier)"]
    E --> E2["• Aplicar Dropout"]
    E --> E3["• Crear clasificadores (Softmax)"]
    E --> E4["• Aumentar datos"]
    E --> E5["• Estimar incertidumbre"]

    style A fill:#e1f5ff
    style B fill:#fff4e1
    style C fill:#e8f5e9
    style D fill:#ffe8e1
    style E fill:#f3e1ff
    style A1 fill:#f0f9ff
    style B1 fill:#fffaf0
    style C1 fill:#f0faf1
    style D1 fill:#fff4f0
    style E1 fill:#faf0ff
    style E2 fill:#faf0ff
    style E3 fill:#faf0ff
    style E4 fill:#faf0ff
    style E5 fill:#faf0ff

🎓 Cuestiones Frecuentes

❓ P: ¿Por qué $P(X = x) = 0$ en continuas?

R: Los números reales son infinitos no numerables. La probabilidad de un punto exacto es infinitesimal.

❓ P: ¿Cuándo usar PMF y cuándo PDF?

R:

PMF: Variable discreta (conteos, categorías)
PDF: Variable continua (tiempo, temperatura, peso)

❓ P: ¿Varianza siempre positiva?

R: Sí, por definición $\text{Var}(X) = E[(X - \mu)^2] \geq 0$. Es cero solo si $X$ es constante.

❓ P: ¿Linealidad de varianza?

R: ⚠️ NO. $\text{Var}(X + Y) \neq \text{Var}(X) + \text{Var}(Y)$ en general. Solo si independientes.

❓ P: ¿Por qué inicializar pesos aleatoriamente?

R: Evita simetría. Si todos pesan igual, todas las neuronas aprenden lo mismo (red inútil).

❓ P: ¿Dropout solo en entrenamiento?

R: Sí. Durante predicción, usar todos los pesos (sin apagar neuronas).

🎯 Próximos Pasos

UD4: Distribuciones Importantes

Distribuciones discretas (Bernoulli, Binomial, Poisson)
Distribuciones continuas (Uniforme, Normal, Exponencial)
Distribuciones derivadas de la normal (χ², t, F)

UD5: Estimación y Métodos

Estimadores puntuales
Intervalos de confianza
Estimación máximo verosímil

📝 Resumen en Línea

Las variables aleatorias transforman la incertidumbre en números, permitiendo formalizarla matemáticamente. A través de PMF/PDF, CDF, esperanza y varianza, describimos cómo se distribuye la probabilidad, facilitando decisiones en IA/ML basadas en datos y cuantificación de riesgo.

🎓 Ejercicios Integrados

Nivel 1 (Conceptual)

Clasifica si son discretas o continuas:
Número de likes en Instagram
Tiempo entre tweets
Clasificación de sentimiento (Positivo/Negativo/Neutro)

Nivel 2 (Procedural)

Dado $X \sim \text{Bernoulli}(p=0.7)$, calcula:
$E[X]$
$\text{Var}(X)$
$\sigma_X$

Nivel 3 (Aplicado)

Una red neuronal tiene capas:
Entrada: 784 neuronas (MNIST)
Capa 1: 512 neuronas

¿Cuál es varianza Xavier para inicializar conexiones?

Respuestas

Clasificaciones:
- Likes: DISCRETA (conteo)
- Tiempo: CONTINUA (medida)
- Sentimiento: DISCRETA (categoría)
Bernoulli(p=0.7):
- $E[X] = 0.7$
- $\text{Var}(X) = 0.7 \times 0.3 = 0.21$
- $\sigma_X = \sqrt{0.21} \approx 0.458$
Xavier (784 → 512):

$$\sigma = \sqrt{\frac{2}{784 + 512}} = \sqrt{\frac{2}{1296}} \approx 0.0394$$

Distribución	PMF/PDF	Esperanza	Varianza
Bernoulli(p)	\(p^x(1-p)^{1-x}\)	\(p\)	\(p(1-p)\)
Binomial(n,p)	\(\binom{n}{x}p^x(1-p)^{n-x}\)	\(np\)	\(np(1-p)\)
Poisson(λ)	\(\frac{λ^x e^{-λ}}{x!}\)	\(λ\)	\(λ\)
Uniforme(a,b)	\(\frac{1}{b-a}\)	\(\frac{a+b}{2}\)	\(\frac{(b-a)^2}{12}\)
Normal(μ,σ)	\(\frac{1}{\sqrt{2πσ^2}}e^{-\frac{(x-μ)^2}{2σ^2}}\)	\(μ\)	\(σ^2\)

Herramienta	Variable	Cálculo	Uso
PMF	Discreta	\(p_X(x) = P(X=x)\)	Probabilidad exacta
CDF	Ambas	\(F_X(x) = P(X \leq x)\)	Probabilidad acumulada
PDF	Continua	\(f_X(x) = dF/dx\)	Densidad de probabilidad
Esperanza	Ambas	\(E[X] = \sum xp(x)\) o \(\int xf(x)dx\)	Media/valor promedio
Varianza	Ambas	\(\text{Var}(X) = E[X^2] - E[X]^2\)	Dispersión respecto media
Desv. Típica	Ambas	\(\sigma = \sqrt{\text{Var}(X)}\)	Dispersión (unidades originales)

Concepto	Fórmula
Axioma aditividad	\(P(A \cup B) = P(A) + P(B) - P(A \cap B)\)
Complemento	\(P(\overline{A}) = 1 - P(A)\)
Condicional	\(P(A\\|B) = \frac{P(A \cap B)}{P(B)}\)
Independencia	\(P(A \cap B) = P(A) \cdot P(B)\) si independientes

Operación	Fórmula
Linealidad esperanza	\(E[aX + b] = aE[X] + b\)
Suma esperanzas	\(E[X + Y] = E[X] + E[Y]\)
Varianza escalada	\(\text{Var}(aX) = a^2 \text{Var}(X)\)
Suma varianzas	\(\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y)\) si independientes
Cálculo varianza	\(\text{Var}(X) = E[X^2] - (E[X])^2\)