Resumen UD1
✨ Mapa Rápido de Conceptos UD1
graph LR
A["<b>UD1<br/>Estadística</b>"]
A --> B["<b>Descriptiva</b><br/>Resumir datos<br/>observados"]
A --> C["<b>Tipos de Datos</b><br/>Cualitativo vs<br/>Cuantitativo"]
A --> D["<b>Medidas</b><br/>Central, Dispersión,<br/>Posición"]
A --> E["<b>Visualización</b><br/>Gráficos y<br/>tablas"]
C --> C1["Cualitativo<br/>Nominal/<br/>Ordinal"]
C --> C2["Cuantitativo<br/>Discreto/<br/>Continuo"]
D --> D1["Central:<br/>Media, Mediana,<br/>Moda"]
D --> D2["Dispersión:<br/>Varianza, σ,<br/>Rango, IQR"]
D --> D3["Posición:<br/>Percentiles,<br/>Cuartiles"]
E --> E1["Histograma"]
E --> E2["Boxplot"]
E --> E3["Barras/Pastel"]
style A fill:#e1f5ff
style B fill:#fff3e0
style C fill:#f3e5f5
style D fill:#e8f5e9
style E fill:#fce4ec
🎯 Conceptos Clave en 1 Página
Estadística Descriptiva vs Inferencial
| Aspecto | Descriptiva | Inferencial |
|---|---|---|
| Objetivo | Resumir datos observados | Concluir sobre población |
| Datos | Muestra o población completa | Solo muestra |
| Técnicas | Media, gráficos, tablas | Intervalos, pruebas hipótesis |
| Pregunta típica | "¿Cuál es la media?" | "¿La media poblacional es > 5?" |
📊 Árbol de Decisión: Tipos de Datos
graph TD
Start["¿Qué tipo de dato tengo?"] --> Q1{"¿Es numérico?"}
Q1 -->|NO| Cualitativo["DATO CUALITATIVO"]
Q1 -->|SÍ| Cuantitativo["DATO CUANTITATIVO"]
Cualitativo --> Q2{"¿Tiene orden?"}
Q2 -->|NO| Nominal["NOMINAL<br/>Ej: color, género,<br/>marca"]
Q2 -->|SÍ| Ordinal["ORDINAL<br/>Ej: satisfacción,<br/>nivel educativo"]
Cuantitativo --> Q3{"¿Es contable?"}
Q3 -->|SÍ| Discreto["DISCRETO<br/>Ej: nº hijos,<br/>nº clientes"]
Q3 -->|NO| Continuo["CONTINUO<br/>Ej: altura,<br/>temperatura, tiempo"]
Nominal --> A1["Análisis:<br/>- Frecuencias<br/>- Moda<br/>- Gráfico barras"]
Ordinal --> A2["Análisis:<br/>- Frecuencias<br/>- Mediana<br/>- Gráfico barras"]
Discreto --> A3["Análisis:<br/>- Media, mediana<br/>- Varianza<br/>- Histograma"]
Continuo --> A4["Análisis:<br/>- Media, mediana<br/>- Desv. típica<br/>- Histograma, boxplot"]
📏 Escalas de Medición
graph LR
A["Escalas de Medición"] --> B["Nominal"]
A --> C["Ordinal"]
A --> D["Intervalo"]
A --> E["Razón"]
B --> B1["Solo categorías<br/>NO orden<br/>Ej: color"]
C --> C1["Categorías + orden<br/>NO distancia igual<br/>Ej: ranking"]
D --> D1["Orden + distancia<br/>NO cero absoluto<br/>Ej: temperatura °C"]
E --> E1["Orden + distancia<br/>+ cero absoluto<br/>Ej: peso, altura"]
style B fill:#ffcccc
style C fill:#ffe6cc
style D fill:#ffffcc
style E fill:#ccffcc
📐 Medidas de Tendencia Central
| Medida | Fórmula | Cuándo usar | Ventajas | Desventajas |
|---|---|---|---|---|
| Media | \(\bar{x} = \frac{\sum x_i}{n}\) | Datos simétricos sin outliers | Usa todos los datos | Sensible a outliers |
| Mediana | Valor central ordenado | Datos con outliers o asimétricos | Robusta a outliers | Ignora valores extremos |
| Moda | Valor más frecuente | Datos categóricos | Fácil de entender | Puede no existir o no ser única |
📊 Medidas de Dispersión
| Medida | Fórmula | Interpretación |
|---|---|---|
| Varianza | \(s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}\) | Dispersión promedio al cuadrado |
| Desv. Típica | \(s = \sqrt{s^2}\) | Dispersión en unidades originales |
| Rango | \(R = \max(x) - \min(x)\) | Amplitud total de los datos |
| IQR | \(IQR = Q_3 - Q_1\) | Rango del 50% central |
| Coef. Variación | \(CV = \frac{s}{\bar{x}} \times 100\%\) | Dispersión relativa (comparar datasets) |
⚠️ Cuidado con la Varianza
- Varianza poblacional: divide por \(n\)
- Varianza muestral: divide por \(n-1\) (corrección de Bessel)
- Usa \(n-1\) cuando calculas de una muestra para inferir sobre población
📦 Visualización: Guía Rápida
graph TD
Start["¿Qué quiero visualizar?"] --> Q1{"Tipo de dato"}
Q1 -->|Cualitativo| G1["Gráfico de Barras<br/>o Pastel"]
Q1 -->|Cuantitativo| Q2{"¿Una variable<br/>o relación?"}
Q2 -->|Una variable| Q3{"¿Distribución<br/>o resumen?"}
Q2 -->|Dos+ variables| G4["Scatterplot<br/>o Líneas"]
Q3 -->|Distribución| G2["Histograma"]
Q3 -->|Resumen| G3["Boxplot"]
G1 --> R1["Muestra frecuencias<br/>por categoría"]
G2 --> R2["Muestra forma<br/>de distribución"]
G3 --> R3["Muestra Q1, Q2, Q3<br/>y outliers"]
G4 --> R4["Muestra correlación<br/>o tendencia"]
[tabla de representacion grafica]
| Nombre gráfica | Tipo de datos | Puntos claves |
|---|---|---|
| Gráfico de barras | Cualitativa (nominal / ordinal) |
|
| Gráfico de sectores (pastel) | Cualitativa (proporciones) |
|
| Histograma | Cuantitativa (continua / discreta) |
|
| Boxplot (diagrama de caja) | Cuantitativa |
|
| Gráfico de densidad (Kernel) | Cuantitativa |
|
| Gráfico de dispersión (scatter) | Dos variables cuantitativas |
|
🔑 Fórmulas Esenciales
Media Aritmética
Varianza Muestral
Desviación Típica
Coeficiente de Variación
Percentil k
Valor que deja el \(k\%\) de datos por debajo. Ejemplo: \(P_{75} = Q_3\) (tercer cuartil).
✅ Checklist del Análisis Descriptivo
Pasos para analizar un dataset
- Identificar tipo de datos
- ¿Cualitativos o cuantitativos?
-
¿Discretos o continuos?
-
Limpiar datos
- Detectar y tratar valores faltantes
-
Identificar y manejar outliers
-
Calcular medidas de tendencia central
-
Media, mediana, moda
-
Calcular medidas de dispersión
-
Varianza, desviación típica, IQR
-
Visualizar
- Histograma o boxplot para cuantitativos
-
Barras para cualitativos
-
Interpretar
- ¿Los datos son simétricos o sesgados?
- ¿Hay outliers significativos?
- ¿Qué historia cuentan los datos?
🎓 Errores Comunes a Evitar
❌ Errores frecuentes
- Usar media con outliers extremos
-
Solución: usar mediana
-
Comparar desviaciones típicas de datasets con medias muy diferentes
-
Solución: usar coeficiente de variación (CV)
-
Confundir varianza poblacional (divide por n) con muestral (divide por n-1)
-
Solución: memoriza que muestral usa n-1
-
Interpretar correlación como causalidad
-
Solución: recordar que correlación ≠ causalidad
-
Elegir gráfico incorrecto para el tipo de dato
- Solución: usar árbol de decisión de visualización
📚 Relación con Otras Unidades
graph LR
UD1["UD1:<br/>Estadística<br/>Descriptiva"] --> UD2["UD2:<br/>Probabilidad"]
UD2 --> UD3["UD3:<br/>Inferencia"]
UD1 --> UD7["UD7:<br/>R/RStudio"]
style UD1 fill:#e1f5ff
style UD2 fill:#fff3e0
style UD3 fill:#f3e5f5
style UD7 fill:#e8f5e9
UD1 es la base: Necesitas dominar los conceptos descriptivos antes de avanzar a probabilidad e inferencia.
🚀 Para Profundizar
- Tipos de datos — Clasificación detallada
- Medidas de tendencia y dispersión — Fórmulas y ejemplos
- Escalas de medición — Nominal, ordinal, intervalo, razón
- Representación visual — Guía de gráficos
- Ejercicios UD1 — Práctica con soluciones