Prerrequisitos recomendados
Siguiente en la ruta
Variables Instrumentales (2SLS)
Estimación consistente ante endogeneidad usando instrumentos exógenos
Conceptos formales
Causalidad
EconometriaRelacion en la que un cambio en la variable X produce directamente un cambio en la variable Y, en contraposicion a la mera correlacion estadistica. El marco de resultados potenciales de Rubin formaliza la causalidad como la diferencia entre dos estados del mundo: Y_i(1) bajo tratamiento e Y_i(0) bajo control. La identificacion causal requiere supuestos sobre la asignacion del tratamiento que deben justificarse teorica o institucionalmente.
Efecto de Tratamiento Promedio (ATE)
EconometriaPromedio del efecto causal individual $\tau_i = Y_i(1) - Y_i(0)$ en la poblacion completa. Se distingue del Efecto Promedio sobre los Tratados (ATT = $E[\tau_i | D_i = 1]$) y del LATE (Efecto Local Promedio del Tratamiento) estimado por variables instrumentales. Identificar el ATE requiere supuestos de soporte comun e ignorabilidad condicional, o asignacion aleatoria al tratamiento.
Endogeneidad
EconometriaSituacion en la que un regresor $x$ esta correlacionado con el termino de error $u$ del modelo, es decir, $E[u | x] \neq 0$. Sus fuentes principales son: variables omitidas correlacionadas con $x$, causalidad simultanea (simultaneidad), y error de medicion en los regresores. La endogeneidad produce estimadores MCO inconsistentes; la solucion mas comun es la estimacion por variables instrumentales o metodos de control del sesgo.
Propensity Score (Puntuacion de Propension)
EconometriaProbabilidad condicional de recibir el tratamiento dado un vector de covariables observables: $p(x) = P(D=1 | X=x)$. Rosenbaum y Rubin (1983) demostraron que, bajo el supuesto de ignorabilidad condicional ($Y(0), Y(1) \perp D | X$), los resultados potenciales son independientes del tratamiento al condicionar solo en $p(x)$. Se usa como base para matching, weighting (IPW) y estratificacion para estimar efectos causales observacionales.
Sesgo de Variable Omitida
EconometriaSesgo en el estimador MCO que surge cuando se excluye del modelo una variable que esta correlacionada tanto con los regresores incluidos como con la variable dependiente. Si la variable omitida $q$ satisface $\text{Cov}(x, q) \neq 0$ y $\gamma \neq 0$, el estimador de $\beta_1$ absorbe parte del efecto de $q$: $\text{plim}(\hat{\beta}_1) = \beta_1 + \gamma \cdot \delta$, donde $\delta = \text{Cov}(x,q)/\text{Var}(x)$. Este sesgo es la principal motivacion para usar instrumentos y disenios de investigacion.
Pregunta Central
¿Cómo podemos distinguir correlación de causalidad usando grafos causales?
🕸️ Mapa de Conexiones
📚 Ruta de Aprendizaje
Sugerimos estudiar estos modelos en orden para una comprensión completa.
🔗 Modelos Relacionados
💡 Conceptos Clave
Relación donde un cambio en X produce un cambio en Y, más allá de simple correlación
Estrategia econométrica para aislar el efecto causal de interés de factores confundidores
Cuando una variable explicativa está correlacionada con el término de error, sesgando OLS
📐 Ecuaciones Fundamentales
✅ Aplicaciones
- •Diseño de estrategias de identificación causal
- •Evaluación de políticas públicas
- •Análisis de sesgo de selección y confounding
⚠️ Limitaciones
- •Los DAGs requieren supuestos teóricos sobre la estructura causal
- •No siempre se puede testear la estructura del grafo
- •Modelos lineales pueden ser insuficientes
Sobre la Causalidad Econometrica y los DAGs
La inferencia causal es el objetivo central de la econometria moderna. Mientras que las correlaciones describen asociaciones entre variables, la causalidad responde a preguntas contrafactuales: ¿que pasaria con Y si intervenimos y cambiamos X? Los Grafos Aciclicos Dirigidos (DAGs) son la herramienta visual y formal para codificar supuestos causales y determinar si un efecto causal puede identificarse a partir de datos observacionales.
¿Que es un DAG?
Un Grafo Aciclico Dirigido codifica los supuestos causales del investigador sobre como se generan los datos.
- - Nodos: representan variables (observadas o no observadas)
- - Flechas: representan relaciones causales directas
- - Ausencia de flecha: implica independencia condicional
- - Aciclico: no existen ciclos (la causalidad no es circular)
Estrategias de Identificacion
Los DAGs permiten determinar que variables controlar para identificar efectos causales.
- - Criterio de puerta trasera: condicionar en variables que bloquean caminos espurios
- - Criterio de puerta delantera: usar mediadores cuando hay confundidores no observados
- - Variables instrumentales: explotar variacion exogena a traves de un instrumento
Elementos Fundamentales de un DAG
- Confundidor (fork): una causa comun de tratamiento y resultado (Z → X, Z → Y). No controlar por Z genera sesgo de variable omitida.
- Mediador (chain): una variable en el camino causal (X → M → Y). Controlar por M bloquea parte del efecto causal.
- Collider: un efecto comun (X → Z ← Y). Condicionar en un collider abre un camino espurio y genera sesgo de seleccion.
El Operador do() de Pearl
La diferencia clave entre asociacion y causalidad se formaliza con el operador do(). Mientras P(Y|X=x) describe la distribucion de Y cuando observamos X=x, P(Y|do(X=x)) describe la distribucion cuando intervenimos y fijamos X=x, eliminando todas las flechas que entran en X. Los DAGs permiten determinar cuando P(Y|do(X=x)) puede calcularse a partir de datos observacionales.
Aplicaciones en Economia
- Retornos a la educacion: la habilidad innata confunde la relacion educacion-salario
- Efecto de politicas publicas: factores no observados afectan tanto la asignacion del programa como el resultado
- Oferta y demanda: la simultaneidad genera endogeneidad; se necesitan instrumentos para identificacion
- Evaluacion de impacto: los DAGs guian la eleccion entre DID, IV, RDD y otros metodos
Conceptos Relacionados
Variables Instrumentales
Estrategia de identificacion cuando existe un instrumento valido representado en el DAG.
Diferencias en Diferencias
Metodo de inferencia causal que explota variacion temporal y entre grupos.
Regresion Discontinua
Identificacion causal usando un umbral de asignacion como fuente de variacion exogena.