当前位置: 欣欣网 > 资讯

24暑期-因果推断方法4天深度学习与应用

2024-06-06资讯

经济学实证研究中

• 统计推断的基本内容,线性回归只是一种参数估计方法,MLE/GMM也是参数估计方法?

• 为什么要考虑高维情形下的参数估计、变量选择方法?

• OLS在估计什么?和因果效应参数是什么关系?

• 什么是因果识别?因果识别和参数识别的区别?

• 如何进行因果推断,如何引入识别条件?

• 如何选择控制变量,基本的原则是什么?

• 什么是固定效应,如何加固定效应?

• 如果选择工具变量,如何说明工具变量的有效性,应该如何思考独立性和排除性假设?

• 如何利用自然实验,包括工具变量、双重差分、断点回归,来识别因果效应?

• 在多期交错政策(staggered)下,双向固定效应方法(TWFE)在估计什么,Goodman-Bacon分解如何判断TWFE估计量的合理性。

• 在交错政策下,事件研究法为何不能用,如果运用正确的方法,包括Callaway and Sant’Anna (2021)的非参数估计量和Wooldridge(2021)的回归估计量。

• 如何进行因果中介分析?

探讨因果关系是经济学实证研究的主要目的,因果关系一般是无法观测到的,我们只能观测到相关性,如何从观测到的相关性中推断出因果效应?

基本有用的计量经济学——因果推断方法课程

将明确经济学实证研究的基本步骤:

首先,定义清楚目标参数(causal estimand),其次,构造识别策略,建立统计参数(statistical estimand),最后,构造估计量(estimator),得到目标参数的估计值。

由目标参数到统计参数,由观测不到的因果效应转变化可以观测到的统计参数的过程,即因果推断。利用样本信息构造估计量,估计统计参数,即统计推断。

2024暑期 因果推断第3期 精彩开讲

开课时间: 2024年7月28-31日 (四天)

课程安排: 上午 9:00-12:00;下午 14:00-17:00; 课后答疑

授课方式: 北京现场,同步远程直播(均提供全程录播在线回放)

课程特色

1、 【基本有用的计量经济学】(第2版)最新内容。进行了全面更新,对统计推断和因果推断进行了区分,对因果推断和因果识别进行了明确定义,并将估计方法和因果推断区分开来,吸收了最近几年各类方法的最新发展,并在统一的框架内进行详细解构,让读者更容易掌握因果推断的基本内容。

2、 讲清楚 因果效应参数(causal estimands) 统计参数(statistical estimands) 统计量(estimators) 的区别。实证分析的第一步就是明确自己想回答的问题,定义清楚因果效应参数或 目标参数(target parameters) ,才能根据研究问题的背景信息和先验知识,构造识别策略。

3、因果推断的关键在于 分配机制(assignment mechanism) ,识别策略主要是对分配机制的描述,通过引入合理的识别条件,描述可能的分配机制,才能识别出因果效应。理解了分配机制,也就理解了因果推断的核心内容,对于匹配、IV、DID(SC)、RDD等具体的方法也就更容易理解。

4、引入高维情形下的统计推断和因果推断,以适应大数据实证的需要。并引入因果中介理论的介绍,讨论如何使中介分析更加可信。

5、在实证分析中,原因变量(或核心解释变量)和控制变量的地位是不同的,如何才能合理的选择控制变量?控制变量越多越好吗?选择控制变量的基本原则是什么?

6、如何选择工具变量?如何思考工具变量的独立性和排除性假设?如何合理化(justify)你的工具变量?

7、面板数据中固定效应是什么,起着什么作用,如何加固定效应?

8、估计方法和目标参数之间是什么关系,关于交错DID(staggered DID)的最新发展,充分反映了这一矛盾。OLS、TSLS、TWFE作为经济学家常用的估计方法,很多时候并不能给研究者想要的目标参数,并不能回答作者想回答的问题。如何解决?

课程大纲

第1讲 统计推断

• 线性回归、饱和模型、二元选择模型、方差估计

• 带惩罚项的线性回归:偏差—方差权衡、交叉验证法、自助法(bootstrap)

• Lasso、岭回归、Neyman正交、 Double Lasso

第2讲 潜在结果框架

• RCM (Rubin Causal Model)

• 潜在结果

• 分配机制(treatment assignment)

• 因果效应参数(causal estimand)

• Lord悖论

• 因果识别

• 回归和因果识别

第3讲 因果图

• 三种基本结构

• 后门标准

• 混杂偏差和样本选择偏差

• 什么是好的控制变量和坏的控制变量

• *前门标准

• *do运算

第4讲 随机化实验

• 随机化实验的作用

• 随机化实验为什么是黄金标准?

• 随机化实验的分析

• Design-based和sampling-based方差

案例:
班级规模与学习成绩(Krueger, 1999),
种族与就业歧视(Bertrand and Mullainathan, 2004)、
竞选中名字在选票中的位置优势 (Ho and Imai, 2006)、

媒体的影响(Chen and Yang, 2019)

第5讲 非混杂性条件下的因果效应估计

最基本的识别条件是非混杂性 (unconfoundedness),也称为条件独立性假设 (CIA, Angrist and Pischke 2009),或根据观测变量进行的选择 (selection on the observables)或可忽略性 (ignorablity),是最基础的分配机制。这类策略的关键是通过(匹配)设计,模拟随机化实验。

• 匹配、倾向指数匹配(PSM, Rosenbaum and Rubin, 1983; Abadie and Imbens, 2006)

• 逆概率加权(Inverse probability weighting, IPW)

• 回归调整(regression adjustment)

• 双重稳健估计(double robust estimator)

双重机器学习(double/debiased machine learning)

案例:

培训的效果 (Dehejia and Wahba, 1999)、

精英大学的作用 (Dale and Kreuger, 2002)

第6讲 工具变量法

工具变量法在模拟非依从的随机化实验。

• 工具变量法的起源和基本思想

• 工具变量法的基本识别条件

• 如何选择工具变量,如何讨论工具变量的外生性条件?

• 工具变量法的选择和说服审稿人的办法

• 异质性因果效应下的工具变量法——LATE(Imbens and Angrist, 1994: Angrist, Imbens and Rubin, 1996)

• 工具变量法和非依从的随机化实验(noncompliance RE)

• 基于选择的工具变量法——Heckman两步法

• *未观测因素为基础的选择MTE——边际干预效应框架(Heckman and Vytlacil, 1999;2005)

案例:

出生季度和教育回报(Angrist and Krueger, 1991),
参军与收入(Angrist,1990)、
家庭规模和父母劳动供给(Angrist and Lavy, 1998)、
美国的教育回报(Carneiro et al., 2011)、
全民儿童照护服务的收益(Cornelissen, Dustmann and Schonbrg, 2018)

第7讲 固定效应方法

• 随机效应模型

• 固定效应模型

• Hausman检验

• 固定效应是什么

• 组内回归(within regression)和虚拟变量回归(LSDV)

• Stata命令reg、xtreg、areg、reghdfe的关系

案例:
双胞胎数据估计中国教育回报(Li, Liu and Zhang, 2012)

第8讲 经典双重差分法

双重差分法在模拟增量上的随机化实验,在线性假设下,属于固定效应模型。

• 共同/平行趋势假设(Parallel/Common Trend Assumption)、无预期假设(no anticipation assumption)、无溢出效应假设(no spillover effects assumption)、共同区间假设(overlap assumption)

• 经典DID的因果识别

• 经典DID的参数估计:回归方法、PSM-DID(Heckman et al. 1997, 1998)、逆概率加权估计量(Abadie, 2005)、双重稳健估计量(Sant’Anna and Zhao, 2020)

• 如何在回归模型中引入不时变的协变量Xi和时变协变量Xit?

案列:
移民冲击和工资(Card, 1990)、
最低工资调整和就业(Card and Krueger, 1994)、
911事件对美国办公楼的影响(Abadie and Dermisi, 2008)、
大学扩招和大学生失业(邢春冰和李实,2011)

第9讲 多期单一政策DID

经典DID的扩展,扩展到多期,仍然只有一个干预组和一个控制组。

• 基本识别条件:平行趋势假设、无预期假设和无溢出效应假设的重新表述。

• 平行趋势假设检验和动态模型构造(事件研究法设计)

• 平行趋势检验方法和敏感性分析

• 以个体出生年份(cohort)构成的DID,有时也称为cohort DID,并不是一种新的设计

案例:

茶叶价格和消失的女性(Qian, 2008)

土豆和人口及城市化(Nunn and Qian, 2011)

第10 讲 DID-IV设计

• DID和IV的结合:不满足平行趋势时的新设计

• 基本识别条件、因果识别过程

• 三重差分法(DDD):一种特殊的工具变量法

• 基本识别条件、因果识别过程

案例:
印尼建校项目对教育回报的影响(Duflo, 2001)
强制福利对劳动力市场的影响(Gruber, 1994)

第11讲 交错DID(staggered DID)

个体是逐渐受到政策影响的,不再只有单纯的干预组和控制组两组,而是有很多的干预组和控制组,而干预组被干预的时点不同,用这样的数据估计政策影响时,早期文献仍然沿用第10讲多期单一政策时的设计方法,采用双向固定效应模型(TWFE)估计,但最新的文献发现,在交错政策时,如果存在组间异质性(Goodman-Bacon, 2021)和时间上异质性(Sun and Abraham, 2021)时,TWFE估计量存在着偏差,事件研究法存在着污染偏差(Contamination bias)。

• 基本识别条件的讨论

• TWFE估计量在估计什么(Goodman-Bacon, 2021; de Chaisemartin and D'Haultfoeuille, 2020)

Ø Goodman-Bacon分解

• 事件研究法存在的偏差(Sun and Abraham, 2021)

• 如果正确的估计因果效应:

Ø Callaway and Santa’Anna(2021)非参数估计量

Ø Wooldridge(2021)回归估计量

案例:
大而坏的银行:放松管制与收入分配(Beck et al., 2010; Baker et al., 2022)

第12讲 合成控制法

• 缺失值填补(Borusyak et al., 2021; Liu et al., 2021)

• 合成控制法(Abadie et al., 2010)

• 合成双重差分法(Arkhangelsky et al., 2021)

• 广义合成控制法(Xu, 2017)

案例:

加州控烟法案的效果(Abadie et al., 2010);

德国统一的经济影响(Abadie et al., 2015)

第13讲 断点回归设计

最接近于完全随机化实验的研究设计,教育学家发明(Thistlethwaite and Compbell, 1960),作者认为价值不大,但被经济学家挖掘出来,焕发异彩(Hahn et al. 2001)。本章讨论RDD、Fuzzy RDD、Kink RDD的基本识别条件、估计方法、带宽选择方法等。

• 精确断点回归设计:局部随机化假设、连续性假设

• 模糊断点回归设计:工具变量法

• 弯折断点回归设计:导数上的断点

案例:

美国政党的在位优势(Lee,2008)、

空气污染和寿命(Chen et al., 2013;Ebenstein et al., 2017)、

学区房的价值(Black, 1999)、

户口的价值(Chen et al., 2019)。

第14讲 因果中介分析

• 传统中介分析理论

• 自然间接效应(中介效应)、自然直接效应、控制直接效应

• 因果中介效应的基本识别条件:序贯可忽略性

• 工具变量因果中介模型

案例:

教育通过职业影响收入的因果中介分析

咨询报名

刘老师

电话:18600211279

WeChat:jg-xs12

往期学员反馈

以上图文为广告内容