24暑期-因果推斷方法4天深度學習與套用

2024-06-06資訊

經濟學實證研究中

• 統計推斷的基本內容，線性回歸只是一種參數估計方法，MLE/GMM也是參數估計方法？

• 為什麽要考慮高維情形下的參數估計、變量選擇方法？

• OLS在估計什麽？和因果效應參數是什麽關系？

• 什麽是因果辨識？因果辨識和參數辨識的區別？

• 如何進行因果推斷，如何引入辨識條件？

• 如何選擇控制變量，基本的原則是什麽？

• 什麽是固定效應，如何加固定效應？

• 如果選擇工具變量，如何說明工具變量的有效性，應該如何思考獨立性和排除性假設？

• 如何利用自然實驗，包括工具變量、雙重差分、斷點回歸，來辨識因果效應？

• 在多期交錯政策(staggered)下，雙向固定效應方法(TWFE)在估計什麽，Goodman-Bacon分解如何判斷TWFE估計量的合理性。

• 在交錯政策下，事件研究法為何不能用，如果運用正確的方法，包括Callaway and Sant’Anna (2021)的非參數估計量和Wooldridge(2021)的回歸估計量。

• 如何進行因果中介分析？

探討因果關系是經濟學實證研究的主要目的，因果關系一般是無法觀測到的，我們只能觀測到相關性，如何從觀測到的相關性中推斷出因果效應？

基本有用的計量經濟學——因果推斷方法課程

將明確經濟學實證研究的基本步驟：

首先，定義清楚目標參數(causal estimand)，其次，構造辨識策略，建立統計參數(statistical estimand)，最後，構造估計量(estimator)，得到目標參數的估計值。

由目標參數到統計參數，由觀測不到的因果效應轉變化可以觀測到的統計參數的過程，即因果推斷。利用樣本資訊構造估計量，估計統計參數，即統計推斷。

2024暑期因果推斷第3期精彩開講

開課時間： 2024年7月28-31日 (四天)

課程安排： 上午 9:00-12:00；下午 14:00-17:00；課後答疑

授課方式： 北京現場，同步遠端直播（均提供全程錄播線上回放）

課程特色

1、【基本有用的計量經濟學】（第2版）最新內容。進行了全面更新，對統計推斷和因果推斷進行了區分，對因果推斷和因果辨識進行了明確定義，並將估計方法和因果推斷區分開來，吸收了最近幾年各類方法的最新發展，並在統一的框架內進行詳細解構，讓讀者更容易掌握因果推斷的基本內容。

2、講清楚 因果效應參數(causal estimands) 、 統計參數(statistical estimands) 和 統計量(estimators) 的區別。實證分析的第一步就是明確自己想回答的問題，定義清楚因果效應參數或 目標參數(target parameters) ，才能根據研究問題的背景資訊和先驗知識，構造辨識策略。

3、因果推斷的關鍵在於 分配機制(assignment mechanism) ，辨識策略主要是對分配機制的描述，透過引入合理的辨識條件，描述可能的分配機制，才能辨識出因果效應。理解了分配機制，也就理解了因果推斷的核心內容，對於匹配、IV、DID(SC)、RDD等具體的方法也就更容易理解。

4、引入高維情形下的統計推斷和因果推斷，以適應大數據實證的需要。並引入因果中介理論的介紹，討論如何使中介分析更加可信。

5、在實證分析中，原因變量（或核心解釋變量）和控制變量的地位是不同的，如何才能合理的選擇控制變量？控制變量越多越好嗎？選擇控制變量的基本原則是什麽？

6、如何選擇工具變量？如何思考工具變量的獨立性和排除性假設？如何合理化(justify)你的工具變量？

7、面板數據中固定效應是什麽，起著什麽作用，如何加固定效應？

8、估計方法和目標參數之間是什麽關系，關於交錯DID（staggered DID）的最新發展，充分反映了這一矛盾。OLS、TSLS、TWFE作為經濟學家常用的估計方法，很多時候並不能給研究者想要的目標參數，並不能回答作者想回答的問題。如何解決？

課程大綱

第1講統計推斷

• 線性回歸、飽和模型、二元選擇模型、變異數估計

• 帶懲罰項的線性回歸：偏差—變異數權衡、交叉驗證法、自助法(bootstrap)

• Lasso、嶺回歸、Neyman正交、 Double Lasso

第2講潛在結果框架

• RCM (Rubin Causal Model)

• 潛在結果

• 分配機制(treatment assignment)

• 因果效應參數(causal estimand)

• Lord悖論

• 因果辨識

• 回歸和因果辨識

第3講因果圖

• 三種基本結構

• 後門標準

• 混雜偏差和樣本選擇偏差

• 什麽是好的控制變量和壞的控制變量

• *前門標準

• *do運算

第4講隨機化實驗

• 隨機化實驗的作用

• 隨機化實驗為什麽是黃金標準？

• 隨機化實驗的分析

• Design-based和sampling-based變異數

案例：
班級規模與學習成績（Krueger, 1999），
種族與就業歧視（Bertrand and Mullainathan, 2004）、
競選中名字在選票中的位置優勢 (Ho and Imai, 2006)、

媒體的影響(Chen and Yang, 2019)

第5講非混雜性條件下的因果效應估計

最基本的辨識條件是非混雜性 (unconfoundedness)，也稱為條件獨立性假設 (CIA, Angrist and Pischke 2009)，或根據觀測變量進行的選擇 (selection on the observables)或可忽略性 (ignorablity)，是最基礎的分配機制。這類策略的關鍵是透過（匹配）設計，模擬隨機化實驗。

• 匹配、傾向指數匹配(PSM, Rosenbaum and Rubin, 1983; Abadie and Imbens, 2006)

• 逆機率加權(Inverse probability weighting, IPW)

• 回歸調整(regression adjustment)

• 雙重穩健估計(double robust estimator)

• 雙重機器學習(double/debiased machine learning)

案例：

培訓的效果 (Dehejia and Wahba, 1999)、

精英大學的作用 (Dale and Kreuger, 2002)

第6講工具變量法

工具變量法在模擬非依從的隨機化實驗。

• 工具變量法的起源和基本思想

• 工具變量法的基本辨識條件

• 如何選擇工具變量，如何討論工具變量的外生性條件？

• 工具變量法的選擇和說服審稿人的辦法

• 異質性因果效應下的工具變量法——LATE(Imbens and Angrist, 1994: Angrist, Imbens and Rubin, 1996)

• 工具變量法和非依從的隨機化實驗(noncompliance RE)

• 基於選擇的工具變量法——Heckman兩步法

• *未觀測因素為基礎的選擇MTE——邊際幹預效應框架(Heckman and Vytlacil, 1999;2005)

案例：

出生季度和教育報酬(Angrist and Krueger, 1991)，
參軍與收入(Angrist,1990)、
家庭規模和父母勞動供給(Angrist and Lavy, 1998)、
美國的教育報酬（Carneiro et al., 2011）、
全民兒童照護服務的收益(Cornelissen, Dustmann and Schonbrg, 2018)

第7講固定效應方法

• 隨機效應模型

• 固定效應模型

• Hausman檢驗

• 固定效應是什麽

• 組內回歸(within regression)和虛擬變量回歸(LSDV)

• Stata命令reg、xtreg、areg、reghdfe的關系

案例：
雙胞胎數據估計中國教育報酬(Li, Liu and Zhang, 2012)

第8講經典雙重差分法

雙重差分法在模擬增量上的隨機化實驗，線上性假設下，屬於固定效應模型。

• 共同/平行趨勢假設(Parallel/Common Trend Assumption)、無預期假設(no anticipation assumption)、無溢位效應假設(no spillover effects assumption)、共同區間假設(overlap assumption)

• 經典DID的因果辨識

• 經典DID的參數估計：回歸方法、PSM-DID（Heckman et al. 1997, 1998）、逆機率加權估計量(Abadie, 2005)、雙重穩健估計量(Sant’Anna and Zhao, 2020)

• 如何在回歸模型中引入不時變的協變量Xi和時變協變量Xit?

案列：
移民沖擊和薪資(Card, 1990)、
最低薪資調整和就業(Card and Krueger, 1994)、
911事件對美國辦公樓的影響(Abadie and Dermisi, 2008)、
大學擴招和大學生失業（邢春冰和李實，2011）

第9講多期單一政策DID

經典DID的擴充套件，擴充套件到多期，仍然只有一個幹預組和一個控制組。

• 基本辨識條件：平行趨勢假設、無預期假設和無溢位效應假設的重新表述。

• 平行趨勢假設檢驗和動態模型構造（事件研究法設計）

• 平行趨勢檢驗方法和敏感性分析

• 以個體出生年份(cohort)構成的DID，有時也稱為cohort DID，並不是一種新的設計

案例：

茶葉價格和消失的女性(Qian, 2008)

馬鈴薯和人口及城市化(Nunn and Qian, 2011)

第10 講 DID-IV設計

• DID和IV的結合：不滿足平行趨勢時的新設計

• 基本辨識條件、因果辨識過程

• 三重差分法(DDD)：一種特殊的工具變量法

• 基本辨識條件、因果辨識過程

案例：
印尼建校計畫對教育報酬的影響(Duflo, 2001)
強制福利對勞動力市場的影響(Gruber, 1994)

第11講交錯DID（staggered DID）

個體是逐漸受到政策影響的，不再只有單純的幹預組和控制組兩組，而是有很多的幹預組和控制組，而幹預組被幹預的時點不同，用這樣的數據估計政策影響時，早期文獻仍然沿用第10講多期單一政策時的設計方法，采用雙向固定效應模型(TWFE)估計，但最新的文獻發現，在交錯政策時，如果存在組間異質性(Goodman-Bacon, 2021)和時間上異質性(Sun and Abraham, 2021)時，TWFE估計量存在著偏差，事件研究法存在著汙染偏差(Contamination bias)。

• 基本辨識條件的討論

• TWFE估計量在估計什麽(Goodman-Bacon, 2021; de Chaisemartin and D'Haultfoeuille, 2020)

Ø Goodman-Bacon分解

• 事件研究法存在的偏差(Sun and Abraham, 2021)

• 如果正確的估計因果效應：

Ø Callaway and Santa’Anna(2021)非參數估計量

Ø Wooldridge(2021)回歸估計量

案例：
大而壞的銀行：放松管制與收入分配(Beck et al., 2010; Baker et al., 2022)

第12講合成控制法

• 缺失值填補(Borusyak et al., 2021; Liu et al., 2021)

• 合成控制法(Abadie et al., 2010)

• 合成雙重差分法(Arkhangelsky et al., 2021)