當前位置: 妍妍網 > 資訊

24暑期-因果推斷方法4天深度學習與套用

2024-06-06資訊

經濟學實證研究中

• 統計推斷的基本內容,線性回歸只是一種參數估計方法,MLE/GMM也是參數估計方法?

• 為什麽要考慮高維情形下的參數估計、變量選擇方法?

• OLS在估計什麽?和因果效應參數是什麽關系?

• 什麽是因果辨識?因果辨識和參數辨識的區別?

• 如何進行因果推斷,如何引入辨識條件?

• 如何選擇控制變量,基本的原則是什麽?

• 什麽是固定效應,如何加固定效應?

• 如果選擇工具變量,如何說明工具變量的有效性,應該如何思考獨立性和排除性假設?

• 如何利用自然實驗,包括工具變量、雙重差分、斷點回歸,來辨識因果效應?

• 在多期交錯政策(staggered)下,雙向固定效應方法(TWFE)在估計什麽,Goodman-Bacon分解如何判斷TWFE估計量的合理性。

• 在交錯政策下,事件研究法為何不能用,如果運用正確的方法,包括Callaway and Sant’Anna (2021)的非參數估計量和Wooldridge(2021)的回歸估計量。

• 如何進行因果中介分析?

探討因果關系是經濟學實證研究的主要目的,因果關系一般是無法觀測到的,我們只能觀測到相關性,如何從觀測到的相關性中推斷出因果效應?

基本有用的計量經濟學——因果推斷方法課程

將明確經濟學實證研究的基本步驟:

首先,定義清楚目標參數(causal estimand),其次,構造辨識策略,建立統計參數(statistical estimand),最後,構造估計量(estimator),得到目標參數的估計值。

由目標參數到統計參數,由觀測不到的因果效應轉變化可以觀測到的統計參數的過程,即因果推斷。利用樣本資訊構造估計量,估計統計參數,即統計推斷。

2024暑期 因果推斷第3期 精彩開講

開課時間: 2024年7月28-31日 (四天)

課程安排: 上午 9:00-12:00;下午 14:00-17:00; 課後答疑

授課方式: 北京現場,同步遠端直播(均提供全程錄播線上回放)

課程特色

1、 【基本有用的計量經濟學】(第2版)最新內容。進行了全面更新,對統計推斷和因果推斷進行了區分,對因果推斷和因果辨識進行了明確定義,並將估計方法和因果推斷區分開來,吸收了最近幾年各類方法的最新發展,並在統一的框架內進行詳細解構,讓讀者更容易掌握因果推斷的基本內容。

2、 講清楚 因果效應參數(causal estimands) 統計參數(statistical estimands) 統計量(estimators) 的區別。實證分析的第一步就是明確自己想回答的問題,定義清楚因果效應參數或 目標參數(target parameters) ,才能根據研究問題的背景資訊和先驗知識,構造辨識策略。

3、因果推斷的關鍵在於 分配機制(assignment mechanism) ,辨識策略主要是對分配機制的描述,透過引入合理的辨識條件,描述可能的分配機制,才能辨識出因果效應。理解了分配機制,也就理解了因果推斷的核心內容,對於匹配、IV、DID(SC)、RDD等具體的方法也就更容易理解。

4、引入高維情形下的統計推斷和因果推斷,以適應大數據實證的需要。並引入因果中介理論的介紹,討論如何使中介分析更加可信。

5、在實證分析中,原因變量(或核心解釋變量)和控制變量的地位是不同的,如何才能合理的選擇控制變量?控制變量越多越好嗎?選擇控制變量的基本原則是什麽?

6、如何選擇工具變量?如何思考工具變量的獨立性和排除性假設?如何合理化(justify)你的工具變量?

7、面板數據中固定效應是什麽,起著什麽作用,如何加固定效應?

8、估計方法和目標參數之間是什麽關系,關於交錯DID(staggered DID)的最新發展,充分反映了這一矛盾。OLS、TSLS、TWFE作為經濟學家常用的估計方法,很多時候並不能給研究者想要的目標參數,並不能回答作者想回答的問題。如何解決?

課程大綱

第1講 統計推斷

• 線性回歸、飽和模型、二元選擇模型、變異數估計

• 帶懲罰項的線性回歸:偏差—變異數權衡、交叉驗證法、自助法(bootstrap)

• Lasso、嶺回歸、Neyman正交、 Double Lasso

第2講 潛在結果框架

• RCM (Rubin Causal Model)

• 潛在結果

• 分配機制(treatment assignment)

• 因果效應參數(causal estimand)

• Lord悖論

• 因果辨識

• 回歸和因果辨識

第3講 因果圖

• 三種基本結構

• 後門標準

• 混雜偏差和樣本選擇偏差

• 什麽是好的控制變量和壞的控制變量

• *前門標準

• *do運算

第4講 隨機化實驗

• 隨機化實驗的作用

• 隨機化實驗為什麽是黃金標準?

• 隨機化實驗的分析

• Design-based和sampling-based變異數

案例:
班級規模與學習成績(Krueger, 1999),
種族與就業歧視(Bertrand and Mullainathan, 2004)、
競選中名字在選票中的位置優勢 (Ho and Imai, 2006)、

媒體的影響(Chen and Yang, 2019)

第5講 非混雜性條件下的因果效應估計

最基本的辨識條件是非混雜性 (unconfoundedness),也稱為條件獨立性假設 (CIA, Angrist and Pischke 2009),或根據觀測變量進行的選擇 (selection on the observables)或可忽略性 (ignorablity),是最基礎的分配機制。這類策略的關鍵是透過(匹配)設計,模擬隨機化實驗。

• 匹配、傾向指數匹配(PSM, Rosenbaum and Rubin, 1983; Abadie and Imbens, 2006)

• 逆機率加權(Inverse probability weighting, IPW)

• 回歸調整(regression adjustment)

• 雙重穩健估計(double robust estimator)

雙重機器學習(double/debiased machine learning)

案例:

培訓的效果 (Dehejia and Wahba, 1999)、

精英大學的作用 (Dale and Kreuger, 2002)

第6講 工具變量法

工具變量法在模擬非依從的隨機化實驗。

• 工具變量法的起源和基本思想

• 工具變量法的基本辨識條件

• 如何選擇工具變量,如何討論工具變量的外生性條件?

• 工具變量法的選擇和說服審稿人的辦法

• 異質性因果效應下的工具變量法——LATE(Imbens and Angrist, 1994: Angrist, Imbens and Rubin, 1996)

• 工具變量法和非依從的隨機化實驗(noncompliance RE)

• 基於選擇的工具變量法——Heckman兩步法

• *未觀測因素為基礎的選擇MTE——邊際幹預效應框架(Heckman and Vytlacil, 1999;2005)

案例:

出生季度和教育報酬(Angrist and Krueger, 1991),
參軍與收入(Angrist,1990)、
家庭規模和父母勞動供給(Angrist and Lavy, 1998)、
美國的教育報酬(Carneiro et al., 2011)、
全民兒童照護服務的收益(Cornelissen, Dustmann and Schonbrg, 2018)

第7講 固定效應方法

• 隨機效應模型

• 固定效應模型

• Hausman檢驗

• 固定效應是什麽

• 組內回歸(within regression)和虛擬變量回歸(LSDV)

• Stata命令reg、xtreg、areg、reghdfe的關系

案例:
雙胞胎數據估計中國教育報酬(Li, Liu and Zhang, 2012)

第8講 經典雙重差分法

雙重差分法在模擬增量上的隨機化實驗,線上性假設下,屬於固定效應模型。

• 共同/平行趨勢假設(Parallel/Common Trend Assumption)、無預期假設(no anticipation assumption)、無溢位效應假設(no spillover effects assumption)、共同區間假設(overlap assumption)

• 經典DID的因果辨識

• 經典DID的參數估計:回歸方法、PSM-DID(Heckman et al. 1997, 1998)、逆機率加權估計量(Abadie, 2005)、雙重穩健估計量(Sant’Anna and Zhao, 2020)

• 如何在回歸模型中引入不時變的協變量Xi和時變協變量Xit?

案列:
移民沖擊和薪資(Card, 1990)、
最低薪資調整和就業(Card and Krueger, 1994)、
911事件對美國辦公樓的影響(Abadie and Dermisi, 2008)、
大學擴招和大學生失業(邢春冰和李實,2011)

第9講 多期單一政策DID

經典DID的擴充套件,擴充套件到多期,仍然只有一個幹預組和一個控制組。

• 基本辨識條件:平行趨勢假設、無預期假設和無溢位效應假設的重新表述。

• 平行趨勢假設檢驗和動態模型構造(事件研究法設計)

• 平行趨勢檢驗方法和敏感性分析

• 以個體出生年份(cohort)構成的DID,有時也稱為cohort DID,並不是一種新的設計

案例:

茶葉價格和消失的女性(Qian, 2008)

馬鈴薯和人口及城市化(Nunn and Qian, 2011)

第10 講 DID-IV設計

• DID和IV的結合:不滿足平行趨勢時的新設計

• 基本辨識條件、因果辨識過程

• 三重差分法(DDD):一種特殊的工具變量法

• 基本辨識條件、因果辨識過程

案例:
印尼建校計畫對教育報酬的影響(Duflo, 2001)
強制福利對勞動力市場的影響(Gruber, 1994)

第11講 交錯DID(staggered DID)

個體是逐漸受到政策影響的,不再只有單純的幹預組和控制組兩組,而是有很多的幹預組和控制組,而幹預組被幹預的時點不同,用這樣的數據估計政策影響時,早期文獻仍然沿用第10講多期單一政策時的設計方法,采用雙向固定效應模型(TWFE)估計,但最新的文獻發現,在交錯政策時,如果存在組間異質性(Goodman-Bacon, 2021)和時間上異質性(Sun and Abraham, 2021)時,TWFE估計量存在著偏差,事件研究法存在著汙染偏差(Contamination bias)。

• 基本辨識條件的討論

• TWFE估計量在估計什麽(Goodman-Bacon, 2021; de Chaisemartin and D'Haultfoeuille, 2020)

Ø Goodman-Bacon分解

• 事件研究法存在的偏差(Sun and Abraham, 2021)

• 如果正確的估計因果效應:

Ø Callaway and Santa’Anna(2021)非參數估計量

Ø Wooldridge(2021)回歸估計量

案例:
大而壞的銀行:放松管制與收入分配(Beck et al., 2010; Baker et al., 2022)

第12講 合成控制法

• 缺失值填補(Borusyak et al., 2021; Liu et al., 2021)

• 合成控制法(Abadie et al., 2010)

• 合成雙重差分法(Arkhangelsky et al., 2021)

• 廣義合成控制法(Xu, 2017)

案例:

加州控煙法案的效果(Abadie et al., 2010);

德國統一的經濟影響(Abadie et al., 2015)

第13講 斷點回歸設計

最接近於完全隨機化實驗的研究設計,教育學家發明(Thistlethwaite and Compbell, 1960),作者認為價值不大,但被經濟學家挖掘出來,煥發異彩(Hahn et al. 2001)。本章討論RDD、Fuzzy RDD、Kink RDD的基本辨識條件、估計方法、頻寬選擇方法等。

• 精確斷點回歸設計:局部隨機化假設、連續性假設

• 模糊斷點回歸設計:工具變量法

• 彎折斷點回歸設計:導數上的斷點

案例:

美國政黨的在位優勢(Lee,2008)、

空氣汙染和壽命(Chen et al., 2013;Ebenstein et al., 2017)、

學區房的價值(Black, 1999)、

戶口的價值(Chen et al., 2019)。

第14講 因果中介分析

• 傳統中介分析理論

• 自然間接效應(中介效應)、自然直接效應、控制直接效應

• 因果中介效應的基本辨識條件:序貫可忽略性

• 工具變量因果中介模型

案例:

教育透過職業影響收入的因果中介分析

咨詢報名

劉老師

電話:18600211279

WeChat:jg-xs12

往期學員反饋

以上圖文為廣告內容