中文字幕欧美乱伦|手机AV永久免费|澳门堵场日韩精品|日本性爱欧美激情|蜜桃狠狠狠狠狠狠狠狠狠|成人免费视频 国|欧美国产麻豆婷婷|99久久久国产精品福利姬喷水|婷婷内射精品视频|日本欧洲一区二区

澎湃Logo
下載客戶端

登錄

  • +1

諾獎編譯 | 更好研究設(shè)計如何規(guī)避計量經(jīng)濟學(xué)弊端?實證經(jīng)濟學(xué)的可信度變革

2022-05-14 09:43
來源:澎湃新聞·澎湃號·湃客
字號

原創(chuàng) 木 海 PoIiticaI理論志

實證經(jīng)濟學(xué)的可信度變革:更好研究設(shè)計如何規(guī)避計量經(jīng)濟學(xué)弊端?

編者按:

本文作者約書亞·安格里斯特是2021年諾貝爾經(jīng)濟學(xué)獎獲得者,本文發(fā)表于Journal of Economic Perspectives并對實證經(jīng)濟學(xué)自1980年代起發(fā)展的回顧。本文側(cè)重介紹研究設(shè)計對于增加經(jīng)濟學(xué)實證研究可靠性的改善,學(xué)者通過反思計量經(jīng)濟學(xué)研究中常見的通過不嚴謹?shù)亩糠治龅贸霾豢煽康慕Y(jié)論的陷阱,總結(jié)經(jīng)濟學(xué)的主要領(lǐng)域中的發(fā)展和局限性,是經(jīng)濟學(xué)方法論綜述的經(jīng)典篇目。

學(xué)人簡介:

Joshua D. Angrist (約書亞·安格里斯特), MIT Ford Professor of Economics

J?rn-Steffen Pischke, LSE Professor of Economics

文獻來源:

Angrist, Joshua D., and J?rn-Steffen Pischke. 2010. "The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics." Journal of Economic Perspectives, 24 (2): 3-30.

作者 Joshua D. Angrist

著名經(jīng)濟學(xué)家Edward Leamer 在1983年曾對經(jīng)濟學(xué)的實證工作提出批判,認為計量經(jīng)濟學(xué)的種種以看似可靠的實證過程得出結(jié)論的“騙術(shù)”應(yīng)被盡快拋棄。本文意在回顧過往二十幾年的實證工作,看實證研究的可靠度是否自Leamer悲觀的斷語面世后有所改善。

Leamer的批評源自于研究中種種預(yù)設(shè)缺乏穩(wěn)健性——而這些預(yù)設(shè)本身雖然對研究結(jié)果極為重要,卻近乎隨意挑選。因此Leamer認為應(yīng)進行敏感度分析,以判斷是否方程模型以及變量選擇改變影響研究結(jié)果。后來的歷史說明,研究設(shè)計的改善使得實證研究雖非按照Leamer提出的方案改革,卻也經(jīng)歷長足發(fā)展。

實證研究中利用隨機實驗的研究最先得益于研究設(shè)計的改進,如在墨西哥進行的改善兒童福利的隨機研究,美國住房和城市發(fā)展部主導(dǎo)的幫助搬遷項目,都因可信的研究成果而改善了現(xiàn)實政策或改變既往的錯誤認知。結(jié)構(gòu)性的經(jīng)濟學(xué)參數(shù),比如跨時期替代彈性,也是隨機實驗的研究重點。在研究人員無法進行隨機實驗的課題上,類實驗或者自然實驗就成為研究者獲取信息的有效渠道。相比之下,實證宏觀經(jīng)濟學(xué)或許進步有限。但是一部分研究設(shè)計為基礎(chǔ)的實證作品依舊促進學(xué)界達成對重要問題的共識。

Leamer的批判與改良策略

Leamer的批判主要針對傳統(tǒng)的樸素的回歸分析,而非針對研究設(shè)計。Leamer為避免回歸分析中的假設(shè)影響研究結(jié)果,提出敏感性分析。Sims也同樣支持這一觀點,并將貝葉斯分析應(yīng)用于這種檢驗中;最終二人提出極限邊界分析,即將多種協(xié)變量組合加入模型中估計目標(biāo)參數(shù),最終確定目標(biāo)參數(shù)的范圍。

本文作者通過下述兩個案例說明Leamer的貢獻和局限:第一個頗有影響力的研究為Ehrlich于1977年發(fā)表的用時間序列和截面數(shù)據(jù)做的法律研究,Ehrlich使用Leamer等人的方法得出結(jié)論,認為死刑確對犯罪行為具有震懾作用。該研究在法院對于死刑的判罰產(chǎn)生實質(zhì)影響。然而該文一經(jīng)面市便引起巨大爭議——研究者發(fā)現(xiàn),Ehrlich的研究結(jié)果會因方程形式變化而異,而作為Ehrlich研究的因變量,即1960年代的兇殺案頻發(fā),可能收到多種因素影響,而非僅依犯人處決率變動。另外,盡管Ehrlich本人試圖通過工具變量應(yīng)對反向因果、遺漏變量等問題,他卻從未論證該工具變量為何有效,乃至為何工具變量與其他內(nèi)生變量相關(guān)。

第二個研究探索教育投入與產(chǎn)出的關(guān)系。Coleman等人1966年發(fā)表的文章可以說明當(dāng)時研究的典型問題。學(xué)生、學(xué)校、社區(qū)不同級別的特點本身并未得到區(qū)分,例如常見的結(jié)論有小課堂可能導(dǎo)致學(xué)生標(biāo)準(zhǔn)化考試成績下降,然而事實是,學(xué)習(xí)吃力的學(xué)生可能會被劃分到小課堂等等。另一方面,許多研究也忽視了作為因變量的課堂規(guī)模等因素實際與平均投入高度相關(guān),因此把平均投入作為控制變量本身就存在問題。其他著名的研究,如蘭德公司1974年的健康保險實驗研究也存在相似問題。

計量經(jīng)濟學(xué)中的“騙術(shù)”為何變少

質(zhì)量更佳的數(shù)據(jù)和穩(wěn)健的估計方式對實證研究的改善自不必說,明晰的研究設(shè)計更對研究的可靠性至關(guān)重要。從Ehrlich 區(qū)區(qū)35個樣本的研究至今,微觀研究的數(shù)據(jù)量大幅增長。研究者的關(guān)注點從過分糾結(jié)技術(shù)細節(jié),忽略估計量的因果闡釋,到如今擺脫對回歸分析的教條理解,而側(cè)重理解包括TSLS在內(nèi)的回歸分析對于平均作用的闡釋,使得實證經(jīng)濟學(xué)在模型本身穩(wěn)健型增強的同時,也有更多的實質(zhì)意義。

最重要的莫過于實證研究的重點逐漸轉(zhuǎn)向以研究設(shè)計為基礎(chǔ)的研究,研究者對于研究設(shè)計傾注的心血對于真正的隨機實驗研究和非實驗研究接近一致?;氐浇逃Y源投入產(chǎn)出的著名研究案例,到1992年,Krueger等人的研究轉(zhuǎn)而從每一代人的出生群為單位,使得變化的源頭與最終估計量的層級統(tǒng)一,如此規(guī)避部分遺漏變量帶來的影響。后來,Lavy等人1999年的文章上以RD研究課堂規(guī)模對于標(biāo)化成績的影響,由此規(guī)避課堂規(guī)模的內(nèi)生性問題。最后一種類實驗的研究設(shè)計為DID,也是如今應(yīng)用最為廣泛的研究設(shè)計為基礎(chǔ)的估計方法。DID研究評估政策變化導(dǎo)致的變動的差異。例如圖一便是著名的關(guān)于死刑廢除與殺人案發(fā)生率的因果關(guān)系的研究,美加兩國相似的變動趨勢說明了這一因果關(guān)系。此外隨機實驗也在研究中得到大力推廣,其中最有名的就是田納西州以10000名幼兒園至三年級學(xué)生為樣本的研究,這些研究者將孩子們隨機分配進不同規(guī)模的課堂并追蹤其成績變化。當(dāng)然了,這些研究都有其自身局限性。但是相比于原本徒勞地尋求“真正”的模型,研究者如今的重點放在了遺漏變量可能的來源等更值得探究的問題。

此外,研究設(shè)計也逐漸成為被公布、廣泛討論的內(nèi)容。如今研究設(shè)計已經(jīng)不再是一個形式主義的產(chǎn)物,而是需要詳細陳述并反復(fù)答辯的實施方案,確定識別策略已經(jīng)成為研究中必不可少的一環(huán)。好的研究設(shè)計也使得實證結(jié)果更加直白,更易于呈現(xiàn)。而敏感性測試則似有式微:相比于Leamer茫無目的地測試不同模型的敏感度,有研究設(shè)計藍本的研究更易甄別研究中的疏忽并及時加以改正。

相比于微觀,宏觀經(jīng)濟學(xué)的進步則有所局限。這一則是因為宏觀經(jīng)濟學(xué)的研究課題自身難以進行隨機實驗,另一方面,許多宏觀經(jīng)濟學(xué)家也逐漸依賴計算機模擬實驗。這些模擬實驗通過改變原模型中的參數(shù)來重新估計以求回答研究問題,由此可以確定因果效應(yīng)是否存在,以及可能的規(guī)模。然而需要注意的是,雖然在理論中增添合理的具體數(shù)值無傷大雅,理論卻并未因此變?yōu)閷嵶C。另一個頻受沖擊的研究領(lǐng)域是產(chǎn)業(yè)組織學(xué),這一領(lǐng)域傳統(tǒng)的研究辦法是估計目標(biāo)產(chǎn)品需求系統(tǒng),接著假定市場行為,最終模擬產(chǎn)業(yè)在是否存在兼并下的行為。然而事實上,兼并行為本身或許并不能單純地以假設(shè)兼并未發(fā)生作為反事實研究,在這種研究范式下,其他市場的價格常被作為工具變量甄別需求,然而市場之間彼此獨立的假設(shè)本身就很有問題。另一種做法是Hastings(2004)中呈現(xiàn)的,找到實驗操作前趨勢相同的控制組和實驗組,以此判斷兼并對市場的影響。好的結(jié)構(gòu)模型可以不僅點明經(jīng)濟學(xué)原理,也指出因果效應(yīng),但是這些原理必須在更弱的前提假設(shè)下依舊成立,否則便乏善可陳。

研究設(shè)計是否已經(jīng)走上歧途

隨機實驗范式的興起使得研究者逐漸質(zhì)疑這種研究的外部有效性,由于種種特定的實驗場景,研究者很難確定在這些特定場景之外,研究結(jié)論是否依舊有效;此外,實驗往往針對細微的變量,而忽視領(lǐng)域中有待探索的大問題。

任何實證研究中某一因果效應(yīng)的證據(jù)都是在地的(local)——它只限于此時此地,基于此研究設(shè)計。籠統(tǒng)的研究框架也不能使研究的變量更具代表性。但是任何相信數(shù)據(jù)的意義的人都不會反對,異質(zhì)性是相對有限的,理解過去總可以指導(dǎo)未來。對于上述疑慮,或許更有建設(shè)性的回應(yīng)是研究設(shè)計中可以增加所尋求的證據(jù),以求獲得對問題的全面闡述。在相似的研究的不斷累積中,外部有效性更強的理論或許會產(chǎn)生。

編譯 | 木 海

原標(biāo)題:《諾獎編譯 | Angrist等:更好研究設(shè)計如何規(guī)避計量經(jīng)濟學(xué)弊端?實證經(jīng)濟學(xué)的可信度變革》

閱讀原文

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006

            增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋