www.henhenlu 实证专题(2)-Heckman 两步法!

发布日期:2024-09-08 17:27    点击次数:77

www.henhenlu 实证专题(2)-Heckman 两步法!

一、Heckman旨趣www.henhenlu

紧记之前给寰宇讲内素性的问题时提过内素性存在过的问题之一,就是样本取舍偏误!其他内素性问题见:计量-内素性的识别与处理!一文读懂!

由于鄙东说念主水的毕业论文可能会用到,于是单独拎出来开个小专题!

Heckman两阶段模子是哄骗宽泛的处理样本取舍偏差问题的一种步调。它是由经济学家 James J. Heckman 在20世纪70年代建议的。该模子的第一阶段是通过拟合一个概率模子来算计是否存在取舍偏差,第二阶段则通过改良概率模子的算计偏差来进行展望。该模子常被用于算计回首统共、放手自变量的影响、对计谋后果进行评估等。

因此仅说明对他步调上的苟简形色,咱们便不错得知Heckman两步法的实质:先算计取舍概率,再说明概率对模子进行修正,一个苟简的例子见我之前作念的札记:对女性工资水平的联系征询分析

韩国三级片

图片

二、操作门径

在第一步中,算计出D:D= αZ + θX

说明一系列可能影响Y的散布情况的外生协变量Z对被深切变量的不雅测性D进行展望,相称近似于PSM。只不外Heckman用匹配协变量来算计数据的可不雅测性判断缺失的可能性,而PSM则说明匹配协变量算计样本在特征上的一致性,两者一个惩办样本取舍偏误、一个惩办样本自取舍偏误。而算计概率当然亦然要选用二值概率模子,时时选用极大似然法;来算计。值得防护的是,该门径的Z必须保证是外生变量,即澈底寂然于X,只可通过D来影响Y。这么算计取得的D就是判断缺失概率(0/1)

第二步:算计IMR(逆米尔斯比率),取得修正模子。咱们唯有知说念这个IMF修恰是基于对OLS的算计渴望退换得来的构建方式www.henhenlu,基于软件生成的IMR(也不错我方算,通过概率密度与蓄积散布函数),咱们将之放入咱们圆善的回首方程中:

取得:Y=αX+ βIMR 此时X即为缓解了取舍偏误的模子

图片

三、stata操作及末端解读

prompt:heckman depvar indepvars, select(selectvars=selectindepvars)  twostep

以上变量折柳对应:因变量Y、自变量X、取舍变量D、外生变量Z

固然uu们在作念的时辰固定效应的lsdv别忘了丢在indepvars中。

对应的末端中,咱们不错最初对比原统共的所在与权贵性水平是否发生变化;在select栏中看到各Z对D的深切水平,以及IMF以lambda(兰姆达)的参数步地出现,在最底下一转咱们发现明白通过了1%水平的权贵性水平,意味着原模子如实存在着取舍偏误。

图片

临了还需进行VIF多重共线性磨练,幸免模子因为包含了IMF(掺杂多种身分组成)而酿成多重共线性问题,酿成模子有偏。

四、实操一些Tips:

什么时辰需要作念Heckman:判断是否需要作念Heckman的关节是从Y以及中枢X是否会存在样本取舍问题,是否我的样本仅仅确切我念念要征询的一部分子集费力。要记取Heckman的骨子就是取舍改良模子!

图片

Heckman的局限性:该模子主要适用于OLS的修正,这就意味着基准自己是其他模子将无法适用

Heckman与PSM的各别:——样本取舍偏误与样本自取舍偏误

图片

Heckman与器具变量法的区别:后者时时能惩办更多的内素性问题。相同关于外生变量Z的条件www.henhenlu,前者仅仅条件Z通过影响D来影响Y的散布,尔后者则是Z只通过X影响Y。相对来说前者相称好找,一些CV就能充任。

本站仅提供存储办事,通盘内容均由用户发布,如发现存害或侵权内容,请点击举报。