《傾向值匹配法(PSM).ppt》由會員分享,可在線閱讀,更多相關(guān)《傾向值匹配法(PSM).ppt(45頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、傾向值匹配法 PSM Q 為什么要使用PSM A 解決樣本選擇偏誤帶來的內(nèi)生性問題例 上北大有助于提高收入嗎 樣本選擇偏誤 考上北大的孩子本身就很出色 聰明 有毅力 能力強(qiáng) 解決方法 樣本配對 配對方法 同行業(yè) 一維配對 同行業(yè) 規(guī)模相當(dāng) 二維配對 同行業(yè) 規(guī)模相當(dāng) 股權(quán)結(jié)構(gòu)相當(dāng) 多維配對 PSM 把多個維度的信息濃縮成一個 降維 多維到一維 配對過程中的兩個核心問題 1 Q1 哪個樣本更好一些 A1 Sample2較好 比較容易滿足共同支撐假設(shè) commonsupportassumption 配對過程中的兩個核心問題 2 Q2 stuc1 c2 c3三人中 誰是stuPK的最佳配對對象 A2
2、 stuc3是最佳配對對象 比較容易滿足平行假設(shè) balancingassumption ATT AverageTreatmentEffectontheTreated 平均處理效應(yīng)的衡量 運(yùn)用得分進(jìn)行樣本匹配并比較 估計出ATT值 ATT E Y 1 Y 0 T 1 Y 1 StuPK上北大后的年薪Y(jié) 0 StuPK假如不上北大的年薪 可觀測數(shù)據(jù) 不可觀測數(shù)據(jù) 采用配對者的收入來代替 ATT 12W 9W 3W 實例介紹 實例介紹 研究問題 培訓(xùn)對工資的效應(yīng)基本思想 分析接受培訓(xùn)行為與不接受培訓(xùn)行為在工資表現(xiàn)上的差異 但是 現(xiàn)實可以觀測到的是處理組接受培訓(xùn)的事實 而如果處理組沒有接受培訓(xùn)會怎么
3、樣是不可觀測的 這種狀態(tài)稱為反事實 匹配法就是為了解決這種不可觀測的事實的方法 實例介紹 分組 在傾向值匹配法中 根據(jù)處理指示變量將樣本分為兩個組 處理組 在本例中就是在NSW 國家支持工作示范項目 實施后接受培訓(xùn)的組 控制組 在本例中就是在NSW實施后不接受培訓(xùn)的組 研究目的 通過對處理組和對照組的匹配 在其他條件完全相同的情況下 通過接受培訓(xùn)的組 處理組 與不接受培訓(xùn)的組 控制組 在工資表現(xiàn)上的差異來判斷接受培訓(xùn)的行為與工資之間的因果關(guān)系 變量定義 變量定義 傾向打分 OLS回歸結(jié)果 工資的變化到底是來自個體的異質(zhì)性性還是培訓(xùn) 傾向打分 1 設(shè)定宏變量 1 設(shè)定宏變量breps表示重復(fù)抽樣
4、200次命令 globalbreps200 2 設(shè)定宏變量x 表示ageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black命令 globalxageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black 傾向打分 2 通過logit模型進(jìn)行傾向打分命令 pscoretreat x pscore mypscore blockid myblock comsupnumblo 5 level 0 05 logit注 表示引用宏變量 pscore結(jié)果 傾向值分布 傾向值分布
5、 block中樣本的分布 block中的描述性統(tǒng)計 運(yùn)用得分進(jìn)行樣本匹配并比較 方法一 最鄰近方法 nearestneighbormatching 含義 最鄰近匹配法是最常用的一種匹配方法 它把控制組中找到的與處理組個體傾向得分差異最小的個體 作為自己的比較對象 優(yōu)點(diǎn) 按處理個體找控制個體 所有處理個體都會配對成功 處理組的信息得以充分使用 缺點(diǎn) 由于不舍棄任何一個處理組 很可能有些配對組的傾向得分差距很大 也將其配對 導(dǎo)致配對質(zhì)量不高 而處理效應(yīng)ATT的結(jié)果中也會包含這一差距 使得ATT精確度下降 方法一 最鄰近方法 nearestneighbormatching 命令setseed1010
6、1 產(chǎn)生隨機(jī)數(shù)種子 attndre78treat x comsupbootreps breps dotslogit 方法一 最鄰近方法 nearestneighbormatching 方法二 半徑匹配法 radiusmatching 半徑匹配法是事先設(shè)定半徑 找到所有設(shè)定半徑范圍內(nèi)的單位圓中的控制樣本 半徑取值為正 隨著半徑的降低 匹配的要求越來越嚴(yán) 方法二 半徑匹配法 radiusmatching 命令setseed10101attrre78treat x comsupbootreps breps dotslogitradius 0 001 方法二 半徑匹配法 radiusmatching
7、方法三 分層匹配法 stratificationmatching 內(nèi)容 分層匹配法是根據(jù)估計的傾向得分將全部樣本分塊 使得每塊的平均傾向得分在處理組和控制組中相等 優(yōu)點(diǎn) Cochrane Chambers 1965 指出五個區(qū)就可以消除95 的與協(xié)變量相關(guān)的偏差 這個方法考慮到了樣本的分層問題或聚類問題 就是假定 每一層內(nèi)的個體樣本具有相關(guān)性 而各層之間的樣本不具有相關(guān)性 缺點(diǎn) 如果在每個區(qū)內(nèi)找不到對照個體 那么這類個體的信息 會丟棄不用 總體配對的數(shù)量減少 方法三 分層匹配法 stratificationmatching 命令setseed10101attsre78treat pscore
8、mypscore blockid myblock comsupbootreps breps dots 方法三 分層匹配法 stratificationmatching 方法四 核匹配法 kernelmatching 核匹配是構(gòu)造一個虛擬對象來匹配處理組 構(gòu)造的原則是對現(xiàn)有的控制變量做權(quán)重平均 權(quán)重的取值與處理組 控制組PS值差距呈反向相關(guān)關(guān)系 方法四 核匹配法 kernelmatching 命令setseed10101attkre78treat x comsupbootreps breps dotslogit 方法四 核匹配法 kernelmatching psmatch2 匹配變量的篩選 1
9、 設(shè)定宏變量設(shè)定宏變量x 表示ageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black命令 globalxageagesqeduceducsqmarriedblackhispre74re75re74sqre75squ74black 匹配變量的篩選 2 初步設(shè)定logittreat x 匹配變量的篩選 3 逐步回歸stepwise pr 0 1 logittreat x ps值的計算 psmatch2treat x out re78 傾向得分的含義是 在給定X的情況下 樣本處理的概率值 利用logit模型估計樣本處理的概率值 概
10、率表示如下 P x Pr D 1 X E D X 匹配處理組 最近鄰匹配命令 psmatch2treat x ifsoe 1 out re78 neighbor 2 ate半徑匹配命令 psmatch2treat x out re78 ateradiuscaliper 0 01 核匹配命令 psmatch2treat x out re78 atekernel 匹配處理組 滿足兩個假設(shè) A共同支撐假設(shè)B平行假設(shè) ATT 平均處理效應(yīng)的衡量 以半徑匹配為例 psmatch2treat x out re78 ateradiuscaliper 0 01 1 2 3 1 處理組平均效應(yīng) ATT 2 控制
11、組平均效應(yīng) ATU 3 總體平均效應(yīng) ATE ATT 平均處理效應(yīng)的衡量 匹配前后變量的差異對比命令 pstestre78 x pstestre78 x bothgraph 匹配前后密度函數(shù)圖 twoway kdensity psif treat 1 legend label 1 Treat kdensity psif wei 1 wei legend label 2 Control xtitle Pscore title AfterMatching twoway kdensity psif treat 1 legend label 1 Treat kdensity psif treat 0 legend label 2 Control xtitle Pscore title BeforeMatching 運(yùn)用bootstrap獲得ATT標(biāo)準(zhǔn)誤 命令 bootstrap reps psmatch2treat x out re78 在統(tǒng)計分析中 樣本較少 采用bootstrap 可以減少小樣本偏誤 步驟 首先 從原始樣本中可重復(fù)地隨機(jī)抽取n個觀察值 得到經(jīng)驗樣本 然后采用PSM計算改經(jīng)驗樣本的平均處理效果ATT 將第一步和第二步重復(fù)進(jìn)行 次 得出 個ATT值 計算 個ATT值的標(biāo)準(zhǔn)差 核匹配的Bootstrap檢驗