王 麗,程凱亮
中國醫(yī)學科學院 北京協(xié)和醫(yī)學院 基礎醫(yī)學研究所 流行病學系, 北京 100005
目前,大多數(shù)臨床研究者仍然面臨著研究經(jīng)費不足、研究持續(xù)時間有限、人群研究應答率和依從性低等困境。電子病歷數(shù)據(jù)庫(electronic health records, EHRs)的及時出現(xiàn)為開展臨床研究,尤其是基于隊列的大樣本臨床研究提供了低成本的愿景和機遇。隨著2009年美國衛(wèi)生信息技術法案的推出,美國80%的醫(yī)療機構實現(xiàn)了病歷電子化,全球EHRs的普及率亦逐漸增加。人們越來越關注如何基于EHRs開展二手數(shù)據(jù)分析,以期最終促進醫(yī)療服務的改善。但由于EHRs收集的初衷是為了臨床診療而非臨床研究需要,因此利用EHRs開展臨床研究仍存在很多問題,包括數(shù)據(jù)信息的完整性、就診人群的代表性、數(shù)據(jù)處理的復雜性等。本文將通過實例探討EHRs的特征、如何利用EHRs開展臨床研究以及在研究中如何控制偏倚。
無論哪種研究設計方法,臨床流行病學研究的核心均是在控制了混雜變量的情況下,探討暴露因素與結局之間的關聯(lián)。EHRs是醫(yī)療機構對門診、住院患者(或保健對象)臨床診療和指導干預的數(shù)字化醫(yī)療記錄,包括患者歷次就診的人口學信息、生命指征、診斷、實驗室檢查、用藥、影像學檢查、既往病史、免疫接種史等[1]。上述信息可對應臨床研究中的不同角色,包括暴露因素、結局、混雜因素和/或效應修飾等(表1),提示利用EHRs開展臨床流行病學研究的可行性。但由于EHRs信息的收集是基于臨床診療需求,因此患者使用何種藥物、進行何種檢查以及被隨訪的頻次等均受到患者及醫(yī)生抉擇的影響,最終影響對疾病患病率、發(fā)病率及暴露因素風險的估計。同時,基于不同環(huán)境建立的EHRs,如某單一醫(yī)療機構EHRs、區(qū)域醫(yī)療健康數(shù)據(jù)庫,其涵蓋的人群特征、用藥信息、檢查、診斷及其他個人信息(如人口學特征、生命指征、家族史及個人史等)的數(shù)據(jù)特點不同[2],導致在回答臨床研究問題的優(yōu)勢與局限性方面亦不同。
以我國為例,目前各醫(yī)院EHRs的現(xiàn)狀大致可分為3類:(1)以各種臨床業(yè)務為中心,患者信息散落在多個相對獨立的系統(tǒng)中;(2)對于大部分三級醫(yī)院,各醫(yī)療機構內(nèi)部已實現(xiàn)了以患者為中心的信息收集,但數(shù)據(jù)庫中僅涵蓋了患者在該醫(yī)療機構的就診信息;(3)極少數(shù)城市已實現(xiàn)建立區(qū)域化的EHRs,解決了區(qū)域內(nèi)各醫(yī)院數(shù)據(jù)的信息共享。研究者需根據(jù)所使用的EHRs特點來確定其可能回答的臨床研究問題,并對結果進行合理解釋。
EHRs作為針對患者臨床診療相關健康信息的縱向電子記錄,可通過與多種機構日常監(jiān)測、記錄、儲存的各類與健康相關的數(shù)據(jù),如其他醫(yī)院EHRs、醫(yī)保理賠數(shù)據(jù)庫、公共衛(wèi)生調(diào)查與公共健康監(jiān)測(如藥品不良事件監(jiān)測)、出生/死亡登記項目等對接[4],從而實現(xiàn)對疾病轉歸及診療全過程的評估。包括描述疾病的流行病學特征及分布,探討疾病的療效或病因,評價真實就診環(huán)境下的依從性、療效,以及政策對于臨床用藥的影響等。針對不同科學問題,其對應的研究設計方法不同,包括橫斷面研究、生態(tài)學研究、病例對照研究及隊列研究。下文主要針對疾病流行病學特征分布、療效研究以及政策對于療效評價的影響等進行討論。
2.1.1 患病率
患病率是指研究特定時間點或期間某特定人群現(xiàn)患病者所占比例,明確目標人群并實現(xiàn)準確診斷是獲得真實患病率估計的前提。疾病患病率的估計通?;趪栏竦某闃诱{(diào)查而獲得,耗時耗力。而EHRs中涵蓋的大量患者的臨床診斷及檢驗信息,為在較低成本下描述疾病的發(fā)病率及患病率提供了可能。以一項利用醫(yī)院數(shù)據(jù)估計炎癥性腸病(inflammatory bowel disease,IBD)疾病分布為例,該研究納入了中國香港1981至2014年7個區(qū)13家醫(yī)院就診的IBD患者信息,以每年13家醫(yī)院IBD就診人群除以當年香港人口數(shù)來估算當年IBD患病率[5]。估算的前提是此13家醫(yī)院覆蓋95%的香港IBD患者,能否依靠EHRs來估計疾病患病率的前提是能確定產(chǎn)生病例的“源人群”。但更多情況下,尤其是基于某單一醫(yī)療機構的EHRs,由于不能確定EHRs中病例的“源人群”,即不能獲得計算患病率所需的分母,此時只能計算構成比而非患病率。同時研究顯示,即使能獲得EHRs對應的“源人群”,其最終獲得的患病率估計與人群調(diào)查獲得的患病率之間仍存在差別,其差別的方向與疾病特征、年齡、性別等密切相關[6- 7]。
表 1 電子病歷數(shù)據(jù)庫中信息與臨床研究中變量的對應關系[3]
ICD:國際疾病分類
2.1.2 發(fā)病率
EHRs作為針對患者臨床診療相關健康信息的縱向電子記錄,原則上研究者可利用其構建回顧性、前瞻性或雙向隊列以估計發(fā)病率。但其根本問題是不能僅僅依賴EHRs區(qū)分新發(fā)和現(xiàn)患病例。對于上述情況,可采用查病歷或補充調(diào)查的方法應對,但其工作量大,費時費力,同時對于無住院病歷的患者很難實現(xiàn)病歷查詢。研究者提出了多種解決EHRs新發(fā)病例確定問題的方法。最簡單的方法是將首次診斷日期確定為新發(fā)日期,但前提是該數(shù)據(jù)庫能長時間覆蓋某個區(qū)域或全國人群,同時疾病嚴重程度高[8]。但對于大多數(shù)疾病,尤其是慢性病,上述方法并不能很好地區(qū)分新發(fā)和現(xiàn)患病例。Mamtani 等[9]的研究顯示,采用Joinpoint回歸通過確定不同時間間隔糖尿病發(fā)病率的變化拐點能較好區(qū)分EHRs中的現(xiàn)患與新發(fā)糖尿病患者。其他更復雜的方法,如基于回溯生存分析或等候時間分布等方法也越來越多被應用于EHRs數(shù)據(jù)中新發(fā)病例的確定[8]。
EHRs為在真實臨床就診環(huán)境下開展療效研究提供了可能。中國臺灣Wu等[10]基于全民健康保險研究資料庫開展了“慢性乙型肝炎患者抗病毒治療對肝癌發(fā)生影響”的研究,探討核苷類似物抗病毒藥物治療是否可減少慢性乙型肝炎患者肝癌的發(fā)生風險。為此,該研究納入了1997年1月1日至2010年12月31日臺灣地區(qū)所有被診斷為慢性乙型肝炎[國際疾病分類- 9(international classification of diseases,ICD- 9):070.2,070.3和V02.61]至少3次,同時使用核苷類藥物或保肝藥物,并排除合并其他病毒性肝炎、艾滋病病毒感染以及在隨訪前3個月發(fā)生肝癌的患者。其中使用核苷類藥物≥3個月者被定義為抗病毒治療者,<3個月者被定義為非抗病毒治療者。通過上述入選和排除標準,199 451例慢性乙型肝炎患者中72 458例納入該研究。對于使用抗病毒治療者,隊列隨訪起點為首次核苷類藥物處方時間,而對于非抗病毒治療者,則以首次使用保肝類藥物為隨訪起點;隨訪終點為發(fā)生肝癌、死亡或2010年12月31日。最終研究顯示,抗病毒治療者發(fā)生肝癌的風險較非抗病毒治療者減少63%(HR=0.37,95% CI:0.34~0.39)。實現(xiàn)上述研究的前提主要包括以下3點:(1)研究人群代表性問題:中國臺灣1997年開始實行強制性全民醫(yī)保覆蓋,同時所有乙型肝炎抗病毒藥及保肝藥均可報銷,保證了所有可能使用抗病毒藥物者的納入;(2)可明確獲得慢性乙型肝炎診斷時間和用藥時間,保證了暴露信息及隨訪起點的可獲得性;(3)該醫(yī)保數(shù)據(jù)庫中災難性疾病患者登記數(shù)據(jù)庫保證了結局信息的可獲得性。但由于EHRs是基于真實就診環(huán)境的數(shù)據(jù)收集,治療不僅僅是一種暴露因素,更是一種臨床決策,患者是否使用核苷類抗病毒藥物受年齡、疾病嚴重程度、經(jīng)濟水平等多方面因素影響,導致使用核苷類藥物者和未使用者在可能影響肝癌發(fā)生的因素分布上不可比,即存在選擇偏倚,因此在分析時需要采用統(tǒng)計分析方法進一步控制。
除了選擇偏倚外,當利用EHRs開展臨床療效研究時,通常還會面臨一系列刪失問題,包括不能保證獲得每個隨訪者的結局(右刪失)、不知道每個患者何時開始治療(左刪失)。右刪失可通過生存分析方法解決,但左刪失則需通過精巧的設計來避免。例如,在利用EHRs評價HBeAg陽性患者HBsAg滴度水平對未來HBsAg陰轉的預測價值時,由于很難根據(jù)EHRs確定患者首次治療時間,此時可結合臨床實際意義,選擇HBeAg陽性患者中發(fā)生HBeAg陰轉的患者作為研究對象,從而確定隨訪起點。
臨床藥物使用與醫(yī)保政策密切相關。醫(yī)保政策對患者臨床藥物使用及療效的影響不太可能使用實驗性研究來評價。Qiu等[11- 12]利用北京市某傳染病醫(yī)院的醫(yī)保和非醫(yī)?;颊咴谡邎?zhí)行前后的EHRs探討2011年7月1日開始執(zhí)行的乙型肝炎抗病毒藥物醫(yī)保報銷政策對于慢性乙型肝炎患者抗病毒用藥種類選擇、用藥依從性及成本的影響,并開展成本效果分析,從而綜合評價該政策對于北京市慢性乙型肝炎患者用藥及療效影響。但需注意的是,以單中心EHRs來評價患者用藥時可能會因“不能獲得患者在其他醫(yī)院或藥房拿藥的信息”而產(chǎn)生信息偏倚,因此有必要評價不同類型患者(醫(yī)保和非醫(yī)保患者)在政策執(zhí)行前后在外院取藥的信息來校正可能產(chǎn)生的偏倚[11]。
與科學研究驅動的研究設計不同,EHRs為基礎的研究相對更省時省力、樣本人群更大。然而,基于EHRs,尤其是基于單中心的EHRs研究,仍然面臨人群代表性、影響暴露因素與結局關系的混雜因素在人群分布不均勻、混雜因素收集不完整、數(shù)據(jù)收集不準確等一系列問題,從而最終使研究結論產(chǎn)生系統(tǒng)誤差。下文著重討論選擇偏倚和混雜偏倚的控制。
當總體人群中單一個體進入樣本的概率與暴露及結局因素密切相關,導致樣本人群與總體人群在暴露因素與結局相關的特征分布上出現(xiàn)系統(tǒng)誤差,則可能產(chǎn)生選擇偏倚。對于基于EHRs的研究來說,產(chǎn)生選擇偏倚的原因包括但不僅限于以下幾方面:(1)入院率偏倚,即患者的年齡、性別、疾病嚴重程度、地域特點、醫(yī)療保險狀態(tài)等均可能影響患者是否到醫(yī)院就診或是否到某個醫(yī)院就診,從而最終影響EHRs人群的代表性。因此,在使用EHRs開展臨床研究時,有必要對患者年齡、性別、種族及其他相關人口學特征與總體患者人群比較,以評價研究對象的代表性。例如,如果想利用北京市某傳染病醫(yī)院的門診及住院EHRs來估計慢性乙型肝炎患者的直接醫(yī)療費用,則需評價在該醫(yī)院就診的慢性乙型肝炎患者年齡、性別及疾病嚴重程度相關指標與總體慢性乙型肝炎患者人群的可比性。(2)數(shù)據(jù)缺失,尤其是非隨機缺失。仍以利用EHRs評價HBeAg陽性患者HBeAg陰轉時HBsAg滴度水平對未來HBsAg陰轉的預測價值為例,由于臨床并非所有慢性乙型肝炎患者在HBeAg陰轉時均會行HBsAg滴度檢查,此時如果有HBsAg滴度檢查的患者疾病嚴重程度指標與未行檢查者不可比,則會產(chǎn)生選擇偏倚,從而最終影響對HBsAg陰轉的預測。探討數(shù)據(jù)缺失的機理(完全隨機缺失、隨機缺失或非隨機缺失)是評價缺失對于研究結果影響的關鍵。
基于EHRs的療效或病因學研究中,由于治療不僅僅是一種暴露因素,更是一種臨床決策,患者是否使用某種治療受患者年齡、疾病嚴重程度、經(jīng)濟水平等多種混雜因素的影響,如何控制混雜因素是基于EHRs開展臨床療效或病因研究的關注熱點。以Wu 等[10]開展的抗病毒治療是否降低肝癌發(fā)生風險的研究為例,對最終納入的符合入選和排除標準的47 611例未使用抗病毒藥物和24 847例使用抗病毒藥物治療的患者基線特征分析顯示,除年齡外,其他所有可能影響結局發(fā)生的因素如其他藥物使用情況、主要共患病、肝硬化程度等均顯著不同,提示控制混雜因素的必要性。目前除在研究設計階段采用匹配或限制方法控制混雜因素外,還可在分析階段采用傳統(tǒng)控制混雜的統(tǒng)計方法,包括分層分析、多因素分析等[13- 15]。隨著現(xiàn)代流行病學的發(fā)展,研究者們提出了傾向性評分法[16]、工具變量法[17]、雙重差分法[18]等新的控制混雜偏倚的方法。
傾向性評分以給定的一組協(xié)變量,通過構建協(xié)變量與處理因素之間的函數(shù)關系,確定任意一個研究對象劃分到處理組的概率,即傾向分值。基于估計的傾向分值,傳統(tǒng)的傾向性評分方法包括傾向性評分匹配法、分層、協(xié)變量校正(又稱回歸法)和加權法。仍以Wu等[10]的研究為例,研究者以是否接受抗病毒治療為因變量,以年齡、性別、主要共患病、肝硬化程度、其他藥物使用情況等為協(xié)變量,建立Logistic回歸模型,估算72 458例患者進入抗病毒治療組的概率,即傾向分值。依據(jù)傾向分值按照最臨近卡鉗匹配法為每例抗病毒治療患者匹配一例對照,匹配后的抗病毒治療組和非抗病毒治療組患者傾向分值的分布基本吻合,提示依據(jù)傾向分值抗病毒治療組和對照組在協(xié)變量的整體分布上具有可比性;同時該研究對匹配后抗病毒治療組和對照組每個協(xié)變量是否均衡可比進行了檢驗(但檢驗均衡性的統(tǒng)計分析方法并不合適,通常建議采用標準化差別的方法以校正樣本量的影響)。最后通過比較匹配后的兩組人群肝癌的發(fā)生率差異來評價抗病毒藥物的長期療效。
傾向性評分方法能否準確控制混雜偏倚的前提是如何構建協(xié)變量與處理因素的模型,從而準確估計傾向分值。目前納入什么協(xié)變量仍然存在爭議。以傾向性評分匹配法為例,Austin等[19]的研究顯示,僅納入與處理因素有關的協(xié)變量與其他納入?yún)f(xié)變量的方法(包括僅與結局因素有關或同時與協(xié)變量和處理因素有關)相比,會導致可匹配的對子數(shù)減少,從而導致處理效應估計值的精度下降。需注意的是,最終確定哪些協(xié)變量納入模型并不取決于模型擬合的好壞,而是基于傾向性評分匹配后處理組和對照組的各協(xié)變量分布是否可比。
貝葉斯傾向性評分則在傳統(tǒng)傾向性評分基礎上,進一步將傾向性評分引入由現(xiàn)有數(shù)據(jù)建立的結局事件與處理因素、協(xié)變量構建的聯(lián)合分布模型[20- 21]。通過該分布模型可同時控制測量和未測量的混雜因素,包括缺失數(shù)據(jù)影響,從而獲得比較真實可靠的效應值[22- 25]。但其計算量大,需借助馬爾科夫鏈蒙特卡羅法實現(xiàn)。例如,在利用醫(yī)院病歷數(shù)據(jù)庫評價他汀類藥物對急性心肌梗死患者全因死亡率的影響研究發(fā)現(xiàn),貝葉斯傾向性評分法較傳統(tǒng)logistic傾向性評分所獲得的效應值更準確,置信區(qū)間更寬[20]。
由于EHRs主要是因臨床診療需要而構建,影響疾病預后的很多環(huán)境或遺傳暴露因素很難在臨床實際就診記錄中收集,因此控制未測量混雜因素在基于EHRs的研究中顯得尤為重要。對未測量混雜因素的處理方法包括工具變量法[17]、雙重差分法[18]、基于傾向性評分法的敏感性分析等。工具變量法主要是通過找到一個合適的變量,該變量與研究結局及混雜因素無關,僅與處理因素有關,將變量替代實際處理因素,通過比較不同工具變量狀態(tài)人群結局的差異得到不同處理因素效應值的無偏估計[26]。例如Stukel等[27]基于1994至1995年全美566個冠狀動脈造影服務機構急性心肌梗死患者的研究,由于不同服務機構患者疾病嚴重程度無差別,但30 d內(nèi)接受心導管術的患者比例(即心導管手術率)不同,因此將不同地區(qū)心導管手術率作為工具變量,通過比較不同心導管手術率患者7年生存率的差別來評價心導管手術對于患者長期生存的影響。
雙重差分法則主要用于干預效果評價研究[28]。例如,黃遠飛等[29]分別從2014年和2015年廣州市南沙區(qū)城鄉(xiāng)居民醫(yī)療保險的就診數(shù)據(jù)中分別抽取農(nóng)村和城鎮(zhèn)參保人各800人,評價廣州市2015年1月1日開始執(zhí)行的城鎮(zhèn)居民基本醫(yī)療保險和新型農(nóng)村合作醫(yī)療整合政策效果。由于整合前原新農(nóng)合和城鎮(zhèn)居民醫(yī)保的參保人在醫(yī)療保險待遇、年齡、性別、家庭規(guī)模、患病情況等方面均可能存在差異,無法僅通過兩種類型參保對象之間的前后或橫向對比來分析政策實施對醫(yī)療服務消費的影響。故采用雙重差分模型法,將原新農(nóng)合參保人定義為處理組,假設整合實施后其醫(yī)療服務支出和補償力度均增加,但城鎮(zhèn)參保人由于待遇提升幅度不大,對其醫(yī)療服務支出影響較少,將其定義為對照組;通過比較原新農(nóng)合居民政策前后醫(yī)療總費用及自付比例改變與城鎮(zhèn)參保人政策前后醫(yī)療總費用及自付比例改變,同時校正參保人性別、年齡、慢性病患病情況以及家庭規(guī)模等變量,來評價新的政策對新農(nóng)合患者的影響。
綜上所述,在目前這個充滿前景、陷阱和挑戰(zhàn)的大數(shù)據(jù)時代,仍需回歸流行病學的本質(zhì),結合EHRs的具體特點和所提出的科學問題,充分考慮研究設計、數(shù)據(jù)分析等過程中出現(xiàn)的偏倚,并結合巧妙的設計和合理的統(tǒng)計學分析方法才能真正實現(xiàn)EHRs與臨床研究的整合。
[1] ISO/TR 20514:2005. Health informatics-electronic health record-definition, scope, and context[EB/OL]. https://www.iso.org/standard/39525.html.
[2] 王雯,劉艷梅,譚婧,等. 回顧性數(shù)據(jù)庫研究的概念、策劃與研究數(shù)據(jù)庫構建[J]. 中國循證醫(yī)學雜志,2018, 18:230- 237.
[3] Casey JA, Schwartz BS, Stewart WF, et al. Using electronic health records for population health research: a review of methods and applications[J]. Annu Rev Publ Health, 2016,37:61- 81.
[4] Kavakiotis I, Tsave O, Salifoglou A, et al. Machine learning and data mining methods in diabetes research[J]. Comput Struct Biotechnol J, 2017,15:104- 116.
[5] Ng SC, Leung WK, Shi HY, et al. Epidemiology of inflammatory bowel disease from 1981 to 2014: results from a territory-wide population-based registry in HongKong[J]. Infl-amm Bowel Dis, 2016,22:1954- 1960.
[6] Esteban-Vasallo MD, Dominguez-Berjon MF, Astray-Moch-ales J, et al. Epidemiological usefulness of population-based electronic clinical records in primary care: estimation of the prevalence of chronic diseases[J]. Fam Pract, 2009,26:445- 454.
[7] Tomasallo CD, Hanrahan LP, Tandias A, et al. Estimating wisconsin asthma prevalence using clinical electronic health records and public health data[J]. Am J Public Health, 2014,104:E65-E73.
[8] Bagley SC, Altman RB. Computing disease incidence, prevalence and comorbidity from electronic medical records[J]. J Biomed Inform, 2016,63:108- 111.
[9] Mamtani R, Haynes K, Finkelman BS, et al. Distinguishing incident and prevalent diabetes in an electronic medical records database[J]. Pharmacoepidemiol Drug Saf, 2014,23:111- 118.
[10] Wu CY, Lin JT, Ho HJ, et al. Association of nucleos(t)-ide analogue therapy with reduced risk of hepatocellular carcinoma in patients with chronic hepatitis B: a nationwide cohort study[J]. Gastroenterology, 2014,147:143- 151
[11] Qiu Q, Duan XW, Li Y, et al. Impact of partial reimbursement on hepatitis B antiviral utilization and adherence[J]. World J Gastroenterol, 2015,21:9588- 9597.
[12] Qiu Q, Li Y, Cheng K, et al. Cost-effectiveness of partial reimbursement for hepatitis B anti-viral drugs in Beijing, China: an analysis based on a retrospective cohort study[J]. Lancet, 2015, 386:S23-S23.
[13] Lucas R, Ponsonby AL, McMichael A, et al. Observational analytic studies in multiple sclerosis: controlling bias through study design and conduct. The Australian Multicentre Study of Environment and Immune Function[J]. Mult Scler, 2007,13:827- 839.
[14] Brookhart MA, Sturmer T, Glynn RJ, et al. Confounding control in healthcare database research: challenges and potential approaches[J]. Med Care, 2010,48:S114-S120.
[15] Pearce N, Checkoway H, Kriebel D. Bias in occupational epidemiology studies[J]. Occup Environ Med, 2007,64:562- 568.
[16] Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies for causal effects[J]. Biometrika, 1983,70:41- 55.
[17] Brookhart MA, Wang PS, Solomon DH, et al. Evaluating short-term drug effects using a physician-specific prescribing preference as an instrumental variable[J]. Epidemiology, 2006,17:268- 275.
[18] Ashenfelter O, Card D. Using the longitudinal structure of earnings to estimate the effect of training programs[J]. Rev Econ Stat, 1985,67:648- 660.
[19] Austin PC, Grootendorst P, Anderson GM. A comparison of the ability of different propensity score models to balance measured variables between treated and untreated subjects: a Monte Carlo study[J]. Stat Med, 2007,26:734- 753.
[20] Mccandless LC, Gustafson P, Austin PC. Bayesian propensity score analysis for observational data[J]. Stat Med, 2009,28:94- 112.
[21] Li L, Shen C, Wu AC, et al. Propensity score-based sensitivity analysis method for uncontrolled confounding[J]. Am J Epidemiol, 2011,174:345.
[22] Schlesselman JJ. Assessing effects of confounding variables[J]. Am J Epidemiol, 1978,108:3- 8.
[23] Greenland S. The Impact of Prior Distributions for uncont-rolled confounding and response bias[J]. JASA, 2003,98:47- 54.
[24] Mccandless LC, Gustafson P, Austin PC, et al. Covariate balance in a Bayesian propensity score analysis of beta blocker therapy in heart failure patients[J]. Epidemiol Perspect Innov, 2009,6:5.
[25] An W. Bayesian propensity score estimators: incorporating uncertainties in propensity scores into causal inference[J]. Sociol Methodol, 2015,40:151- 189.
[26] Greenland S. An introduction to instrumental variables for epidemiologists[J]. Int J Epidemiol 2000;29:1102.
[27] Stukel TA, Fisher ES, Wennberg DE, et al. Analysis of observational studies in the presence of treatment selection bias: effects of invasive cardiac management on AMI survival using propensity score and instrumental variable methods[J]. JAMA,2007,297:278- 285.
[28] Ashenfelter O. Estimating the effect of training programs on earnings[J]. Rev Econ Stat, 1978,60:47- 57.
[29] 黃遠飛, 張家業(yè). 城鄉(xiāng)醫(yī)保整合對農(nóng)村居民醫(yī)療服務利用的影響-以廣州市為例[J]. 中國公共政策評論, 2017,1:34- 52.