王 凱,劉玉文,2,徐濟成
(1.蚌埠醫(yī)學院 衛(wèi)生管理系,安徽 蚌埠 233030;2.中國科學技術大學 計算機科學與技術學院,安徽 合肥 230027;3.安徽農(nóng)業(yè)大學 信息與計算機學院,安徽 合肥 230027)
一種基于后悔理論的啟發(fā)式醫(yī)學決策曲線分析方法
王 凱1,劉玉文1,2,徐濟成3
(1.蚌埠醫(yī)學院 衛(wèi)生管理系,安徽 蚌埠 233030;2.中國科學技術大學 計算機科學與技術學院,安徽 合肥 230027;3.安徽農(nóng)業(yè)大學 信息與計算機學院,安徽 合肥 230027)
決策曲線分析(decision curve analysis,DCA)已被廣泛用于診斷或評價預測模型.然而,DCA的核心是基于期望效用理論的,通常受直覺系統(tǒng)和分析與審議雙認知系統(tǒng)的影響,決策準確度不高.為提高預測模型的準確性,提出了一種雙重模擬量表,通過預期后悔差異算子描述遺憾決策函數(shù)模型,基于經(jīng)典決策樹模型描述決策方案,然后對策略候選集計算凈預期后悔差異值,構建決策閾值概率關系,以疾病概率的形式確定潛在錯誤決策的閾值,以提高模型的容錯能力.實驗表明,本模型具有較高的穩(wěn)定性與準確性.
后悔理論;決策曲線分析;雙重模擬量表;閾值概率
為消除臨床決策模型的不確定性,相關專家學者提出了許多方法,主要基于統(tǒng)計概率模型、信息理論、模糊邏輯及熵理論等方法.文獻[1]區(qū)別對待離散型和連續(xù)型屬性值,基于決策鏈方式處理離散屬性間的傳遞相關性,利用連續(xù)多標記決策系統(tǒng)擴展了傳統(tǒng)粗糙集模型.文獻[2]對Partin表的預測作用進行了評估,通過建立不同預測模型的效益模型,評估并預測了基于決策曲線分析理論的數(shù)學模型,優(yōu)化了決策理論.文獻[3]運用效用分析函數(shù)模擬建立了社交網(wǎng)絡模型,估計效用函數(shù)參數(shù),校準蒙特卡羅參數(shù).文獻[4]針對語言集數(shù)據(jù)構建云模型生成算法,采用數(shù)值模擬方法處理語言數(shù)據(jù)的基本運算,生成多準則決策模型.文獻[5]針對雙邊匹配決策問題, 基于變步長求解模型,計算最優(yōu)匹配決策方案.文獻[6]以多屬性決策分析中常優(yōu)劣解距離法為核心構建最優(yōu)云服務決策函數(shù),獲取了云模型決策最優(yōu)集合.以上模型與方法雖然能夠有效降低決策系統(tǒng)的數(shù)據(jù)噪聲問題,過濾出有效的評價數(shù)據(jù),但由于未考慮決策認知模型的主觀偏好性,整體決策精準度不高.
在臨床醫(yī)學研究中,面向診斷及治療的決策支持系統(tǒng)已在智能診療領域廣泛應用,如慢性炎癥的診療、傳染病和肝外科的確診等.多數(shù)醫(yī)學概率決策支持系統(tǒng)基于預期效用理論[7],試圖最大程度模擬人類直覺輸出良好決策,但由于過分依賴決策者的期望,故具有較大的決策波動性,未能完全達到臨床決策精準診療的要求,誤診概率較大.
因此,以后悔理論[9]為決策評價基礎,融合理性和直覺的認知情感,引入決策者的個人偏好,確定最優(yōu)策略決策.通過決策曲線分析評估不同的治療策略,采用預測模型來估計患者的疾病概率,與決策者的閾值概率比較,整合了決策者包含預后及治療的態(tài)度和喜好的證據(jù)信息,確定決策者能夠容忍的決策錯誤域,輸出最優(yōu)決策集.
本模型提出了一種引出決策者對治療決策偏好的新方法.與傳統(tǒng)的引導偏好方法相反,本模型考慮了潛在錯誤在決策中的后果,通過建立一個雙重模擬量表來捕獲決策遺憾錯誤集,評估每個可用策略的相關利弊并建立候選集,從遺憾理論的角度重新建立啟發(fā)式?jīng)Q策曲線模型.
圖1 治療管理決策樹Fig.1 Treatment management of decision tree
圖1描述了一個典型的基于預測模型的決策樹治療模型,該模型設有兩個競爭策略:治療策略與不治療策略,輸出4個可能的組合結(jié)果:全部治療、不治療、模型決策必要治療和模型決策不治療.P=P(D+)表示與疾病相關聯(lián)概率;1-P=P(D-)表示不存在疾病而診療的相關概率;Ui是對應結(jié)果輸出,i∈[1,4],U1表示對存在疾病的病人進行治療(必要治療),U2表示對沒有疾病的人進行治療(不必要治療).以下使用的術語——治療,涉及一般意義上的保健干預,包括可能的治療或診斷測試.
基于預測模型的概率復雜性決定了決策過程具有很大的偶然性[10].由于目前尚無對概率值規(guī)范化的決策診療說明,對患者的治療主要依靠決策者本身的經(jīng)驗.從經(jīng)典決策理論的角度來看,解決方案往往需要引入閾值概率Pt,當病人的患病概率值超過該閾值時,即可進入下一階段診療.然而,在大多數(shù)情況下決策無法做到百分之百準確.因此,一旦做出決定,可能會出現(xiàn)錯誤決策,在臨床診斷領域帶來嚴重的后果.當錯誤決定的后果危及生命或嚴重影響病人的生命質(zhì)量時,后悔尤其強烈.形式上,遺憾可以表示為所采取的決策行為效用與真實效用之間的差異.在決策過程中,任何一方都可能會感到遺憾,例如接受治療的病人、病人的代理人或管理治療的醫(yī)生.假設決策者是治療醫(yī)生,采用遺憾理論估計閾值概率Pt描述兩種遺憾結(jié)果:對有病患者未采取治療和對未患有疾病者采取治療措施.
圖2 基于決策診斷的決策樹后悔模型Fig.2 Decision tree depression model based on decision diagnosis注:圖中P表示患病概率;1-P表示未患病概率;Pt表示治療閾值概率;Rg表示與錯誤決策關聯(lián)后悔函數(shù);Rx-表示不采取治療措施;Rx+表示采取治療措施;D+表示患??;D-表示未患??;例如Rg(Rx+,D-)表示對未患病患者采取治療措施的后悔值.
圖2描述了基于決策結(jié)果的遺憾推導效用模型.當患病概率超過閾值概率時,遺憾值表示對患病者未采取治療的錯誤后悔度.類似地,當患病概率小于閾值概率時,遺憾值表示對未患病者采取治療的錯誤后悔度.Rg(RX,D+)=Rg(RX,D-)=0表示采取了正確決策,故相應遺憾度為0;(U1-U3)表示犯了有病未治的錯誤(稱為Ⅰ類錯誤后果);(U4-U2)表示犯了未病有治的錯誤(稱為Ⅱ類錯誤后果).基于以上假設,定義閾值概率如下:
(1)
公式(1)有區(qū)別地限定了決策者采取治療或不治療的偏好.通過閾值概率將決策者的假陰性錯誤(即未能提供必要治療的Ⅰ類錯誤)與假陽性錯誤(即不必要治療的Ⅱ類錯誤)相結(jié)合.特別是當U4-U2=0時,對不必要的治療不存在遺憾.這種情況下,Pt=100%,說明治療只是針對患病者的確定性治療,然而在臨床診斷領域此狀況屬于小概率事件.
啟發(fā)式閾值概率是試圖衡量決策者傾向性態(tài)度的決策理論,核心是通過捕捉?jīng)Q策態(tài)度,利用閾值概率規(guī)范管理策略模型.存在兩類方法規(guī)范閾值概率,一類是標準規(guī)范理論、時間權衡理論,但由于時間復雜度較高且缺乏足夠的認知能力,是有偏估計決策,無法有效評估決策價值,決策精度不高;另一類方法是使用評定量表,如視覺模擬評分策略,通過管理決策參與者縮減候選策略集,但受限于模擬決策尺度,不能完全實現(xiàn)決策狀態(tài)的動態(tài)平衡.
改進的啟發(fā)式閾值概率利用雙重視覺模擬決策評估可能出現(xiàn)的失誤后果.第一類用于評估決策遺憾與潛在錯誤之間的缺失管理;第二類是衡量決策遺憾與潛在錯誤之間的過度管理治療,計算閾值概率.
采用雙重模擬策略,仿照疼痛評估限制理論[ 11],利用0~100評分制描述遺憾后悔度.引入閾值概率,將醫(yī)生的遺憾與錯誤決定(如給予不必要的治療與過度治療)關系數(shù)值化,這些問題可以狹義地與特定的結(jié)果(例如生存/死亡率、心臟病發(fā)作等)相關.然而,大多數(shù)治療都與多個維度相關,要準確地取舍多領域、多維度可置換決策集,需要通過詢問方式進行利弊權衡,解決認知機制中直覺與審議的雙重決策過程.
對醫(yī)生閾值概率的數(shù)值設定采用基于決策遺憾水平的訪談形式,獲取醫(yī)生對疾病診療結(jié)果的遺憾后悔度,核心問題如下:
(1)對0~100的任意整數(shù),0表示沒有遺憾,100表示最大遺憾,如果沒有提供必要的治療,會如何評價遺憾水平(即沒有對應該治療的病人治療)?本問題答案可表達為公式(1)中的(U1-U3);
(2)對0~100的任意整數(shù),0表示沒有遺憾,100表示最大遺憾,如果對病人做了不必要的治療,會如何評價遺憾水平?本問題答案可表達為公式(1)中(U4-U2).
假設醫(yī)生對以上問題的回答分別是60和30,即意味該醫(yī)生認為Ⅰ類錯誤決策發(fā)生的概率是Ⅱ類錯誤發(fā)生概率的2倍(60÷30=2),則該醫(yī)生的閾值概率可計算為
(2)
決策者可能會提出許多供選擇的策略,這使得決策模型計算量過大.本模型公式以Vickers[12]的決策曲線預期效用分析模型為改進對象,增加基于遺憾度的簡約函數(shù),具有額外的決策理論優(yōu)勢,能夠在雙認知水平上度量決策后果,從而描述了包含所有替代策略的廣義決策樹,如圖3所示.
圖3 治療的廣義決策樹分類決策模型Fig.3 Treatment of generalized decision tree classification decision model注:圖中P表示患有疾病的概率;1-P表示沒有疾病的概率;Rg表示與錯誤決定相關的遺憾度;Rx-表示無治療;Rx+表示治療;D+表示存在疾病;D-表示不存在疾病.
通過求解決策樹,估計與每個策略相關聯(lián)的遺憾期望,模型決策后悔度函數(shù)可表示如下:
ERg[Model]=p(FN)(U1-U3)+(1-p)(FP)(U4-U2).
(3)
FN=P(p (4) 對于給予治療和不給予治療的決策策略,預期后悔度模型表示如下: (5) (6) 若把不給予治療的決策策略后悔度函數(shù)看成基準策略,凈期望后悔差異函數(shù)中模型決策后悔度函數(shù),Ⅰ類錯誤治療策略和Ⅱ類錯誤策略決策后悔度函數(shù)可表示如下: (7) (8) NERD[non-Treat,non-Treat]=0, (9) (10) 為便于分類決策時更加清晰地描述患病比例與閾值概率的相關性,分別將上述公式改寫如下: (11) (12) 本模型策略集的決策響應集合采用如下規(guī)則集: (1)當計算NERD[不治療、全部治療]時,假設所有患者都有該疾病,所以#TP是實際患有該疾病的人數(shù),#FP是沒有該疾病但被給予治療的人數(shù). (2)當利用公式(11)計算NERD[不治療,模型決策]及用公式(12)計算NERD[全部治療,模型決策]時,計算每個閾值概率#TP,#FP,#TN,#FN,如果預測概率大于或等于閾值概率則推斷患者具有該類疾病. (3)當給定閾值概率將兩個策略進行比較時,NERD值提供與遺憾度相關的信息.如果NERD=0,意味著兩種策略的遺憾度沒有差別: NERD[策略1,策略2]=0?ERg(策略1)-ERg(策略2)=0?ERg(策略1)=ERg(策略2). (13) (4)如果NERD[策略1,策略2]>0,意味著策略2比策略1造成的遺憾度更小,優(yōu)選策略2,反之亦成立: NERD[策略1,策略2]>0?ERg(策略1)>ERg(策略2), (14) NERD[策略1,策略2]<0?ERg(策略1) (15) (5)滿足傳遞性原理(若A>B且B>C,則A>C),通過其對應的NERD數(shù)值比較每對策略,輸出每個閾值概率下的最優(yōu)決策: NERD[策略1,策略2]>NERD[策略2,策略3]>0?ERg(策略1)>ERg(策略3). (16) 基于后悔度的決策曲線分析模型算法如下: ①選擇并確定閾值概率; ②假設不對患者進行治療且p≥Pt時,計算#TP和#FP; ③使用公式(11)計算NERD[不治療,模型決策]; ④使用公式(12)計算NERD[全部治療,模型決策]; ⑤使用公式(11)計算NERD[不治療,全部治療],其中#TP是患有疾病的患者數(shù),#FP是沒有接受治療的疾病患者數(shù); ⑥在閾值概率范圍內(nèi),重復步驟①至⑥; ⑦將步驟③至⑤中計算的NERD數(shù)值逐個與閾值概率相比較,并按規(guī)則(3)與規(guī)則(4)輸出模型決策. 本模型選取男性死亡主要原因之一的前列腺癌作為說明本方法適用性的實驗用例.目前,臨床上對前列腺癌的主要篩查手段是前列腺癌活檢.前列腺癌活檢是一種侵入且不舒服的檢查項目,過程痛苦且伴隨有感染風險.通常,將患者是否有前列腺特異性抗原(PSA)水平升高作為重要診斷指標,然而大多數(shù)PSA高的男性并沒有前列腺癌. 在統(tǒng)計模型的基礎上增加多個預測因子(PSA、年齡、家族病史等其他標記),可預測患者是否有必要進行活檢.當醫(yī)生看到一個病人的PSA升高時,有3種可能的選擇:活檢、拒絕活檢或在統(tǒng)計模型中查找他的患病概率,然后做出決策.依據(jù)本算法,通過比較決策集確定閾值概率不同取值條件下的最優(yōu)策略.通過將每個NERD策略的特定閾值概率與公式(13)至公式(15)中的策略進行比較,實現(xiàn)策略優(yōu)化.依據(jù)NERD[策略1,策略2]的數(shù)值,采取以下決策策略: (1)當NERD(不活檢,模型決策)>0,該模型選取不活檢策略; (2)當NERD(不活檢,全部活檢)>0,該模型選取不活檢策略; (3)當NERD(全部活檢,模型決策)>0,該模型選取不活檢策略. 基于最優(yōu)策略評價,通過比較治療醫(yī)生的概率閾值與啟發(fā)規(guī)則,根據(jù)預測模型的癌癥概率對比閾值概率.使用臨床醫(yī)生訪談方式,整體決策過程描述如下: (1)醫(yī)生決策閾值概率.在0~100,將醫(yī)生對Ⅰ類錯誤治療策略進行評分,其中0表示對決策做出完全沒有后悔的評價,100表示對決策做出最大限度后悔的評價,設置問題“如果沒有提供必要的治療,如何評價后悔水平1#醫(yī)師為50,2#醫(yī)師為70……”,將上述值代入公式(1)中的U1~U3.類似地,對Ⅱ類錯誤策略決策評分,設置問題“如果你進行了不必要的治療,你如何評價你的后悔水平?1#醫(yī)師為10,2#醫(yī)師為60……”,代入公式(1)的U4-U2.計算閾值概率:1#醫(yī)師為16%,2#醫(yī)師為46%. (2)計算閾值概率的最佳策略.依據(jù)公式(13)至公式(15),計算#1醫(yī)師在閾值概率等于16%時,通過求解不等式得到最佳決策:NERD(全部活檢,模型決策)>0,策略“模型決策”優(yōu)于策略“全部活檢”;NERD(不活檢,模型決策)>0,策略“模型決策”優(yōu)于策略“不活檢”;NERD(不活檢,全部活檢)>0,策略“全部活檢”優(yōu)于“不活檢”. 因此,對于1#醫(yī)師的臨床決策而言,通過統(tǒng)計模型預測癌癥概率的活檢,最佳策略是“模型決策”,下一步是計算患者的癌癥概率并將其與閾值概率進行對比.對于2#醫(yī)師而言,閾值概率等于46%,最佳策略是“不活檢”. 在這種情況下,計算癌癥概率的引入不會影響醫(yī)生決策. (3)基于統(tǒng)計模型計算特定患者的癌癥概率.如果癌癥概率大于或等于閾值概率,醫(yī)生應該對患者進行活組織檢查;如果癌癥概率小于閾值概率,醫(yī)生則不應該對患者進行活組織檢查.假設特定患者的癌癥概率等于20%,1#醫(yī)師的閾值概率為16%,在這種情況下,1#醫(yī)生考慮推薦活檢,2#醫(yī)生的最佳策略是建議不對任何患者進行活檢. 本研究提出了一種基于后悔理論的啟發(fā)式醫(yī)學決策曲線分析方法,依靠遺憾理論和決策曲線分析,幫助醫(yī)生在適當?shù)尼t(yī)療干預措施中進行決策選擇.利用帶有遺憾反饋函數(shù)的認知模型確定決策者對可用策略的偏好,做出最佳決策.從遺憾理論的角度改進了曲線決策理論,基于后悔理論的啟發(fā)式醫(yī)學決策曲線分析方法量化了決策者對特定策略的態(tài)度,不需要在雙重處理認知系統(tǒng)中對每種決策單獨推理. [1] 余鷹,苗奪謙,趙才榮,等.基于粗糙集的多標記決策系統(tǒng)知識獲取方法[J].計算機科學與探索,2015,14(1):141-147. [2] 肖文軍,陸茜,姚旭東,等.決策曲線分析評價臨床預測模型的應用研究[J].中國衛(wèi)生統(tǒng)計,2012,26(3):110-118. [3] 李永立,羅鵬,張書瑞.基于決策分析的社交網(wǎng)絡鏈路預測方法[J].管理科學學報,2017,32(1):89-97. [4] 楊惡惡,王堅強,馬超群,等.基于云發(fā)生算法的猶豫語言多準則決策方法[J].控制與決策,2015,40(2):224-231. [5] 梁海明,姜艷萍,孔德財.考慮偏好序的多滿意穩(wěn)定導向雙邊匹配決策方法[J].系統(tǒng)工程理論與實踐,2015,15(6):135-141. [6] 張龍昌,楊艷紅,趙緒輝.基于云模型的SaaS決策方法[J].電子學報,2015,32(5):98-105. [7] GREENLAND S.Bayesian interpretation and analysis of research results [J].Seminars in Hematology,2008,45(3):141-149. [8] SHRINK C A M,LUCAS P J F,HOEPELMAN I M,et al.Computer-assisted decision support for the diagnosis and treatment of infectious diseases in intensive care units [J].The Lancet Infectious Diseases,2005,5(5):305-312. [9] VICKERS A,CRONIN A,ELKIN E,et al.Extensions to decision curve analysis,a novel method for evaluating diagnostic tests, prediction models and molecular markers [J].BMC Medical Informatics and Decision Making,2008,8(1):53-60. [10]HOZO I,DJULBEGOVIC B.When is diagnostic testing inappropriate or irrational acceptable regret approach [J].Med Dec Making,2008,28(4):540-553. [11]O′CONNOR A M,LEGARE F,STACEY D.Risk communication in practice:the contribution of decision aids [J].BMJ,2003,327(7417):736-740. [12]VICKERS A,ELKIN E.Decision curve analysis:a novel method for evaluating prediction models[J].Med Dec Making,2006,26(6):565-574. Amethodofheuristicmedicaldecisioncurveanalysisbasedonregrettheory WANGKai1,LIUYuwen1,2,XUJicheng3 (1.DepartmentofHealthManagement,BengbuMedicalCollege,Bengbu233030,China; 2.SchoolofComputerScienceandTechnology,UniversityofScienceandTechnologyofChina,Hefei230027,China; 3.SchoolofInformationandComputerScience,AnhuiAgricultureUniversity,Hefei230027,China) Decision Curve Analysis has been widely used to diagnose or the evaluation predictive models. However, the core of DCA is based on the theory of expectation utility, which is also usually influenced by the intuitive system as well as the analysis and consideration of the dual cognitive system. In order to improve the accuracy of the forecasting model, this paper presents a dual simulation scale, which describes the regrettable decision function model by describing the regrettable difference operator, and describes the decision-making scheme based on the classical decision tree model. Then, the value of the difference is determined, the probability of the decision threshold is constructed, and the threshold of the potential error decision is determined. Experiments show that the model has high stability and accuracy. regret theory; decision curve analysis; double simulation scale; threshold probability TP391 A 1674-330X(2017)04-0066-06 2017-08-10 安徽省高校自然科學重點研究項目(KJ2017A223);安徽省高校自然科學一般項目(KJ2015B023);安徽省蚌埠市科技發(fā)展指導性項目(20160327) 王凱(1985-),男,安徽蚌埠人,講師,碩士,研究方向為醫(yī)學信息決策與數(shù)據(jù)挖掘.3 實驗
4 結(jié)語