臧曉彤,張培彤
中國(guó)中醫(yī)科學(xué)院廣安門(mén)醫(yī)院腫瘤科,北京 100053
小細(xì)胞肺癌(small cell lung cancer,SCLC)是一種神經(jīng)內(nèi)分泌起源的高度侵襲性癌癥,與吸煙密切相關(guān),有60%~65%的患者會(huì)伴有轉(zhuǎn)移性疾病[1]。SCLC占所有肺癌發(fā)病的15%,且目前治療方案有限,預(yù)后較差,無(wú)論在臨床試驗(yàn)還是真實(shí)世界的研究中各類(lèi)治療方案都未能取得顯著效果[2]。臨床研究顯示,中醫(yī)藥的介入能夠有效減輕SCLC放化療的不良反應(yīng)、改善癥狀及生存質(zhì)量、提高治療效果[3-6]。辨證論治是中醫(yī)臨床實(shí)踐的核心,而目前傳統(tǒng)的中醫(yī)辨證主觀性強(qiáng),對(duì)比性及可重復(fù)性差,交流學(xué)習(xí)及經(jīng)驗(yàn)推廣難度大,因而借助現(xiàn)代信息技術(shù)進(jìn)行準(zhǔn)確的辨證對(duì)提升SCLC中醫(yī)辨證效率及精度具有重要意義。
近年來(lái),信息技術(shù)尤其是人工智能在中醫(yī)智能辨證領(lǐng)域中已取得一定成果[7]。人工神經(jīng)網(wǎng)絡(luò)是一種模擬大腦神經(jīng)元細(xì)胞功能傳遞信息的模型,以網(wǎng)絡(luò)拓?fù)錇槔碚摶A(chǔ)模擬人腦對(duì)復(fù)雜信息的處理模式,具有高容錯(cuò)性、智能性等特征,已在肺癌的西醫(yī)基礎(chǔ)研究及臨床診治中發(fā)揮了重要作用[8]。因此,本研究采用人工神經(jīng)網(wǎng)絡(luò)算法構(gòu)建SCLC患者中醫(yī)智能辨證模型,以期為提高SCLC中醫(yī)臨床診斷效率及精度提供參考。
1.1 一般資料納入病例為2020年9月1日至2021年2月28日期間中國(guó)中醫(yī)科學(xué)院廣安門(mén)醫(yī)院腫瘤科的105例病理確診為SCLC的患者。患者平均年齡61歲,男性占比72%,女性占比28%,局限期占比45%,廣泛期占比55%。本研究經(jīng)中國(guó)中醫(yī)科學(xué)院廣安門(mén)醫(yī)院倫理委員會(huì)審查批準(zhǔn)(2020-071-KY-01)。
1.2 診斷標(biāo)準(zhǔn)西醫(yī)診斷標(biāo)準(zhǔn):采用中華人民共和國(guó)衛(wèi)健委醫(yī)政醫(yī)管局發(fā)布的《原發(fā)性肺癌診療規(guī)范(2018年版)》[9]中的SCLC診斷標(biāo)準(zhǔn)。
中醫(yī)證型診斷標(biāo)準(zhǔn):參考中醫(yī)證候分層診斷標(biāo)準(zhǔn)[10-11],將八綱辨證、臟腑辨證、氣血津液辨證相結(jié)合,借助證素理念,采用單證的研究方法,將證候分層至不能再進(jìn)一步劃分。一級(jí)診斷:虛證、實(shí)證,是綱領(lǐng)性證候,區(qū)分出證候的虛實(shí)類(lèi)別。二級(jí)診斷:根據(jù)病位的外內(nèi)淺深區(qū)分表里,具體為表虛證、里虛證;表實(shí)證、里實(shí)證。三級(jí)診斷:在二級(jí)診斷的基礎(chǔ)上加氣、血、陰、陽(yáng)、津、液、精等病性證素區(qū)分證候的基本類(lèi)別,包括氣血津液辨證和寒熱辨證兩部分內(nèi)容。四級(jí)診斷:在三級(jí)診斷的基礎(chǔ)上加上病位證素。
1.3 納入標(biāo)準(zhǔn)①符合上述SCLC診斷標(biāo)準(zhǔn);②就診時(shí)無(wú)其他影響癥狀表現(xiàn)的疾病。
1.4 排除標(biāo)準(zhǔn)①有其他惡性疾??;②既往有其他惡性腫瘤病史;③認(rèn)知障礙或依從性差,不能配合量表評(píng)價(jià)者。
2.1 調(diào)查方法采用橫斷面調(diào)查法,由中醫(yī)腫瘤專(zhuān)業(yè)的碩士研究生對(duì)就診的研究對(duì)象進(jìn)行現(xiàn)場(chǎng)調(diào)查,收集各病癥信息,根據(jù)上述中醫(yī)證型診斷標(biāo)準(zhǔn)判斷單證證型,一個(gè)患者可對(duì)應(yīng)多個(gè)單證,并經(jīng)腫瘤科專(zhuān)家導(dǎo)師修正。
2.2 癥狀術(shù)語(yǔ)規(guī)范方法病例中的中醫(yī)癥狀,采取黎敬波主編的《中醫(yī)臨床常見(jiàn)癥狀術(shù)語(yǔ)規(guī)范》[12]的癥狀描述,采用課題組時(shí)美伶[13]研究的相似癥狀歸類(lèi)法進(jìn)行整理,將病例涉及癥狀進(jìn)行標(biāo)準(zhǔn)化后納入癥狀術(shù)語(yǔ)庫(kù)。
2.3 建模方法采用Excel 2016建立數(shù)據(jù)庫(kù),將癥狀和單證分別整理為二分類(lèi)變量,“有”賦值為“1”“無(wú)”賦值為“0”。利用SPSS 23.0軟件,建立基于人工神經(jīng)網(wǎng)絡(luò)算法的SCLC患者中醫(yī)智能辨證模型。軟件按照73的比例自動(dòng)隨機(jī)拆分?jǐn)?shù)據(jù)為訓(xùn)練集和驗(yàn)證集,建立神經(jīng)網(wǎng)絡(luò)模型,并計(jì)算模型受試者工作特征曲線(receiver operating curve,ROC)下面積(area under curve,AUC)以評(píng)估模型優(yōu)劣。
3.1 頻率分析對(duì)105例患者的1 729條癥狀表現(xiàn)進(jìn)行整理,對(duì)標(biāo)準(zhǔn)化后的77個(gè)中醫(yī)癥狀進(jìn)行頻率分析,頻率大于20%的26個(gè)典型癥狀見(jiàn)表1。
表1 SCLC患者典型癥狀分布表
對(duì)按照分層診斷辨證方式得出的47個(gè)單證進(jìn)行頻數(shù)統(tǒng)計(jì),結(jié)果見(jiàn)表2。
表2 SCLC患者單證分布表
出現(xiàn)頻數(shù)最高的前五種單證診斷的關(guān)鍵癥狀分布,見(jiàn)表3。
表3 SCLC患者高頻單證關(guān)鍵癥狀分布表
3.2 智能辨證模型對(duì)47個(gè)單證構(gòu)建神經(jīng)網(wǎng)絡(luò)模型(圖1),隱藏層有18個(gè)神經(jīng)元節(jié)點(diǎn)。
圖1 神經(jīng)網(wǎng)絡(luò)模型示意圖
訓(xùn)練集總準(zhǔn)確率達(dá)91%,驗(yàn)證集總準(zhǔn)確率均達(dá)92.6%,模型平均AUC為0.842,見(jiàn)表4。
表4 SCLC患者智能辨證模型結(jié)果
SCLC可歸于中醫(yī)學(xué)“咳嗽”“胸痛”“咯血”“肺積”等范疇,其病因病機(jī)復(fù)雜,在進(jìn)行中醫(yī)臨床辨證之前需要了解其中醫(yī)證型分布特點(diǎn)。研究表明,SCLC中醫(yī)證候以虛證為主,兼以虛實(shí)夾雜,痰、氣、血的異常在SCLC疾病發(fā)展過(guò)程中有重要意義[14]。證候是疾病發(fā)展過(guò)程中某一階段的病理概括,準(zhǔn)確的辨證是中醫(yī)臨床診斷的核心。證素[15]是構(gòu)成中醫(yī)證候的基本要素,它包含病位證素、病性證素,病位和病性證素組合成單證,臨床上患者常表現(xiàn)為多個(gè)單證的復(fù)雜組合。因此,本研究以單證的組合作為診斷結(jié)果,能夠全面反映患者病情,且為進(jìn)一步的量化診斷研究工作奠定了基礎(chǔ)。
人工神經(jīng)網(wǎng)絡(luò)[16]是在模擬人腦的信息處理機(jī)制的基礎(chǔ)上建立起來(lái)的一種非線性動(dòng)力系統(tǒng),具有快速的數(shù)據(jù)處理能力,且能夠通過(guò)對(duì)樣本的學(xué)習(xí),自動(dòng)提取隱藏規(guī)律,并根據(jù)這些規(guī)律,對(duì)新樣本進(jìn)行自動(dòng)歸類(lèi)。中醫(yī)臨床辨證是通過(guò)大量癥狀表現(xiàn)來(lái)判斷一種或幾種證候,臨床經(jīng)驗(yàn)的積累某種程度上等同于在人腦中建立起癥狀與證候之間的非線性映射關(guān)系,因此,人工神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)處理方式十分適用于復(fù)雜的中醫(yī)辨證邏輯。
本研究收集的SCLC患者病歷信息中,出現(xiàn)頻次排名前10位的癥狀依次是脈沉、舌紫暗、咳嗽、面色少華、咳痰、干咳少痰、唇甲紫暗、脈細(xì)、痰白、痰黏稠,其中脈沉主里證,是所有SCLC患者的共性特征。舌紫暗、唇甲紫暗說(shuō)明有瘀血內(nèi)結(jié),咳嗽、咳痰等癥狀是痰飲阻滯而肺氣上逆的表現(xiàn),面色少華、脈細(xì)則意味著患者氣血不足。結(jié)合單證的分布特征來(lái)看,SCLC患者表現(xiàn)出虛實(shí)夾雜以實(shí)證為主的臨床表現(xiàn),這同多數(shù)患者無(wú)法手術(shù)而荷瘤生存的狀態(tài)有關(guān),病灶的存在導(dǎo)致肺部局部癥狀嚴(yán)重,痰瘀久結(jié)無(wú)法消除,然而細(xì)究其疾病的本質(zhì)還是正虛,在臨床治療時(shí)不可一味祛瘀化痰而忽略了補(bǔ)虛的重要性。從出現(xiàn)頻率最高的5個(gè)單證中各核心癥狀的占比統(tǒng)計(jì)可以看出,核心癥狀也有主次差異,如果能對(duì)每個(gè)單證對(duì)應(yīng)的核心癥狀賦予權(quán)重,并由此計(jì)算單證得分,可以為未來(lái)量化的智能辨證提供依據(jù)。
本研究通過(guò)人工神經(jīng)網(wǎng)絡(luò)構(gòu)建出了整體準(zhǔn)確率較高的SCLC中醫(yī)智能辨證模型,但對(duì)于具體單證,則有部分準(zhǔn)確率不高,這是由于樣本量小以及所涉及單證較多但分布不平衡造成的。目前該模型只是根據(jù)患者各項(xiàng)癥狀的有無(wú)來(lái)推斷單證組合,還無(wú)法對(duì)癥狀主次、嚴(yán)重程度進(jìn)行量化,故而也無(wú)法衡量各單證所占的比重,尚不能夠反映疾病的全貌,筆者將在后續(xù)研究中繼續(xù)探索改進(jìn)。
綜上所述,通過(guò)人工神經(jīng)網(wǎng)絡(luò)算法,能夠形成準(zhǔn)確率較高的中醫(yī)智能辨證模型,為SCLC中醫(yī)臨床診斷提供參考依據(jù)。今后可通過(guò)大樣本、多中心的研究,納入足夠多的樣本數(shù)據(jù),優(yōu)化算法,進(jìn)一步完善模型,為其在臨床上的實(shí)際應(yīng)用奠定基礎(chǔ)。未來(lái)通過(guò)規(guī)范的癥狀量表的研究,可對(duì)本研究的各單證進(jìn)一步量化賦予權(quán)重,使中醫(yī)臨床辨證更加精準(zhǔn)客觀,從而實(shí)現(xiàn)針對(duì)性處方施治及療效評(píng)價(jià),如此,SCLC的精準(zhǔn)中醫(yī)診療未來(lái)可期。