徐甜甜,薛 旻,劉衛(wèi)勇,付 超+
(1.合肥工業(yè)大學(xué) 管理學(xué)院,安徽 合肥 230009;2.合肥工業(yè)大學(xué) 過程優(yōu)化與智能決策教育部重點實驗室,安徽 合肥 230009;3.中國科學(xué)技術(shù)大學(xué)附屬第一醫(yī)院 超聲科,安徽 合肥 230036)
甲狀腺結(jié)節(jié)臨床診斷中,醫(yī)生觀察超聲圖像中的結(jié)節(jié)特征給出診斷意見。受限于醫(yī)生的專業(yè)知識和診斷經(jīng)驗,存在一定的誤診可能性[1]。新一代信息技術(shù)的發(fā)展及其在臨床中的廣泛應(yīng)用,使得大量臨床診斷數(shù)據(jù)得以保存,為運用SVM[2]、決策樹[3]、神經(jīng)網(wǎng)絡(luò)[4]等機器學(xué)習(xí)方法進(jìn)行輔助診斷提供了數(shù)據(jù)基礎(chǔ)。文獻(xiàn)[5]就機器學(xué)習(xí)在甲狀腺疾病診斷中的應(yīng)用做了詳細(xì)綜述,指出目前神經(jīng)網(wǎng)絡(luò)方法在甲狀腺疾病診斷中使用最多。為提高甲狀腺結(jié)節(jié)的臨床診斷精度,降低誤診率,文獻(xiàn)[6]提出基于卷積神經(jīng)網(wǎng)絡(luò)的診斷方法,并利用超聲圖像數(shù)據(jù)驗證了所提方法的可行性。BP神經(jīng)網(wǎng)絡(luò)作為神經(jīng)網(wǎng)絡(luò)中最成熟的方法之一,具有較好的泛化能力和容錯性,是一種極具潛力的臨床決策支持工具。文獻(xiàn)[7]建立BP神經(jīng)網(wǎng)絡(luò)模型對甲狀腺結(jié)節(jié)良惡性進(jìn)行分類識別,實驗結(jié)果表明,該模型能得到較高的惡性識別率。
上述研究工作雖取得了較好的效果,但也存在一些不足之處。一是上述研究沒有將預(yù)測精度與醫(yī)生自身的精度進(jìn)行對比,難以體現(xiàn)模型的輔助診斷意義。二是上述研究主要圍繞甲狀腺超聲圖像開展工作,忽略了文本數(shù)據(jù)在甲狀腺輔助診斷中的重要性。三是TI-RADS分級作為被普遍使用的甲狀腺結(jié)節(jié)臨床診斷分級標(biāo)準(zhǔn),并未被上述研究所考慮。針對上述研究不足,本文設(shè)計一套醫(yī)療診斷文本數(shù)據(jù)規(guī)范化處理流程,并在此基礎(chǔ)上構(gòu)建了基于BP神經(jīng)網(wǎng)絡(luò)的甲狀腺結(jié)節(jié)輔助診斷模型,用于預(yù)測甲狀腺結(jié)節(jié)TI-RADS分級。此外,在模型中引入病理結(jié)果作為精度判定的“金標(biāo)準(zhǔn)”,進(jìn)而利用區(qū)間數(shù)距離測度,定義新的診斷精度公式。最后立足于安徽合肥某三甲醫(yī)院甲狀腺超聲診斷數(shù)據(jù),3個對比實驗結(jié)果表明,所提出的輔助診斷模型能有效幫助醫(yī)生提高診斷水平。
醫(yī)療領(lǐng)域由于缺乏標(biāo)準(zhǔn)化的數(shù)據(jù)管理模式,導(dǎo)致診斷數(shù)據(jù)大都是以不規(guī)范的自由文本形式記錄[8]。為基于醫(yī)療診斷文本數(shù)據(jù)進(jìn)行研究,首要問題是如何從中提取出真正有價值的數(shù)據(jù)并進(jìn)行規(guī)范化處理。因此,本節(jié)設(shè)計一種醫(yī)療診斷文本數(shù)據(jù)規(guī)范化處理流程,并將該流程應(yīng)用于甲狀腺超聲診斷數(shù)據(jù)的規(guī)范化處理中。
本文將醫(yī)療診斷文本數(shù)據(jù)規(guī)范化處理流程分為4個階段,包括數(shù)據(jù)采集、特征提取、數(shù)據(jù)分級以及數(shù)據(jù)轉(zhuǎn)化,具體過程如圖1所示。
數(shù)據(jù)采集取決于研究對象和研究目的。據(jù)此聚焦所需數(shù)據(jù),采集相關(guān)原始數(shù)據(jù)并適當(dāng)刪減,將檢查數(shù)據(jù),醫(yī)生診斷意見,病理結(jié)果及其它基本信息匯總整合。
特征提取是從采集的數(shù)據(jù)中根據(jù)檢查指標(biāo)提取病癥的指標(biāo)特征信息。疾病的診斷大都需要進(jìn)行相應(yīng)的檢查,而每項檢查都有專業(yè)的檢查指標(biāo)以幫助醫(yī)生做出診斷。根據(jù)歷史數(shù)據(jù)特點,再結(jié)合醫(yī)學(xué)專業(yè)知識可以確定醫(yī)院所關(guān)注的檢查指標(biāo)。指標(biāo)確定之后,針對選定的指標(biāo)從檢查數(shù)據(jù)中提取各項指標(biāo)的特征詞,并依據(jù)特征詞庫規(guī)范特征詞,得到規(guī)范的特征數(shù)據(jù)。
數(shù)據(jù)分級以提取的特征詞為基礎(chǔ),對指標(biāo)特征按惡性程度進(jìn)行分級。疾病的良惡性會通過各項指標(biāo)特征來體現(xiàn),每項指標(biāo)都存在很多特征,不同的特征代表病灶在該指標(biāo)上的惡性程度不同。臨床診斷中,僅通過檢查并不能完全確定疾病的良惡性,醫(yī)生只能基于各項指標(biāo)的特征對疾病的惡性等級提供診斷意見。而病理檢查結(jié)果才是疾病的最終確診。鑒于此,在醫(yī)生輔助下根據(jù)特征-病理的關(guān)系統(tǒng)計分析每個特征的惡性風(fēng)險等級,實現(xiàn)指標(biāo)特征的分級,得到特征分級標(biāo)準(zhǔn)。
圖1 醫(yī)療診斷文本數(shù)據(jù)規(guī)范化處理流程
完成數(shù)據(jù)的采集、提取、規(guī)范和分級后,利用數(shù)據(jù)分級得到的特征分級標(biāo)準(zhǔn)轉(zhuǎn)化相關(guān)數(shù)據(jù),將指標(biāo)特征、診斷意見、病理結(jié)果等文本數(shù)據(jù)轉(zhuǎn)化為可用于計算機直接使用的數(shù)字矩陣。
該流程為醫(yī)療診斷文本數(shù)據(jù)的規(guī)范化處理提供了一個范式,解決了面對不規(guī)范的醫(yī)療診斷文本數(shù)據(jù)無從下手的困難,為面向甲狀腺輔助診斷的研究工作奠定了數(shù)據(jù)基礎(chǔ)。它不僅適用于本文研究的甲狀腺超聲診斷數(shù)據(jù),同樣可推廣用于其它疾病的診斷文本數(shù)據(jù)處理,如乳腺,頸動脈等。
依據(jù)上述所設(shè)計的醫(yī)療診斷文本數(shù)據(jù)規(guī)范化處理流程,以安徽省合肥市某三甲醫(yī)院的甲狀腺超聲診斷文本數(shù)據(jù)為例,驗證該流程的可行性和合理性。
(1)數(shù)據(jù)采集
在第三作者的幫助下,從醫(yī)院電子病歷系統(tǒng)、報告系統(tǒng)等信息系統(tǒng)中采集到2014-01-01至2018-12-31期間甲狀腺超聲診斷相關(guān)的病癥描述、醫(yī)生診斷意見、病理結(jié)果以及病例基本信息等文本數(shù)據(jù),具體數(shù)據(jù)樣例見表1和表2。
表1 病癥描述數(shù)據(jù)示例
表2 醫(yī)生診斷意見與病理結(jié)果數(shù)據(jù)示例
(2)特征提取
據(jù)現(xiàn)有研究可知,通過超聲檢查可以檢測甲狀腺結(jié)節(jié)的邊緣、邊界、大小、輪廓、回聲、鈣化、血流、聲暈、縱橫比等多種特征信息[9]。這些特征是幫助診斷甲狀腺結(jié)節(jié)的有效指標(biāo),但不同的醫(yī)院選取的檢查指標(biāo)具有一定差異。根據(jù)歷史數(shù)據(jù)及與醫(yī)生討論后,確定該醫(yī)院主要關(guān)注邊緣、邊界、回聲、鈣化及血流共5項甲狀腺超聲指標(biāo)進(jìn)行診斷。
醫(yī)生綜合考慮各項指標(biāo)特征提供診斷意見,為標(biāo)準(zhǔn)化醫(yī)生的診斷意見,許多研究參考乳腺影像報告和數(shù)據(jù)系統(tǒng)(BI-RADS)分級,提出了不同的甲狀腺影像報告和數(shù)據(jù)系統(tǒng)(TI-RADS)分級,但目前還未形成公認(rèn)的國際標(biāo)準(zhǔn)[10]。在第三作者幫助下得知該醫(yī)院的實際臨床診斷中所采用的TI-RADS分級見表3,由于TI-RADS 1級和TI-RADS 2級的惡性風(fēng)險概率為0%,TI-RADS 6級的惡性風(fēng)險概率為100%,在甲狀腺結(jié)節(jié)的超聲檢查中并不考慮這3類,因此本文對這3類也不予考慮。
確定指標(biāo)和醫(yī)院采用的TI-RADS分級標(biāo)準(zhǔn)后,便可從原始數(shù)據(jù)中提取各項指標(biāo)特征和醫(yī)生的TI-RADS分級意見,同時也將最終確診的病理結(jié)果以及審核醫(yī)生,審核日期等信息從原始數(shù)據(jù)中提取出來。對于表1和表2所示的原始數(shù)據(jù),提取到的有效數(shù)據(jù)見表4,為節(jié)省空間這里省略了部分基本信息。
表3 采用的TI-RADS分級標(biāo)準(zhǔn)
(3)數(shù)據(jù)分級
基于有效數(shù)據(jù),用統(tǒng)計與規(guī)則相結(jié)合的方法,依照醫(yī)院的TI-RADS分級標(biāo)準(zhǔn),將5個指標(biāo)上的特征詞也劃分為8個等級。設(shè)計統(tǒng)計量對每個特征詞計算惡性風(fēng)險概率,統(tǒng)計量如下
表4 有效數(shù)據(jù)
(1)
其中,j表示邊界、邊緣、回聲、鈣化及血流5項指標(biāo),i表示j指標(biāo)上的特征詞。NT代表在指標(biāo)j上特征詞i的總數(shù)據(jù)量,NE代表在病理為惡性的前提下指標(biāo)j上特征詞i的數(shù)據(jù)量。據(jù)式(1)可得到每個特征詞的惡性風(fēng)險概率,然后依照該醫(yī)院的TI-RADS分級標(biāo)準(zhǔn)的惡性風(fēng)險概率區(qū)間將特征詞分類,得到特征分級標(biāo)準(zhǔn)。為節(jié)省空間這里不再展示,標(biāo)準(zhǔn)詳情可參見文獻(xiàn)[11]。
(4)數(shù)據(jù)轉(zhuǎn)化
數(shù)據(jù)轉(zhuǎn)化以特征分級標(biāo)準(zhǔn)為轉(zhuǎn)化規(guī)則,對有效數(shù)據(jù)進(jìn)行數(shù)字化處理。根據(jù)該數(shù)據(jù)特點,以5*8的0-1數(shù)字矩陣表示每條病例的指標(biāo)特征信息,行代表指標(biāo),列代表等級,‘1’的位置代表特征在對應(yīng)指標(biāo)上的等級。以1*9的0-1數(shù)字矩陣來代表醫(yī)生提供的TI-RADS分級意見和最終確診的病理結(jié)果,前8位代表TI-RADS分級,其中數(shù)字‘1’出現(xiàn)的位置代表TI-RADS等級,最后一位代表病理結(jié)果,‘0’表示良性,‘1’表示惡性。具體示例如圖2所示。
圖2 數(shù)據(jù)轉(zhuǎn)化示例
利用第1節(jié)得到的規(guī)范化數(shù)字矩陣,本節(jié)將進(jìn)一步討論基于BP神經(jīng)網(wǎng)絡(luò)的甲狀腺結(jié)節(jié)輔助診斷模型。并以安徽省合肥市某三甲醫(yī)院甲狀腺超聲診斷數(shù)據(jù)為例,通過3個對比實驗,驗證了所提模型的有效性。
甲狀腺結(jié)節(jié)的臨床診治中,外科醫(yī)生依賴超聲科醫(yī)生提供的診斷意見,即TI-RADS分級意見,來確定患者進(jìn)一步的診治方案。由此可看出,TI-RADS分級在甲狀腺結(jié)節(jié)診治過程中起著至關(guān)重要的作用。然而,如引言所述,面向甲狀腺結(jié)節(jié)臨床輔助診斷的現(xiàn)有研究中,大多只預(yù)測得到結(jié)節(jié)的良惡性結(jié)果,而較少考慮TI-RADS分級意見。鑒于此,本文引入BP神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)隱含在歷史數(shù)據(jù)中的甲狀腺超聲指標(biāo)特征和TI-RADS分級之間的映射關(guān)系,以預(yù)測得到八分類的TI-RADS分級推薦,為超聲科醫(yī)生提供更具參考價值的輔助診斷意見。
此外,傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)中,預(yù)測精度通常是根據(jù)預(yù)測值和實測值的差距度量的。換言之,針對本文甲狀腺結(jié)節(jié)臨床輔助診斷問題,傳統(tǒng)的預(yù)測精度是通過計算預(yù)測的診斷推薦和超聲科醫(yī)生提供的實際診斷意見之間的差異性得到。值得注意的是,超聲科醫(yī)生提供的診斷意見并不是最終確診,往往并不能完全正確地反映患者甲狀腺的患病情況。為了解決上述問題,本文以細(xì)針穿刺細(xì)胞學(xué)活檢得到的病理結(jié)果作為“金標(biāo)準(zhǔn)”,利用區(qū)間數(shù)距離測度,用于刻畫BP神經(jīng)網(wǎng)絡(luò)預(yù)測得到的TI-RADS分級推薦與“金標(biāo)準(zhǔn)”之間的差異性,基于這一差異性,本文界定了新的預(yù)測精度。綜上所述,基于BP神經(jīng)網(wǎng)絡(luò)的甲狀腺結(jié)節(jié)輔助診斷模型結(jié)構(gòu)如圖3所示。
BP神經(jīng)網(wǎng)絡(luò)由一系列神經(jīng)元組成,包括輸入層、隱藏層和輸出層,是一種按照逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)[12]。BP神經(jīng)網(wǎng)絡(luò)由信號的前向傳遞與誤差的逆向傳播兩個過程組成。其基本原理是:先是輸入樣本前向傳播,從輸入層經(jīng)過隱含層到達(dá)輸出層并計算誤差;再是誤差信號按照原路逆向傳播,從輸出層到隱藏層,再到輸入層,不斷更新網(wǎng)絡(luò)的參數(shù)直至達(dá)到最優(yōu)。
網(wǎng)絡(luò)的隱含層可以有一層或者多層,本文實質(zhì)為一般的利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類的實驗,只需構(gòu)建只含有一個隱含層的網(wǎng)絡(luò)即可。網(wǎng)絡(luò)的輸入數(shù)據(jù)為第1節(jié)得到的甲狀腺指標(biāo)特征矩陣,輸出數(shù)據(jù)為甲狀腺結(jié)節(jié)的TI-RADS分級。隱含層的節(jié)點數(shù)N采用經(jīng)驗式(2)來確定
(2)
其中,A代表輸入層節(jié)點數(shù),B代表輸出節(jié)點數(shù)。對于網(wǎng)絡(luò)的其它參數(shù),在綜合考慮訓(xùn)練時間,訓(xùn)練效果,硬件成本等多方面問題且經(jīng)過多次訓(xùn)練測試對比后,確定本文BP神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)速率為0.005,期望誤差為0.001,最大迭代次數(shù)為1000,隱含層和輸出層的傳遞函數(shù)分別采用tansig函數(shù)和purelin函數(shù)。
圖3 基于BP神經(jīng)網(wǎng)絡(luò)的甲狀腺結(jié)節(jié)輔助診斷模型
為方便度量預(yù)測精度,首先將預(yù)測的TI-RADS分級推薦根據(jù)醫(yī)院采用的TI-RADS分級標(biāo)準(zhǔn)轉(zhuǎn)化為區(qū)間數(shù),即{TI-RADS 3,TI-RADS 4A-1,TI-RADS 4A-2,TI-RADS 4B-1,TI-RADS 4B-2,TI-RADS 4B-3,TI-RADS 4C,TI-RADS 5} = {[0, 0.03], [0.03, 0.15], [0.15, 0.24], [0.24, 0.4], [0.4, 0.65], [0.65, 0.75], [0.75, 0.95], [0.95, 1]}。對于作為“金標(biāo)準(zhǔn)”的病理結(jié)果,用區(qū)間數(shù)[0, 0]表示良性,區(qū)間數(shù)[1, 1]表示惡性。下面引入?yún)^(qū)間數(shù)距離測度,度量TI-RADS分級推薦和“金標(biāo)準(zhǔn)”之間的差異性。
(3)
由于本文中所涉及的區(qū)間數(shù)均限于[0,1]之間,故而定義中的d(x,y)也限于[0,1]之間。TI-RADS分級推薦與病理結(jié)果之間的平均差異越小,說明BP神經(jīng)網(wǎng)絡(luò)預(yù)測精度越高??紤]這一事實,將精度計算公式定義為
(4)
其中,an表示TI-RADS分級,bn表示對應(yīng)的病理結(jié)果,M表示數(shù)據(jù)量。這一精度精算公式不僅可用于預(yù)測精度的計算,同時也可用于度量醫(yī)生提供的TI-RADS分級意見與“金標(biāo)準(zhǔn)”之間的差異性,從而得到醫(yī)生的自身精度。因此,使用上述精度計算公式,便于將預(yù)測精度與醫(yī)生自身精度進(jìn)行對比,從而進(jìn)一步驗證本文所提輔助診斷模型的有效性。
實驗在CPU Intel Core 2.8 GHz,8 G內(nèi)存,win 10操作系統(tǒng)和MATLAB R2017a環(huán)境下進(jìn)行,構(gòu)建基于BP神經(jīng)網(wǎng)絡(luò)的甲狀腺結(jié)節(jié)輔助診斷模型。利用本文第1節(jié)的醫(yī)療診斷文本數(shù)據(jù)規(guī)范化處理流程,對合作醫(yī)院2014-01-01至2018-12-31期間5位超聲科醫(yī)生共3486條甲狀腺超聲診斷文本數(shù)據(jù)進(jìn)行規(guī)范化處理,得到規(guī)范化數(shù)字矩陣,進(jìn)而分別開展如下3個實驗。
實驗1:不同指標(biāo)組合對預(yù)測精度的影響
基于歷史數(shù)據(jù)中提取出的5項指標(biāo)特征,先嘗試探討不同的指標(biāo)組合對預(yù)測精度的影響,用數(shù)字1-5分別表示邊界、邊緣、回聲、鈣化、血流5項指標(biāo)。以2014-01-01至2017-12-31年期間共2840條數(shù)據(jù)為訓(xùn)練樣本集,以2018-01-01年至2018-12-31期間共646條數(shù)據(jù)為測試樣本集,針對不同的指標(biāo)組合進(jìn)行實驗,得到對應(yīng)的預(yù)測精度見表5。
表5 不同指標(biāo)組合下的預(yù)測精度對比
由表5可以看出,只考慮單個指標(biāo)的預(yù)測精度普遍很低,其中鈣化對預(yù)測精度的影響最大,血流的影響最小。同時考慮多個指標(biāo)的預(yù)測精度比單個指標(biāo)時有所提高。其中,指標(biāo)組合{1, 2, 3, 4, 5}的預(yù)測精度最高,達(dá)到83.92%,指標(biāo)組合{1, 2, 3, 4}的預(yù)測精度次之,為81.56%。因此,同時考慮5項指標(biāo)的特征值訓(xùn)練網(wǎng)絡(luò)模型效果最好。以下實驗將均選取5項指標(biāo)特征值來實現(xiàn)BP神經(jīng)網(wǎng)絡(luò)對甲狀腺結(jié)節(jié)的TI-RADS分級預(yù)測。
實驗2:模型輔助診斷有效性驗證
以2014-01-01至2017-12-31期間5位超聲科醫(yī)生的甲狀腺超聲診斷數(shù)據(jù)為訓(xùn)練樣本,2018-01-01至2018-12-31期間5位醫(yī)生各自的數(shù)據(jù)為測試樣本,用D1,D2,D3,D4,D5分別代表5位醫(yī)生,預(yù)測樣本見表6。
表6 訓(xùn)練樣本及測試樣本統(tǒng)計
利用2.1節(jié)所提出的BP神經(jīng)網(wǎng)絡(luò),以5項超聲指標(biāo)特征矩陣作為網(wǎng)絡(luò)輸入來訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)模型,分別對5位醫(yī)生的測試樣本進(jìn)行TI-RADS分級推薦預(yù)測。針對預(yù)測的TI-RADS分級推薦以及醫(yī)生提供的TI-RADS分級意見,利用式(3)和式(4)分別計算模型的預(yù)測精度和醫(yī)生的自身精度?,F(xiàn)隨機取其中一次實驗結(jié)果與醫(yī)生自身的精度作對比,如圖4所示。
圖4 預(yù)測精度與自身精度對比
實驗結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度普遍高于5位醫(yī)生的自身精度。對于醫(yī)生D1,D2,D3,精度有提升但不太明顯,有大約2%的提高,對于醫(yī)生D4,D5,精度相對有明顯提升,達(dá)到4%-7%??傮w而言,基于BP神經(jīng)網(wǎng)絡(luò)的甲狀腺結(jié)節(jié)輔助診斷模型的預(yù)測精度高于醫(yī)生自身的精度,對甲狀腺結(jié)節(jié)臨床輔助診斷具有較好的有效性和應(yīng)用性。
針對部分精度提高并不明顯這一現(xiàn)象,考慮到BP神經(jīng)網(wǎng)絡(luò)是通過訓(xùn)練樣本不斷學(xué)習(xí)得到預(yù)測模型,訓(xùn)練得到的模型好壞必然受到訓(xùn)練樣本本身質(zhì)量的影響。鑒于此,為驗證猜想,下面進(jìn)一步探討不同訓(xùn)練樣本集對預(yù)測精度的影響。
實驗3:不同訓(xùn)練樣本集對預(yù)測精度的影響
為比較不同訓(xùn)練樣本集對預(yù)測精度的影響,實驗選取2014-01-01至2017-12-31期間不同醫(yī)生的數(shù)據(jù)組合作為訓(xùn)練樣本集來訓(xùn)練網(wǎng)絡(luò)模型,測試樣本集與實驗2的測試樣本集保持一致,為2018-01-01至2018-12-31期間的數(shù)據(jù),進(jìn)行對比實驗。實驗結(jié)果見表7。
表7 不同訓(xùn)練樣本集的預(yù)測精度對比
由表7可以看出:①訓(xùn)練樣本集選取{D1,D2,D3}的預(yù)測精度最好,比實驗2中選用的全部醫(yī)生的數(shù)據(jù)集{D1,D2,D3,D4,D5}得到的預(yù)測精度有明顯提高。這主要是因為醫(yī)生D3,D4和D5的自身精度相對偏低,致使預(yù)測精度降低。②訓(xùn)練樣本集選取自身精度較高的兩位醫(yī)生的數(shù)據(jù)集{D1}和{D1,D2}得到的預(yù)測精度并不高。這是因為對BP神經(jīng)網(wǎng)絡(luò)來說,訓(xùn)練樣本量太少也會影響模型訓(xùn)練的質(zhì)量。
若只關(guān)注以{D1,D2,D3}為訓(xùn)練樣本集的BP神經(jīng)網(wǎng)絡(luò)模型,對于醫(yī)生D1,BP神經(jīng)網(wǎng)絡(luò)預(yù)測精度比醫(yī)生自身提高4.02%;對于醫(yī)生D2,預(yù)測精度比醫(yī)生自身精度提高4.09%;對于醫(yī)生D3,預(yù)測精度比醫(yī)生自身精度提高4.9%;對于醫(yī)生D4,預(yù)測精度比醫(yī)生自身精度提高8.34%;對于醫(yī)生D5,預(yù)測精度比醫(yī)生自身精度提高10.09%。
綜上所述,通過上述3個對比實驗可以得出:①5項指標(biāo)特征均會影響B(tài)P神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度,且同時考慮5個指標(biāo)特征值的預(yù)測效果最好。②本文提出的基于BP神經(jīng)網(wǎng)絡(luò)的甲狀腺結(jié)節(jié)輔助診斷模型具有較好的輔助診斷有效性,模型的預(yù)測精度高于醫(yī)生自身的精度。③選取自身精度較高的3位醫(yī)生的數(shù)據(jù)作為訓(xùn)練樣本得到的模型預(yù)測精度最好,可將該模型用于甲狀腺結(jié)節(jié)的臨床輔助診斷,尤其對醫(yī)技水平較差的醫(yī)生或者缺乏經(jīng)驗的年輕醫(yī)生來說,將預(yù)測得到的TI-RADS分級推薦給醫(yī)生作為參考,以幫助醫(yī)生進(jìn)一步提高醫(yī)技水平。
本文面向甲狀腺結(jié)節(jié)輔助診斷問題,針對標(biāo)準(zhǔn)化程度較低的醫(yī)療診斷文本數(shù)據(jù),設(shè)計了一套醫(yī)療診斷文本數(shù)據(jù)規(guī)范化處理流程,并以安徽省合肥市某三甲醫(yī)院甲狀腺超聲檢查數(shù)據(jù)為例,將該流程用于甲狀腺超聲檢查文本數(shù)據(jù)的規(guī)范化處理。在此基礎(chǔ)上,為利用歷史數(shù)據(jù)提高甲狀腺結(jié)節(jié)診斷的精度,構(gòu)建了基于BP神經(jīng)網(wǎng)絡(luò)的甲狀腺結(jié)節(jié)輔助診斷模型,并在該模型中引入“金標(biāo)準(zhǔn)”和區(qū)間數(shù)距離測度,定義了新的精度計算公式,用于預(yù)測精度和醫(yī)生自身精度的度量。通過3個對比實驗得到,基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測的精度普遍高于醫(yī)生自身的精度,該模型對甲狀腺結(jié)節(jié)的診治具有很好的輔助診斷價值,可以作為一種臨床決策支持工具,幫助醫(yī)生提升診斷水平,提高工作效率。此外,本文進(jìn)一步分析了不同指標(biāo)組合和不同訓(xùn)練樣本集對預(yù)測精度的影響,得到了最優(yōu)的特征組合和訓(xùn)練數(shù)據(jù)集。
未來將進(jìn)一步將設(shè)計的醫(yī)療診斷文本數(shù)據(jù)規(guī)范化處理流程以及基于BP神經(jīng)網(wǎng)絡(luò)的輔助診斷模型用于其它疾病的臨床輔助診斷中,以幫助醫(yī)生提高診斷水平。