亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于集成學習后融合神經(jīng)網(wǎng)絡算法構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的探討

        2023-10-10 09:20:28張明琪鄧鑫
        廣州中醫(yī)藥大學學報 2023年10期
        關(guān)鍵詞:代償證型梯度

        張明琪,鄧鑫

        (廣西中醫(yī)藥大學,廣西南寧 530001)

        肝硬化是一種因感染性、毒性或藥物誘導(主要是酒精誘導)、代謝性、膽汁淤積或自身免疫性損傷等各種因素所導致的彌漫性肝損害,其肝損害以肝臟彌漫性纖維化、假小葉形成、肝內(nèi)外血管增殖為病理特征[1-2]。肝硬化常呈隱匿性起病,代償期可無明顯臨床癥狀,隨著疾病進展可發(fā)展為失代償期,出現(xiàn)多種并發(fā)癥,甚則癌變及死亡。因此,延緩代償期肝硬化進入失代償期、預防肝細胞癌變及減少并發(fā)癥是肝硬化的治療目標。病因治療及抗炎抗肝纖維化治療是現(xiàn)代醫(yī)學治療肝硬化代償期最主要的方法。然而目前尚無抗纖維化的特效西藥[2]。代償期肝硬化可歸屬于中醫(yī)“積聚”范疇[3]。中醫(yī)藥抗肝纖維化治療有顯著的療效,且副作用較少[4]。“辨證論治”是中醫(yī)學理論體系的主要特點之一,中醫(yī)辨證的精準性決定了論治的有效性,但現(xiàn)行中醫(yī)的辨證方法眾多,證型分類不規(guī)范,易受個人主觀因素的影響[5],中醫(yī)辨證有待進一步客觀化、標準化。

        近年來,隨著人工神經(jīng)網(wǎng)絡架構(gòu)和算法的不斷發(fā)展,以及計算能力的不斷增強,人工智能技術(shù)在中醫(yī)臨床的疾病診斷、輔助治療及經(jīng)驗傳承等多方面取得了較大的發(fā)展[6-8]。其中,中醫(yī)數(shù)字化辨證一直是人工智能在中醫(yī)領(lǐng)域研究的熱點課題[9]。統(tǒng)一規(guī)范的中醫(yī)辨證模式是中醫(yī)辨證智能化的基礎(chǔ),同時也是中醫(yī)藥現(xiàn)代化的重要內(nèi)容之一[10]。目前機器學習領(lǐng)域有較多經(jīng)典的算法,如決策樹、支持向量機、K最近鄰、隨機梯度下降法、隨機森林、極端梯度增強法等,這些算法基于不同的數(shù)學原理,具有各自的優(yōu)缺點,均可運用于中醫(yī)藥領(lǐng)域的研究。本研究采用集成學習的方法研究肝硬化代償期中醫(yī)辨證模型,將這些算法輸出的概率進行后融合,通過后融合的方法彌補各個模型的不足,發(fā)揮其長處,達到取長補短的目的,用BP 神經(jīng)網(wǎng)絡作為最終的元學習器,輸出最終的預測概率,以期為中醫(yī)辨證智能化和客觀化提供借鑒,并為肝硬化代償期的中醫(yī)臨床診療提供參考。

        1 資料與方法

        1.1 病歷資料來源及篩選收集2016 年1 月至2022 年10 月期間在廣西中醫(yī)藥大學附屬瑞康醫(yī)院就診(包括門診及住院)的肝硬化代償期(首次就診)的病歷數(shù)據(jù)。收集的病歷資料包含中醫(yī)癥狀、體征、舌象、脈象等詳細信息,不記錄其他個人信息。對患者的性別、年齡、職業(yè)、病程、原發(fā)疾病、用藥情況不做特殊限制。

        納入以下病歷資料:①患者符合《肝硬化診治指南》[2]中的肝硬化代償期診斷標準;②患者以肝硬化代償期為主要診斷;③患者無其他重大疾病。排除以下病歷資料:①患者有嚴重心、腎等并發(fā)癥,或合并有其他嚴重原發(fā)性疾??;②患者以其他疾病為主要診斷,而肝硬化代償期為次要診斷;③患者為肝硬化失代償期;④臨床記錄有缺陷而無法使用的病歷記錄。

        1.2 證候分型標準參考《積聚(肝硬化代償期)中醫(yī)診療方案》[11],將本病的證候確定為5 個證型,即濕熱瘀阻證、氣滯瘀阻證、肝郁脾虛血結(jié)證、陰虛血阻證、氣虛血瘀證。

        1.3 數(shù)據(jù)錄入與預處理獲得上述病歷樣本的數(shù)據(jù)信息,將規(guī)范后的數(shù)據(jù)與證型(包括患者的癥狀和體征及所對應的證型)錄入到Excel中,并以此作為原始數(shù)據(jù)庫(錄入格式:醫(yī)案編號;證型;癥狀和體征)。

        以患者的臨床表現(xiàn)作為特征值,參考《肝硬化醫(yī)生報告結(jié)局量表研制》[12]中的癥狀和體征,將獲得的數(shù)據(jù)進行規(guī)范化?;颊叩呐R床特征(癥狀、體征、舌象和脈象)包括肝區(qū)疼痛、腹部疼痛、腹部脹滿不適、情志抑郁、煩躁易怒、乳房脹痛或結(jié)塊、疲倦乏力、視物模糊、噯氣、腰痛、頭痛、咳嗽、咽部異物感、目干澀、頭暈、難以入睡、口干、口苦、口臭、納差、盜汗、五心煩熱、惡心不適、肢體困重、牙齦出血、耳鳴耳聾、腰膝酸軟、皮膚瘙癢、小便黃、尿頻、嘔吐、胸悶氣喘、大便干結(jié)、小便少、遺精、月經(jīng)量少、閉經(jīng)、下肢水腫、蜘蛛痣、毛細血管擴張、肝掌、面色晦暗、面色黧黑、面色萎黃、唇色紫暗、黃染、消瘦、貧血貌、舌淡紅、舌紫、舌淡紫、舌質(zhì)暗、舌有瘀斑或瘀點、苔薄白、苔薄黃、舌苔白膩、舌苔黃膩、舌苔少、舌少津、舌邊有齒痕、舌胖大、舌質(zhì)紅、舌下絡脈顯露、裂紋舌、脈弦、脈細、脈滑、脈無力、脈數(shù)、脈澀、脈沉等共72項。采用“0-1”編碼對各臨床特征進行賦值,即出現(xiàn)該特征計為“1”,未出現(xiàn)該特征計為“0”。然后以原始數(shù)據(jù)庫中每個樣本所對應的證型作為目標值,以此建立符合方案的數(shù)據(jù)集(PPS 數(shù)據(jù)集格式包括患者編號、目標值、特征值)。

        1.4 數(shù)據(jù)集建立及實驗開發(fā)環(huán)境與框架通過Scikit-learn 機器學習庫中的標簽編碼(label encoding)對目標值下的中醫(yī)證型進行處理,將文本信息映射為數(shù)值,將氣虛血瘀證、氣滯血瘀證、濕熱瘀阻證、陰虛血阻證、肝郁脾虛血結(jié)證分別編碼為0、1、2、3、4。利用Python 將數(shù)據(jù)集以8∶2隨機劃分為訓練集和測試集,通過設(shè)置參數(shù)stratify=y使得訓練集和測試集的各個證型數(shù)據(jù)的比例與原PPS數(shù)據(jù)集保持相同的比例,然后通過設(shè)置參數(shù)random state=0 保證每次實驗都使用相同的訓練集和測試集,并增加實驗的可重現(xiàn)性。

        本研究的開發(fā)環(huán)境為Anaconda 4.10.3,采用決策 樹(decision tree,DT)、K最近鄰(K-nearest neighbor,KNN)、支持向量機(support vector machine,SVM)、隨機梯度下降法(stochastic gradient descent,SGD)、隨機森林(random forest,RF)、極端梯度增強(extreme gradient boosting,XGBoost)等算法。算法采用的框架為Scikit-learn(0.24.2)。Scikitlearn 是Python 第三方提供的機器學習框架,支持分類、聚類、降維、回歸四大算法以及特征提取、數(shù)據(jù)處理、模型評估三大模塊[13]。BP 神經(jīng)網(wǎng)絡采用的框架為PyTorch(1.12.0+cpu)。PyTorch 是以Python 優(yōu)先的深度學習框架,它僅支持自動求導功能,而且設(shè)計簡潔,較其他深度學習框架具有靈活性強、運行速度快等優(yōu)點[14]。模型解釋采用的框架為SHAP(0.40.0),使用SHAP 值解釋機器學習模型和特征的重要性[15]。

        1.5 模型構(gòu)建方法

        1.5.1 初級學習器之傳統(tǒng)機器學習算法 不同的機器學習模型是基于不同的數(shù)學算法原理,究竟何種機器學習模型更具優(yōu)勢還不明確,因此選擇多個機器學習模型共同參與肝硬化代償期診斷模型的構(gòu)建,有助于模型之間的優(yōu)勢互補,彌補其不足,提高最終模型的性能表現(xiàn)。研究過程中可融合多種傳統(tǒng)機器學習算法構(gòu)建模型,以提高模型準確度。本研究所涉及的主要算法有6種,即決策樹(DT)、K最近鄰(KNN)、支持向量機(SVM)、隨機梯度下降法(SGD)、隨機森林(RF)、極端梯度增強法(XGBoost)。各算法原理及優(yōu)缺點如下:

        DT 是一種被廣泛應用于數(shù)據(jù)處理的分類器,主要根據(jù)數(shù)據(jù)特征屬性值進行排序及分組。DT 由節(jié)點和分支組成,節(jié)點則由根節(jié)點、葉子節(jié)點和若干內(nèi)部節(jié)點構(gòu)成[16]。DT 決策的過程就是從頂端的根節(jié)點開始,通過測試待分類項中相應的特征屬性進行節(jié)點分裂,直到到達葉子節(jié)點停止分裂,葉子節(jié)點的類別代表分類決策最終結(jié)果[17]。其優(yōu)點是具有簡單高效、便于理解、易于評測,也存在易于過擬合的固有缺陷。

        KNN 分類器代表了一種簡單通用的分類方法,其相對性能與距離度量或相似度量的選擇密切相關(guān)。其核心工作原理是計算待分類樣本與K個鄰居樣本的距離,尋找與待分類樣本距離最近的K個樣本,由這K個樣本中數(shù)量最多的類別決定待分類樣本的類別,使用少數(shù)服從多數(shù)的原則[18]。KNN分類器具有對數(shù)據(jù)分布要求較低、對噪聲有一定容忍度的特點,是最懶惰的學習方法之一。

        SVM 最早應用在二分類問題上,用于尋找能將二類樣本分開且分類間隔最大的一個最優(yōu)超平面[19]。其基本思想在于引用核函數(shù)將輸入的非線性樣本空間映射到高維特征空間,以構(gòu)建線性函數(shù)判別。SVM 適用于回歸分析和分類問題等領(lǐng)域,具有結(jié)構(gòu)簡單、適應性好、訓練速度快和良好泛化能力等優(yōu)勢[20]。

        RF 是基于決策樹基礎(chǔ)上的一種集成算法,隨機性是其區(qū)別于決策樹的重要屬性。這種隨機性體現(xiàn)在Bagging 技術(shù)上可實現(xiàn)對樣本的重采樣,有利于降低決策樹模型之間的相關(guān)性、增加RF 的精度。RF 具有簡單、計算量小、可以降低決策樹容易過于擬合等諸多優(yōu)勢[21]。

        SGD 是基于全梯度下降方法(GD)的一種優(yōu)化形式。GD 每次迭代時需使用全部的訓練集樣本以更新模型參數(shù),而SGD 每次更新訓練則只需在訓練集隨機抽取一個樣本計算梯度。相較而言,GD有較高的精度,但也存在計算量過大,耗時明顯,且容易陷入局部極值點的問題;SGD 雖然計算量小,速度快,但精度稍遜GD[21]。

        XGBoost 同樣以DT 作為基學習器,通過弱分類器的多輪迭代計算以降低偏差、實現(xiàn)最優(yōu)分類效果[22-23]。通常以分類回歸樹作為弱分類器,每次訓練所得弱分類器需要經(jīng)過加權(quán)求和,最終生成總的分類器。XGBoost 主要利用二階泰勒損失函數(shù)進行運算,并用正則項得到最優(yōu)解,能夠充分利用多核CPU 并行計算的優(yōu)勢,實現(xiàn)更快的模型探索[24]。

        1.5.2 集成學習后融合 融合是將相同數(shù)據(jù)的不同模型預測結(jié)果進行有機整合后以刻畫結(jié)果的過程。一般情況下,融合分為前融合、后融合,后融合是結(jié)果層面的融合。stacking 概率后融合是經(jīng)典的集合算法。本研究使用stacking 后端概率融合模式將訓練好的機器學習分類器預測概率輸出,再結(jié)合原始影像組學特征以及深度學習特征輸入到BP 人工神經(jīng)網(wǎng)絡(backpropagation neural network)進行融合,其中,6 種傳統(tǒng)機器學習模型作為初級學習器,而BP神經(jīng)網(wǎng)絡則屬于元學習器。

        元分類器之深度學習網(wǎng)絡通過BP 人工神經(jīng)網(wǎng)絡算法實現(xiàn),它由輸入層、隱藏層和輸出層三部分組成[25]。其工作原理如下:首先,向輸入層神經(jīng)元輸入信號,再把信號一層層向前傳遞,直至輸出層結(jié)果生成為止;接著對輸出層進行誤差計算,將得到的誤差反向擴散到隱層神經(jīng)元上;最后,基于隱層神經(jīng)元誤差調(diào)整連接權(quán)與閾值,直到滿足停止條件,最終獲得具有較好泛化能力的模型[25]。整個研究利用torch 模塊完成,使用交叉熵損失函數(shù)(cross entropy loss)對特征進行分類;優(yōu)化器選擇Adam 優(yōu)化器。分類結(jié)果設(shè)置為5,隱藏層設(shè)定為100。基于集成學習后融合神經(jīng)網(wǎng)絡算法構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的建模流程如圖1所示。

        圖1 基于集成學習后融合神經(jīng)網(wǎng)絡算法構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的建模流程圖Figure 1 Modeling flow chart for the construction of TCM intelligent syndrome differentiation model of compensated liver cirrhosis based on integrated learning and late-fusion neural network algorithm

        1.6 參數(shù)調(diào)優(yōu)及模型評價決策樹(DT)、K最近鄰(KNN)、支持向量機(SVM)、隨機梯度下降法(SGD)、隨機森林(RF)、極端梯度增強法(XGBoost)采用GridSearchCV 模塊通過參數(shù)列表param_grid 尋找最優(yōu)模型的超參數(shù)組合,使用分層K(K=5)折交叉驗證。人工神經(jīng)網(wǎng)絡在Optuna 框架下創(chuàng)建目標函數(shù)(objective),目標函數(shù)的評估指標設(shè)置為準確率(accuracy),進行100 次試驗(epoches=100),并在試驗完成后從study 項下選擇最優(yōu)的超參數(shù)組合。以上模型均使用準確率、精確率(precsion)、召回率(recall)、F1分數(shù)(F1 score)、混淆矩陣、受試者工作特征曲線(ROC 曲線)以及ROC 曲線下面積(AUC)值評估模型的性能。各模型最優(yōu)超參數(shù)組合見表1。

        表1 各模型的最優(yōu)超參數(shù)組合Table 1 The optimal hyperparameter combination for various models

        2 結(jié)果

        初步搜集得到928例肝硬化代償期患者的病歷資料,經(jīng)篩選后可供錄入的病歷資料(包含了中醫(yī)癥狀、體征、舌象、脈象等證候詳細信息)為912 份。912 例患者的原發(fā)病主要為病毒性肝炎、酒精性脂肪肝、非酒精性脂肪肝以及原發(fā)性膽汁性肝硬化等,其中氣虛血瘀證108例,氣滯瘀阻證95例,濕熱瘀阻證168例,陰虛血阻證95例,肝郁脾虛血結(jié)證446 例。構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的病歷數(shù)據(jù)處理流程如圖2所示。

        圖2 構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的病歷數(shù)據(jù)處理流程圖Figure 2 Flow chart for the process of medical record data for constructing TCM intelligent syndrome differentiation model of compensated liver cirrhosis

        2.1 模型評價結(jié)果將912 例患者的證型數(shù)據(jù)按8∶2劃分為訓練集(共730例,以上各證型的例數(shù)分別為83、78、135、77、357 例)和測試集,采用不同算法進行訓練,其訓練結(jié)果如下:

        2.1.1 決策樹模型 通過決策樹建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖3所示。決策樹在各個證型的分類正確率都很高,對肝硬化代償期證型預測較為理想。

        圖3 肝硬化代償期各證型的決策樹(DT)模型的ROC曲線與混淆矩陣Figure 3 The ROC curve and confusion matrix of decision tree(DT)model for compensated liver cirrhosis of various syndrome types

        2.1.2 支持向量機模型 通過支持向量機建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖4 所示。支持向量機未能較好地區(qū)分氣虛血瘀證和肝郁脾虛血結(jié)證,在83 例氣虛血瘀證中,有40例被誤分類為肝郁脾虛血結(jié)證。

        圖4 肝硬化代償期各證型的支持向量機(SVM)模型的ROC曲線與混淆矩陣Figure 4 The ROC curve and confusion matrix of support vector machine(SVM)model for compensated liver cirrhosis of various syndrome types

        2.1.3K最近鄰模型 通過K最近鄰建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖5 所示。K最近鄰在預測氣虛血瘀證的分類上的表現(xiàn)也不盡人意,83 例氣虛血瘀證僅有54 例分類正確。

        圖5 肝硬化代償期各證型的K最近鄰(KNN)模型的ROC曲線與混淆矩陣Figure 5 The ROC curve and confusion matrix of K-nearest neighbor(KNN)model for compensated liver cirrhosis of various syndrome types

        2.1.4 隨機梯度下降法模型 通過隨機梯度下降法建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖6所示。隨機梯度下降法預測陰虛血阻證的分類結(jié)果尚可,77 例陰虛血阻證中有76 例分類預測正確,但對其他證的預測能力則較弱。

        圖6 肝硬化代償期各證型的隨機梯度下降法(SGD)模型的ROC曲線與混淆矩陣Figure 6 The ROC curve and confusion matrix of stochastic gradient descent(SGD)model for compensated liver cirrhosis of various syndrome types

        2.1.5 隨機森林模型 通過隨機森林建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖7所示。隨機森林在陰虛血阻證的分類上表現(xiàn)最佳,在其余證型的預測上表現(xiàn)也尚可。

        圖7 肝硬化代償期各證型的隨機森林(RF)模型的ROC曲線與混淆矩陣Figure 7 The ROC curve and confusion matrix of random forest(RF)model for compensated liver cirrhosis of various syndrome types

        2.1.6 極端梯度增強法模型 通過極端梯度增強法(XGBoost)建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖8 所示。XGBoost 對陰虛血阻證的預測結(jié)果尚可,77 例陰虛血阻證中僅有2 例被預測錯誤,分別被誤歸類為濕熱瘀阻證和肝郁脾虛血結(jié)證,但在其他證型的預測方面則表現(xiàn)一般。

        圖8 肝硬化代償期各證型的極端梯度增強法(XGBoost)模型的ROC曲線與混淆矩陣Figure 8 The ROC curve and confusion matrix of extreme gradient boosting(XGBoost)model for compensated liver cirrhosis of various syndrome types

        2.1.7 BP 神經(jīng)網(wǎng)絡模型 通過BP 神經(jīng)網(wǎng)絡建模的準確率-損失(accuracy-loss)曲線見圖9。x軸代表迭代周期(epoch),y軸代表準確率和損失。隨著迭代次數(shù)增加,準確率逐漸上升,損失逐漸下降。迭代周期為65 的曲線趨平緩,達到收斂。BP神經(jīng)網(wǎng)絡輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣見圖10。

        圖9 BP神經(jīng)網(wǎng)絡訓練過程的準確率-損失(accuracyloss)曲線Figure 9 The accuracy-loss curve of backpropagation neural network training process

        圖10 肝硬化代償期各證型的BP神經(jīng)網(wǎng)絡模型的ROC曲線與混淆矩陣Figure 10 The ROC curve and confusion matrix of backpropagation neural network model for compensated liver cirrhosis of various syndrome types

        2.2 各類模型的性能比較在相同測試集下各分類模型的準確率(accuracy)、精確率(precsion)、召回率(recall)、F1 分數(shù)以及AUC 值如表1 所示。F1值是對精確率與召回率的調(diào)和平均,優(yōu)點在于能賦予精確率和召回率相同的權(quán)重以平衡兩者,F(xiàn)1值越高,說明精確率和召回率都較高,算法的性能越好。從表2 可知,F(xiàn)1 值最高為BP 神經(jīng)網(wǎng)絡模型,最低為支持向量機。

        表2 構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的各算法模型的性能指標比較Table 2 Comparison of the performace indicators of various models using for constructing TCM intelligent syndrome differentiation model of compensated liver cirrhosis

        2.3 模型解釋醫(yī)學領(lǐng)域中,模型可解釋性的重要性與模型的性能同樣重要,這些具有高準確度預測結(jié)果的模型要讓人們(尤其是專業(yè)醫(yī)生)信服,就必須更進一步提供模型做出預測的依據(jù)[26]。SHAP(Shapley additive explanations)值是Lundberg S M等在2017年提出的一種基于博弈論的模型解釋方法[27],該方法量化了模型中每個特征對觀察結(jié)果最終預測的貢獻,采用基于所有可能的特征子集組合(包括給定特征)預測模型[28]。本研究按照證型分類求得每個樣本特征對應的SHAP值,并采用SHAP 值的平均值作為該特征的重要性值,從而得到全局解釋,以此來闡明模型中貢獻度較大的特征。通過模型性能指標的比較可知,BP 神經(jīng)網(wǎng)絡模型和隨機梯度下降法的各項評估指標均超過0.90,但BP 神經(jīng)網(wǎng)絡模型的維度太高,無法使用SHAP 進行研究。因此本研究在隨機梯度下降法的基礎(chǔ)上,調(diào)用SHAP 庫的Explainer API 降序輸出肝硬化代償期各證型的PPS 數(shù)據(jù)集的特征重要性(排前20位),結(jié)果見圖11。

        圖11 肝硬化代償期各證型中特征貢獻度排前20位的符合方案數(shù)據(jù)集(PPS)Figure 11 The per protocol set(PPS)with the leading 20 feature contribution degree for compensated liver cirrhosis of various syndrome types

        由圖11 中可知,對于陰虛血阻證而言,疲倦乏力、舌質(zhì)紅、舌苔少、脈細等特征有著較高的貢獻度;舌苔黃膩、舌質(zhì)紅、脈滑等特征對濕熱瘀阻證有著較高的貢獻度;舌淡紅、苔薄白、脈弦等特征對肝郁脾虛血結(jié)證有著較高的貢獻度;脈澀、舌紫、舌質(zhì)暗等特征對氣滯瘀阻證有著較高的貢獻度;脈細、疲倦乏力、舌淡紫等特征對氣虛血瘀證有著較高的貢獻度。

        3 討論

        目前,阻礙中醫(yī)藥客觀化與規(guī)范化的主要原因是中醫(yī)語言的模糊性、理論知識的難理解性、治療思維的抽象性以及中醫(yī)醫(yī)案的繁雜性。機器學習能將中醫(yī)藥內(nèi)部復雜的聯(lián)系轉(zhuǎn)化為不同變量在隱層空間的數(shù)學關(guān)系,將中醫(yī)模糊用詞進行規(guī)范,降低主觀性,提高客觀性,有益于中醫(yī)藥理論體系的理解,可為中醫(yī)藥理論的傳承與創(chuàng)新以及中醫(yī)循證醫(yī)學的發(fā)展做出貢獻。

        本研究基于決策樹、支持向量機、K最近鄰、隨機梯度下降法、隨機森林、XGBoost 等機器學習算法和集成學習后融合的算法,通過病歷數(shù)據(jù)對肝硬化代償期的中醫(yī)智能辨證進行了深入分析和探索。實驗結(jié)果表明,在模型性能評估指標中,BP 神經(jīng)網(wǎng)絡模型的召回率為0.90,略低于隨機森林的0.91,但BP 神經(jīng)網(wǎng)絡模型其他各項評估指標均大于0.90 并優(yōu)于其他分類器模型??梢?,與機器學習相比,BP 神經(jīng)網(wǎng)絡對肝硬化代償期中醫(yī)證型預測具有更好的準確性、精確性,其各項指標具有更好的均衡性。

        本研究使用了集成學習后融合的方法,該方法類似于醫(yī)院的臨床科室會診制度,各個科室的住院醫(yī)師(機器學習模型)對同一份病例(搜集的數(shù)據(jù)資料)提出各自的意見(機器模型預測結(jié)果),將這些意見提交給副主任醫(yī)師(BP 神經(jīng)網(wǎng)絡)后,副主任醫(yī)師綜合這些意見得出最準確、最綜合、最全面的結(jié)果(BP 神經(jīng)網(wǎng)絡預測結(jié)果)。BP 神經(jīng)網(wǎng)絡具有良好的容錯性、自組織適應性和學習能力,在疾病診斷、預后判斷等方面有著廣泛的應用[29]。劉麗蓉等[30]通過BP 神經(jīng)網(wǎng)絡構(gòu)建蕁麻疹證候預測模型,其預測的準確率為83.13%,表明利用BP 神經(jīng)網(wǎng)絡進行蕁麻疹證候分類取得較好的結(jié)果。劉秀峰等[31]將遺傳算法降維優(yōu)化后的BP 神經(jīng)網(wǎng)絡(GABP)診斷模型用于大腸癌虛實證型的分類研究,并與傳統(tǒng)的未經(jīng)優(yōu)化的BP 診斷模型進行比較,結(jié)果發(fā)現(xiàn)優(yōu)化后的神經(jīng)網(wǎng)絡模型建模所需時間明顯減少,證型正判率都較前顯著提高,表明基于GABP 的神經(jīng)網(wǎng)絡泛化能力更好,分類效果更佳。辛基梁等[32]比較了機器學習和BP-MLL 神經(jīng)網(wǎng)絡構(gòu)建的中醫(yī)健康狀態(tài)辨識的分類預測模型的平均精度,結(jié)果顯示BP-MLL神經(jīng)網(wǎng)絡預測模型的平均精度最高,性能最優(yōu)。綜上可見,以往的研究多使用單一的模型進行中醫(yī)疾病證型的預測,然而單個模型的泛化能力單薄,在解決所研究的問題上能力較出色,但在解決其他問題時結(jié)果卻不盡人意。本文所研究的集成學習后融合BP 神經(jīng)網(wǎng)絡的方法可以提高模型對未知問題的泛化能力,避免算法失誤,通過結(jié)合多個模型的優(yōu)點,實現(xiàn)優(yōu)勢互補,提升模型的預測精度。

        本研究所搭建的集成學習后融合的神經(jīng)網(wǎng)絡肝硬化代償期中醫(yī)辨證模型,將多個機器學習模型的預測結(jié)果進行相互補充結(jié)合,保證了各模型的多樣性,克服了不同模型的劣勢,具有性能全面、指標均衡、預測結(jié)果客觀可靠等優(yōu)勢。集成學習后融合的神經(jīng)網(wǎng)絡肝硬化代償期中醫(yī)辨證模型所輸出的肝硬化代償期各證型的PPS數(shù)據(jù)集,可提高臨床醫(yī)生對肝硬化代償期中醫(yī)辨證的速度和準確率,提高對患者的診療質(zhì)量。

        猜你喜歡
        代償證型梯度
        陸倫根:肝硬化代償期管理
        肝博士(2024年1期)2024-03-12 08:37:28
        謝雯:肝硬化再代償?shù)娜嬲J識
        肝博士(2024年1期)2024-03-12 08:37:24
        基于因子分析及聚類分析的241例感染后咳嗽中醫(yī)證素證型研究
        一個改進的WYL型三項共軛梯度法
        治咽炎要分清證型
        不同證型糖尿病的調(diào)理
        基于自適應矩估計的BP神經(jīng)網(wǎng)絡對中醫(yī)痛經(jīng)證型分類的研究
        一種自適應Dai-Liao共軛梯度法
        一類扭積形式的梯度近Ricci孤立子
        經(jīng)顱多普勒超聲檢查在大腦中動脈閉塞診斷及側(cè)支循環(huán)觀察中的作用
        中国少妇内射xxxx狠干| 天堂精品人妻一卡二卡| 国产精品一区av在线 | 中文字幕乱码亚洲精品一区| 美丽人妻被按摩中出中文字幕| 毛片一级精油按摩无码| 国产一区二区视频免费| 欧美综合天天夜夜久久| a在线观看免费网站大全| 成激情人妻视频| 中文字幕一区二区综合| 山外人精品影院| 亚洲日韩乱码中文无码蜜桃臀| 蜜桃在线观看免费高清完整版| 国产自拍在线观看视频| 精品国产拍国产天天人| 亚洲人成亚洲人成在线观看| 国产三级伦理视频在线| 最新国产熟女资源自拍| 少妇丰满大乳被男人揉捏视频| 久久久久国产一级毛片高清版A | av人摸人人人澡人人超碰小说| 久久久99久久久国产自输拍| 五月激情在线视频观看| 被三个男人绑着躁我好爽视频 | 人人摸人人操| 久久人人做人人妻人人玩精 | 精品9e精品视频在线观看| 欧美视频九九一区二区 | 亚洲熟妇无码八av在线播放| 久久九九青青国产精品| 久久久久亚洲女同一区二区| 国产大学生自拍三级视频| 成年女人免费v片| 国产全肉乱妇杂乱视频 | 亚洲av不卡无码国产| 精品一区二区久久久久久久网站| 波多野无码AV中文专区| 91成人自拍在线观看| 亚洲色无码国产精品网站可下载| 白白色发布在线播放国产|