楊 淇,郝二偉,侯小濤,鄧家剛,杜正彩, 5,范麗麗*,夏中尚*
基于藥性理論的中藥抗輻射預(yù)測(cè)模型的構(gòu)建
楊 淇1,郝二偉2, 3, 4,侯小濤2, 3, 4,鄧家剛2, 3, 4,杜正彩2, 3, 4, 5,范麗麗1*,夏中尚2, 3, 4*
1. 廣西中醫(yī)藥大學(xué)藥學(xué)院,廣西 南寧 530000 2. 廣西中醫(yī)藥大學(xué) 廣西中藥藥效研究重點(diǎn)實(shí)驗(yàn)室,廣西 南寧 530000 3. 廣西中醫(yī)藥大學(xué) 廣西農(nóng)作物廢棄物功能成分研究協(xié)同創(chuàng)新中心,廣西 南寧 530000 4. 廣西中醫(yī)藥大學(xué) 廣西中醫(yī)濕病方藥理論與轉(zhuǎn)化重點(diǎn)實(shí)驗(yàn)室,廣西 南寧 530000 5. 廣西中醫(yī)藥大學(xué) 廣西中醫(yī)藥科學(xué)實(shí)驗(yàn)中心,廣西 南寧 530000
以中藥藥性作為特征描述符構(gòu)建機(jī)器學(xué)習(xí)抗輻射作用預(yù)測(cè)模型,并解釋抗輻射中藥藥性的重要藥性特征以指導(dǎo)臨床和日常輻射防治。通過藥智網(wǎng)、中國知網(wǎng)、PubMed等數(shù)據(jù)庫獲取報(bào)道具有抗輻射作用的中藥研究文獻(xiàn),通過SymMap數(shù)據(jù)庫獲得《中國藥典》等權(quán)威著作記載的中藥性味歸經(jīng)等藥性作為特征描述符構(gòu)建數(shù)據(jù)庫,并將數(shù)據(jù)處理為適合機(jī)器學(xué)習(xí)的格式。使用隨機(jī)森林、支持向量機(jī)、梯度提升、邏輯回歸、全連接神經(jīng)網(wǎng)絡(luò)5種機(jī)器學(xué)習(xí)模型對(duì)數(shù)據(jù)集進(jìn)行五折交叉訓(xùn)練并進(jìn)行性能評(píng)估,再使用10個(gè)未參與訓(xùn)練的報(bào)道具抗輻射作用的中藥和10個(gè)報(bào)道無抗輻射作用的中藥作為外部驗(yàn)證集測(cè)試模型,最后利用SHapley加性解釋(SHapley additive ex planations,SHAP)解釋器對(duì)決定抗輻射作用有無的重要藥性特征進(jìn)行可視化。收集到涉及單味藥研究、保健食品注冊(cè)和復(fù)方研究共136味報(bào)道具抗輻射作用的中藥,總頻次為447次,其中中藥使用頻次及頻率排名前3的為靈芝、紅景天、枸杞子,頻次≥10的中藥共10味。在5個(gè)機(jī)器學(xué)習(xí)的性能評(píng)估中,隨機(jī)森林性能最佳,其準(zhǔn)確率、平衡F分?jǐn)?shù)(F1)和曲線下面積(area under urve,AUC)分別為0.804 4、0.773 2和0.879 8。在外部中藥抗輻射的驗(yàn)證中,隨機(jī)森林模型能較好地預(yù)測(cè)已報(bào)道具有抗輻射作用的中藥。性能最佳的隨機(jī)森林SHAP解釋器認(rèn)為“補(bǔ)虛、清熱”功效,“心、肝、脾、肺”歸經(jīng),“酸、甘、苦”味,“寒”藥性特征對(duì)抗輻射作用貢獻(xiàn)最大。首次將中藥藥性作為特征描述應(yīng)用到機(jī)器學(xué)習(xí)當(dāng)中并取得了較好的預(yù)測(cè)模型性能,并指導(dǎo)了放射病的中醫(yī)藥防治,即當(dāng)以扶正祛邪,滋陰降火,主治心、肝、脾、肺為治療原則。此外,機(jī)器學(xué)習(xí)模型較好的預(yù)測(cè)結(jié)果反映了中醫(yī)藥理論對(duì)疾病的防治具有良好的可解釋性與可重現(xiàn)性。
機(jī)器學(xué)習(xí);中藥;藥性;四氣五味;抗輻射;靈芝;紅景天;枸杞子
2023年8月24日日本開始首輪排放福島儲(chǔ)存的核污水,使得抗輻射成為了熱點(diǎn)話題[1]。輻射分為電離輻射與非電離輻射,其中電離輻射對(duì)人體的傷害最大,其作用于人體主要是誘導(dǎo)機(jī)體產(chǎn)生自由基導(dǎo)致?lián)p傷,從而導(dǎo)致機(jī)體所有器官不同程度的傷害,另還可致癌和引起胎兒死亡或畸形[2]。放射病目前主流的臨床治療方法為生物治療、基因轉(zhuǎn)染等,其中防護(hù)效果好的手段往往毒副作用太明顯,嚴(yán)重限制了其應(yīng)用[3],因此,尋求安全有效的抗輻射藥物對(duì)人體健康有重要意義,對(duì)此祖國醫(yī)學(xué)提供了許多抗輻射新思路[4-5]。中醫(yī)藥治未病,防大于治,除物理防護(hù)輻射手段和化學(xué)藥之外,中藥或?yàn)榘踩矣行Х乐畏派洳〉倪x擇。
現(xiàn)有的研究資料顯示,中藥關(guān)于抗輻射作用的研究相對(duì)于其他功效的研究較少[5],所以如何在當(dāng)前的形勢(shì)下進(jìn)一步理解中藥的抗輻射作用從而預(yù)測(cè)出潛在具有抗輻射作用的中藥來指導(dǎo)放射病防治與藥學(xué)研究則顯得意義重大。但目前國內(nèi)外大多關(guān)于藥物藥效的預(yù)測(cè)研究均是局限于分子水平的物質(zhì)基礎(chǔ)[6-9],在藥效預(yù)測(cè)常用的機(jī)器學(xué)習(xí)方法中,特征的描述符也都以描述藥物分子的理化性質(zhì)、分子結(jié)構(gòu)等為主[10-11]。為此本研究首次嘗試使用中藥藥性作為特征描述符構(gòu)建抗輻射作用預(yù)測(cè)模型,觀察模型的性能與外部驗(yàn)證來判斷其可靠性,同時(shí)分析中藥的四氣五味、歸經(jīng)等特征在抗輻射作用中的重要性,為后續(xù)的中藥抗輻射研究提供創(chuàng)新方法,指導(dǎo)放射病的中藥防治。
本研究從公開的藥智網(wǎng)數(shù)據(jù)庫(https://db. yaozh.com/)收集具有抗輻射作用的藥食同源中藥,從中國知網(wǎng)與PubMed數(shù)據(jù)庫收集具有抗輻射作用的單味中藥和中藥復(fù)方。
藥食同源中藥:①來源于包含“抗輻射”保健功能的產(chǎn)品,且有明確的“主要原料”記載;②“主要原料”至少包含1個(gè)中藥品種;③中藥品種符合《按照傳統(tǒng)既是食品又是中藥材的物質(zhì)目錄管理規(guī)定》[12];④制劑輔料或添加劑可能為主要原料時(shí),經(jīng)評(píng)定其在保健食品配方中的作用,考慮刪除或保留,如白酒、醋等。
單味中藥和中藥復(fù)方:在中國知網(wǎng)與PubMed數(shù)據(jù)庫中檢索“抗輻射”“中藥”等相關(guān)主題詞或關(guān)鍵詞,得到具有抗輻射作用的中藥研究。納入標(biāo)準(zhǔn)如下:①動(dòng)物模型由輻射誘導(dǎo);②干預(yù)措施為中藥或復(fù)方;③結(jié)論明確表示干預(yù)的中藥或復(fù)方有抗輻射作用。對(duì)于具有抗輻射作用報(bào)道的中藥復(fù)方,根據(jù)納入標(biāo)準(zhǔn)將復(fù)方中的所有中藥品種都納入到數(shù)據(jù)庫當(dāng)中并計(jì)算頻次。本研究認(rèn)為同一種中藥若存在相同的抗輻射研究報(bào)道(即也被復(fù)方包含在內(nèi)的品種),應(yīng)當(dāng)進(jìn)行報(bào)道次數(shù)的加權(quán)作為其抗輻射的“證據(jù)力度”,所以保留了研究的報(bào)道次數(shù)用作后續(xù)機(jī)器學(xué)習(xí)的特征加權(quán)。
①?zèng)]有確切標(biāo)注保健功能為“抗輻射”的保健食品配方;②同一單位注冊(cè)且主要原料完全相同的保健食品配方;③“主要原料”未有記錄的保健食品配方;④中藥單體成分的抗輻射研究。
使用Excel提取符合納入標(biāo)準(zhǔn)的中藥信息,提取內(nèi)容包括名稱、性味歸經(jīng)、功效、保健功能、主要原料等。隨后對(duì)中藥進(jìn)行規(guī)范化處理,參考《中國藥典》2020年版、《中藥大辭典》等統(tǒng)一中藥的名稱,如“高山紅景天”規(guī)范為“紅景天”、“懷山藥”規(guī)范為“山藥”等。最后檢索《中國藥典》2020年版、《全國中草藥匯編》《中藥大辭典》《中華本草》及地方標(biāo)準(zhǔn),以及結(jié)合中醫(yī)藥證候關(guān)聯(lián)數(shù)據(jù)庫SymMap[13]得到中藥對(duì)應(yīng)的藥性、藥味、歸經(jīng)、功效分類等,其中微寒、微苦等帶有“微”的均刪除,統(tǒng)一為寒、苦等,規(guī)范化完成后構(gòu)建出具抗輻射作用的中藥數(shù)據(jù)庫。
本研究的機(jī)器學(xué)習(xí)問題屬于二元分類問題,需要準(zhǔn)備正負(fù)標(biāo)簽的數(shù)據(jù)集。對(duì)“1.4”項(xiàng)得到的具抗輻射作用的中藥數(shù)據(jù)庫進(jìn)行處理,提取其中不同中藥的“藥性”“藥味”“歸經(jīng)”“功效”4個(gè)特征類別,并以收集到的“具抗輻射作用”的中藥作為正標(biāo)簽。對(duì)于負(fù)標(biāo)簽中藥的收集(即無抗輻射作用報(bào)道的中藥),通過以下方法在SymMap數(shù)據(jù)庫的704種中藥中獲?。孩賲⒖颊龢?biāo)簽“具抗輻射作用”中藥的功效歸屬,選擇功效關(guān)系較遠(yuǎn)的中藥,如具有抗輻射作用中藥中“補(bǔ)虛”功效出現(xiàn)的次數(shù)較多,則選擇與“補(bǔ)虛”功效關(guān)系較遠(yuǎn)的“活血化瘀”或“涌吐”等類型的中藥;②收集到的負(fù)標(biāo)簽中藥的數(shù)量超過正標(biāo)簽2倍后,首先返回正標(biāo)簽數(shù)據(jù)集中進(jìn)行檢查,確保負(fù)標(biāo)簽中藥不會(huì)與正標(biāo)簽重復(fù)出現(xiàn),隨后對(duì)待確認(rèn)的負(fù)標(biāo)簽數(shù)據(jù)集進(jìn)行隨機(jī)抽取至數(shù)量與正標(biāo)簽一致。通過此方法保證了正、負(fù)標(biāo)簽數(shù)據(jù)集的差異,同時(shí)正、負(fù)標(biāo)簽的數(shù)量均衡使數(shù)據(jù)集更具有代表性且能涵蓋更廣泛的中藥藥性,進(jìn)而提升模型的泛化性[14]。
為了使中藥藥性特征成為適應(yīng)機(jī)器學(xué)習(xí)的格式,本研究使用“熱編碼”技術(shù)對(duì)藥性特征進(jìn)行處理。獨(dú)熱編碼(one-hot encoding)是一種處理分類變量的方法[15],假設(shè)有一個(gè)“藥味”變量,其包含多種可能的類別:“辛”“甘”“酸”等,在獨(dú)熱編碼中會(huì)為每種藥味創(chuàng)建1個(gè)新的變量:“是辛”“是甘”“是酸”等。每個(gè)新變量都賦予二進(jìn)制0或1的值。如人參的藥味是“甘、微苦”,那么在熱編碼后,“是甘”和“是苦”的值就會(huì)是1,而其他的變量“是辛”“是酸”等則都是0,這就表示人參的藥味是甘、苦,而不是辛、酸或咸等,其他特征同理。最后對(duì)“1.4”項(xiàng)得到的數(shù)據(jù)中存在不同中藥出現(xiàn)頻次不同的情況,在進(jìn)行機(jī)器學(xué)習(xí)之前將其進(jìn)行頻次加權(quán),如靈芝有36次抗輻射作用的研究報(bào)道,那么在訓(xùn)練的數(shù)據(jù)集中會(huì)出現(xiàn)36行。
本研究使用隨機(jī)森林、支持向量機(jī)、梯度提升、邏輯回歸和全神經(jīng)網(wǎng)絡(luò)5種機(jī)器學(xué)習(xí)模型對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練,涵蓋了傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí),使用的編程語言為Python。本研究的機(jī)器學(xué)習(xí)邏輯:①讀取“2.2”項(xiàng)得到的適合學(xué)習(xí)格式的數(shù)據(jù)集并使用5折交叉進(jìn)行訓(xùn)練(隨機(jī)分配的訓(xùn)練集∶測(cè)試集=4∶1,5次);②提取數(shù)據(jù)集的特征與標(biāo)簽;③對(duì)特征所屬的中藥頻次進(jìn)行加權(quán);④定義模型并訓(xùn)練,參數(shù)設(shè)置為默認(rèn),主體代碼為models = {'Random Forest': RandomForestClassifier(), 'Support Vector Machine': SVC(probability=True), 'Gradient Boosting': Gradient BoostingClassifier(), 'Logistic Regression': Logistic Regression(max_iter = 1 000),'Neural Network': MLP Classifier(max_iter = 1 000)};⑤對(duì)隨機(jī)森林、支持向量機(jī)、梯度提升和邏輯回歸進(jìn)行特征重要性的SHapley加性解釋(SHapley additive ex planations,SHAP)[16],而全神經(jīng)網(wǎng)絡(luò)由于復(fù)雜的非線性關(guān)系和多層結(jié)構(gòu)使得直接解釋其工作原理和做出的特定預(yù)測(cè)變得極其困難,在本研究中不作SHAP解釋;⑥性能評(píng)估與外部預(yù)測(cè)驗(yàn)證等。
由于本研究機(jī)器學(xué)習(xí)使用的多個(gè)Python庫無法識(shí)別中文,所以將“2.1.1”項(xiàng)所構(gòu)建的數(shù)據(jù)集表頭以拼音表示,并將標(biāo)簽中“有抗輻射作用”的中藥設(shè)置為“1”,“無抗輻射作用”的中藥設(shè)置為“0”,需要注意的是“辛(xin)”與“心(xin)”等會(huì)被認(rèn)為是同一事物,所以本研究將“辛(xin)”轉(zhuǎn)化成了“辛味(xinwei)”。
本研究首次探究使用中藥藥性作為特征描述符來構(gòu)建機(jī)器學(xué)習(xí)的預(yù)測(cè)模型,因此能夠較好預(yù)測(cè)抗輻射作用能力的模型不僅體現(xiàn)在預(yù)測(cè)的準(zhǔn)確性,還能反映出中醫(yī)藥理論的可重現(xiàn)性。本研究使用機(jī)器學(xué)習(xí)研究中常見的評(píng)價(jià)指標(biāo)來評(píng)價(jià)模型,包括準(zhǔn)確率、平衡F分?jǐn)?shù)(F1)、曲線下面積(area under urve,AUC)、受試者工作特征(receiver operator characteristic,ROC)曲線以及混淆矩陣[17],在計(jì)算模型準(zhǔn)確率前采用五折交叉法取平均值來評(píng)價(jià)模型性能并可視化為箱線圖[18]。
準(zhǔn)確率=正確分類的樣本數(shù)/所有樣本數(shù)
F1分?jǐn)?shù)=2×(精確率×召回率)/(精確率+召回率)
精確率=真正例/(真正例+假正例)
召回率=真正例/(真正例+假負(fù)例)
AUC是評(píng)估二元分類器性能的指標(biāo)之一,簡(jiǎn)單地說,AUC測(cè)量了模型在不同閾值下的分類能力;ROC曲線是以假正例率為橫坐標(biāo),真正例率為縱坐標(biāo)繪制的曲線。混淆矩陣是一個(gè)表格,用來描述分類模型的性能,包括真正例、假負(fù)例、真負(fù)例和假正例,簡(jiǎn)單來說可以看到正負(fù)標(biāo)簽的預(yù)測(cè)正誤情況。需要注意的是混淆矩陣將會(huì)體現(xiàn)出模型對(duì)正標(biāo)簽(即具抗輻射作用)和負(fù)標(biāo)簽(即不具抗輻射作用)各自的預(yù)測(cè)能力,將有力地指導(dǎo)預(yù)測(cè)的方向。五折交叉驗(yàn)證是將數(shù)據(jù)集分成5個(gè)部分,輪流將其中4個(gè)部分作為訓(xùn)練數(shù)據(jù),剩下的一部分作為測(cè)試數(shù)據(jù),進(jìn)行5次訓(xùn)練和測(cè)試,最后取5次測(cè)試結(jié)果的平均值。
真正例率=真正例/(真正例+假負(fù)例)
假正例率=假正例/(假正例+真負(fù)例)
本研究選擇SHAP解釋器對(duì)隨機(jī)森林、支持向量機(jī)、梯度提升和邏輯回歸4種機(jī)器學(xué)習(xí)模型的訓(xùn)練結(jié)果進(jìn)行特征重要性可視化[19],而全神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型無法使用SHAP可視化特征的重要性。本研究抗輻射作用預(yù)測(cè)模型中使用的藥性特征包括辛、甘、酸、苦、咸、寒、熱、平和涼等,通過SHAP可視化可以了解到哪些藥性特征對(duì)抗輻射效果的預(yù)測(cè)最為重要,以及這些特征是如何影響預(yù)測(cè)結(jié)果的。例如,SHAP值顯示“辛”特征對(duì)預(yù)測(cè)結(jié)果的貢獻(xiàn)較大,那么就可以推斷出具有“辛”特征的中藥可能對(duì)放射病有較好的防治效果;相反,如果“寒”特征的SHAP值為負(fù),便可以推斷出“寒”特征可能會(huì)降低這味中藥的抗輻射效果。
為了驗(yàn)證模型的預(yù)測(cè)可靠性,本研究從中國知網(wǎng)、PubMed等數(shù)據(jù)庫獲取了10個(gè)報(bào)道具有抗輻射作用的中藥,并與數(shù)據(jù)集進(jìn)行了遍歷對(duì)照保證這10個(gè)中藥不在先前構(gòu)建的抗輻射中藥數(shù)據(jù)庫當(dāng)中;同時(shí),本研究使用隨機(jī)法在SymMap數(shù)據(jù)庫中收集了不重復(fù)的10種報(bào)道不具有抗輻射作用的中藥,再到中國知網(wǎng)等數(shù)據(jù)庫中確認(rèn),確認(rèn)后作為預(yù)測(cè)共組成20味中藥的外部驗(yàn)證數(shù)據(jù)集,如表1所示,并使用5種機(jī)器學(xué)習(xí)模型中綜合性能最佳的模型進(jìn)行預(yù)測(cè)。
本研究獲得136味具有抗輻射作用的中藥,總頻次為447次,其中中藥使用頻次及頻率排名前3的為靈芝(36次,8.05%)、紅景天(30次,6.71%)、枸杞子(24次,5.37%),頻次≥10的中藥共10味,見表2。涉及補(bǔ)虛藥、清熱藥、活血化瘀藥等20種功效,心、肝、腎等全部經(jīng)絡(luò),以及全部藥味和寒熱屬性。
由于本研究是初次使用中藥藥性作為機(jī)器學(xué)習(xí)特征,所以展示訓(xùn)練集構(gòu)建的詳細(xì)過程。表3展示了部分中藥藥性特征初步處理的結(jié)果,是從數(shù)據(jù)庫初步收集到中藥藥性后整理得到的。而表4則是使用熱編碼方法,將表3的數(shù)據(jù)進(jìn)行向量化,以符合機(jī)器學(xué)習(xí)的訓(xùn)練格式要求。需要注意的是RDkit庫識(shí)別不了中文,所以從表3開始主要特征需要使用英文字母來進(jìn)行描述,本研究采用拼音表示。通過“2.2”項(xiàng)的方法本研究最終得到了44個(gè)特征用以機(jī)器學(xué)習(xí)。
5個(gè)機(jī)器學(xué)習(xí)模型的準(zhǔn)確率平均值經(jīng)五折交叉驗(yàn)證后如圖1所示,可以看到隨機(jī)森林、梯度提升和支持向量機(jī)模型性能相對(duì)較好,特別是隨機(jī)森林預(yù)測(cè)結(jié)果穩(wěn)定且準(zhǔn)確率高。邏輯回歸與全連接神經(jīng)網(wǎng)絡(luò)的五折交叉準(zhǔn)確率較低,中位數(shù)處于0.5附近,說明模型的預(yù)測(cè)能力幾乎與隨機(jī)預(yù)測(cè)沒有區(qū)別。從表5和圖2的ROC曲線可以看出,隨機(jī)森林的綜合性能仍然是最佳的,其準(zhǔn)確率高達(dá)0.8以上,F(xiàn)1分?jǐn)?shù)為0.773 2,AUC為0.879 8,說明隨機(jī)森林模型可以較好地預(yù)測(cè)待輸入的數(shù)據(jù)集;梯度提升模型次之,準(zhǔn)確率和F1分?jǐn)?shù)在0.76左右,AUC為0.824 4;其余3個(gè)模型的綜合性能均較差。而不同模型的ROC曲線越接近左上角其在不同閾值下的預(yù)測(cè)能力越好,可以看到隨機(jī)森林模型的ROC曲線AUC最高。而支持向量機(jī)在不同閾值的預(yù)測(cè)能力都一樣為0.5,可以認(rèn)為其沒有根據(jù)特征分類的能力。圖3反映了5種機(jī)器學(xué)習(xí)模型區(qū)分預(yù)測(cè)測(cè)試集正、負(fù)標(biāo)簽的能力,可以認(rèn)為是左上與左下圖的顏色越淺,其對(duì)正、負(fù)標(biāo)簽的預(yù)測(cè)能力越強(qiáng);左下與左上的顏色越深,其誤判率越低??梢钥吹诫S機(jī)森林模型最符合上述“答對(duì)率”最高與“誤判率”最低的描述。
表1 待預(yù)測(cè)抗輻射作用的20種中藥藥性
表2 抗輻射中藥頻次分布(頻次≥10)
表3 抗輻射中藥藥性特征的初步處理(示例)
表4 最終用于機(jī)器學(xué)習(xí)的中藥藥性特征數(shù)據(jù)集(示例)
表5 5種機(jī)器學(xué)習(xí)模型的性能評(píng)估
圖1 5種機(jī)器學(xué)習(xí)模型的準(zhǔn)確率交叉驗(yàn)證
圖2 5種機(jī)器學(xué)習(xí)模型的ROC曲線
由于全神經(jīng)網(wǎng)絡(luò)模型無法進(jìn)行SHAP解釋,所以僅計(jì)算隨機(jī)森林、支持向量機(jī)、梯度提升和邏輯回歸模型的SHAP值并可視化。如圖4所示,紅色代表“特征重要性”,藍(lán)色代表“特征不重要性”,橫坐標(biāo)的左側(cè)代表著“負(fù)標(biāo)簽(無抗輻射作用)”的貢獻(xiàn)程度,右側(cè)代表著“正標(biāo)簽(有抗輻射作用)”的貢獻(xiàn)程度,簡(jiǎn)單來說,紅色散點(diǎn)在正坐標(biāo)軸(右側(cè))越高越遠(yuǎn)越多,那么這個(gè)特征在抗輻射作用中重要性越大,反之紅色散點(diǎn)在負(fù)坐標(biāo)軸(左側(cè))越高越遠(yuǎn)越多,則這個(gè)特征在抗輻射作用中重要性越小。如圖4所示,性能較好的隨機(jī)森林模型給出的結(jié)果可信度相對(duì)高,被放大以加強(qiáng)顯示。可以看到4個(gè)機(jī)器學(xué)習(xí)模型雖性能差異較大,但給出的藥性特征重要性基本相同,以隨機(jī)森林模型認(rèn)為“補(bǔ)虛”“清熱”“心經(jīng)”是具抗輻射作用中藥的前3重要特征,而“祛風(fēng)濕”“辛味”“熱性”是使中藥遠(yuǎn)離抗輻射作用的前3重要的特征。
20味中藥的抗輻射作用預(yù)測(cè)與驗(yàn)證結(jié)果見表6,其中編號(hào)1~10的中藥為已報(bào)道有抗輻射作用,可以看到隨機(jī)森林對(duì)已經(jīng)具有確切抗輻射作用的木香、天山雪蓮等10味中藥給出了具抗輻射作用可能性均在0.7以上的結(jié)果,而對(duì)于暫未報(bào)道有抗輻射作用的鬼箭羽、雞骨草、京大戟、萊菔子和連錢草給出了0.9以上的具抗輻射作用可能性,紅粉與葫蘆巴可能性較低。
圖3 5種機(jī)器學(xué)習(xí)模型的測(cè)試集預(yù)測(cè)結(jié)果
圖4 基于4種機(jī)器學(xué)習(xí)模型的抗輻射作用重要特征評(píng)估
本研究使用中藥藥性作為機(jī)器學(xué)習(xí)的特征描述符成功構(gòu)建了抗輻射作用的中藥預(yù)測(cè)模型,并使用SHAP解釋器對(duì)其中4種機(jī)器學(xué)習(xí)訓(xùn)練的結(jié)果進(jìn)行了藥性特征重要性的描述,指導(dǎo)了放射病的中醫(yī)藥防治研究方向,同時(shí)本研究是首次將中藥藥性作為特征應(yīng)用到機(jī)器學(xué)習(xí)中并取得了良好的模型性能。但在探索的過程存在著許多需要討論和注意的問題。
表6 20味中藥的抗輻射作用預(yù)測(cè)與驗(yàn)證
中藥藥性基于中醫(yī)藥理論,是多成分作用于多靶點(diǎn)協(xié)同調(diào)控多條信號(hào)通路從而發(fā)揮整體作用[30]。本研究使用的“中藥藥性”屬于一種表征的特征,或者說是復(fù)雜的因素(如多成分-多靶點(diǎn))交織融合而表現(xiàn)出來的現(xiàn)象[31],從而被記錄下來形成“四氣五味”“歸經(jīng)”等藥性。這些藥性實(shí)際上已經(jīng)體現(xiàn)了中藥的藥理效應(yīng)、藥物動(dòng)力、藥物代謝等,與中醫(yī)藥理論的“整體觀念”“對(duì)癥治療”理論高度吻合[32]。目前已有研究使用機(jī)器學(xué)習(xí)來解釋中醫(yī)理論,如秘紅英等[33]采用貝葉斯算法研究吳以嶺教授的用藥規(guī)律,總結(jié)了其治療冠心病的“病、證、癥、法、方、藥”特點(diǎn)。但關(guān)于中藥的機(jī)器學(xué)習(xí)研究中,目前鮮有使用“中醫(yī)藥理論-疾病治療”的方法進(jìn)行中藥的機(jī)器學(xué)習(xí)研究[34],而都是圍繞著微觀分子的特征來展開[35-36]。但本研究所訓(xùn)練出來的機(jī)器學(xué)習(xí)模型特別是隨機(jī)森林性能良好,可以較好地應(yīng)對(duì)不同藥性特征的輸入,從而給出較為準(zhǔn)確的預(yù)測(cè)結(jié)果,這點(diǎn)體現(xiàn)在模型性能評(píng)估和外部驗(yàn)證以及SHAP解釋的結(jié)果當(dāng)中。
目前關(guān)于機(jī)器學(xué)習(xí)的研究國內(nèi)外大多使用“分子描述符”,如相對(duì)分子質(zhì)量(W)、對(duì)數(shù)分配系數(shù)(lg)、拓?fù)錁O性表面積(TPSA)、電荷分布(FASA)、拓?fù)渲讣y等[37],但都是基于分子理化性質(zhì)與“原子論”學(xué)說[38],存在著化學(xué)物質(zhì)基礎(chǔ)收集不全面與僅有定性描述而可能造成認(rèn)識(shí)片面的情況發(fā)生,如基于單純理化性質(zhì)(如柔性)的配體- 靶點(diǎn)的分子對(duì)接就會(huì)出現(xiàn)結(jié)果與實(shí)驗(yàn)驗(yàn)證時(shí)常不一致的情況發(fā)生。
自然辨證法闡釋了矛盾的對(duì)立統(tǒng)一[39],雖然相比于化學(xué)藥常使用的分子拓?fù)浣Y(jié)構(gòu)描述符的“黑箱操作”(即難以解釋特征)[40],使用表征的中藥藥性來描述特征具有較好的解釋性,但也更容易出現(xiàn)“不確定”的情況,其中最容易發(fā)生的情況就是“質(zhì)量穩(wěn)定”與“認(rèn)可度”問題。如大黃可能會(huì)因?yàn)榛⑴谥?、產(chǎn)地、歷史等差異而有“瀉下攻積、清熱瀉火、涼血解毒、逐瘀通經(jīng)、利濕退黃”多種功效,在“功效歸類”中可以是瀉下藥也可以是清熱藥、活血化瘀藥、利水滲濕藥等[41];同時(shí)一種中藥甚至?xí)疅?、浮沉、補(bǔ)瀉等相反藥性的情況[42],根據(jù)陰陽學(xué)說這是一種必然的現(xiàn)象[43]。
除此之外,由于描述的表征性使得本研究訓(xùn)練得到的機(jī)器學(xué)習(xí)預(yù)測(cè)模型可能存在“過度泛化”的現(xiàn)象,即只要?dú)w心經(jīng)或寒涼藥,機(jī)器學(xué)習(xí)模型可能會(huì)認(rèn)為其或多或少有抗輻射的作用,因?yàn)閺臋C(jī)制上來說抗氧化、抗炎等也屬于抗輻射的范疇[44],這使得機(jī)器學(xué)習(xí)模型在指導(dǎo)抗輻射治療研究的過程中可能會(huì)出現(xiàn)特異性較差的情況,弱化了“同病異治”“辨證論治”等中醫(yī)獨(dú)特治法的應(yīng)用。
本研究采用了隨機(jī)森林、支持向量機(jī)、梯度提升、邏輯回歸和全神經(jīng)網(wǎng)絡(luò)5種機(jī)器學(xué)習(xí)模型,是取決于特征的特點(diǎn)。根據(jù)中藥的四氣五味、歸經(jīng)和功效,最終標(biāo)準(zhǔn)化特征得到了中藥44個(gè)特征描述,相比于摩根指紋的1 024位特征[45]或166位的分子接入系統(tǒng)鍵(molecular access system key,MACCS)鍵型指紋[46]等來說特征數(shù)量較少,而隨機(jī)森林等傳統(tǒng)機(jī)器學(xué)習(xí)模型是比較適用于特征數(shù)量較少的情況,并且解釋能力強(qiáng)[47],與本研究的初衷一致,即希望通過機(jī)器學(xué)習(xí)獲得抗輻射作用的重要特征以指導(dǎo)放射病的中醫(yī)藥防治方法。除此之外,本研究也使用了深度學(xué)習(xí)中的全神經(jīng)網(wǎng)絡(luò),目的是用以比較傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在學(xué)習(xí)中藥藥性特征中的性能,結(jié)果顯示傳統(tǒng)機(jī)器學(xué)習(xí)特別是隨機(jī)森林模型的綜合性能最佳。
需要注意的是,本研究通過了詳盡的檢索,獲得了136味不重復(fù)的有實(shí)驗(yàn)研究報(bào)道的抗輻射作用中藥,頻次在400以上,在常用中藥中占比較高,《中國藥典》2020年版收載616種中藥,以單味中藥為單位的數(shù)據(jù)庫有別于以億為數(shù)量級(jí)的單體化合物數(shù)據(jù)庫,所以不論是抗輻射作用還是其他功效,使用藥性作為特征描述符進(jìn)行機(jī)器學(xué)習(xí)的過程中,數(shù)據(jù)庫的樣本數(shù)量就不可避免地存在著較少的情況。藥性特征本研究僅采納了四氣五味、歸經(jīng)與功效歸類4種,其他如升降沉浮、發(fā)散收斂、有毒無毒等藥性[48]暫未被納入,在后續(xù)的研究中可以豐富藥性特征以更全面地描述中藥,提高預(yù)測(cè)模型的性能和泛化能力。
從隨機(jī)森林模型的SHAP解釋器結(jié)果可以看出,以補(bǔ)虛、清熱功效,歸心、肝、脾、肺經(jīng),酸、甘、苦味,寒性特征對(duì)抗輻射正向作用貢獻(xiàn)最大,在臨床用藥中一般應(yīng)優(yōu)先考慮使用此類藥性的中藥;而祛風(fēng)濕、驅(qū)蟲、瀉下功效,歸腎、大腸、胃經(jīng),辛味,熱、溫性特征對(duì)抗輻射起到反作用,在臨床用藥中一般應(yīng)考慮避免此類藥性的中藥。輻射導(dǎo)致的放射病在中醫(yī)學(xué)上被認(rèn)為是火熱溫毒致病[49],輻射應(yīng)為六淫之中的“火邪”,且有經(jīng)脈傳化、臟腑傳化、衛(wèi)氣營血傳化而致全身患病的特點(diǎn)[50]。發(fā)病之初,熱傷皮毛,衛(wèi)先受之,病邪由此而入。肺主皮毛,肺衛(wèi)受損。熱邪日久,傳及他臟[51],最終“火毒傷陰”,導(dǎo)致氣血兩虛等證。本研究的機(jī)器學(xué)習(xí)結(jié)果與中醫(yī)藥理論、放射病的臨床表現(xiàn)均吻合,總結(jié)出對(duì)于輻射火毒所致?lián)p傷,當(dāng)以扶正祛邪、滋陰降火、主治心、肝、脾、肺為治療原則的結(jié)論。
但使用中藥藥性作為特征描述符來進(jìn)行機(jī)器學(xué)習(xí),若要取得精準(zhǔn)的預(yù)測(cè)結(jié)果仍是一個(gè)挑戰(zhàn),學(xué)習(xí)的結(jié)果在一定程度上可以指導(dǎo)抗輻射的中醫(yī)藥防治或加以解釋,也可以在研究的開始階段指導(dǎo)中藥的抗輻射或其他替換功效的藥效研究,但將分子性質(zhì)與表觀藥性“中西結(jié)合”,從小到大、由淺入深地描述物質(zhì)可能會(huì)得到更好的結(jié)果??傊?,本研究結(jié)果表明這將是有效的傳承創(chuàng)新的必然過程。
利益沖突 所有作者均聲明不存在利益沖突
[1] 劉國信. 日本核污染水排海帶來的影響不可小覷 [J]. 防災(zāi)博覽, 2023(5): 48-53.
[2] 李秀婷, 胡曉江, 董秋, 等. 低劑量電離輻射長期暴露對(duì)人體健康影響研究進(jìn)展 [J]. 職業(yè)衛(wèi)生與應(yīng)急救援, 2023, 41(5): 652-656.
[3] 付偉, 杜光. 核輻射防治藥物的基礎(chǔ)研究進(jìn)展 [J]. 世界臨床藥物, 2022, 43(8): 1012-1018.
[4] 辛佳蕓, 魏艷平, 丁倩倩, 等. 中藥抗輻射活性成分及其作用機(jī)制研究進(jìn)展 [J]. 中華中醫(yī)藥學(xué)刊, 2023, 41(7): 166-172.
[5] 韋唯唯, 杜光. 抗輻射中藥的研究進(jìn)展 [J]. 湖北科技學(xué)院學(xué)報(bào): 醫(yī)學(xué)版, 2023, 37(1): 84-89.
[6] Juul R V, Rasmussen M H, Agers? H,. Pharmacokinetics and pharmacodynamics of once-weekly somapacitan in children and adults: Supporting dosing rationales with a model-based analysis of three phase I trials [J]., 2019, 58(1): 63-75.
[7] Ebata S, Oba K, Kashiwabara K,. Predictors of rituximab effect on modified Rodnan skin score in systemic sclerosis: A machine-learning analysis of the DesiReS trial [J]., 2022, 61(11): 4364-4373.
[8] Alves V M, Bobrowski T, Melo-Filho C C,. QSAR modeling of SARS-CoV mproinhibitors identifies sufugolix, cenicriviroc, proglumetacin, and other drugs as candidates for repurposing against SARS-CoV-2 [J]., 2021, 40(1): e2000113.
[9] Yang X, Feng Y, Liu Y,. Fuzheng Jiedu Xiaoji formulation inhibits hepatocellular carcinoma progression in patients by targeting the AKT/CyclinD1/p21/p27 pathway [J]., 2021, 87: 153575.
[10] 劉皓淼, 楊志偉, 王力卓, 等. 基于機(jī)器學(xué)習(xí)的藥物-靶標(biāo)相互作用預(yù)測(cè) [J]. 中國生物工程雜志, 2022, 42(4): 40-48.
[11] 王振娟, 韓樂, 李雪嬋, 等. 機(jī)器學(xué)習(xí)在藥物篩選中的研究進(jìn)展 [J]. 中國醫(yī)院藥學(xué)雜志, 2023, 43(22): 2584-2588.
[12] 國家衛(wèi)生健康委關(guān)于印發(fā)《按照傳統(tǒng)既是食品又是中藥材的物質(zhì)目錄管理規(guī).定》的通知 [J]. 中華人民共和國國家衛(wèi)生健康委員會(huì)公報(bào), 2021(11): 7-9.
[13] Wu Y, Zhang F L, Yang K,. SymMap: An integrative database of traditional Chinese medicine enhanced by symptom mapping [J]., 2019, 47(D1): D1110-D1117.
[14] Wu Y F, Fang Y. Stroke prediction with machine learning methods among older Chinese [J]., 2020, 17(6): 1828.
[15] Okada S, Ohzeki M, Taguchi S. Efficient partition of integer optimization problems with one-hot encoding [J]., 2019, 9(1): 13036.
[16] Ma Y B, Zhang D, Xu J,. Explainable machine learning model reveals its decision-making process in identifying patients with paroxysmal atrial fibrillation at high risk for recurrence after catheter ablation [J]., 2023, 23(1): 91.
[17] Cagirici H B, Budak H, Sen T Z. G4Boost: A machine learning-based tool for quadruplex identification and stability prediction [J]., 2022, 23(1): 240.
[18] Gossert A D. Assessing molecular interactions with biophysical methods using the validation cross [J]., 2019, 47(1): 63-76.
[19] El-Sappagh S, Alonso J M, Islam S M R,. A multilayer multimodal detection and prediction model based on explainable artificial intelligence for Alzheimer’s disease [J]., 2021, 11(1): 2660.
[20] 李碩, 王志允, 常華杰, 等. 木香HPLC指紋圖譜的建立及其抗氧化、抗輻射作用譜效關(guān)系研究 [J]. 中草藥, 2023, 54(8): 2580-2587.
[21] 周湘潔, 周曉春, 張麗芬, 等. 雪蓮培養(yǎng)細(xì)胞提取物對(duì)60Co γ射線照射后小鼠外周血細(xì)胞的保護(hù)作用 [J]. 航天醫(yī)學(xué)與醫(yī)學(xué)工程, 2015, 28(1): 16-21.
[22] 陳曉白, 王曉平, 趙仕花, 等. 牛大力對(duì)60Coγ射線致小鼠造血系統(tǒng)損傷的保護(hù)作用 [J]. 中成藥, 2013, 35(9): 1852-1856.
[23] 黃明欣, 鄭思新, 王培仁, 等. 若干香豆素衍生物對(duì)小鼠抗輻射作用的研究 [J]. 軍事醫(yī)學(xué)科學(xué)院院刊, 1986, 10(6): 409-412.
[24] 毛峻琴, 徐超斗, 陳大貴, 等. 淡豆豉提取物對(duì)急性輻射損傷小鼠的保護(hù)作用 [J]. 解放軍藥學(xué)學(xué)報(bào), 2014, 30(2): 110-113.
[25] 楊建華, 閆瑤, 胡君萍, 等. 沙棗總酚抗輻射活性研究 [J]. 時(shí)珍國醫(yī)國藥, 2013, 24(9): 2120-2122.
[26] 張海東, 王仁生, 馬姍姍, 等. 腫節(jié)風(fēng)顆粒對(duì)小型豬腮腺放射損傷所致活性氧簇的清除作用 [J]. 南方醫(yī)科大學(xué)學(xué)報(bào), 2011, 31(1): 93-95.
[27] 齊琳, 吳文倩, 陳韶華, 等. 沙苑子黃酮對(duì)輻射損傷的抗氧化保護(hù)作用 [J]. 上海中醫(yī)藥雜志, 2011, 45(5): 73-77.
[28] 王波. 秦皮提取物的抗輻射研究 [J]. 陜西農(nóng)業(yè)科學(xué), 2010, 56(4): 40-42.
[29] 朱世權(quán), 蔡文秀, 薛玲, 等. 徐長卿多糖的分離純化及其抗輻射和升高白細(xì)胞的作用 [J]. 中草藥, 2010, 41(1): 103-106.
[30] 翟興英, 李洋, 涂珺, 等. 基于多靶點(diǎn)協(xié)同作用中藥藥效物質(zhì)評(píng)價(jià)指數(shù)構(gòu)建及其在葛根治療糖尿病藥效物質(zhì)基礎(chǔ)分析中應(yīng)用 [J]. 中國藥理學(xué)與毒理學(xué)雜志, 2023, 37(S1): 33.
[31] 秦林, 彭欣. 現(xiàn)代中藥法象理論研究 (I): 論藥象與藥性的辯證關(guān)系及意義 [J]. 山東中醫(yī)藥大學(xué)學(xué)報(bào), 2023, 47(5): 548-553.
[32] 彭亞倩, 唐輝, 韓彥琪, 等. 中藥五味藥性理論的現(xiàn)代研究進(jìn)展 [J]. 藥物評(píng)價(jià)研究, 2023, 46(9): 2014-2023.
[33] 秘紅英, 魏聰, 李紅蓉, 等. 基于貝葉斯算法的吳以嶺教授治療冠心病心絞痛的病案分析研究 [J]. 中國中西醫(yī)結(jié)合雜志, 2018, 38(5): 534-538.
[34] 姜皓, 張冰, 張曉朦, 等. 基于4種機(jī)器學(xué)習(xí)算法的妊娠期中藥“禁忌慎”判別 [J]. 中草藥, 2021, 52(24): 7596-7605.
[35] 劉滇, 王海. 基于加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)篩選腎母細(xì)胞瘤特征基因及其靶向中藥預(yù)測(cè) [J]. 中醫(yī)臨床研究, 2023, 15(20): 43-49.
[36] 劉洋, 曹賽雅, 馮月嬌, 等. 應(yīng)用機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)模型識(shí)別結(jié)直腸癌“炎癌轉(zhuǎn)化”過程的關(guān)鍵基因及防治中藥預(yù)測(cè) [J]. 中草藥, 2023, 54(19): 6386-6399.
[37] 龐國慶, 嚴(yán)沛鑫, 周康喬. 基于機(jī)器學(xué)習(xí)的抗乳腺癌候選藥物篩選模型優(yōu)化 [J]. 南通職業(yè)大學(xué)學(xué)報(bào), 2023, 37(2): 67-72.
[38] 佟藝辰. 在原子論、元素論和經(jīng)驗(yàn)主義之間: 若弗魯瓦的化學(xué)研究 [J]. 自然辯證法通訊, 2023, 45(6): 53-64.
[39] 王鵬偉. 馬克思恩格斯共同體思想的本質(zhì)與發(fā)展——基于自然辯證法的維度[J]. 系統(tǒng)科學(xué)學(xué)報(bào), 2024(4): 1-6.
[40] Hedderich D M, Eickhoff S B. Machine learning for psychiatry: Getting doctors at the black box? [J]., 2021, 26(1): 23-25.
[41] 段展輝, 劉桂榮. 從量效關(guān)系探討張志遠(yuǎn)運(yùn)用大黃經(jīng)驗(yàn) [J]. 中醫(yī)雜志, 2022, 63(13): 1219-1222.
[42] 王洋洋, 匡海學(xué), 蘇發(fā)智, 等. 中藥四性的臨床應(yīng)用價(jià)值及與五味的關(guān)系 [J]. 中草藥, 2023, 54(4): 1329-1341.
[43] 姚春鵬, 姚丹. 論李杲醫(yī)學(xué)的易理基礎(chǔ) [J]. 周易研究, 2021(4): 85-91.
[44] 楊露勛, 楊新瑞, 劉晶, 等. EGCG在抗輻射方面的研究進(jìn)展 [J]. 中國輻射衛(wèi)生, 2023, 32(6): 700-704.
[45] Zhong S F, Guan X H. Count-based morgan fingerprint: A more efficient and interpretable molecular representation in developing machine learning-based predictive regression models for water contaminants' activities and properties [J]., 2023, 57(46): 18193-18202.
[46] Xia Z H, Yan A X. Computational models for the classification of mPGES-1 inhibitors with fingerprint descriptors [J]., 2017, 21(3): 661-675.
[47] Rigatti S J. Random forest [J]., 2017, 47(1): 31-39.
[48] 楊曙光, 王鵬, 開菲. 桔梗升降浮沉藥性考辨 [J]. 中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志, 2022, 28(8): 1323-1325.
[49] 高明澤, 徐文慧, 王天琪, 等. 急性輻射損傷的中醫(yī)病因?qū)W探討 [J]. 中醫(yī)雜志, 2016, 57(6): 454-457.
[50] 張悅, 梁建慶, 李金田, 等. 輻射毒與中醫(yī)火毒相關(guān)性探討 [J]. 中華中醫(yī)藥雜志, 2022, 37(10): 6084-6087.
[51] 王子驍, 梁小蘭, 李淦, 等. 電磁輻射損傷的中醫(yī)研究進(jìn)展 [J]. 職業(yè)與健康, 2021, 37(5): 707-709.
Construction of antiradiation prediction model of traditional Chinese medicine based on medicinal property theory
YANG Qi1, HAO Erwei2, 3, 4, HOU Xiaotao2, 3, 4, DENG Jiagang2, 3, 4, DU Zhengcai2, 3, 4, 5, FAN Lili1, XIA Zhongshang2, 3, 4
1. School of Pharmacy, Guangxi University of Chinese Medicine, Nanning 530000, China 2. Key Laboratory of Pharmacodynamic Research of Chinese Medicine in Guangxi, Guangxi University of Chinese Medicine, Nanning 530000, China 3. Collaborative Innovation Center for Functional Component Research of Crop Waste in Guangxi, Guangxi University of Chinese Medicine, Nanning 530000, China 4. Key Laboratory of Theory and Transformation of Chinese Medicine for Dampness and Wetness Diseases in Guangxi, Guangxi University of Chinese Medicine, Nanning 530000, China 5. Guangxi Experimental Center of Traditional Chinese Medicine Science, Guangxi University of Chinese Medicine, Nanning 530000, China
To construct a machine learning model for predicting anti-radiation effects using the medicinal properties of traditional Chinese medicine (TCM) as feature descriptors, and elucidate the significant medicinal properties of anti-radiation TCM to guide clinical practice and daily radiation prevention and control.Research literature on TCM with reported anti-radiation effects was collected from databases such as the Medicinal Herb Database, CNKI, and PubMed. The SymMap database was utilized to obtain the medicinal properties of TCM, such as taste, attributed meridians, etc., as recorded in authoritative texts like the Chinese Pharmacopoeia. These properties were used as feature descriptors to construct a database, which was then processed into a format suitable for machine learning. Five machine learning models-random forest, support vector machine, gradient elevator, logistic regression, and fully connected neural network-were employed to perform five-fold cross-validation on the dataset and assess performance. An external validation set, comprising 10 TCMs with reported anti-radiation effects and 10 TCMs without such reports, was used to test the models. Finally, the SHapley Additive exPlanations (SHAP) interpreter was used to visualize and interpret the significant medicinal properties that contribute to the anti-radiation effects.A total of 136 TCMs with reported anti-radiation effects were collected, including single herbs, health food registrations, and compound formulations, with a total frequency of 447 occurrences. The top three most frequently used TCMs were Lingzhi (), Hongjingtian (et), and Gouqizi (), with each being used more than 10 times. Among the five machine learning models, the random forest exhibited the best performance, with an accuracy rate, F1 score, and area under urve (AUC) of 0.804 4, 0.773 2, and 0.879 8, respectively. The random forest model also demonstrated a good ability to correctly predict TCMs with reported anti-radiation effects in the external validation. The SHAP interpreter for the best-performing random forest model identified the functions of “tonifying deficiency, clearing heat”, the attributed meridians of “heart, liver, spleen, lung”, the tastes of “sour, sweet, bitter”, and the properties of “cold” as the most contributive to the anti-radiation effects.This study is the first to apply the medicinal properties of TCM as feature descriptors in machine learning, achieving good predictive model performance. It provides guidance for the prevention and treatment of radiation sickness with TCM, suggesting that principles such as reinforcing healthyand eliminating pathogen, nourishing yin and reducing fire, and focusing on the heart, liver, spleen, and lung should be followed. Furthermore, the satisfactory performance of the machine learning models reflects the good interpretability and reproducibility of TCM theory in disease prevention and treatment.
machine learning; traditional Chinese medicine; drug properties; four natures and five flavors; antiradiation;;et;
G350;R285.1
A
0253 - 2670(2024)08 - 2684 - 10
10.7501/j.issn.0253-2670.2024.08.018
2023-12-16
廣西中醫(yī)藥大學(xué)“桂派中醫(yī)藥傳承創(chuàng)新團(tuán)隊(duì)”資助項(xiàng)目(2022A005)
楊 淇(1997—),男,碩士研究生,研究方向?yàn)橹兴幩幮ШY選與應(yīng)用研究。E-mail: yangqi2023@stu.gxtcmu.edu.cn
通信作者:夏中尚,男,博士,助理研究員,研究方向?yàn)橹兴帉W(xué)。E-mail: 2671691281@qq.com
范麗麗,女,副教授,研究方向?yàn)橹兴幩幮ШY選與應(yīng)用研究。E-mail: fanli228@163.com
[責(zé)任編輯 潘明佳]