李紅巖,李燦,郎許鋒,楊濤,周作建,戰(zhàn)麗彬
(1.南京中醫(yī)藥大學(xué)人工智能與信息技術(shù)學(xué)院,江蘇 南京 210023;2.遼寧中醫(yī)藥大學(xué)中醫(yī)藥創(chuàng)新工程技術(shù)中心,遼寧 沈陽 110847)
中醫(yī)藥作為中華文明的瑰寶,在抗擊非典型性肺炎和新型冠狀病毒肺炎疫情中都發(fā)揮了重要的作用,并做出了巨大的貢獻(xiàn)。在中醫(yī)藥傳承發(fā)展,守正創(chuàng)新的時(shí)代背景下,四診作為中醫(yī)診斷辨證的基礎(chǔ),在人工智能等新技術(shù)的賦能下也開始加速發(fā)展。本文針對(duì)中醫(yī)四診智能化的研究現(xiàn)狀和熱點(diǎn)展開討論,以期對(duì)該領(lǐng)域的進(jìn)一步發(fā)展和研究起到參考和借鑒。
中醫(yī)四診要求醫(yī)生在獲取信息的基礎(chǔ)上利用經(jīng)驗(yàn)進(jìn)行分析并做出準(zhǔn)確判斷。然而,這種診斷方法依賴于醫(yī)生的知識(shí)水平和實(shí)踐經(jīng)驗(yàn),主觀性很強(qiáng),并且對(duì)醫(yī)生具有極高的要求,從而導(dǎo)致不同的醫(yī)師針對(duì)同一病例的診斷也可能會(huì)有較大的差異。此外,由于時(shí)空限制,目前中醫(yī)醫(yī)療資源分配不均,大部分患者很難獲取優(yōu)質(zhì)的醫(yī)療資源。在中醫(yī)人才供給不足,診療負(fù)擔(dān)重,經(jīng)驗(yàn)要求高的情況下,如何突破中醫(yī)發(fā)展的困境,促進(jìn)中醫(yī)的傳承創(chuàng)新,不僅是中醫(yī)人需要思考的問題,也是國家和人民對(duì)中醫(yī)藥發(fā)展的殷切期望。
與此同時(shí),人工智能作為計(jì)算機(jī)科學(xué)的一個(gè)分支,被認(rèn)為是21世紀(jì)三大尖端技術(shù)之一。近30年來人工智能發(fā)展迅速,已廣泛應(yīng)用于各大學(xué)科領(lǐng)域,對(duì)行業(yè)的賦能作用不斷凸顯,制造業(yè)、交通業(yè)、醫(yī)療業(yè)等各大行業(yè)都迎來了智能化進(jìn)程。利用人工智能為中醫(yī)四診賦能,實(shí)現(xiàn)四診智能化,讓四診發(fā)揮更好的價(jià)值,已成為近年來廣大中醫(yī)藥和科技工作者共同的追求。
自1982年郭振球[1]探討如何通過人工智能模擬中醫(yī)辨證思維規(guī)律以來,越來越多的學(xué)者開始關(guān)注中醫(yī)藥與人工智能的融合發(fā)展。伴隨著人工智能的迅猛發(fā)展,中醫(yī)四診智能化的研究更是逐步吸引了中醫(yī)學(xué)、自動(dòng)化技術(shù)、計(jì)算機(jī)科學(xué)與技術(shù)、生物醫(yī)學(xué)工程、儀器儀表以及電信技術(shù)等不同學(xué)科學(xué)者的關(guān)注,開展更為深入的技術(shù)和應(yīng)用研究。
我們檢索并篩選了中國知網(wǎng)(CNKI)和Web of science(WOS)上近十年有關(guān)中醫(yī)四診智能化的中英文文獻(xiàn),統(tǒng)計(jì)發(fā)現(xiàn)近十年來關(guān)注中醫(yī)四診智能化問題的學(xué)者越來越多,對(duì)這一科學(xué)問題的研究也得到了國家的高度重視。自2016年以來,隨著人工智能重要分支深度學(xué)習(xí)技術(shù)的成熟,人工智能發(fā)展火熱,國家和廣大學(xué)者對(duì)中醫(yī)四診智能化的研究也開始高度重視。如圖1(a)所示,2017年開始,無論是CNKI還是WOS上的學(xué)術(shù)文獻(xiàn)的發(fā)文量都開始大幅增加,此后每年增長幅度平均約為前一年度的2.15倍。圖1(b)的國家合作網(wǎng)絡(luò)中則明顯展示出我國大陸地區(qū)為該研究領(lǐng)域的主體,并與中國臺(tái)灣地區(qū)、澳大利亞、德國、加拿大、美國、英國、羅馬尼亞有不同程度的合作。日本、芬蘭、韓國、印度等國家也已經(jīng)開始開展相關(guān)研究??梢姲殡S著中醫(yī)魅力的展現(xiàn)以及人工智能技術(shù)的迅猛發(fā)展,全世界范圍開始有越來越多的學(xué)者關(guān)注中醫(yī)四診智能化研究。由圖1(c)文獻(xiàn)資助情況來看,我國國家級(jí)科研基金對(duì)該主題研究領(lǐng)域的資助已超過總體資助的一半以上,更可見我國政府對(duì)該研究領(lǐng)域的重視程度之深及學(xué)者們對(duì)該問題的研究興趣之濃厚。
(a)年度發(fā)文統(tǒng)計(jì) (b)國家合作網(wǎng)絡(luò)
為了解該領(lǐng)域?qū)W者的關(guān)注點(diǎn)及合作情況,我們分析并繪制了文獻(xiàn)作者合作關(guān)系網(wǎng)絡(luò)及關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),如圖2所示。圖中顏色代表了首次發(fā)表文獻(xiàn)的時(shí)間,節(jié)點(diǎn)和標(biāo)簽的大小則對(duì)應(yīng)于發(fā)文量的多少。從圖2(a)來看,上海中醫(yī)藥大學(xué)的王憶勤團(tuán)隊(duì)[2-8],許家佗團(tuán)隊(duì)[9-12],成都中醫(yī)藥大學(xué)的溫川飚團(tuán)隊(duì)[13-16]和天津中醫(yī)藥大學(xué)的王泓午團(tuán)隊(duì)[17-18]在CNKI上發(fā)文較多。華南理工大學(xué)文貴華團(tuán)隊(duì)[19-24]在WOS上發(fā)文較多。而上海中醫(yī)藥大學(xué)許家佗、屠立平團(tuán)隊(duì)[9-12,25-32],福建中醫(yī)藥大學(xué)的李燦東團(tuán)隊(duì)[33-40]在CNKI和WOS上均有較多發(fā)文。我們對(duì)這些團(tuán)隊(duì)在四診智能化領(lǐng)域的研究興趣及內(nèi)容進(jìn)行了梳理,詳見表1。
表1 中醫(yī)四診智能化主要團(tuán)隊(duì)及研究內(nèi)容Table 1 The main team and research contents of intelligent four-diagnosis in TCM
(a)作者合作網(wǎng)絡(luò)
圖2(b)中關(guān)鍵詞術(shù)語共現(xiàn)圖譜中節(jié)點(diǎn)(及標(biāo)簽)大小表示術(shù)語出現(xiàn)的頻次,紫色外圈表示該節(jié)點(diǎn)具有較高的中介中心性。由圖中可以看出,CNKI文獻(xiàn)中人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)已成為三大高頻關(guān)鍵詞,分別出現(xiàn)44、20和19次。WOS文獻(xiàn)匯總深度學(xué)習(xí)、舌診舌像和機(jī)器學(xué)習(xí)成為高頻術(shù)語,分別出現(xiàn)17、28和12次,而卷積神經(jīng)網(wǎng)絡(luò)則自2019年開始廣泛出現(xiàn)在各研究文獻(xiàn)中,成為中醫(yī)四診智能化的基本技術(shù)和主要手段。
得益于計(jì)算機(jī)視覺和語音識(shí)別技術(shù)的發(fā)展,目前中醫(yī)四診智能化研究的熱點(diǎn)主要集中于舌診、面診、脈診、問診方面。而聞診中聲診和嗅診的研究由于數(shù)據(jù)采集過程中環(huán)境干擾因素交錯(cuò),目前大多仍關(guān)注于采集儀器的研制和數(shù)據(jù)去噪等質(zhì)量提升工作方面,智能化的診斷還相對(duì)較少。
當(dāng)前研究熱點(diǎn)中舌診和面診均是直接針對(duì)采集圖像進(jìn)行學(xué)習(xí),早期文章多采用傳統(tǒng)的圖像處理技術(shù),后來則逐漸采用機(jī)器學(xué)習(xí)的方法,近年來采用深度學(xué)習(xí)方法的文獻(xiàn)顯著增多。脈診可看作是在二維脈圖數(shù)據(jù)上通過信號(hào)處理或?qū)W習(xí)的方式完成分析與預(yù)測(cè)。問診數(shù)據(jù)大多為量表化數(shù)據(jù),在選擇和推薦問診問題時(shí),大多數(shù)研究仍采用基于圖模型、內(nèi)容或鄰域的傳統(tǒng)推薦算法。在針對(duì)獲取到的問診數(shù)據(jù)進(jìn)行證候分類時(shí)則多采用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)建模的方式來完成。
目前中醫(yī)診斷智能化研究大多集中在舌診方面。部分學(xué)者對(duì)于舌診客觀化研究[13,17],人工智能技術(shù)在舌診中的應(yīng)用[4]以及基于舌像的疾病診斷[18]方面的研究現(xiàn)狀進(jìn)行了分析和綜述。在技術(shù)實(shí)現(xiàn)上,主要側(cè)重于舌像的標(biāo)準(zhǔn)化采集,已獲取舌像的圖像質(zhì)量評(píng)估[26]、顏色校正[31]等預(yù)處理手段,以及進(jìn)行舌體分割、構(gòu)建舌像數(shù)據(jù)庫,為應(yīng)用人工智能技術(shù)作準(zhǔn)備。其次,主要是舌像特征學(xué)習(xí)的研究,如舌像中齒痕和裂紋的檢測(cè)[38],舌苔的檢測(cè)和標(biāo)定及舌體構(gòu)成識(shí)別[23-24],舌像局部及全局特征的提取[30]等。由于醫(yī)學(xué)數(shù)據(jù)的特殊性及個(gè)人隱私保護(hù)的需要,目前相關(guān)研究均采用自己采集數(shù)據(jù)的方式,每種方法采用的評(píng)價(jià)指標(biāo)也不盡相同,因此方法之間難以進(jìn)行定量比較。針對(duì)舌體分割問題,一般多采用動(dòng)態(tài)輪廓(Snake)模型,支持向量機(jī)(SVM)或深度學(xué)習(xí)的U-Net、Seg-Net以及改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)(FCN)模型。針對(duì)舌裂紋檢測(cè),則多采用深度學(xué)習(xí)的方法,如卷積神經(jīng)網(wǎng)絡(luò)、YoLo、Faster RCNN、DenseNet等。從近兩年文獻(xiàn)報(bào)告來看,李淵彤等[41]采用FCN-16s模型結(jié)合單像素?fù)p失函數(shù)LCLoss進(jìn)行舌體分割,分割平均像素精度達(dá)到98.51%,平均交并比達(dá)到96.32%,進(jìn)而對(duì)齒痕的識(shí)別精度達(dá)到85%以上,對(duì)裂紋、芒刺、腐膩、瘀點(diǎn)、厚薄、苔色等紋理特征的分析平均準(zhǔn)確率為82.07%。顏建軍等[6]采用深度學(xué)習(xí)完成舌體分割,繼而利用YoLoV5檢測(cè)齒痕,最后借助隨機(jī)森林完成對(duì)正常、輕度和重度齒痕舌的分類,分類平均準(zhǔn)確率為93.17%。劉佳麗等[42]融合YoLoV3和DenseNet,提出Double-D模型實(shí)現(xiàn)舌裂紋的檢測(cè),檢測(cè)結(jié)果召回率為92.93%,精準(zhǔn)率為97.56%,特異性為98.75%,平均檢測(cè)速度為0.029 s?;趯?duì)舌體的分析和學(xué)習(xí),可進(jìn)一步實(shí)現(xiàn)通過中醫(yī)舌診基于機(jī)器學(xué)習(xí)來構(gòu)建糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型[27-28]、慢性胃炎識(shí)別模型[30]等。Wen等[19]則構(gòu)建了舌像與中醫(yī)處方對(duì)應(yīng)的數(shù)據(jù)庫,在舌像分析的前提下利用神經(jīng)網(wǎng)絡(luò)完成了處方及藥材推薦。
面診的智能化研究目前主要集中于面部分割后的面色識(shí)別。面色識(shí)別近年來多采用機(jī)器學(xué)習(xí)的K近鄰(KNN)、K均值聚類(K-means)和SVM方法,以及深度學(xué)習(xí)的BP神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)方法。2018年,陳夢(mèng)竹等[11]采用BP神經(jīng)網(wǎng)絡(luò)對(duì)面色為白色的分類準(zhǔn)確率可達(dá)89.5%。2020年,林怡等[9]融合多種不同面部特征對(duì)比使用BP神經(jīng)網(wǎng)絡(luò)和SVM和KNN方法對(duì)赤、黃、白、黑4種面色進(jìn)行識(shí)別,識(shí)別率最高為91.03%。2021年,孫康寧等[43]進(jìn)一步將青色也加入面色識(shí)別中,并對(duì)比了K-means、支持向量機(jī)和卷積神經(jīng)網(wǎng)絡(luò)CNN 3種方法的識(shí)別效果,得出CNN分類效果最佳,整體面色分類準(zhǔn)確率為89.33%,局部面色識(shí)別準(zhǔn)確率為95.11%。Liao等[22]嘗試使用深度學(xué)習(xí)挖掘患者的面部與中藥處方之間的關(guān)系,并提出構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),根據(jù)患者的面部圖像生成中藥處方。
脈診的智能化研究大多是在獲取脈搏波后,分析提取脈搏波特征來進(jìn)行脈象識(shí)別,或利用脈搏變化預(yù)測(cè)血壓情況,分析方法多采用機(jī)器學(xué)習(xí)的決策樹、K近鄰、SVM和邏輯回歸,以及深度學(xué)習(xí)的概率神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)。如張嘉琪等[44]對(duì)比循環(huán)神經(jīng)網(wǎng)絡(luò)RNN和概率神經(jīng)網(wǎng)絡(luò)PNN對(duì)脈位失常、脈率失常、脈型失常的識(shí)別能力,證明在噪聲數(shù)據(jù)為0.1時(shí),RNN的識(shí)別準(zhǔn)確率為95.51%,F(xiàn)1度量為98.72%。李勐等[45]對(duì)冬至和夏至?xí)r期采集到的脈搏信號(hào)采用K近鄰、SVM、決策樹和Bagged Tree 4種機(jī)器學(xué)習(xí)方法進(jìn)行數(shù)據(jù)分類,以驗(yàn)證所設(shè)計(jì)的脈診機(jī)器人系統(tǒng)的有效性。其中Bagged Tree的分類準(zhǔn)確率為97.5%,ROC為98%。顏建軍等[3]對(duì)脈圖波形進(jìn)行時(shí)域特征提取,并基于隨機(jī)森林等機(jī)器學(xué)習(xí)算法建立血壓預(yù)測(cè)模型,預(yù)測(cè)精度已達(dá)到AAMI國際電子血壓計(jì)的標(biāo)準(zhǔn)。Luo等[29]通過觀察脈搏波的動(dòng)態(tài)變化,評(píng)估高血壓的風(fēng)險(xiǎn)。分析了脈沖波對(duì)多種機(jī)器學(xué)習(xí)模型準(zhǔn)確性和穩(wěn)定性的影響,在采用AdaBoost方法時(shí)評(píng)估準(zhǔn)確率高達(dá)86.41%,為中醫(yī)藥在現(xiàn)代疾病診斷和療效動(dòng)態(tài)評(píng)價(jià)方面提供了研究方向和基礎(chǔ)。
問診智能化的研究主要有兩種方式,一是如何通過推薦算法完成問卷設(shè)計(jì),二是結(jié)合其他診療方法以提高問詢效率。如迪盼祺等[2]借鑒了物品推薦中常用的協(xié)同過濾算法和遺傳算法,實(shí)現(xiàn)了中醫(yī)智能問診系統(tǒng),達(dá)到了僅在進(jìn)行13次提問的情況下,便可使證候分類器的辨證效果達(dá)到90%以上。Fan等[20]提出了一種基于機(jī)器學(xué)習(xí)技術(shù)的個(gè)性化身體素質(zhì)查詢方法。問卷設(shè)計(jì)首先根據(jù)患者舌苔圖像的識(shí)別結(jié)果對(duì)問題進(jìn)行排序,從而為患者選擇個(gè)性化的問題,大大減少了患者回答問題的時(shí)間和數(shù)量。與直接采用《中醫(yī)體質(zhì)問卷》相比,患者回答問題減少了68.3%,回答時(shí)間則減少了80.3%。除了確定智能問診中需要“問什么,怎么問”之外,也有部分研究基于問診數(shù)據(jù)進(jìn)一步實(shí)現(xiàn)證候分類。如迪盼祺等[2]利用問診數(shù)據(jù)完成心系疾病的證候分類,分類精度可達(dá)90%以上。顏建軍等[7]則基于慢性胃炎的問診數(shù)據(jù),采用深度森林算法gcForest并對(duì)比DBN和DBM深度學(xué)習(xí)方法以及BSVM、ML-KNN、RankSVM、ECC和LIFT 5種機(jī)器學(xué)習(xí)多標(biāo)記方法的證候分類效果。實(shí)驗(yàn)證明,gcForest可取得更好的證候分類效果,分類平均精度為83.4%,覆蓋距離為16.2%,漢明損失為13.5%。
目前的研究除了針對(duì)某一種診法如何實(shí)現(xiàn)智能化以外,研究熱點(diǎn)也包括數(shù)據(jù)及系統(tǒng)構(gòu)建和多信息融合兩個(gè)方面。
數(shù)據(jù)及系統(tǒng)構(gòu)建方面,成都中醫(yī)藥大學(xué)溫川飚團(tuán)隊(duì)[16]采用音視頻設(shè)備及傳感器采集四診信息,并對(duì)采集到的信息進(jìn)行脫敏和壓縮,從而建立中醫(yī)四診數(shù)據(jù)倉庫。該團(tuán)隊(duì)進(jìn)一步在中醫(yī)四診的基本理論指導(dǎo)下,通過多學(xué)科交叉,構(gòu)想制定中醫(yī)的體檢服務(wù)體系。福建中醫(yī)藥大學(xué)李燦東團(tuán)隊(duì)[33,36]則致力于構(gòu)建中醫(yī)健康狀態(tài)辨識(shí)系統(tǒng),期待完成中醫(yī)四診信息的智能化采集和辨識(shí)。
多信息融合方面目前也有兩種做法,一種是融合四診的不同信息,另一種則是融合中西醫(yī)的不同指標(biāo)和方法。如Shi等[25]采用智能舌診和脈診分析儀采集舌像和脈圖數(shù)據(jù),基于兩種信息建立綜合分類模型,以辨別非小細(xì)胞肺癌的氣虛證和陰虛證。Fan等[20]在舌像識(shí)別的基礎(chǔ)上進(jìn)行中醫(yī)問詢,以實(shí)現(xiàn)將舌診和問診相結(jié)合的診查方式。Xia等[39]則在2020年首次探討了中醫(yī)證候元素與39項(xiàng)理化指標(biāo)之間的相關(guān)性,并基于同一患者可發(fā)生多種中醫(yī)證候的特點(diǎn),構(gòu)建多標(biāo)簽學(xué)習(xí)算法獲取對(duì)代謝綜合征的中醫(yī)診斷結(jié)果。2021年Xia等[37]進(jìn)一步融合了14個(gè)理化指標(biāo)和6個(gè)中醫(yī)指標(biāo),包括弦脈、胸悶、自汗等預(yù)測(cè)代謝綜合征。從其研究結(jié)果來看,基于融合指標(biāo)構(gòu)建的模型相比于單純理化指標(biāo)模型和中醫(yī)指標(biāo)模型特異性、準(zhǔn)確性及敏感性更高,具有更好的預(yù)測(cè)能力。
從已有研究來看,目前中醫(yī)四診的智能化研究大多仍基于某一種診斷方法進(jìn)行。盡管近兩年來,逐漸有學(xué)者融合不同診斷方法,如將舌診與面診、舌診與脈診、舌診與問診相結(jié)合,但四診合參的智能化仍處于探索階段,尚缺少真正的技術(shù)化實(shí)現(xiàn)。而四診合參才能真正體現(xiàn)中醫(yī)診斷的整體觀念,對(duì)于全面了解和辨別病情具有重要的意義。因此,如何進(jìn)一步完善四診的多信息融合,真正實(shí)現(xiàn)中醫(yī)四診合參的智能化將是亟待解決的重要問題。
此外,目前的中醫(yī)四診智能化技術(shù)主要以學(xué)習(xí)方法為主,即采用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)挖掘采集的診療信息中所蘊(yùn)含的規(guī)律。然而基于學(xué)習(xí)的方法,其結(jié)果極大依賴于用于訓(xùn)練的數(shù)據(jù)量及數(shù)據(jù)標(biāo)注質(zhì)量。而根據(jù)收集的四診信息進(jìn)行標(biāo)注是一個(gè)非常冗繁耗時(shí)的過程,且需要經(jīng)驗(yàn)極為豐富的中醫(yī)專家完成。而當(dāng)不同的專家去完成標(biāo)注時(shí),因其經(jīng)驗(yàn)和觀察側(cè)重點(diǎn)不同也往往會(huì)出現(xiàn)意見相左的情形。因此,如何在學(xué)習(xí)過程中更好地利用標(biāo)注信息,繼而實(shí)現(xiàn)知識(shí)與學(xué)習(xí)的融合,學(xué)習(xí)結(jié)果的即時(shí)反饋也是將來需要進(jìn)一步研究和探討的問題。