聶曉霞 趙佳
(石家莊理工職業(yè)學院,河北 石家莊 050081)
中醫(yī)是我國的傳統(tǒng)醫(yī)學,隨著中醫(yī)技術的發(fā)展,其在治療一些疑難雜癥上起到的作用越來越大。隨著互聯(lián)網(wǎng)技術的發(fā)展,利用機器學習技術開發(fā)中藥推薦模型,即根據(jù)患者的癥狀表現(xiàn),快速的推薦出一組中藥組合,能夠幫助臨床中醫(yī)快速的對癥治療,提高了治療的效率。目前中藥推薦技術主要以主題模型為主,僅利用患者癥狀和中間藥的共享信息,并不能建立合理的推薦模型。因此,將中醫(yī)實體表示學習引入中藥推薦技術中,能夠很好地建模癥狀與中藥之間的關系,從而優(yōu)化中藥推薦模型的相關性能。
將豐富的中醫(yī)領域的知識以知識圖譜的形式進行呈現(xiàn),可以為中醫(yī)醫(yī)生提供治療的便利,方便他們進行查詢和利用醫(yī)學知識,同時也能為中藥推薦技術提供數(shù)據(jù)的支持。中醫(yī)知識圖譜的建構過程一般為選擇中醫(yī)知識—本體建構—實體學習、實體抽取、實體填充—知識圖譜。中醫(yī)領域的數(shù)據(jù)獲取主要以“中藥”“疾病”為中心開展,包含了結構化、半結構化和非結構化類型等幾種。結構化類型數(shù)據(jù)包含各種形式的草藥、基因、疾病、基因-疾病關聯(lián)、基因相互作用、藥物副作用記錄以及毒性記錄等,建立了中藥與疾病之間的關系網(wǎng)絡;半結構化類型數(shù)據(jù)囊括了動植物的具體類型,每一種中藥都包含了具體的使用方法、性味歸經(jīng)、化學成分、用法用量以及臨床應用等信息;非結構化類型數(shù)據(jù)包含了疾病部分、候證部分和治法部分,對于每個癥狀的病因、治療與康復過程等都進行了詳細的說明。只有對中醫(yī)知識圖譜中的中醫(yī)數(shù)據(jù)進行充分的了解,才能在數(shù)據(jù)抽取、統(tǒng)計、查詢中獲取中醫(yī)實體的具體表示學習內容,這對于中藥推薦技術的發(fā)展有很大的幫助作用。
對于中醫(yī)知識圖譜來講,圖是信息的重要載體,是機器學習模型最常用的數(shù)據(jù)類型之一。但是很多中醫(yī)知識圖譜不具有歐式的結構,很難被模型直接利用。在中醫(yī)實體表示學習中,可以對異質的節(jié)點和邊采用不同的處理方式,讓中醫(yī)實體向量表示的質量更高一些;也可以將“癥狀”與“中藥”實體進行直接的相連,在關注實體間淺層關系的同時,也要充分建模他們之間的高階聯(lián)通性。比如在中醫(yī)異質圖的構建中,可以以癥狀和重要為關聯(lián)點,構建中醫(yī)異質信息圖,將中醫(yī)知識的相關內容與已經(jīng)構建的知識圖譜進行融合,連接相關的癥狀實體,最終打造具有多個節(jié)點和邊的中醫(yī)異質圖。在模型目標函數(shù)的構建中,中醫(yī)推薦的實現(xiàn)依賴于中醫(yī)實體關聯(lián)的挖掘,比如將癥狀與中藥進行關聯(lián)。在構建目標函數(shù)的過程中,一定要將不同的節(jié)點與邊進行相互關聯(lián),同時構建性能完善的激活函數(shù),設計針對節(jié)點的權重數(shù)據(jù),將向量逐元素相乘,最終形成中醫(yī)實體表示的學習模型。
我們都知道在中藥材推薦任務上,中醫(yī)學仍面臨一些挑戰(zhàn),比如中藥配伍原則很難準確的利用模型刻畫治療的過程;與西醫(yī)不同,中醫(yī)認為患者的一系列臨床癥狀都是相互依存的,獨立對患者建立某種癥狀與中藥的模型是不恰當?shù)模瑫r中醫(yī)藥方大都篇幅極少,包含的單詞量不多,在信息共享上做得不到位,不利于利用模型挖掘信息。為了解決上述問題,可以將中醫(yī)領域知識的主題模型用于中藥推薦中,避免傳統(tǒng)主題模型的缺點。在這種模式下,中醫(yī)實體向量表示之間是有彼此關聯(lián)的,模型在進行中藥推薦時,不僅僅是依靠共現(xiàn)信息進行建模,在很大程度上提升了模型的性能。也可以將中藥配伍信息引入所構建的模型中,進一步加強對重要的建模,使得中藥的推薦結果更符合配伍的原則,為中醫(yī)治療疑難雜癥提供更多途徑和方法,豐富臨床治療的體系。
在這類模型中,主要包含“單次-主題”兩個模型,分別對應了藥方中的“癥狀”和“中藥”兩個部分。在“癥狀部分”,可以將其中一種癥狀當作觀察變量,將其中一種“疾病”當作隱變量,采用一定的參數(shù)實現(xiàn)對“疾病”主題的S維“疾病-癥狀”多項分布。同樣,在“中藥部分”,可以將其中一種中藥作為觀察變量,將其中一種“適應癥”當作隱變量,采用另外一種參數(shù)實現(xiàn)對“中藥”主題的H維“適應癥-中藥”多項分布。也可以將癥狀與中藥的向量表示融入到各個主題模型中,從而形成疾病模型的多種流程算法,實現(xiàn)對疾病的精準中藥推薦。因此,在利用中醫(yī)實體表示學習進行中藥推薦選擇時,要融合中醫(yī)藥的多種知識,強調藥物組合之間的注意事項,使得模型邏輯更符合中醫(yī)領域的知識要求,推薦結果更符合實際治療的要求。在設計好推薦模型之后,也要驗證所提出模型的有效性,對實驗進行精心的設計,充分考慮各個向量之間的關系,保證模型的實際效果,為中醫(yī)發(fā)展提供數(shù)據(jù)的支持。
綜上所述,基于中醫(yī)實體表示學習的中藥推薦技術是一種新型的臨床用藥技術,可以根據(jù)患者的疾病類型和癥狀幫助他們選擇相關的中藥組合進行治療。在構建推薦模型的過程中,要利用中醫(yī)數(shù)據(jù),深刻挖掘癥狀與中藥材的潛在關系,以基于知識圖譜的向量表示的方式支撐中藥推薦任務。為了更加貼合中醫(yī)理論的需要,也可以將中藥配伍知識融入到推薦模型中,采用多元化的模型提出中藥的推薦算法,從而保證臨床中醫(yī)用藥的準確性和安全性。