陳 鑫,曹 征,林色奇,婁亞兵,簡 暉,呂愛平,查青林
(1.江西中醫(yī)藥大學(xué)第二附屬醫(yī)院 南昌 330012;2.江西中醫(yī)藥大學(xué)健康養(yǎng)生研究所 南昌 330004;3.江西中醫(yī)藥大學(xué)中醫(yī)基礎(chǔ)理論分化發(fā)展研究中心 南昌 330004;4.首都醫(yī)科大學(xué)附屬北京康復(fù)醫(yī)院 北京 100041;5.江西中醫(yī)藥大學(xué)基礎(chǔ)醫(yī)學(xué)院 南昌 330004;6.香港浸會大學(xué)中醫(yī)藥學(xué)院 香港;7.江西中醫(yī)藥大學(xué)第二附屬醫(yī)院 南昌 330012)
隨著“互聯(lián)網(wǎng)+”時代的到來,中醫(yī)借助現(xiàn)代信息技術(shù)研究邁向了更高的臺階。由于中醫(yī)古籍?dāng)?shù)字化的廣泛開展,許多中醫(yī)藥高校和科研院所都建立了中醫(yī)古籍?dāng)?shù)據(jù)庫,研究者們對于中醫(yī)信息化的研究更是此起彼伏。然而當(dāng)前從事中醫(yī)養(yǎng)生方案知識庫構(gòu)建的研究者并不多。從目前已發(fā)表文獻(xiàn)來看,中國中醫(yī)科學(xué)院中醫(yī)藥研究所于琦[1]等人從中醫(yī)養(yǎng)生分類體系的指導(dǎo)下構(gòu)建面向中醫(yī)養(yǎng)生的專題文獻(xiàn)庫;莫宏建[2]通過知識的獲取方式、步驟以及表達(dá)式,建立了診斷系統(tǒng)知識模型和基于關(guān)系數(shù)據(jù)庫的知識庫;賈麗雅[3]利用人工智能領(lǐng)域中的專家系統(tǒng)知識,采用計算機(jī)編程應(yīng)用知識庫系統(tǒng)將運(yùn)動與健康的體育學(xué)科知識、飲食與健康的營養(yǎng)學(xué)知識有機(jī)的結(jié)合到一起構(gòu)建運(yùn)動與營養(yǎng)健康管理專家系統(tǒng);張悅悅[4]通過構(gòu)建亞健康食療領(lǐng)域的主題詞表,基于該主題詞表設(shè)計面向亞健康人群的食療知識庫框架,并在此基礎(chǔ)上實(shí)現(xiàn)食療知識庫檢索原型系統(tǒng),展示主題詞表對食療知識庫的語義檢索提升效果。
上述知識庫或者從大的中醫(yī)養(yǎng)生分類體系,或者針對亞健康人群特征來構(gòu)建知識庫。女性中醫(yī)健康狀態(tài)有月經(jīng)的周期性變化,以及在臟腑功能失調(diào)、氣血陰陽變化和病邪性質(zhì)上均有自身特點(diǎn),采用當(dāng)前大養(yǎng)生分類體系下建立的或針對亞健康的知識庫難以女性中醫(yī)健康管理的需求。此外,隨著信息的爆發(fā)性增長,中醫(yī)文獻(xiàn)知識庫難以滿足女性精準(zhǔn)健康管理的需求。基于上述理由,本文擬從女性健康狀態(tài)特點(diǎn)入手,利用健康管理過程中的療效反饋信息,構(gòu)建一個適宜女性的不斷自我完善的中醫(yī)健康干預(yù)知識庫。
女性中醫(yī)健康干預(yù)知識庫是為滿足女性中醫(yī)健康管理需求而構(gòu)建的,女性中醫(yī)健康狀態(tài)內(nèi)涵豐富,包括已病狀態(tài)下的病證分類和未病或欲病狀態(tài)下臟腑功能失調(diào)、氣血陰陽狀態(tài)和病邪性質(zhì)強(qiáng)弱,女性健康狀態(tài)的組合是無窮的,尤其是多個臟腑病位、多個病性證素同時出現(xiàn)在一個女性個體身上時,如何選擇理論上最佳的健康干預(yù)方案?
干預(yù)知識庫的內(nèi)容來源于文獻(xiàn)記載的有效干預(yù)方案,研究通過超星學(xué)術(shù)搜索查詢正式出版的圖書中針對女性月經(jīng)病調(diào)理的藥茶、藥膳方案,每個疾病的藥茶、藥膳方案都達(dá)到1千余種。每個月經(jīng)不調(diào)疾病根據(jù)《中醫(yī)婦科常見病診療指南》[5]大概可以分成4-7個證型,1千余種干預(yù)方案平均到每個證型也有100-300種食療方。按照中醫(yī)辨證施食的原則,如何從100-300種干預(yù)方案中找出適合某一證型個體的藥茶和藥膳食療方,已經(jīng)無法從現(xiàn)有干預(yù)方案主治內(nèi)容中進(jìn)行推理了。干預(yù)方案的精準(zhǔn)推薦是當(dāng)前信息爆炸時代的通病,即通常所說的“信息泛濫、知識貧瘠”[6]。
食療是中醫(yī)健康干預(yù)方案的一大特色療法,包括藥茶、藥膳等,食療方的應(yīng)用需要遵循辨證施食的原則,同時食療方的食材有地域、季節(jié)等特點(diǎn),這些都是推薦食療方所需要考慮的因素。
中醫(yī)情志、穴位、起居等方案的制定亦需要考慮不同地域和季節(jié)特點(diǎn),即中醫(yī)的因地、因時制宜。
因此,女性干預(yù)知識庫的構(gòu)建需要解決的以下3個問題:①推薦的干預(yù)方案如何滿足女性中醫(yī)健康狀態(tài)特點(diǎn)中多病位并存和多病性證素并存的需要;②如何從多個滿足同一女性健康狀態(tài)的干預(yù)方案中選擇一個最佳方案;③如何推薦個體當(dāng)前所在地域和當(dāng)前季節(jié)特點(diǎn)的干預(yù)方案?
與一般中醫(yī)健康干預(yù)知識庫一樣,首先要搜集適合女性健康問題干預(yù)各種中醫(yī)特色療法和養(yǎng)生保健方案,包括起居、飲食、情志、運(yùn)動、藥餌、穴位、按摩、房事、沐浴、休閑等。然后,依據(jù)文獻(xiàn)數(shù)據(jù)庫整理的要求對每一條干預(yù)文本進(jìn)行文獻(xiàn)元數(shù)據(jù)標(biāo)記,包括文獻(xiàn)來源、標(biāo)題、作者、出版社、出版年份等,并標(biāo)記干預(yù)方案的分類信息,構(gòu)建女性中醫(yī)健康干預(yù)數(shù)據(jù)庫。
圖1 女性食療知識庫標(biāo)記內(nèi)容與標(biāo)記流程
在中醫(yī)健康干預(yù)數(shù)據(jù)庫的基礎(chǔ)上進(jìn)行知識庫加工,知識庫的加工主要面向女性中醫(yī)健康狀態(tài)推薦干預(yù)方案,因此加工過程中緊扣女性中醫(yī)健康狀態(tài)特點(diǎn)來標(biāo)記。不同類型的干預(yù)方案實(shí)施原則略有不同,需要兼顧考慮,如食療的原則是辨證施食,藥餌的實(shí)施原則是辨證論治,其他方案的實(shí)施則大多沒有嚴(yán)格的辨證需求,但均需要考慮因時、因地制宜。因食療知識庫的標(biāo)記較為特殊,本研究對女性食療知識庫標(biāo)記的內(nèi)容和標(biāo)記流程如下(圖1)。
女性食療知識庫構(gòu)建除了標(biāo)記的一般干預(yù)方案的內(nèi)容外,筆者還設(shè)計了食療方適宜女性健康狀態(tài)推理機(jī),推理機(jī)根據(jù)食療方的主治推薦其用于治療的相關(guān)月經(jīng)病,并根據(jù)食材與中藥知識庫中每一味中藥的歸經(jīng)、四氣偏性、補(bǔ)益氣血營養(yǎng)和針對邪氣的內(nèi)容,計算食療方整體針對的臟腑、氣血陰陽盈虧特性和病邪性質(zhì),以匹配女性個體的中醫(yī)健康狀態(tài)(圖1)。通過計算得到的食療方針對臟腑功能、氣血陰陽盈虧和病邪性質(zhì)內(nèi)容比食療方原始的主治內(nèi)容更豐富,有利于理論上精準(zhǔn)的食療方推薦,并能解決多病位共存和多病性并存?zhèn)€體的調(diào)理問題。
圖2 女性中醫(yī)健康干預(yù)知識庫架構(gòu)療效反饋機(jī)制
對于同一個體狀態(tài)多個相近干預(yù)方案選擇問題,因?yàn)閺闹嗅t(yī)理論上推斷,幾個相近干預(yù)方案都適宜,究竟選擇哪一個方案?理論推斷已經(jīng)不能解決問題了。針對這種現(xiàn)象,本研究設(shè)計了一個可長期持續(xù)發(fā)展的知識庫構(gòu)建機(jī)制。具體實(shí)施過程為:在沒有療效信息反饋的情況下,對相近的幾個干預(yù)方案進(jìn)行隨機(jī)推薦;隨著干預(yù)的實(shí)施,系統(tǒng)將會通過健康管理平臺獲得用戶干預(yù)效果的評估信息;在有療效信息反饋的情況下,干預(yù)方案的推薦依據(jù)療效信息,向用戶推薦有效率較高的方案,放棄有效率較低的干預(yù)方案。這種知識庫的設(shè)計模式,在大數(shù)據(jù)環(huán)境下可以有效的解決中醫(yī)干預(yù)知識庫不斷完善和長期發(fā)展的機(jī)制,有助于干預(yù)知識逐步實(shí)現(xiàn)精準(zhǔn)推薦。
本研究設(shè)計的女性健康干預(yù)知識庫包括兩部分內(nèi)容,一部分來自文獻(xiàn)的女性健康干預(yù)數(shù)據(jù),另一部分是干預(yù)實(shí)施過程中的療效數(shù)據(jù)。通過療效反饋不斷豐富知識庫的證據(jù),逐步實(shí)現(xiàn)精準(zhǔn)干預(yù)(圖2)。
3.1.1 中醫(yī)健康干預(yù)知識搜索
女性中醫(yī)健康干預(yù)方法分散在于古今文獻(xiàn)資料,當(dāng)前各種搜索引擎、圖書數(shù)據(jù)庫、期刊數(shù)據(jù)庫等均為信息的獲取提供了極大方便。有關(guān)女性中醫(yī)健康的知識源,從時間的分布來看,止于辛亥革命前的中國古代文獻(xiàn)文獻(xiàn),民國時期文獻(xiàn),新中國建國后文獻(xiàn);從文獻(xiàn)的載體形式上有竹簡、帛書、紙質(zhì)文獻(xiàn)、音頻資料、視頻資料。對于古代文獻(xiàn),可以從以下目錄學(xué)中去查詢:《中醫(yī)圖書聯(lián)合目錄》、《中國古籍總目》、《中國中醫(yī)古籍總目》、《中國醫(yī)籍續(xù)考》、《新中國六十年中醫(yī)圖書總目:1949-2008》,以及分省醫(yī)籍考,如:《嶺南醫(yī)籍考》、《浙江醫(yī)籍考》、《河北醫(yī)籍考》、《中國分省醫(yī)籍考》、《新安醫(yī)籍考》。本研究對搜索引擎和各大文獻(xiàn)數(shù)據(jù)庫進(jìn)行了搜索分析,發(fā)現(xiàn)女性中醫(yī)健康干預(yù)方法主要存在于已經(jīng)出版的圖書文獻(xiàn)中。其中包括《中華醫(yī)典》光盤、超星讀秀、愛如生醫(yī)書、超星特色數(shù)據(jù)庫、《瀚堂典藏》醫(yī)藥類古籍等。其他來源有350種傳統(tǒng)醫(yī)籍整理與深度加工課題成果、各類電子工具書以及網(wǎng)絡(luò)搜索引擎(百度、谷歌)等。圖書文獻(xiàn)的搜索以超星的讀秀搜索最為實(shí)用,可以檢索圖書中的知識片段。
3.1.2 文獻(xiàn)數(shù)據(jù)摘錄
對通過超星讀秀搜索引擎搜索到的女性中醫(yī)健康干預(yù)內(nèi)容,本研究統(tǒng)一摘錄成文本格式,采用Word文檔進(jìn)行管理。
3.1.3 文本的知識元標(biāo)記
知識元[7],通常由形成一定關(guān)聯(lián)的短語或詞語組成,是知識系統(tǒng)中不可再分解的能夠表達(dá)一個完整概念的最小知識單元。
把每一個干預(yù)文本看做一個知識元,知識元下面有知識部件。不同類型知識元的知識部件不同,需要分開進(jìn)行標(biāo)記。食療方案知識元的知識部件包括適宜疾病、食療方案名稱、組成、制法、服法、功效、主治、用途、證型、癥狀體征、釋義、宜忌。對每個知識元的內(nèi)容均采用XML[8]語言進(jìn)行標(biāo)記。
3.1.4 XML文件轉(zhuǎn)換未關(guān)系型數(shù)據(jù)庫
標(biāo)記后的XML文檔通過轉(zhuǎn)換程序轉(zhuǎn)換成關(guān)系型數(shù)據(jù)庫,用SQL Server和Microsoft Access進(jìn)行管理。在Microsoft Access中對各個知識部件文本進(jìn)行詞語切分,通過SAS軟件對女性生理周期干預(yù)知識元中切分后的知識部件進(jìn)行文本分詞處理,初步完成女性生理周期干預(yù)知識元庫的構(gòu)建。
標(biāo)記每一種干預(yù)的方法,文獻(xiàn)的來源,包括每一味食療方等的組成、制法、適合月經(jīng)周期的哪一階段、藥茶和食材的來源分布以及適合哪一個地域能夠方便購買用戶等。
首先對選取的有關(guān)中醫(yī)女性養(yǎng)生文獻(xiàn)進(jìn)行校對,針對不同古籍文獻(xiàn)中對于女性養(yǎng)生知識進(jìn)行描述時,語言不夠統(tǒng)一規(guī)范,通過SAS9.4軟件進(jìn)行編程,以部件文本為對象進(jìn)行分詞,剔除無關(guān)詞語,保留辨證論治相關(guān)語義,對提取的語義進(jìn)行規(guī)范與消歧。對于多詞一義時,用同一個詞語表述;復(fù)合詞均拆分為便于統(tǒng)計分析的單義詞;繁體字、別字均轉(zhuǎn)換為現(xiàn)代中醫(yī)規(guī)范用語,以中華中醫(yī)藥學(xué)會行業(yè)指南標(biāo)準(zhǔn)為參考。如食療藥膳材料“白砂糖”[9]名稱多種,有石蜜、白霜糖、白糖、糖霜等稱呼,統(tǒng)一規(guī)范為“白砂糖”,規(guī)范原則要充分尊重古籍原文。
推理機(jī)是用來控制、協(xié)調(diào)整個系統(tǒng)一組程序。知識庫推理機(jī)由食療數(shù)據(jù)庫(其中包括食療方組成、治法、服法、主治、癥候來源)和食材與中藥數(shù)據(jù)庫(包括食材與中藥ID、名稱、地域、季節(jié)、四氣偏性程度、氣血陰陽、臟腑歸經(jīng)、病邪特性)匹配相應(yīng)的月經(jīng)病類型,根據(jù)組成計算氣血陰陽盈虧特性,匹配用戶當(dāng)前所處的地域和季節(jié),根據(jù)適宜臟腑特性計算病邪特性以及適宜的月經(jīng)分期,推算出女性用戶的健康狀態(tài),包括女性月經(jīng)病類型和月經(jīng)分期、氣血陰陽的盈虧以及臟腑功能和病邪的性質(zhì)與程度。
知識庫的核心在于知識庫對于女性健康干預(yù)方案的辨證論治的個性化推送,辨證施治強(qiáng)調(diào)個體差異,每個人的陰陽氣血、臟腑經(jīng)絡(luò)、體質(zhì)不同,病因、病機(jī)、發(fā)展轉(zhuǎn)歸不同,因而需要個性化治療,因人而異,因病而異,因證而異,因時而異。
和精準(zhǔn)醫(yī)學(xué)不同的是,精準(zhǔn)醫(yī)學(xué)是以基因組、蛋白質(zhì)組、代謝組學(xué)等內(nèi)在因素及外在影響為主,以辨“基”施治為主。充分運(yùn)用現(xiàn)代科學(xué)的理論、方法、手段,直接觀測人體內(nèi)在的、本質(zhì)的變化。以客觀、定量的方法作為精準(zhǔn)醫(yī)療的基礎(chǔ),以微觀分析為主。精準(zhǔn)醫(yī)療也強(qiáng)調(diào)個體差異,每個人的基因組、蛋白質(zhì)組、代謝組學(xué)等內(nèi)在因素及外在影響不同,因而需要個性化預(yù)防方案和治療方案[10]。
本研究較以往知識庫構(gòu)建創(chuàng)新處在于知識庫推理機(jī)實(shí)時記載女性生理相關(guān)的信息,然后對女性健康狀況進(jìn)行評估,根據(jù)生理周期、臟腑功能、氣血陰陽盈虧三個維度之間的關(guān)系進(jìn)行關(guān)聯(lián)規(guī)則分析,然后知識庫會給予相應(yīng)的健康干預(yù)方案ID,記載女性生理健康干預(yù)方案給予的實(shí)施日期和疾病狀態(tài)、疾病類型、證素分類(女性中醫(yī)健康狀態(tài)的整體反映就是“證)、月經(jīng)分期。在通過推送的干預(yù)方案療效反饋再進(jìn)行評估,合適的調(diào)整推送干預(yù)方案,實(shí)時的更新知識庫的動態(tài),使得知識庫推送機(jī)越來越精準(zhǔn)。隨著信息技術(shù)理論基礎(chǔ)的研究和應(yīng)用不斷發(fā)展,基于關(guān)系型女性中醫(yī)健康干預(yù)知識庫將會更加的完善,這對于女性中醫(yī)健康干預(yù)知識庫方案在個性化精準(zhǔn)的推送中毫無疑問是有促進(jìn)作用的。