摘 要:中藥學(xué)是中華人民幾千年來(lái)與疾病作斗爭(zhēng)的智慧結(jié)晶,在中醫(yī)藥學(xué)科體系中占據(jù)著重要的地位。文章在探討了中藥知識(shí)庫(kù)建設(shè)意義的基礎(chǔ)上,解析了中藥知識(shí)庫(kù)建設(shè)的初步思路和方案。
關(guān)鍵詞:中藥知識(shí)庫(kù);建設(shè)思路;推理機(jī)
中圖分類號(hào):TP182
隨著信息技術(shù)的飛速發(fā)展,數(shù)據(jù)庫(kù)技術(shù)在中醫(yī)藥領(lǐng)域也得到了廣泛的應(yīng)用。目前從以光盤為載體的數(shù)據(jù)庫(kù)逐漸過(guò)渡為以網(wǎng)絡(luò)數(shù)據(jù)庫(kù)為主的中藥數(shù)據(jù)庫(kù)存儲(chǔ)與處理模式。這種現(xiàn)代信息技術(shù)是在中醫(yī)藥信息研究過(guò)程中,針對(duì)原始資料信息量大、不規(guī)范等問(wèn)題進(jìn)行分析與整理、補(bǔ)充與完善而逐漸建立起來(lái)的[1],并隨著信息技術(shù)和計(jì)算機(jī)技術(shù)的進(jìn)步而不斷進(jìn)步。人工智能和數(shù)據(jù)庫(kù)等技術(shù)的有機(jī)結(jié)合,促成了中藥知識(shí)庫(kù)的產(chǎn)生和發(fā)展。這種新興的知識(shí)庫(kù)技術(shù),又被稱為人工智能數(shù)據(jù)庫(kù),可以理解為是由人工智能和數(shù)據(jù)庫(kù)等技術(shù)有機(jī)結(jié)合而成的,是中藥知識(shí)庫(kù)建立、發(fā)展的激素和基礎(chǔ)。
1 中藥知識(shí)庫(kù)建設(shè)意義
知識(shí)庫(kù)是知識(shí)工程中結(jié)構(gòu)化、易操作、易利用、全面有組織的知識(shí)集群,是針對(duì)某一領(lǐng)域問(wèn)題求解的需要,采用某種或者某些若干知識(shí)表示方式在計(jì)算機(jī)存儲(chǔ)器中存儲(chǔ)、組織、管理和使用的互相聯(lián)系的知識(shí)片集合。
中藥知識(shí)庫(kù)研究,是一項(xiàng)關(guān)系到子孫后代,造福人類的工程,也是中醫(yī)學(xué)繼承和發(fā)展頗具實(shí)效的知識(shí)工程。意義主要體現(xiàn)在以下幾方面:(1)中藥知識(shí)庫(kù)有利于古籍的保護(hù)、中藥文獻(xiàn)的保存。通過(guò)數(shù)字化、復(fù)制、轉(zhuǎn)存,可以相對(duì)真實(shí)、永久地保存古籍原貌。(2)中藥知識(shí)庫(kù)將中醫(yī)藥的期刊、會(huì)議成果、研究報(bào)告、教材等以數(shù)字信息化的形式保存在數(shù)據(jù)庫(kù)中,提供上傳、查詢、檢索等功能,實(shí)現(xiàn)了廣泛的資源共享,也避免了信息的冗余與過(guò)度重復(fù)[2]。(3)完善的中藥知識(shí)庫(kù)可以實(shí)現(xiàn)基于知識(shí)層面的中藥知識(shí)傳播,提高中醫(yī)藥文獻(xiàn)的研究和利用水平。有利于中醫(yī)藥資源的傳承,是延續(xù)民族文化的重要手段。(4)便于普通用戶獲取中藥知識(shí)。中藥知識(shí)庫(kù)通過(guò)方便自然的檢索方法不僅可以原文再現(xiàn),而且可以進(jìn)一步實(shí)現(xiàn)對(duì)知識(shí)的統(tǒng)計(jì)分析和知識(shí)控制。用戶可以任意地通過(guò)知識(shí)元概念或?qū)傩栽~進(jìn)行檢索,獲取與這個(gè)概念或詞語(yǔ)相關(guān)的完整的一組知識(shí)。如方證關(guān)系、藥證關(guān)系規(guī)律等。(5)中藥知識(shí)庫(kù)可以為學(xué)術(shù)研究開(kāi)辟一條新途徑。學(xué)者可以通過(guò)移動(dòng)終端、電腦、手機(jī)等上網(wǎng)工具,隨時(shí)便攜地進(jìn)行資料檢索,也可以采用便攜式存儲(chǔ)器下載知識(shí)庫(kù)部分內(nèi)容進(jìn)行進(jìn)一步開(kāi)發(fā)和研究工作。(6)有利于利用數(shù)據(jù)挖掘技術(shù)探求中醫(yī)藥診治疾病的規(guī)律、有利于發(fā)現(xiàn)中醫(yī)的診治規(guī)律,并創(chuàng)新診治模式,提高診療水平[3]。(7)推動(dòng)實(shí)現(xiàn)中醫(yī)現(xiàn)代化。運(yùn)用現(xiàn)代計(jì)算機(jī)與信息技術(shù)將這些古代文獻(xiàn)的知識(shí)創(chuàng)造性地轉(zhuǎn)化為數(shù)字化知識(shí),使之成為適應(yīng)時(shí)代發(fā)展需要的更具有價(jià)值的新資源,以廣泛應(yīng)用于中醫(yī)藥教學(xué)、臨床、科研與產(chǎn)業(yè)開(kāi)發(fā)。(8)為中國(guó)傳統(tǒng)文化走向世界提供了必要條件。數(shù)字化中藥知識(shí)庫(kù)工程,可以對(duì)傳統(tǒng)文化進(jìn)行全面整理,是對(duì)傳統(tǒng)文化的再學(xué)習(xí),也是為中藥傳統(tǒng)文化的傳播提供了有力武器。(9)相較于傳統(tǒng)紙質(zhì)書籍,成本大大降低。
2 知識(shí)庫(kù)建設(shè)原則
中藥知識(shí)庫(kù)是專用型知識(shí)類數(shù)據(jù)庫(kù),建設(shè)的主要目的是實(shí)現(xiàn)中藥文本內(nèi)容的規(guī)范統(tǒng)一、中藥媒體的信息的整合。因此在收集、加工中藥知識(shí)理論的過(guò)程中,必須反復(fù)考究,做到準(zhǔn)確性、規(guī)范性和統(tǒng)一性。在規(guī)范統(tǒng)一的基礎(chǔ),中藥知識(shí)建設(shè)的最大愿望便是便于民眾的使用。中藥知識(shí)庫(kù)根據(jù)文獻(xiàn)創(chuàng)建時(shí)間、空間、文獻(xiàn)重要性、流派等進(jìn)行多種分類歸納整理,首要任務(wù)是能夠?qū)崿F(xiàn)交叉索引查找,其次是推理機(jī)合理,使不同層次的用戶都能夠按照需求方便、準(zhǔn)確地獲取中藥知識(shí)。
3 中藥知識(shí)庫(kù)建設(shè)思路
中藥學(xué)是一個(gè)龐大復(fù)雜的知識(shí)體系,中藥知識(shí)庫(kù)的建設(shè)更是一個(gè)長(zhǎng)遠(yuǎn)的系統(tǒng)工程,需要進(jìn)行總體總體規(guī)劃、審核、規(guī)范的同時(shí),還需要細(xì)致、耐心的計(jì)算機(jī)技術(shù)研究與多學(xué)科的支撐,建設(shè)思路見(jiàn)圖1。
圖1 中藥知識(shí)庫(kù)建設(shè)思路
3.1 中藥知識(shí)采集。中藥知識(shí)采集,首先需要數(shù)字化,建議首先采集權(quán)威期刊、會(huì)議成果、研究報(bào)告、診療經(jīng)驗(yàn)、中醫(yī)藥教材等中藥知識(shí)。其次,進(jìn)行元數(shù)據(jù)定義。最后運(yùn)用ETL技術(shù),對(duì)采集的知識(shí)信息進(jìn)行數(shù)據(jù)清洗、規(guī)范化處理、格式轉(zhuǎn)化、過(guò)濾等,最終沉淀積累形成有組織的知識(shí)庫(kù)。
3.2 分析內(nèi)容和結(jié)構(gòu)進(jìn)行中藥知識(shí)庫(kù)總體規(guī)劃。根據(jù)中藥文獻(xiàn)的數(shù)量和內(nèi)容,中藥知識(shí)庫(kù)應(yīng)能夠包含幾乎所有重要文獻(xiàn)與大多數(shù)一般文獻(xiàn),包含幾乎所有有據(jù)可查的中藥知識(shí)。中藥知識(shí)庫(kù)的結(jié)構(gòu)根據(jù)中藥學(xué)總論可分為七大類:(1)中藥的起源與中藥學(xué)的發(fā)展;(2)中藥的產(chǎn)地與采集;(3)中藥的炮制;(4)藥性理論;(5)中藥的配伍;(6)中藥的用藥禁忌中藥的劑量與用法。
根據(jù)具體藥用還包含二十一個(gè)個(gè)類:解表藥、清熱藥、瀉下藥、祛風(fēng)濕藥、化濕藥、利水滲濕藥、溫里藥、理氣藥、消食藥、驅(qū)蟲藥、止血藥、活血化瘀藥、化痰止咳平喘藥、安神藥、平肝息風(fēng)藥、開(kāi)竅藥、補(bǔ)虛藥、收澀藥、涌吐藥、攻毒殺蟲止癢藥、拔毒化腐生肌藥等[4]。還應(yīng)根據(jù)論文期刊、會(huì)議成果、教材等類別進(jìn)行結(jié)構(gòu)分塊。
3.3 確定中藥知識(shí)庫(kù)知識(shí)表示。知識(shí)表示是研究用機(jī)器表示知識(shí)的可行性、有效性的一般方法,是一種數(shù)據(jù)結(jié)構(gòu)與控制結(jié)構(gòu)的統(tǒng)一體,既考慮知識(shí)的存儲(chǔ)又考慮知識(shí)的使用[5]。知識(shí)表示分陳述性知識(shí)表示和過(guò)程性知識(shí)表示兩種表示方法。描述事實(shí)性知識(shí),例如某中藥藥性,采用陳述性知識(shí)表示法;描述規(guī)則性知識(shí)和控制結(jié)構(gòu)知識(shí),例如中藥的炮制過(guò)程,采用過(guò)程性知識(shí)表示法。在中藥知識(shí)庫(kù)的建設(shè)中采取兩種表示方法協(xié)同表示,相互補(bǔ)充,使知識(shí)理論更清晰易懂。陳述性知識(shí)表示,建議使用數(shù)據(jù)庫(kù)技術(shù)、本體技術(shù)進(jìn)行處理,二過(guò)程性知識(shí)表示,則可理解為流程控制、統(tǒng)計(jì)分析與挖掘、人工智能等技術(shù)。
3.4 構(gòu)建中藥數(shù)據(jù)庫(kù)基本事實(shí)數(shù)據(jù)層。中藥知識(shí)包含的信息是多方面的,既有藥的,也有方的,還有診斷的,并且其間的關(guān)系也往往縱橫交錯(cuò)。因此,對(duì)中藥知識(shí)的系統(tǒng)存儲(chǔ)是關(guān)鍵的一個(gè)環(huán)節(jié),既應(yīng)減少冗余又要方便系統(tǒng)快速處理,還要有靈活性和擴(kuò)展性。中藥數(shù)據(jù)層的構(gòu)建可以采用主流的關(guān)系型數(shù)據(jù)庫(kù),也可以采用新型的本體表示法??傮w上講應(yīng)包含以下知識(shí)元:正別名、異名、處方用名、基源、性味、歸經(jīng)、用藥宜忌、功效、主治、證、主癥、次癥、用法用量、常用配伍、處方來(lái)源、劑型、藥物組成、功效主治、制備方法、用法用量與禁忌等。另外,根據(jù)知識(shí)元需要,還應(yīng)有中藥用藥劑量轉(zhuǎn)換表、特殊劑量表等。
3.5 構(gòu)建中藥知識(shí)庫(kù)。在關(guān)系數(shù)據(jù)庫(kù)的基本事實(shí)表,建立準(zhǔn)則層和決策層,統(tǒng)一規(guī)范與分門別類,把中藥數(shù)據(jù)上升為中藥知識(shí),構(gòu)建中藥知識(shí)庫(kù)。根據(jù)提取的中藥和方劑相關(guān)知識(shí)點(diǎn),以中醫(yī)理論為依據(jù),將中藥作為本體,分別確立中藥與方劑知識(shí)中的類,類的層次及其關(guān)系。
3.6 建立推理機(jī)。推理機(jī)是實(shí)施問(wèn)題求解、知識(shí)工程、輔助決策的核心執(zhí)行機(jī)構(gòu),是對(duì)知識(shí)進(jìn)行解釋的程序,根據(jù)知識(shí)的語(yǔ)義,對(duì)按一定策略找到的知識(shí)進(jìn)行解釋執(zhí)行,并把結(jié)果記錄到動(dòng)態(tài)庫(kù)的適當(dāng)空間中去[6]。主要由執(zhí)行器、調(diào)度器和一致性協(xié)調(diào)器等組成。中藥知識(shí)庫(kù)結(jié)合推理機(jī)應(yīng)用到生活中,解決具體的中醫(yī)藥疑難病癥。在中藥專家的指導(dǎo)下,建立對(duì)象推理機(jī)、規(guī)則集推理機(jī)和方法推理機(jī)。通過(guò)在推理機(jī)系統(tǒng)中描述病癥,利用醫(yī)學(xué)本體的屬性和關(guān)系進(jìn)行基于公理的醫(yī)學(xué)知識(shí)推理,進(jìn)而獲取醫(yī)學(xué)知識(shí)。根據(jù)推理結(jié)果,推理機(jī)會(huì)給出相應(yīng)的解決方案以供選擇。當(dāng)然,為確保推理機(jī)精確推理,必須進(jìn)行大量的研究,使推理機(jī)執(zhí)行器、調(diào)度器和一致性協(xié)調(diào)器合理運(yùn)行,符合臨床情況。在檢索文本框中描述病癥特征,對(duì)象推理機(jī)鎖定對(duì)象,方法推理機(jī)根據(jù)已有條件調(diào)用規(guī)則,在知識(shí)庫(kù)中獲取醫(yī)學(xué)知識(shí)結(jié)論,同時(shí)給出相應(yīng)的治療方案。
3.7 中藥知識(shí)審核、發(fā)布。在知識(shí)的審核和發(fā)布階段,使用靈活、便捷的工作流管理機(jī)制,對(duì)知識(shí)管理系統(tǒng)中的各類知識(shí)資源進(jìn)行分級(jí)審核,并進(jìn)行發(fā)布。
3.8 知識(shí)瀏覽、共享與評(píng)價(jià)。通過(guò)配置不同的知識(shí)概覽模板來(lái)滿足不同的知識(shí)瀏覽要求,采取標(biāo)題+摘要的方式進(jìn)行顯示,方便用戶快速了解每一篇知識(shí)的概要。設(shè)置專門的評(píng)價(jià)模塊,以便瀏覽者對(duì)系統(tǒng)問(wèn)題或知識(shí)內(nèi)容進(jìn)行評(píng)價(jià),能夠更好地完善知識(shí)庫(kù)系統(tǒng)。
4 中藥知識(shí)庫(kù)建設(shè)探討
中藥理論知識(shí)體系的復(fù)雜性使中藥在知識(shí)傳承、知識(shí)共享、知識(shí)交流等方面存在較大的障礙,這也是長(zhǎng)期以來(lái)制約中醫(yī)藥發(fā)展的主要因素,建設(shè)中藥知識(shí)庫(kù)的目的恰恰是明確規(guī)范地、系統(tǒng)化地表示、利用、嶄新中藥理論知識(shí)體系。因此,中藥知識(shí)庫(kù)將在中醫(yī)藥知識(shí)工程、中醫(yī)信息系統(tǒng)、中醫(yī)藥學(xué)術(shù)經(jīng)驗(yàn)傳承等多個(gè)方向有很大的應(yīng)用潛力。
參考文獻(xiàn):
[1]萬(wàn)仁甫,徐偉亞.中藥數(shù)據(jù)庫(kù)的現(xiàn)狀及發(fā)展趨勢(shì)探討[J].中國(guó)藥房,2006(17):794-796.
[2]張恒娟,邱亞娜.基于Dspace的中醫(yī)藥機(jī)構(gòu)知識(shí)庫(kù)構(gòu)建研究[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2010(01).
[3]張五輩.中醫(yī)藥知識(shí)庫(kù)設(shè)計(jì)與實(shí)現(xiàn)[D].航空航天大學(xué),2011.
[4]高學(xué)敏.中藥學(xué)[M].北京:人民衛(wèi)生出版社,2007.
[5]張仰森,黃改娟.人工智能教程[M].北京:高教出版社,2008.
[6]周揚(yáng),王振國(guó).基于文本內(nèi)容理解的中醫(yī)藥數(shù)據(jù)基礎(chǔ)研究—中醫(yī)藥文獻(xiàn)語(yǔ)料庫(kù)的建設(shè)[J].中國(guó)中醫(yī)藥信息,2007(09).
作者簡(jiǎn)介:王珍(1967.2-),女,遼寧大連人,副教授,軟件工程碩士研究生;研究方向:云計(jì)算在中醫(yī)藥中的應(yīng)用、醫(yī)療信息系統(tǒng)架構(gòu)、中醫(yī)藥數(shù)據(jù)分析等;竇鵬偉,男,南京中醫(yī)藥大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)2010級(jí)2班優(yōu)秀本科學(xué)生。
作者單位:南京中醫(yī)藥大學(xué),南京 210023
基金項(xiàng)目:(1)江蘇省中醫(yī)藥局科技項(xiàng)目“基于數(shù)據(jù)挖掘技術(shù)的中藥水提液分析方法研究(LZ11203)”、國(guó)家自然基金“中藥揮發(fā)油成分與膜相互作用機(jī)制及專屬膜制備基礎(chǔ)研究(81274095)”、南京中醫(yī)藥大學(xué)重點(diǎn)培育學(xué)科“軟件工程”資助;(2)大學(xué)生實(shí)踐創(chuàng)新訓(xùn)練計(jì)劃項(xiàng)目“基于云計(jì)算的社區(qū)健康醫(yī)療數(shù)據(jù)中心研究與模型建立”資助。