孫雨生 付榮榮 郭隆敏
(1.湖北工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院 武漢 430068)(2.華南理工大學(xué)工商管理學(xué)院 廣州 510641)
作為知識(shí)層面描述信息系統(tǒng)的概念建模工具和語(yǔ)義網(wǎng)核心技術(shù),本體技術(shù)通過(guò)提供共同詞匯解決人機(jī)信息交換問(wèn)題、借助本體映射使不同模型方法、軟件工具、范例與語(yǔ)言實(shí)現(xiàn)互操作、用計(jì)算機(jī)可理解形式化語(yǔ)言進(jìn)行知識(shí)表示、獲取、需求分析等,并廣泛用于人工智能、計(jì)算機(jī)科學(xué)、信息系統(tǒng)工程、知識(shí)工程、數(shù)字圖書(shū)館、信息檢索、地理、醫(yī)學(xué)、化學(xué)、生物、旅游、金融、農(nóng)林、機(jī)械、教育、電子商務(wù)、電子政務(wù)等領(lǐng)域。目前,本體技術(shù)研究已趨成熟并逐步實(shí)現(xiàn)工程應(yīng)用但仍需深入研究:本體建模元語(yǔ)、構(gòu)建標(biāo)準(zhǔn)等概念性問(wèn)題達(dá)成共識(shí),但本體半自動(dòng)構(gòu)建方法與工具、本體評(píng)價(jià)等尚未形成統(tǒng)一標(biāo)準(zhǔn)。因此,客觀、全面分析國(guó)內(nèi)本體技術(shù)研究進(jìn)展,對(duì)把握研究主題與熱點(diǎn)、突破難點(diǎn)、促進(jìn)技術(shù)發(fā)展有重要意義。
本文用文獻(xiàn)計(jì)量和基于高被引文獻(xiàn)的內(nèi)容分析法,從載文、知識(shí)基礎(chǔ)兩方面揭示國(guó)內(nèi)本體技術(shù)研究進(jìn)展。
為確保結(jié)論代表性、準(zhǔn)確性和可操作性,筆者以CNKI的期刊論文庫(kù)為數(shù)據(jù)源,以“本體”或“ontology”或“本體論”為關(guān)鍵詞組合在題名中檢索,收集國(guó)內(nèi)本體技術(shù)文獻(xiàn)(檢索時(shí)間為2018年7月29日,發(fā)表期限截止到2018年6月30日),據(jù)筆者統(tǒng)計(jì),現(xiàn)有本體技術(shù)研究主要集中在信息科技和經(jīng)濟(jì)與管理科學(xué)領(lǐng)域,故選擇這兩個(gè)領(lǐng)域,最終共得6190篇文獻(xiàn),剔除無(wú)關(guān)文獻(xiàn)740篇,最終有效文獻(xiàn)5450篇,國(guó)內(nèi)本體技術(shù)研究最早出現(xiàn)在高濟(jì)等1996年發(fā)表的《基于表示本體論的智能系統(tǒng)開(kāi)發(fā)》一文中。
首先,統(tǒng)計(jì)文獻(xiàn)數(shù)量、基金文獻(xiàn)、來(lái)源期刊和高被引文獻(xiàn);其次,解析文獻(xiàn)年代、基金文獻(xiàn)及來(lái)源期刊統(tǒng)計(jì)結(jié)果,得出基本研究狀況;結(jié)合高被引文獻(xiàn)內(nèi)容分析知識(shí)基礎(chǔ)。
文獻(xiàn)年代分布一定程度反映領(lǐng)域?qū)W術(shù)研究水平和發(fā)展速度。1996~2018國(guó)內(nèi)本體技術(shù)文獻(xiàn)年代分布見(jiàn)圖1,可看出,文獻(xiàn)分布呈鐘形曲線,2009年達(dá)到峰值,近9年整體呈下降趨勢(shì),這與本體技術(shù)研究逐步成熟、走向?qū)嵱?、工程化有較大關(guān)系,但整體年發(fā)文量相對(duì)穩(wěn)定,受關(guān)注度仍較高。
圖1 1996~2018國(guó)內(nèi)本體技術(shù)文獻(xiàn)年代分布
基金文獻(xiàn)體現(xiàn)研究領(lǐng)域受重視度及創(chuàng)新度與前沿動(dòng)態(tài)[1]。5450篇文獻(xiàn)中共3093篇受到基金資助(多基金資助文獻(xiàn)僅取最高級(jí)別基金),約占56.75%,年代分布見(jiàn)圖2,和文獻(xiàn)年代分布趨勢(shì)吻合。各類基金資助文獻(xiàn)中,國(guó)家和教育部等國(guó)家級(jí)基金文獻(xiàn)2293篇,省部級(jí)、院校和科研院所基金、軍隊(duì)及國(guó)防基金分別為765篇、16篇、19篇,表明國(guó)內(nèi)本體技術(shù)研究多受國(guó)家、省市部門資助,院校、科研部門及軍隊(duì)也給予一定資助,企事業(yè)等社會(huì)團(tuán)體則資助較少,表明本體技術(shù)實(shí)踐應(yīng)用尚未普及。
圖2 1996~2018國(guó)內(nèi)本體技術(shù)文獻(xiàn)基金資助分布
來(lái)源期刊分布主要分析刊載期刊及其發(fā)文狀況,為讀者獲取信息、發(fā)表文獻(xiàn)提供指導(dǎo),利于主辦方把握辦刊方向與特點(diǎn)[2]。經(jīng)統(tǒng)計(jì),5450篇文獻(xiàn)發(fā)表的期刊多屬圖書(shū)情報(bào)、計(jì)算機(jī)及科技信息領(lǐng)域,其中,載文大于20篇期刊見(jiàn)表1;發(fā)文85篇及以上期刊共15種,共載文1991篇,占總量36.5%(約1/3),為該領(lǐng)域文獻(xiàn)主要刊載期刊。
高影響力文獻(xiàn)(尤其是高被引文獻(xiàn))是新文獻(xiàn)理論、方法來(lái)源,反映領(lǐng)域知識(shí)基礎(chǔ)。故筆者通過(guò)閱讀、歸納高被引文獻(xiàn)內(nèi)容,初步得出本體技術(shù)知識(shí)基礎(chǔ)。
被引頻次是評(píng)價(jià)文獻(xiàn)質(zhì)量重要指標(biāo),文獻(xiàn)被引頻次越高,其觀點(diǎn)或方法同行認(rèn)可度越高,研究水平、價(jià)值及影響力越高。經(jīng)統(tǒng)計(jì),國(guó)內(nèi)本體技術(shù)文獻(xiàn)共4387篇被引用過(guò),占總量80.50%,被引頻次不小于10文獻(xiàn)共1241篇,單篇最高被引2359次,指數(shù)均較高,表明本體技術(shù)受關(guān)注度較高且理論基礎(chǔ)較好并逐步成熟,同時(shí),根據(jù)文獻(xiàn)[3],h-b指數(shù)可用于確定研究領(lǐng)域高被引文獻(xiàn),經(jīng)分析,國(guó)內(nèi)本體技術(shù)高被引文獻(xiàn)共77篇且發(fā)表時(shí)間均較早(見(jiàn)表2),一方面,文獻(xiàn)被引頻次與發(fā)表時(shí)間有關(guān),另一方面,說(shuō)明近年內(nèi)該領(lǐng)域無(wú)重大理論或技術(shù)突破。此外,該領(lǐng)域應(yīng)用研究文獻(xiàn)被引頻次均較高,表明隨著本體技術(shù)成熟,學(xué)者關(guān)注重點(diǎn)逐步轉(zhuǎn)向應(yīng)用探索。
分析高被引文獻(xiàn)可知,國(guó)內(nèi)本體技術(shù)知識(shí)基礎(chǔ)主要包括發(fā)展演繹、理論研究、本體構(gòu)建與優(yōu)化、本體應(yīng)用四方面。
4.2.1 發(fā)展演繹
本體起源于哲學(xué),20世紀(jì)末引入到人工智能領(lǐng)域[4],后主要用于計(jì)算機(jī)、網(wǎng)絡(luò)、軟件工程、信息系統(tǒng)、知識(shí)工程等領(lǐng)域的自然語(yǔ)言處理、信息交換、互操作、數(shù)據(jù)庫(kù)管理、知識(shí)獲取、表示和管理。國(guó)際計(jì)算機(jī)科學(xué)界1998年召開(kāi)的第一個(gè)本體主題會(huì)議“信息系統(tǒng)中形式化本體論國(guó)際會(huì)議”及本體研究成果數(shù)量、質(zhì)量增加標(biāo)志著該領(lǐng)域研究日趨成熟[5],國(guó)內(nèi)本體技術(shù)研究最初多從國(guó)外學(xué)習(xí)借鑒,后逐漸自主創(chuàng)新,目前趨于成熟并用于解決諸多學(xué)科領(lǐng)域問(wèn)題,形成相對(duì)標(biāo)準(zhǔn)的領(lǐng)域本體分析、構(gòu)建、評(píng)價(jià)方法與工具,本體專業(yè)性、詳盡性、描述深度、粒度及形式化更強(qiáng)并趨向多元化發(fā)展、交叉學(xué)科應(yīng)用。
表1 1996-2018國(guó)內(nèi)刊載本體技術(shù)大于20篇期刊
4.2.2 理論研究
國(guó)內(nèi)本體技術(shù)研究吸收國(guó)外研究成果,重視理論研究,主要包括本體技術(shù)演變、定義、分類、描述語(yǔ)言、構(gòu)建工具等。
1)本體概念
不同領(lǐng)域?qū)Ρ倔w定義不同。人工智能領(lǐng)域,Neches等認(rèn)為本體是給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語(yǔ)和關(guān)系及用這些術(shù)語(yǔ)和關(guān)系構(gòu)成的規(guī)定詞匯外延規(guī)則的定義[6];B.Chandrasekaran等認(rèn)為本體研究特定領(lǐng)域知識(shí)的對(duì)象分類、對(duì)象屬性和對(duì)象間關(guān)系,為領(lǐng)域知識(shí)描述提供術(shù)語(yǔ)[7]。信息科學(xué)和知識(shí)工程領(lǐng)域,Gruber[6]認(rèn)為本體是概念模型的明確的規(guī)范說(shuō)明;Borst認(rèn)為[6]是共享概念模型的形式化規(guī)范說(shuō)明;Guarino等[8]引入“域空間”概念并定義“概念關(guān)系”,明確說(shuō)明本體論和概念化間差別,對(duì)“概念化”明確說(shuō)明;Studer[6]等認(rèn)為是共享概念模型的明確的形式化規(guī)范說(shuō)明;Fonseca[7]從建模元語(yǔ)方面認(rèn)為是從特定角度用特定詞匯表描述實(shí)體、概念、特性和相關(guān)功能的理論;William等[7]從特征和形態(tài)方面認(rèn)為是用于描述或表達(dá)領(lǐng)域知識(shí)的概念或術(shù)語(yǔ)集,以組織知識(shí)庫(kù)較高層次抽象或描述特定領(lǐng)域知識(shí)??傊倔w主要包含概念模型、明確、形式化和共享四層含義[6]。
2)本體分類
本體按不同標(biāo)準(zhǔn)(如表示形式化度、描述對(duì)象、應(yīng)用領(lǐng)域、目的、主題、是否在線、是否共享等)分類方式各異:Guarino[6]基于詳細(xì)度(分為詳細(xì)度高的參考本體及詳細(xì)度低的共享本體)和領(lǐng)域依賴度(分為頂級(jí)本體、領(lǐng)域本體、任務(wù)本體和應(yīng)用本體)分類;按本體形式化程度分高度非形式化本體、非形式化本體、半形式化本體、嚴(yán)格形式化本體[7];按描述對(duì)象分特殊領(lǐng)域本體、一般世界知識(shí)本體、問(wèn)題求解本體和知識(shí)表示語(yǔ)言本體等[9];按應(yīng)用領(lǐng)域分為人或組織的通信、系統(tǒng)間互操作和系統(tǒng)工程領(lǐng)域三類[5]。此外,Perez和Benjamins將本體分為[6]知識(shí)表示本體、普通本體、頂級(jí)本體、元(核心)本體、領(lǐng)域本體、語(yǔ)言本體、任務(wù)本體、領(lǐng)域-任務(wù)本體、方法本體和應(yīng)用本體10種有交叉本體。
3)描述語(yǔ)言
本體描述語(yǔ)言應(yīng)有定義良好的語(yǔ)法、語(yǔ)義、有效推理支持、充分表達(dá)能力,以清晰、形式化描述概念,可用自然語(yǔ)言、框架、邏輯語(yǔ)言、語(yǔ)義網(wǎng)絡(luò)等描述。本體描述語(yǔ)言根據(jù)應(yīng)用及功能各異:基于AI本體描述語(yǔ)言包括KIF(多用于企業(yè)級(jí)[10])、Ontolingua、Loom、OCML、OKBC、FLogic等[8];基于Web本體描述語(yǔ)言包括SHOE(基于并擴(kuò)展HTML)、OML、CMKL、OWL(包括 3 個(gè)子語(yǔ)言[11]OWL Lite、OWL DL、OWL Full)、XOL、DAML、OIL、RDF、RDF(S)(后6種均基于XML,屬W3C本體語(yǔ)言棧中不同層次[10])等,此外,OWL、OIL、DAML+OIL、CMKL基于描述邏輯[8],OWL、DAML+OIL、RDF(S)是 W3C 推薦的標(biāo)準(zhǔn)本體描述語(yǔ)言;基于謂詞邏輯本體描述語(yǔ)言包括 Ontolingua、CycL、Loom、OIL、KIF、F-logic、XOL等[9],前三者和具體系統(tǒng)相關(guān),基本只用于相關(guān)項(xiàng)目[10];基于圖本體描述語(yǔ)言包括WordNet語(yǔ)義網(wǎng)絡(luò)、概念圖、CR、DAG、LSG、LCG等。
4)構(gòu)建工具
表2 1996-2018國(guó)內(nèi)本體技術(shù)研究高被引文獻(xiàn)
續(xù)表3
按支持語(yǔ)言分兩類[12]:基于特定語(yǔ)言并一定程度支持多種基于AI本體描述語(yǔ)言,如基于Ontolingua語(yǔ)言的Ontolingua、基于LOOM語(yǔ)言的OntoSaurus、基于OCML語(yǔ)言的WebOnto等;基于Web本體描述語(yǔ)言構(gòu)建語(yǔ)義Web本體,如Protégé、WebODE、OntoEdit、OilEd等。按功能分[13]編輯工具(如OntoEdit、OILed、Protégé等)、標(biāo)注工具(如AeroDAML、OntoAnnotate、COHSE等)和集成工具(如PROMPT、FCA-Merge、ODEMerge等)、本體存儲(chǔ)查詢工具和學(xué)習(xí)工具等。
4.2.3 本體構(gòu)建與優(yōu)化
1)構(gòu)建方法
本體構(gòu)建遵循明確性和客觀性、完全性、一致性、最大單調(diào)可擴(kuò)展性、最小承諾等規(guī)則[6],主要構(gòu)建方法有七步法、METHONLOGY法、IDEF5法、TOVE法(又稱Gruninger&Fox“評(píng)價(jià)法”[14]、企業(yè)建模法[12])、骨架法(又稱 Enterprise ontology法[9])、SENSUS法、KACTUS法[15](又稱Berneraset al法[14])、AFM 法[16]、五步循環(huán)法[16]、循環(huán)獲取法[17]、生命周期法[9]和基于領(lǐng)域知識(shí)重用的虛擬本體構(gòu)造法[18]等。
2)建模元語(yǔ)
主要包含類(又稱概念)、關(guān)系、函數(shù)、公理和實(shí)例 5 類,概念間基本關(guān)系包括 part-of、kind-of、instance-of和attribute-of。實(shí)際應(yīng)用中本體構(gòu)造無(wú)需嚴(yán)格按上述5類元語(yǔ)且概念間關(guān)系定義可按應(yīng)用需求而不限于上述4種基本關(guān)系[6]。
3)建模思路
核心包括明確領(lǐng)域中概念、概念屬性和約束條件、概念間層次關(guān)系等[13]。陳剛等[18]提出重用現(xiàn)有領(lǐng)域知識(shí)庫(kù)知識(shí)構(gòu)建可重用虛擬領(lǐng)域本體思路;王洪偉等[19]提出基于描述邏輯的本體建模思路并構(gòu)建基于邏輯的形式化本體模型;向陽(yáng)等[20]根據(jù)軟件工程原理,提出基于Jena的OWL本體建模思路,包括構(gòu)建步驟與實(shí)現(xiàn)算法;劉宗田[21]等提出構(gòu)建面向事件的本體模型;丁晟春[22]基于本體工程思想提出基于頂層本體的領(lǐng)域本體構(gòu)建框架。
4)本體映射
旨在發(fā)現(xiàn)不同領(lǐng)域本體概念間相關(guān)性,是本體集成、合并、修正、翻譯技術(shù)基礎(chǔ),可很好解決本體異構(gòu)問(wèn)題[23],主要研究本體映射方法、工具、模型等。黃煙波等[24]分類本體映射方法,針對(duì)本體定義模型提出基于語(yǔ)法、實(shí)例、定義和層次結(jié)構(gòu)的分類,針對(duì)映射技術(shù)提出基于規(guī)則、統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的分類;瞿裕忠等[25]從模型轉(zhuǎn)換途徑、映射策略適用范圍及映射結(jié)果表達(dá)形式三方面歸納關(guān)系數(shù)據(jù)庫(kù)模式與本體映射難點(diǎn)并基于此比較映射工具;唐杰等[26]基于貝葉斯決策理論提出最小風(fēng)險(xiǎn)的本體映射模型RiMOM,提供多策略本體映射方法;高鵬等[27]研究用戶需求本體與產(chǎn)品配置本體間映射,以自動(dòng)獲取產(chǎn)品配置模型;徐振寧等[28]提出本體到文檔類型定義映射算法和文檔類型定義到關(guān)系視圖映射算法,實(shí)現(xiàn)XML文檔和數(shù)據(jù)庫(kù)視圖在語(yǔ)義和結(jié)構(gòu)上對(duì)應(yīng)關(guān)系。王宇華[29]等構(gòu)建本體需求模型到UML原模型映射規(guī)則以實(shí)現(xiàn)兩者轉(zhuǎn)換;劉宗田[21]等提出用事件本體將句子或篇章映射成事件網(wǎng)絡(luò)。
5)相似度計(jì)算
相似度衡量文本中詞語(yǔ)可替換度,反映信息檢索、信息推薦和過(guò)濾中文本或用戶查詢符合度,廣泛用于數(shù)據(jù)挖掘、機(jī)器翻譯[30,31]。朱禮軍等[32]引入計(jì)算語(yǔ)言學(xué)中語(yǔ)義距離思想計(jì)算領(lǐng)域本體中概念相似度;陳杰等[33]將概念相似度分為概念語(yǔ)義初始相似度層和概念非上下位關(guān)系相似度層,加權(quán)兩層相似度得出最終相似度;徐德智等[34]基于SUMO提出計(jì)算概念語(yǔ)義相似度的語(yǔ)義距離法;李文清[35]提出將基于節(jié)點(diǎn)信息量的概念語(yǔ)義相似性算法及基于邊計(jì)算的本體概念語(yǔ)義相似度算法線性加權(quán)的算法。李鵬等[31]用本體結(jié)構(gòu)上ISA關(guān)系提出本體內(nèi)部概念間相似度算法;黃果等[30]提出基于領(lǐng)域本體的可量化概念語(yǔ)義相似度計(jì)算模型,依類型、密度、深度、強(qiáng)度、屬性對(duì)有向邊權(quán)重影響度進(jìn)行線性加權(quán)組合以計(jì)算相似度。
6)本體評(píng)價(jià)
本體評(píng)價(jià)較難且相關(guān)研究相對(duì)較少,尚無(wú)統(tǒng)一標(biāo)準(zhǔn)。Duineveld A.J[36]構(gòu)建本體評(píng)價(jià)框架,從 Ontology、General、Cooperation三方面評(píng)估本體構(gòu)建工具 WebOnto、 Ontolingua、 ODE、 ProtégéWin、KADS22、OntoSaurus;宋丹輝[37]認(rèn)為本體評(píng)價(jià)方法包括基于專家法、基于任務(wù)法、基于黃金標(biāo)準(zhǔn)法、基于指標(biāo)體系法和基于文本語(yǔ)料庫(kù)法等。
4.2.4 本體應(yīng)用
1)語(yǔ)義Web
本體技術(shù)對(duì)語(yǔ)義Web研究、應(yīng)用起重要推動(dòng)作用。李曼等[38]用領(lǐng)域本體及其推理能力生成優(yōu)化的服務(wù)組合圖,提出Web服務(wù)動(dòng)態(tài)組合方法;吳健等[39]基于詞語(yǔ)間距離度量、義原相似度兩種詞匯語(yǔ)義相似度算法,提出基于本體論和詞匯語(yǔ)義相似度的Web服務(wù)發(fā)現(xiàn)方法;彭暉等[40]提出基于本體概念相似度(通過(guò)概念間語(yǔ)義距離計(jì)算)描述服務(wù)請(qǐng)求方和發(fā)布方的Web服務(wù)匹配算法;鄧志鴻等[41]分析本體在Web信息集成中應(yīng)用;周明建[42]等提出基于Web頁(yè)面的信息項(xiàng)本體和結(jié)構(gòu)項(xiàng)本體的信息提取規(guī)則以有效提取Web頁(yè)面信息;袁柳等[43]提出基于領(lǐng)域本體語(yǔ)義標(biāo)注Web數(shù)據(jù)庫(kù)查詢結(jié)果以便機(jī)器處理和用戶理解。
2)信息檢索
本體技術(shù)可有效提高信息檢索系統(tǒng)性能[23]。廖明宏[44]提出基于本體信息檢索方法;徐振寧[5]提出基于本體的智能化、個(gè)性化語(yǔ)義信息檢索系統(tǒng)體系結(jié)構(gòu);武成崗等[45]提出基于本體和多智能主體、可對(duì)用戶需求及Internet信息進(jìn)行領(lǐng)域分類的信息檢索服務(wù)框架以提高檢索結(jié)果針對(duì)性;萬(wàn)捷等[46]基于本體將用戶檢索需求擴(kuò)充成語(yǔ)義集并通過(guò)文檔分析器過(guò)濾檢索結(jié)果以提高檢索質(zhì)量;丁晟春等[4]分析Jena在語(yǔ)義檢索中作用與應(yīng)用;廖樂(lè)健等[47]從知識(shí)表示與推理角度提出基于本體與模板規(guī)則混合技術(shù),混合本體和樹(shù)形模板以增強(qiáng)模板語(yǔ)義表達(dá)能力,提高信息抽取智能性;宋峻峰等[48]用描述邏輯、tableau算法等語(yǔ)義索引項(xiàng)生成基于本體的文檔邏輯視圖和用戶信息需求邏輯視圖改善信息檢索性能;陳康等[49]用傳統(tǒng)技術(shù)收集Web資源中領(lǐng)域信息,基于領(lǐng)域本體將用戶檢索需求轉(zhuǎn)為本體概念,實(shí)現(xiàn)用戶以自然語(yǔ)言方式表達(dá)檢索請(qǐng)求;潘旭偉[50]提出基于情感感知和本體方法實(shí)現(xiàn)信息服務(wù)自適應(yīng)個(gè)性化;王進(jìn)[51]用本體刻畫(huà)不同語(yǔ)言中對(duì)應(yīng)領(lǐng)域知識(shí),提出基于語(yǔ)義的跨語(yǔ)言信息檢索模型解決查詢語(yǔ)言與檢索語(yǔ)言間語(yǔ)義損失及曲解問(wèn)題。
3)需求分析
張勁松等[52]針對(duì)配置建模存在問(wèn)題,提出基于本體的產(chǎn)品配置建模方法與過(guò)程并用面向?qū)ο蠓ū磉_(dá)配置模型;高鵬等[27]提出基于本體的用戶需求模型和產(chǎn)品配置模型,構(gòu)建將用戶需求知識(shí)轉(zhuǎn)成產(chǎn)品配置知識(shí)的本體映射規(guī)則;金芝[53]以企業(yè)信息系統(tǒng)為背景,提出以企業(yè)本體和領(lǐng)域本體為基本線索,引導(dǎo)領(lǐng)域用戶全面描述現(xiàn)實(shí)系統(tǒng)并通過(guò)重用領(lǐng)域需求模型,構(gòu)造應(yīng)用軟件需求模型的基于本體需求獲取法;陸汝鈐[54]等將對(duì)象關(guān)聯(lián)引入到面向?qū)ο蠓ㄖ幸栽鰪?qiáng)其表達(dá)能力,構(gòu)建自動(dòng)化需求獲取和分析模型。
4)知識(shí)工程
顧芳[9]等概述知識(shí)工程中本體構(gòu)建準(zhǔn)則、方法、表示語(yǔ)言、代表項(xiàng)目、主要應(yīng)用等;王英林等[55]提出基于本體重構(gòu)知識(shí)管理系統(tǒng)框架,解決知識(shí)管理中知識(shí)類型不可擴(kuò)充局限性;郭鳴等[56]提出基于本體和語(yǔ)義Web、支持知識(shí)處理的結(jié)構(gòu)層次化產(chǎn)品信息模型并給出從EXPRESS模式到DAML+OIL映射方法;胡玉杰[57]等基于產(chǎn)品知識(shí)表達(dá)模型構(gòu)建流本體和功能本體,進(jìn)而定義特定領(lǐng)域產(chǎn)品共享、通用知識(shí)并提出基于本體的產(chǎn)品知識(shí)表達(dá)應(yīng)用模型和集成框架;張東民[58]提出包括多知識(shí)源設(shè)計(jì)知識(shí)獲取、建模和檢索的設(shè)計(jì)知識(shí)管理框架,研究基于本體的設(shè)計(jì)知識(shí)建模方法;周肖彬[59]等提出醫(yī)學(xué)本體構(gòu)建、知識(shí)表示及獲取方法;劉煒[60]等分析知識(shí)本體對(duì)元數(shù)據(jù)方案的補(bǔ)充、高層互操作作用及知識(shí)本體構(gòu)建一般流程和方法;李勇[61]等提出通用、工程化領(lǐng)域本體構(gòu)建方法;鐘秀琴[62]提出幾何學(xué)形式本體及知識(shí)表示;王文?。?3]基于ABC本體提出應(yīng)急預(yù)案本體及其表示。
4.2.5 其他研究
主要是本體在關(guān)系數(shù)據(jù)庫(kù)與本體庫(kù)中不同存儲(chǔ)格式間轉(zhuǎn)換問(wèn)題。李曼等[64]提出將常用本體查詢信息按類分別存于不同表以減少本體查詢時(shí)表連接代價(jià);徐振寧[28]將知識(shí)表示和處理引入到Web信息處理,為半結(jié)構(gòu)化Web數(shù)據(jù)和關(guān)系數(shù)據(jù)庫(kù)提供統(tǒng)一語(yǔ)義模型,實(shí)現(xiàn)基于數(shù)據(jù)庫(kù)的Web信息動(dòng)態(tài)發(fā)布與多數(shù)據(jù)源集成。
綜上,本文用文獻(xiàn)計(jì)量、內(nèi)容分析法,從載文、知識(shí)基礎(chǔ)兩方面揭示了國(guó)內(nèi)本體技術(shù)研究進(jìn)展:從載文角度看,國(guó)內(nèi)本體技術(shù)研究高度受關(guān)注且逐步成熟、走向?qū)嵱茫臧l(fā)文量、基金文獻(xiàn)量均較高且資助中多為國(guó)家級(jí)基金,表明該領(lǐng)域側(cè)重科學(xué)研究、前沿性較強(qiáng)、實(shí)踐應(yīng)用尚未普及;來(lái)源期刊分布較廣,現(xiàn)有成果主要刊載于圖書(shū)情報(bào)、計(jì)算機(jī)和科技信息類期刊。從知識(shí)基礎(chǔ)角度看,主要分發(fā)展演繹、理論研究、本體構(gòu)建與優(yōu)化、本體應(yīng)用四方面:發(fā)展演繹表明本體技術(shù)研究趨向多元化發(fā)展、交叉學(xué)科應(yīng)用;理論研究較多,雖尚無(wú)完全統(tǒng)一標(biāo)準(zhǔn)但基本達(dá)成共識(shí),包括本體定義、分類、描述語(yǔ)言、構(gòu)建工具等,學(xué)者主要分布于人工智能、信息科學(xué)領(lǐng)域;本體構(gòu)建與優(yōu)化涉及構(gòu)建方法、建模思路、本體映射、相似度計(jì)算、本體評(píng)價(jià)等,本體優(yōu)化、本體評(píng)價(jià)、本體半自動(dòng)構(gòu)建等將逐步成為研究熱點(diǎn);本體主要用于語(yǔ)義Web、信息檢索、需求分析、知識(shí)工程等領(lǐng)域。