[摘 要]本體在信息系統(tǒng)中的應(yīng)用取決于知識型系統(tǒng)的商業(yè)需要,同時也受到管理范式變遷的影響;人們對信息的理解異構(gòu)是比計算機(jī)系統(tǒng)數(shù)據(jù)存儲模式異構(gòu)更重要的問題,本體能在多大程度上幫助智力資本的隱性知識顯性化對知識管理的發(fā)展起著決定性作用。
[關(guān)鍵詞]知識工程;知識管理;本體論;知識表示
[中圖分類號] F270.7
[文獻(xiàn)標(biāo)識碼] A
[文章編號] 1673-0194(2006)09-0008-03
[收稿日期] 2006-07-04
[作者簡介] 姚靠華(1962-),湖南益陽人,湖南大學(xué)會計學(xué)院信息管理系主任,副教授,博士,碩士生導(dǎo)師。主要研究方向:人工智能與會計。
1 引言
本體(Ontology)本是哲學(xué)術(shù)語,意為客觀存在的一個系統(tǒng)的解釋或說明,反映客觀現(xiàn)實的抽象本質(zhì);計算機(jī)科學(xué)中本體指的是領(lǐng)域內(nèi)共享概念模型的明確的形式化規(guī)范說明,其目的是提供給領(lǐng)域內(nèi)不同主體(包括人、機(jī)器、軟件等)相互交流的語義基礎(chǔ),即形式化地明確定義包括機(jī)器在內(nèi)的各主體理解的共識;本體論在自然語言處理、知識工程、語義Web等眾多領(lǐng)域得到了廣泛的應(yīng)用,通過提供信息語義層處理的基礎(chǔ),它將大大提高計算機(jī)的知識處理能力;在信息、知識爆炸的時代,開發(fā)知識型系統(tǒng)(Knowledge-based System,KBS)對企業(yè)生存與發(fā)展已經(jīng)不可或缺。
本體論應(yīng)用于信息系統(tǒng)開發(fā)大多都基于這樣一條基本信念:知識可以使用簡單的規(guī)則來表示和推理,這實質(zhì)是還原論;與還原論相對應(yīng)的知識復(fù)雜性分析正在興起,但還停留在理論探討階段,商業(yè)應(yīng)用仍處于馮·諾依曼時代,還原論規(guī)則依舊是開發(fā)商業(yè)應(yīng)用的KBS時應(yīng)當(dāng)堅持的信念。當(dāng)前KBS的應(yīng)用要解決兩大問題,其一是知識獲取瓶頸,其二是多個KBS間的協(xié)作通信問題;本體不僅能提供知識工程師與領(lǐng)域?qū)<业墓蚕砀拍钅P?,也同時提供了不同系統(tǒng)間知識共享的基礎(chǔ),對擴(kuò)展KBS的應(yīng)用有著非常重要的意義。
在KBS中應(yīng)用本體論,需要考慮到以下的基本問題:(1)知識管理并不是信息管理的簡單延伸,還伴隨著科學(xué)管理哲學(xué)向人本管理哲學(xué)的變遷;(2)本體對信息語義歧義性的削弱不能僅僅局限于不同計算機(jī)系統(tǒng)之間,應(yīng)當(dāng)泛化到人與人之間;(3)在幫助人力資本將隱性知識轉(zhuǎn)化為顯性知識上,本體的工程方法起著至關(guān)重要的作用,本體內(nèi)在的潛質(zhì)并不能意味著它一定能解決問題。
2 信息管理與知識管理
學(xué)術(shù)界對知識管理存在工具論與戰(zhàn)略論等兩種不同看法,前者認(rèn)為知識管理是信息管理的延伸,知識與信息密不可分,知識管理也是一種信息處理工具;后者認(rèn)為知識是企業(yè)唯一得以保持可持續(xù)競爭優(yōu)勢的戰(zhàn)略資源,知識管理是一種取代以資源配置為中心的科學(xué)管理哲學(xué)的、以知識的創(chuàng)造與共享為核心的新型管理哲學(xué)。這兩種觀點并非對立的,知識管理既會影響到企業(yè)戰(zhàn)略層,也會改變企業(yè)作業(yè)層,工具論與戰(zhàn)略論實際上是互為補(bǔ)充的關(guān)系。
數(shù)據(jù)、信息、知識三者的差異體現(xiàn)了信息管理與知識管理的區(qū)別;數(shù)據(jù)是沒有任何判斷和背景內(nèi)容的對事物客觀事實的描述,信息是賦予了相關(guān)性與內(nèi)容的數(shù)據(jù),信息按照使用者的要求經(jīng)過進(jìn)一步的組織和融合生成背景信息,個體吸收背景信息加入個人經(jīng)驗、價值觀和信念后轉(zhuǎn)化為知識。在信息管理思想發(fā)展的3個階段中,技術(shù)信息管理階段強(qiáng)調(diào)信息技術(shù)而忽視人文因素,實現(xiàn)的是數(shù)據(jù)的共享與快速傳遞;信息資源管理階段則將信息資源視為管理的核心,力求構(gòu)建準(zhǔn)確及時傳遞決策相關(guān)信息的信息資源平臺;知識管理階段的管理核心演變?yōu)槠髽I(yè)的智力資本,知識管理要實現(xiàn)知識共享與知識創(chuàng)新激勵的有效統(tǒng)一。
企業(yè)是一個生成、編碼、儲存、分配和應(yīng)用知識的社會集合;知識管理的目的是通過提高企業(yè)創(chuàng)新能力和應(yīng)變能力以期在非連續(xù)變化的市場環(huán)境下獲取持續(xù)的競爭優(yōu)勢;知識管理是將知識看作一項重要戰(zhàn)略資源的新型管理戰(zhàn)略,用戰(zhàn)略的眼光經(jīng)營知識,尋求如何有效率地從組織的知識資產(chǎn)中創(chuàng)造價值。一個企業(yè)為其顧客創(chuàng)造有競爭力的價值的能力取決于有能力、有創(chuàng)造性和有知識的員工被激勵后的協(xié)作努力,這些員工構(gòu)成企業(yè)的人力資本,員工的激勵和協(xié)作與企業(yè)的社會資本相關(guān),社會資本包括共同的價值觀、愿景、個人的使命感以及組織內(nèi)部信任和關(guān)心的氛圍;員工的技巧、能力、創(chuàng)造性和知識反過來又受企業(yè)創(chuàng)造、發(fā)展、共享、整合和使用知識資源的活動影響,這些活動構(gòu)成企業(yè)的知識管理;社會資本、人力資本和知識管理相互作用,共同形成知識管理關(guān)系結(jié)構(gòu),這個結(jié)構(gòu)中的任何組成部分發(fā)展較差,企業(yè)都不能持續(xù)地、有競爭力地創(chuàng)造價值。與科學(xué)管理模式強(qiáng)調(diào)成本效益等經(jīng)濟(jì)指標(biāo)不同,知識管理關(guān)注的是企業(yè)知識創(chuàng)新與共享的文化環(huán)境和知識的持續(xù)性影響。
知識管理戰(zhàn)略是科學(xué)管理向人本管理的回歸,是企業(yè)資源基礎(chǔ)理論向企業(yè)知識基礎(chǔ)理論的升華;同時也是信息技術(shù)從信息處理向知識處理的發(fā)展。目前知識管理研究也相應(yīng)地出現(xiàn)了兩條路徑:一條路徑研究對智力資本知識創(chuàng)新與共享的激勵問題,這可歸屬于經(jīng)濟(jì)學(xué)研究的新熱點——人力資本理論;另一條路徑研究員工隱性知識向顯性知識的轉(zhuǎn)化以及知識的計算機(jī)自動處理的問題。本體論屬于后一條路徑的研究;本體論既用于知識管理系統(tǒng)的概念設(shè)計,提供統(tǒng)一的領(lǐng)域概念與術(shù)語,奠定知識共享與重用的基礎(chǔ);也用于系統(tǒng)開發(fā),為數(shù)據(jù)庫智能化查詢、多agent間的通信、推理與決策支持以及自然語言理解等提供技術(shù)支持。本體思想既源自哲學(xué)本體論,也基于面向?qū)ο筌浖椒ǖ姆e累。與哲學(xué)本體論試圖提供解釋事物多樣性與理論復(fù)雜性的普遍性框架相類似,計算機(jī)本體提供的是不同類型的機(jī)器、不同專業(yè)領(lǐng)域的人之間的溝通中介。
知識的計算機(jī)自動處理技術(shù)如語義Web、自然語言處理等近年來發(fā)展迅速,隱性知識向顯性知識的轉(zhuǎn)化已經(jīng)成為知識工程發(fā)展的瓶頸;突破這一瓶頸不僅是知識工程技術(shù)上的問題,還得依靠有效的人力資本激勵機(jī)制。顯性知識是可編碼的,亦即可轉(zhuǎn)化為信息,隱性知識向顯性知識的轉(zhuǎn)化在某種意義上也可說是知識的信息化,顯性知識的共享與傳播只是信息資源管理功能的進(jìn)一步挖掘;而知識管理創(chuàng)新的功能是隱性知識的處理。本體能夠在知識管理中發(fā)揮多大的作用,主要取決于本體能夠在多大程度上削弱信息的語義異構(gòu)性以及本體提供的共享概念模型能夠在多大意義上幫助智力資本隱性知識顯性化。
3 本體論在知識管理中的應(yīng)用
本體研究興起的背景是:為規(guī)范網(wǎng)絡(luò)信息資源的無序生長狀態(tài),各標(biāo)準(zhǔn)化組織使用各種建模工具(如UML、XML等)建立了各自行業(yè)領(lǐng)域內(nèi)的元模型,統(tǒng)一了數(shù)據(jù)的格式和表現(xiàn)形式以及業(yè)務(wù)流程的接口,極大地促進(jìn)了模型的規(guī)范和統(tǒng)一;但是,信息與軟件系統(tǒng)的元建模比數(shù)據(jù)的元建模更加復(fù)雜,不具備自然、直觀、公共性、容易理解的特性,同時不同組織所定義的元模型之間可能存在概念的定義不同和采用的技術(shù)不同的雙重分歧;本體試圖為不同范圍、不同層次的研究領(lǐng)域統(tǒng)一認(rèn)識,消除由于應(yīng)用背景不同而造成的理解上的沖突和混亂,促進(jìn)不同領(lǐng)域的人們相互交流和不同系統(tǒng)之間的通信、資源共享與協(xié)同工作。知識的本體層表示處于自然語言表示層與邏輯表示層的中間;一方面自然語言層的各種概念混亂,專業(yè)性過強(qiáng)不利于溝通,需要一個統(tǒng)一的、規(guī)范的表示框架;另一方面,為實現(xiàn)知識的計算機(jī)處理,本體需要提供形式化表示,這種表示還要能被方便地映射為不同的邏輯層表示。本體研究不僅是計算機(jī)知識表示的規(guī)范問題,更是人們科學(xué)研究與生產(chǎn)生活實踐中術(shù)語的規(guī)范性問題。
3.1本體相關(guān)的基本理論與工具
一個完整的本體應(yīng)當(dāng)包括概念(Concepts)、關(guān)系(Relations )、函數(shù)( Functions )、公理( Axioms )、實例( Instances )等5個部分,其中關(guān)系主要包括part-of、kind-of、instance-of、attribute-of等4種;目前使用的本體建模語言如Ontolingua等大多都支持這5種原語和4種關(guān)系。
目前本體的工程方法尚不成熟,人們在不同的本體工程中使用著不同的建模方法,主要使用的方法有:骨架法、IDEF-5法、企業(yè)建模法、Methontology法、循環(huán)獲取法、評價法、Bemeras方法、SENSUS描述法等等;各種方法有不同的應(yīng)用和產(chǎn)生背景,也適用于不同的領(lǐng)域。雖然構(gòu)建本體的方法各異,但人們普遍接受Gruber于1995年提出的5條構(gòu)建規(guī)則:明確性和客觀性、完全性、一致性、最大單調(diào)可擴(kuò)展性、最小承諾。
本體描述語言最早提出是在知識工程領(lǐng)域,代表性的有KIF、Ontolingua、Loom、OCML、FLogic等,KIF是基于一階邏輯的,Ontolingua、OCML和Flogic是基于框架和一階邏輯的,而Loom是基于描述邏輯的。近年來,Web成為本體研究的主戰(zhàn)場,出現(xiàn)了一系列基于Web的Ontology表示語言,如SHOE、XOL、RDF、RDF-S、OIL、OIL+DAML、OWL等等,W3C先后推薦了RDF(S),DAML+OIL和OWL作為本體描述語言標(biāo)準(zhǔn);本體語言要達(dá)到清晰的、形式化的概念描述,需要具有良好定義的語法、良好定義的語義、有效的推理支持、充分的表達(dá)能力以及表達(dá)的方便性。基于Web的本體構(gòu)建大多是基于XML的,一方面XML已經(jīng)成為當(dāng)今Web數(shù)據(jù)表示與交換的事實標(biāo)準(zhǔn),另一方面XML使用的可擴(kuò)展的數(shù)據(jù)表示結(jié)構(gòu)很適合本體的描述;RDF、OWL等都使用XML為書寫工具。
基于AI(Artificial Intelligence,人工智能)的本體構(gòu)建工具主要有Ontolingua、OntoSaurus,WebOnto等,分別基于Ontolingua語言、LOOM語言、OCML;而Protégé、WebEDIT、OntoEdit、OilEd等都支持基于Web的本體開發(fā),并獨立于特殊的語言,可導(dǎo)入導(dǎo)出多種基于Web的本體語言。一種語言可在多個工具中使用,一個工具支持多種語言,這種網(wǎng)狀的交錯關(guān)系是建立統(tǒng)一的元語言標(biāo)準(zhǔn)的實踐基礎(chǔ)。
3.2本體論對信息語義異構(gòu)性的削弱
哲學(xué)上的本體是脫離了語言的存在,這也是計算機(jī)中本體追求的目標(biāo)。本體要處理人機(jī)兩端的異構(gòu):在機(jī)器一端,既有網(wǎng)絡(luò)硬件、操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、應(yīng)用程序等系統(tǒng)平臺的異構(gòu),也有數(shù)據(jù)存儲模式的異構(gòu),由于各異構(gòu)的系統(tǒng)平臺實際上都支持互聯(lián)網(wǎng)協(xié)議,數(shù)據(jù)存儲模式的異構(gòu)是計算機(jī)系統(tǒng)間的主要異構(gòu);而在人一端,既有人們使用的自然語言各異,也有不同的人(尤其是不同專業(yè)領(lǐng)域的人)對同一概念及關(guān)系的理解各異,從當(dāng)前的實踐來看,后者即不同領(lǐng)域的人與人之間的理解異構(gòu)是制約商業(yè)信息系統(tǒng)應(yīng)用的主要異構(gòu)。
本體能否讓系統(tǒng)和人共同理解,從根本上說可分解為兩方面:(1)馮·諾依曼計算機(jī)能否處理非結(jié)構(gòu)化問題;(2)形式系統(tǒng)能否表述人所有的知識。理想的情況下,只要其中的一個方面能滿足,我們就能構(gòu)建出形式化的或者非形式化的人機(jī)共同理解的本體,并解決所有的知識處理問題。盡管有些人相信這兩方面都能實現(xiàn),但就目前來說,事實對兩方面的回復(fù)都是否定的;當(dāng)前人們所廣泛使用的處理方法是使用形式系統(tǒng)描述知識,隨著Web的發(fā)展,計算機(jī)系統(tǒng)間的相互理解性已經(jīng)不再是大問題,關(guān)鍵的問題是所采用的形式系統(tǒng)能在多大程度上被人們理解并被人們借以表述出頭腦中的知識。
當(dāng)前的研究主要集中在構(gòu)建可集成異構(gòu)數(shù)據(jù)源、并可自由進(jìn)化的本體模型上。這些研究本身不涉及是信息資源管理還是知識管理的管理戰(zhàn)略問題,它們在不同的管理戰(zhàn)略下使用;語義信息處理提供了知識管理的技術(shù)基礎(chǔ),但知識管理真正關(guān)心的是本體工程是否集成了能解決實際問題的多領(lǐng)域綜合知識,而不是知識是否可以用本體來表示和集成。
一個與人們的理解異構(gòu)關(guān)系密切的問題便是隱性知識的顯性化。本體表述的是共享的概念及概念間的關(guān)系,但隱性知識并不是使用概念關(guān)系來刻畫的;另外,顯性知識是否就全部能夠用本體來描述呢?目前的答案是否定的。用一組定義精確的概念及概念間的關(guān)系來表述隱性知識,我們也可以稱之為隱性知識的本體化,是同時實現(xiàn)隱性知識顯性化與知識的計算機(jī)表述;但這在目前并不能處理所有的知識。
3.3本體與隱性知識的顯性化
關(guān)于隱性知識的顯性化,存在可轉(zhuǎn)化論與不可轉(zhuǎn)化論兩種對立的觀點。不可轉(zhuǎn)化論者認(rèn)為隱性知識不可被轉(zhuǎn)化為顯性知識,但可以度量每個人的隱性知識優(yōu)勢;可轉(zhuǎn)化論則認(rèn)為這種轉(zhuǎn)化是可能,他們最重要的成果是組織知識創(chuàng)新動態(tài)理論,指出組織知識創(chuàng)新是社會化、外化、綜合化、內(nèi)化等4種知識轉(zhuǎn)化模式之間相互轉(zhuǎn)化的螺旋上升過程。無論是可轉(zhuǎn)化論還是不可轉(zhuǎn)化論,都強(qiáng)調(diào)人們主要的知識是沒有表達(dá)出來的知識,不可轉(zhuǎn)化論實際上也沒有在能否轉(zhuǎn)化這個問題上做過多的爭執(zhí),我們完全可以將它作為隱性知識的測度理論來使用。
當(dāng)前的研究集中在顯性知識的編碼方面,這嚴(yán)格地說包括本體研究,本體表述的是共享的形式化的概念,自然也是顯性知識。但從哲學(xué)的角度來看,本體是世界本原,包括精神的本原,隱性知識的本原也被概括在內(nèi);關(guān)于隱性知識是否可以被顯性化的兩種對立觀點,實際上成了可知論與不可知論的對立;可以認(rèn)為5個本體建模原語足以描述出世界的本原,隱性知識在現(xiàn)實條件下能否被顯性化,取決于所使用的本體工程方法能否發(fā)現(xiàn)相應(yīng)的隱性知識;由于人類不可知的范圍總比已知的范圍大,而人們未表達(dá)的知識總比表達(dá)了的知識多,本體的建模方法必須是發(fā)展的。
無論在哪一個領(lǐng)域內(nèi),構(gòu)建出的本體都不可能是絕對完備的,這意味著本體的每個層次(包括元本體)都需要不斷發(fā)展。但是,人們未得以表達(dá)的隱性知識中,總有一部分是可以通過現(xiàn)有本體來表達(dá)的,這意味著本體在歷史的范圍內(nèi)有幫助人們表述隱性知識的潛質(zhì)。但本體這一潛質(zhì)要在一定的環(huán)境下才能得以發(fā)揮,這個環(huán)境包括知識產(chǎn)權(quán)制度與知識創(chuàng)新及共享激勵機(jī)制、消除了數(shù)據(jù)異構(gòu)性的語義信息交流平臺、高素質(zhì)的知識工程師與良好的工程管理、輕松活躍的組織文化環(huán)境等等;本體在削弱人們理解異構(gòu)及隱性知識顯性化上應(yīng)用的成效,很大程度上取決于應(yīng)用的社會環(huán)境。
4 結(jié)論
當(dāng)前比較引人關(guān)注的是本體在NKI(國家知識基礎(chǔ)設(shè)施)建設(shè)中的應(yīng)用;當(dāng)前CNKI(中國知識基礎(chǔ)設(shè)施)完成的主要是各種文獻(xiàn)資料數(shù)據(jù)庫(比如中國期刊全文數(shù)據(jù)庫、學(xué)位論文數(shù)據(jù)庫等等)的建設(shè),只提供資料的檢索,并不能夠提供知識的分析;可供計算機(jī)自動分析的大型知識庫的建設(shè)必須借助本體。任何領(lǐng)域的本體庫建設(shè)都是一項浩大的工程,且由于知識的可無限復(fù)制性特征,高質(zhì)量的公共知識本體庫對企業(yè)開發(fā)面向商業(yè)應(yīng)用的知識型系統(tǒng)意義重大,政府等公共部門在知識經(jīng)濟(jì)發(fā)展中應(yīng)當(dāng)起主導(dǎo)作用。
主要參考文獻(xiàn)
[1] Studer R,Benjamins V R,F(xiàn)ensel D.Knowledge Engineering、Principles and Methods.Data and Knowledge Engineering,1998,25(12):16l-197.
[2] J Heflin J Hendler.A portrait of the semantic web in action.IEEE Intelligent Systems,2001,116(3):54-59.
[3] W. Swartout.Future directions in knowledge based systems.ACM Computing Surveys, 1996,(11):28.
[4] 周竺,孫愛英.知識管理研究綜述[J].中南財經(jīng)政法大學(xué)學(xué)報,2005,(6):28-33.
[5] Wiig KarlM.Knowledge Management Foundationions:Thinking about Thinking-How People and Organizations Create、Represent、and Use Knowledge.Arlington,TX: Scheme Press,1993,164-165.