王 悅
(北京開放大學 商學院,北京 100081)
隨著信息技術的發(fā)展,基于人工智能的商業(yè)智能逐漸在企業(yè)知識管理范疇得到廣泛應用。人們越來越多地注重對于知識管理系統(tǒng)的內容和對象——即知識本身的分析,由此,出現(xiàn)了對于知識本體和分類以及元知識結構研究的熱潮。把本體的思想方法應用到知識管理系統(tǒng)本身的研究當中,分析知識管理的本體問題,對于深入把握知識管理的內在本質,以及企業(yè)知識管理系統(tǒng)的設計與實施,都具有非常重要的意義?;诖?,為構建企業(yè)知識管理系統(tǒng),文章分析了知識管理的本體,探討了知識元流程與本體開發(fā)過程,提出了基于知識管理本體的企業(yè)語義網(wǎng)框架及建立方法。
將本體的概念引入知識管理領域,目的是為人類對現(xiàn)實的知識建模提供所需的原料和基礎,即通過為事件、理念、行動、關系和行為提供一組顯式詞匯,為計算機賦予某種程度類似于人類的思考能力。具有這種表達能力的本體,稱作正式本體。除了這種嚴格語義意義上的正式本體以外,還有一類被稱作非正式本體,它們是一組有選擇的術語或標簽,用來表示某些話題或感興趣的領域。當非正式本體的成分是按照層級結構組織起來的時候,經(jīng)常被稱作是分類、目錄、主題-標題列表。
由于知識的特殊性質,人們可以從各種不同的視角對知識本身進行審視,知識可以體現(xiàn)為心靈、行為、符號、數(shù)字、視覺、聲音以及其他一切可能的感官方式。知識具有多種不同的屬性,包括模式、類型、指向性、適應性等?;谶@種復雜性,有學者提出了被稱作場景視圖的本體構建方式。按照這種方式,主體從事知識管理的活動可以視作一系列場景的集合,這些在結構、功能和目標上各不相同的場景,在不同的條件下,可以實現(xiàn)不同的知識管理任務。本體作為知識操縱活動的構造和配置方式,采用一切可用的知識處理手段,操縱一切可以獲得的知識資源,并且受限于知識管理的各種影響因素,最終導致主體的學習和推斷活動。當出現(xiàn)新的知識管理需求和機會時,知識管理場景啟動;當需求得到滿足或機會中止時,場景結束。這種知識管理場景可以用圖1表示。
圖1 知識管理場景的架構
從圖1可以看出,知識管理場景包括三種主要成分:知識操縱活動、知識資源、知識管理的影響。這三種成分的含義和作用分別如下。
對知識資源所蘊含的一切可用知識進行加工處理的活動。知識處理者既可以是掌握知識處理技能的人,也可以是計算機系統(tǒng),或兩者的結合。知識管理中出現(xiàn)的知識操縱活動分為兩個層次,即基本的知識操縱活動和次級活動,如表1所示。
表1 知識管理本體中的知識操縱活動成分
一個組織的資源是價值、收入、財富或經(jīng)濟的來源。傳統(tǒng)意義上的資源包括財務資源、人力資源、原材料資源。知識資產(chǎn)可以創(chuàng)造和維系企業(yè)的競爭優(yōu)勢,因此知識也是組織的一種重要資源。某些知識資源可以獨立于主體的存在而存在,另一些知識資源則依存于特定的主體。在知識管理本體中,可以獨立于主體而存在的知識資源稱作內容,依存于特定主體的知識資源稱作圖式。作為內容而存在的知識資源可再分為兩類,即參與者的知識和知識構件。圖式包括組織的文化、架構、戰(zhàn)略和目標。
知識管理的影響是指支配和控制知識操縱活動的影響因素,包括三類:管理的影響、資源的影響和環(huán)境的影響。管理的影響可以再劃分為知識領導、知識協(xié)調、知識控制、知識計量;資源的影響既可以來自知識資源,也可以來自財務、人力、原材料等傳統(tǒng)資源;環(huán)境的影響分成六類:競爭、風尚、市場、技術、時間以及GEPSE綜合因素。
文章將上述知識管理本體的三個成分進行綜合,得到了這一本體的基本架構。
所謂基于本體的知識管理系統(tǒng),實際上就是應用智能化技術對知識本身進行規(guī)范化、結構化處理,從而能夠有效地將各種不同來源、不同形態(tài)、不同載體的知識素材,包括蘊含在人腦中和企業(yè)組織結構中的各類隱性知識,外化成符合系統(tǒng)統(tǒng)一規(guī)范的顯性知識,再通過智能化的用戶建模、任務建模和流程建模等手段,把這種顯性知識按照個性化匹配的原則,提供給知識用戶。在知識管理的理論研究和實際應用當中,本體的思想和方法,主要是應用在對知識管理系統(tǒng)的設計、評價和實施方面,即對知識管理系統(tǒng)的操縱對象——知識本身進行結構化和規(guī)范化。在一個已經(jīng)部署完成的知識管理系統(tǒng)中,循環(huán)的知識流程由以下四個環(huán)節(jié)組成:①知識創(chuàng)造和/或導入:按照企業(yè)的規(guī)范建立或轉化所需要的知識;②知識采集:知識項按照其重要性和關聯(lián)程度被知識管理系統(tǒng)所采集,這種重要性和關聯(lián)程度由企業(yè)的規(guī)范詞匯所表達;③知識檢索和訪問:知識工作者提出“簡單”請求獲取這些知識;④知識使用:知識工作者按照自己所處情境,對知識做進一步處理并投入使用。
構造本體的目的在于以一種通用的方式采集域知識,并且對于域提供一種普遍認可的理解,使其可以在不同的應用和群組中共享和再利用。不同于已經(jīng)部署完成的知識管理系統(tǒng)中的一般知識流程,知識元流程是指企業(yè)導入知識管理的階段,本體的構建和維護就是在這個階段完成的,這就是所謂基于本體的知識管理系統(tǒng)的實質所在。在知識元流程當中,也就是在知識管理系統(tǒng)的導入階段,要用一種規(guī)范化的手段構建出用于識別知識項的框架,即本體。本體構建的過程即知識元流程,包括五個階段,如圖2所示。
圖2 知識元流程與本體開發(fā)過程
隨著人工智能技術,特別是語義網(wǎng)技術日益普遍地應用到知識管理當中,在知識管理中應用本體的方法,從技術和應用層面都顯示出巨大的優(yōu)勢。對研究成果綜合歸納,可以把知識管理系統(tǒng)中對知識管理軟件和本體的要求歸納為三點:一是盡量簡化前期的知識工程;二是將知識管理與日常工作和工具緊密結合;三是具備處理異質化信息的能力。在對知識管理系統(tǒng)中的信息技術和應用軟件進行詳細分析之后,總結出本體在知識管理系統(tǒng)中的作用和價值:①本體可以支持知識搜尋、檢索和個性化;②本體作為信息收集、整合與組織的基礎;③本體可以支持知識可視化。
可以看出本體方法在現(xiàn)代知識管理系統(tǒng)中的核心地位。本體的開發(fā)和應用是知識管理系統(tǒng)從機械式的文檔管理(即知識容器)轉化為智能化的內容管理(即知識項)的關鍵樞紐。
一切知識管理活動的最終目標,即是通過獲取、整理、整合各種形態(tài)、各種來源的知識,使得組織內的成員可以很容易地共享和應用組織中的關鍵知識和信息。這種資本化、顯性化的知識和信息也被稱作企業(yè)記憶。當前,構建和管理企業(yè)記憶的最重要的一種手段就是企業(yè)語義網(wǎng)。
企業(yè)記憶或知識庫當中的知識,主要是以自然語言構成的文檔形態(tài)存在,因此就必須在作為非正式知識形態(tài)的文檔和用正式語言表達的知識庫/本體之間建立起規(guī)范的連接,使得文檔的潛在語義顯性化,并可以通過基于知識庫的推理方法改善對文檔的檢索過程。正是在這樣的背景下,企業(yè)語義網(wǎng)技術尤為重要。Web應該被設計成一個信息空間,不僅可用于人與人之間的溝通,而且機器也可以參與其中并為人提供幫助。要實現(xiàn)這一點,最大的障礙是Web上的大量原本是設計成供人消費的信息,其數(shù)據(jù)的結構對于瀏覽Web的機器人而言是不清晰的。語義網(wǎng)的方法可以開發(fā)出供機器處理的、表達信息的語言。因此,要建立起一個具有強大的機器推理能力的Web。另外,語義網(wǎng)絡還可以為社交網(wǎng)絡提供技術支撐,特別是可以極大地增強那些地理上遠距離分散的人們之間的互動與合作。
基于語義網(wǎng)技術的企業(yè)知識管理系統(tǒng),包括三個概念上的要素:企業(yè)知識資源、本體、知識資源的語義標注:①資源:可以是各種格式的Web文檔,如HTML、XML,也可以對應于人、服務或軟件;②本體:描述企業(yè)內某個或多個社群所共享的詞匯表;③資源的語義標注:基于本體的文檔內容、人員技能或軟件/服務/程序的特性,可以在企業(yè)Web或Intranet/Extranet上傳播。
文章提出了基于這三個要素的企業(yè)語義網(wǎng)架構,如圖3所示。相對于整個互聯(lián)網(wǎng)的語義分析,企業(yè)語義網(wǎng)具有明確的邏輯邊界和管理邊界,因此更容易建立起本體和標注體系,更容易驗證信息資源的效度和信度,可以更精確地為用戶建模,知識/文檔庫和本體的規(guī)模也更小。
圖3 企業(yè)語義網(wǎng)的架構
企業(yè)語義網(wǎng)由四種要素組成。
3.2.1 行為者
企業(yè)語義網(wǎng)構建和使用過程中的三種主要角色是:知識的擁有者、使用者和標注者。①知識擁有者:也稱為知識作者,是指企業(yè)記憶或知識庫當中文檔、軟件、服務、程序的編織者;②知識使用者:語義標注的目標是為檢索知識資源的用戶提供更精準的服務,包括向這些用戶主動傳播知識;③知識標注者:既可以是知識擁有者,也可以是知識中介,他們必須按照本體的規(guī)范對知識資源進行標注,供知識用戶檢索、接收和使用。
3.2.2 企業(yè)知識資源
知識資源可以是以多種形式存儲的文檔,也可以是人、服務、軟件、程序、數(shù)據(jù)庫、本體、知識庫、案例庫等。經(jīng)過顆粒度選擇,知識資源的要素既可以是整個文檔,也可以是文檔的部分元素。知識庫中的資源既可以來自組織內部,也可以來自組織外部。
3.2.3 企業(yè)知識本體
本體是域共享的概念化的明確規(guī)則。企業(yè)知識本體包括六個基本元素:①根概念:主語義軸或基本視點;②概念:每個用自然語言給出非正式定義的概念,以及這個概念的屬性,以及它與其他概念之間的關系都可以用內涵的方式給出正式定義;③本體的結構:用包含鏈接建構概念層級,部分鏈接建構概念整體的結構;④關系:概念之間的關系;⑤實例:概念作為本體一部分的實例;⑥公理:概念與關系的公理。
在企業(yè)語義網(wǎng)當中,本體既可以作為組織記憶或企業(yè)知識庫的組成部分,同時也可以作為組織記憶的索引參考和語義標注,用以改善資源的檢索過程,還可以作為程序或軟件之間交換信息的基礎。本體的構建方法有三類:①人工構建過程:收集數(shù)據(jù)和情境,術語選擇與描述,在概念之間建立聯(lián)系,專家驗證,以本體呈現(xiàn)語言實現(xiàn)形式化;②根據(jù)文本資源半自動構建:設立語料庫,通過語言規(guī)范化和概念建模進行語言分析形式化;③根據(jù)結構化數(shù)據(jù)庫半自動構建:通過翻譯算法將結構化數(shù)據(jù)庫翻譯成由標準化呈現(xiàn)方式所表達的本體。
3.2.4 語義標注
基于本體的語義標注,與傳統(tǒng)的信息檢索當中的索引所起的作用是相似的,但概念的層級、關系的呈現(xiàn)以及公理的運用提供了一定的推理能力,使得本體指導下的信息檢索具有更高的相關性。通過語義標注,可以表達出“概念、概念實例以及概念之間或概念實例之間的關系”,因此標注可以理解為是一種論證、示例和推斷等。語義標注的主要工具是:①本體開發(fā)工具:通過對現(xiàn)有本體進行修訂創(chuàng)造新的本體;②標注工具:實現(xiàn)人工或半自動的方式進行資源標注;③基于本體的信息檢索工具:使用語義標注對資源進行檢索,如語義搜索引擎;④多代理平臺:可以對分布式的企業(yè)語義網(wǎng)進行處理。
基于以上分析,在企業(yè)語義網(wǎng)架構基礎上,文章提出了一套構建、呈現(xiàn)、使用和進化企業(yè)語義網(wǎng)的完整方法和過程, 如圖4所示。
圖4 企業(yè)語義網(wǎng)的構建
時代的發(fā)展決定了企業(yè)知識管理的必然性,而知識管理又必然要求企業(yè)建立自己的知識管理系統(tǒng)。知識管理系統(tǒng)是企業(yè)今后進行有效管理的主流方向。然而,知識管理的實施是一項系統(tǒng)工程,目前,它的發(fā)展還處于初步階段,還有許多技術性和非技術性的難題需要解決,有待于進一步的研究和探索。因此,有必要從各個方面進行努力,為知識管理的有效實施以及知識管理系統(tǒng)的構建和完善尋求有效的解決途徑。