姜凱曦
(河海大學(xué)商學(xué)院,江蘇 南京,210098)
科學(xué)技術(shù)的發(fā)展往往依賴于知識創(chuàng)新,知識創(chuàng)新的前提是有一個完美的知識共享和傳播平臺,機構(gòu)知識庫應(yīng)運而生。機構(gòu)知識庫 (Institutional Repository, IR)就是一種基于機構(gòu)的系統(tǒng)和服務(wù),用以收集、組織、存儲、分享本機構(gòu)的知識資產(chǎn)。
基于社會網(wǎng)絡(luò)模型的專家推薦系統(tǒng)就是要通過構(gòu)建專家之間的關(guān)系網(wǎng)絡(luò)圖,分析用戶與專家之間的最短距離,并構(gòu)建相應(yīng)的推薦指標(biāo),來滿足用戶的多樣化需求。
通過以上的分析,針對傳統(tǒng)專家推薦系統(tǒng)的不足,在繼續(xù)選擇常用的專家推薦技術(shù),比如基于內(nèi)容的推薦等,作為推薦的基礎(chǔ),除此之外,本文構(gòu)建的系統(tǒng)具有更強的目的性,更全面的信息,以及以社會關(guān)系和專家作為推薦的依據(jù),使用戶更容易聯(lián)系到適合自己的專家。
首先,本文中用到的基礎(chǔ)數(shù)據(jù)庫包括,專家的Tag、專家文檔的Tag、專家自我描述信息、專家文檔信息。
專家的匹配是推薦的基礎(chǔ),本系統(tǒng)中,擬用“相關(guān)性”來作為專家匹配的度量,采用基于內(nèi)容的推薦技術(shù),并結(jié)合重名消歧算法,解決專家姓名非完全匹配和專家重名帶來的錯誤,取出相關(guān)性最高的N個專家作為推薦的備選。本文在進行相似度計算時,借鑒了傳統(tǒng)的計算方法,套用傳統(tǒng)的公式,進行了特征向量與輸入信息的相似度計算,得到所匹配的Tag的關(guān)聯(lián)Tag,以此擴充所需要查詢的Tag。
但是,傳統(tǒng)的計算方法,在計算文本特征項權(quán)重的時候,有不足之處——沒有考慮詞條位置對權(quán)重的影響。針對這個不足,本文在計算文本特征項權(quán)值時,改進了原有的計算公式,得到新的文本特征項權(quán)值計算公式如下:
上面已經(jīng)得到匹配的專家信息,進一步進行專家推薦時,主要是計算匹配專家的質(zhì)量指標(biāo):權(quán)威程度、互補程度、活躍程度,還有結(jié)構(gòu)指標(biāo):位置特征、可達性、親疏程度。這邊的研究比較成熟,比如親疏程度用六度空間理論可以分析,所以本文就不再多說。
首先,基于師生關(guān)系的網(wǎng)絡(luò)模型和基于同事關(guān)系的網(wǎng)絡(luò)模型,都很簡單,因為就兩種情況,要不有這層關(guān)系,要不就沒有,所以對這兩個關(guān)系的關(guān)聯(lián)強度的設(shè)置是:有這層關(guān)系,對應(yīng)位置上矩陣元素值為1;沒有關(guān)系,則值為0。
其次,基于合作關(guān)系的網(wǎng)絡(luò)模型,在對專家之間的合作關(guān)系強度值進行量化處理時,本文采用了論文貢獻因子合成法。假設(shè)每位專家對論文的貢獻都是相同的,那么兩位專家合作完成一篇論文的關(guān)系強度小于兩位專家合作完成多篇論文的關(guān)系強度,并且兩位專家合作完成一篇論文的關(guān)系強度大于多位專家合作完成一篇論文的關(guān)系強度?;谝陨系囊粋€假設(shè),可以得到兩個專家之間的合作關(guān)系強度計算公式:
最后,基于多重關(guān)系的網(wǎng)絡(luò)模型,多重關(guān)系包括上述的三類關(guān)系,此網(wǎng)絡(luò)模型的作用就是輔助專家推薦中的專家序列的形成,在通過相似度計算得到匹配專家集后,再按照專家的多重關(guān)系,將其他與某一位專家相關(guān)的專家的相似度分值按照某一設(shè)定規(guī)則傳遞給該專家,從而改變該專家的相似度值,對專家序列重新排序,最終使真正與該學(xué)科領(lǐng)域高度相關(guān)的專家排在前面。在處理這三種關(guān)系的關(guān)聯(lián)強度值時,要充分考慮三個關(guān)系的權(quán)重分配,還需要注意,在合并時,三個關(guān)系的關(guān)聯(lián)強度值必須處于同一數(shù)量級,計算公式如下:
在上一章,本文已經(jīng)對專家推薦系統(tǒng)構(gòu)建的目的和方案進行了說明,并依據(jù)專家推薦系統(tǒng)推薦專家的流程構(gòu)建了專家推薦系統(tǒng)的指標(biāo)體系和社會網(wǎng)絡(luò),在這個基礎(chǔ)上,我們對專家推薦系統(tǒng)的原型系統(tǒng)進行了總體設(shè)計。首先,根據(jù)Web應(yīng)用程序的特點,將專家推薦系統(tǒng)分為三層結(jié)構(gòu):用戶界面層、業(yè)務(wù)邏輯層和數(shù)據(jù)訪問層。其次,為滿足系統(tǒng)對可擴展性、可移植性和安全性等方面的要求,本系統(tǒng)采用J2EE構(gòu)架的核心思想,即MVC設(shè)計模式,將系統(tǒng)分為視圖、模型和控制器3個核心模塊,每個模塊的功能及系統(tǒng)的工作流程見圖4-1
圖4-1
在以上敘述的基礎(chǔ)上,下面可以設(shè)計出如下原型系統(tǒng)的功能模塊:
這個原型系統(tǒng)中,核心模塊為專家推薦模塊和社會網(wǎng)絡(luò)模塊。專家推薦模塊主要實現(xiàn)基于分類的專家推薦,基于主體的專家推薦,專家關(guān)系查找,專家信息查找這四個功能;社會網(wǎng)絡(luò)模塊,這個模塊的實現(xiàn)是基于Applet與Servlet技術(shù)的。Applet程序是一個經(jīng)過編譯的Java程序 ,它運行于客戶端的網(wǎng)頁之中,一般情況下以GUI的形式展現(xiàn)出來,能過完成接收用戶輸入、圖形顯示、聲音演奏等工作。Servlet是與Applet相對應(yīng)的技術(shù),只不過它運行在服務(wù)器端,本文將兩者結(jié)合,采用Http協(xié)議的通信方式,實現(xiàn)社會網(wǎng)絡(luò)的動態(tài)結(jié)構(gòu)。實現(xiàn)的社會網(wǎng)絡(luò)結(jié)構(gòu)包括以下四個方面:通用類庫、數(shù)據(jù)處理類庫、JUNG社會網(wǎng)絡(luò)圖類庫以及社會網(wǎng)絡(luò)控制類庫。其中,JUNG社會網(wǎng)絡(luò)圖類庫 ,負責(zé)接收到數(shù)據(jù)進行視圖映射、視覺轉(zhuǎn)化和視覺渲染,并實現(xiàn)最終社會關(guān)系網(wǎng)絡(luò)圖形的繪制。
到這里,我們可以說基于社會網(wǎng)絡(luò)模型的專家推薦系統(tǒng)的基礎(chǔ)工作已經(jīng)完成,下面是按照設(shè)計,運用計算機語言來實現(xiàn)這個系統(tǒng),所以下面就不再做過多的敘述。
針對機構(gòu)知識庫構(gòu)建過程中存在的問題,特別是隱性知識共享這個瓶頸問題,本文提出了基于社會網(wǎng)絡(luò)模型的專家推薦系統(tǒng)的構(gòu)建,重點研究了專家推薦指標(biāo)體系的構(gòu)建和社會網(wǎng)絡(luò)模型的簡歷,這為專家推薦原型系統(tǒng)的設(shè)計與實現(xiàn),奠定了基礎(chǔ)。希望本文的研究成果對機構(gòu)知識庫的研究能有所幫助。
[1]Raym Crow.The Case for Institutional Repositories:A SPARC Position Paper[J].ARL Bimonthly Report,2002(8)
[2]CARL.Institutional Repositories:Innovation in Scholarly Publishing,[2007-04-15].http://www.carlabrc.ca/projects
[3]朱麗雪.基于Dspace的機構(gòu)知識庫構(gòu)建[D].天津:天津師范大學(xué),2010
[4]王眾托.知識系統(tǒng)工程[M].北京:科學(xué)出版社,2004
[5]張星星,陳雪瓊.基于SNA的企業(yè)內(nèi)部團隊隱性知識共享的實證研究—以酒店業(yè)為例[J].北京第二外國語學(xué)院學(xué)報,2011,(7):51-57