張春友 閆偉 吳曉強(qiáng) 郝瑞參
摘 要: 數(shù)字資源服務(wù)是現(xiàn)代化圖書(shū)館提供的重要服務(wù),數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)是圖書(shū)館改善數(shù)字資源的基礎(chǔ)。針對(duì)現(xiàn)有數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)方法存在的不足,提出一種新的基于區(qū)間數(shù)支持向量回歸機(jī)的圖書(shū)館數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)方法。在構(gòu)建數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系的基礎(chǔ)上,建立了基于區(qū)間數(shù)支持向量回歸機(jī)的圖書(shū)館數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)模型。仿真結(jié)果表明, 所建立的評(píng)價(jià)模型是合理有效的,并且具有較強(qiáng)的泛化能力。
關(guān)鍵詞: 圖書(shū)館; 數(shù)字資源; 服務(wù)績(jī)效; 區(qū)間數(shù); 支持向量回歸機(jī); 泛化能力
中圖分類(lèi)號(hào): TN919?34; TP301.6 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)22?0021?04
Abstract: Digital resource service is an important service provided by modern library. The performance evaluation of digital resource service is a foundation for improving digital resources of the library. In allusion to the shortcomings of the existing digital resource service performance evaluation methods, a new performance evaluation method based on interval numbers and support vector regression is proposed for the digital resource service of the library. On the basis of constructing the performance evaluation index system for the digital resource service, a performance evaluation model based on interval numbers and support vector regression is established for the digital resource service of the library. The simulation results show that the established evaluation model is reasonable, effective, and has a strong generalization capability.
Keywords: library; digital resource; service performance; interval number; support vector regression; generalization capability
在計(jì)算機(jī)、網(wǎng)絡(luò)技術(shù)飛速發(fā)展的大背景下,具有種類(lèi)繁多、信息量大、存儲(chǔ)便捷等諸多優(yōu)勢(shì)的數(shù)字資源逐漸成為人們獲取信息的重要渠道。圖書(shū)館數(shù)字資源建設(shè)的優(yōu)劣直接影響圖書(shū)館的服務(wù)水平和層次,已成為圖書(shū)館建設(shè)的關(guān)鍵問(wèn)題之一。如何客觀評(píng)價(jià)數(shù)字資源的建設(shè)情況,如何科學(xué)衡量數(shù)字資源服務(wù)的優(yōu)劣,如何解決數(shù)字資源種類(lèi)繁多與經(jīng)費(fèi)有限的矛盾,都需開(kāi)展數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)問(wèn)題的研究。目前,數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)問(wèn)題已成為圖書(shū)館界的研究熱點(diǎn)。很多學(xué)者在評(píng)價(jià)指標(biāo)體系、評(píng)價(jià)方法、評(píng)價(jià)模型等方面開(kāi)展了深入的研究。文獻(xiàn)[1]采用改進(jìn)的層次分析法對(duì)數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系進(jìn)行了研究;文獻(xiàn)[2]提出基于擬熵權(quán)模糊綜合評(píng)價(jià)的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)方法;文獻(xiàn)[3]采用模糊多屬性決策方法對(duì)高校圖書(shū)館電子資源服務(wù)績(jī)效評(píng)價(jià)問(wèn)題進(jìn)行了研究;文獻(xiàn)[4]基于模糊語(yǔ)義法研究了電子資源服務(wù)績(jī)效評(píng)價(jià)問(wèn)題;文獻(xiàn)[5]采用模糊神經(jīng)網(wǎng)絡(luò)方法構(gòu)建了數(shù)字資源服務(wù)績(jī)效的智能評(píng)價(jià)模型?,F(xiàn)有研究方法中均需計(jì)算指標(biāo)權(quán)重,但數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)繁多,指標(biāo)權(quán)重計(jì)算復(fù)雜且主觀性較大。雖然文獻(xiàn)[5]提出了智能評(píng)價(jià)模型,取得了較好的預(yù)測(cè)效果,但神經(jīng)網(wǎng)絡(luò)方法存在收斂速度慢、學(xué)習(xí)效率低、網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜和泛化能力弱等問(wèn)題。支持向量回歸機(jī)(Support Vector Regression,SVR)是SVM在解決回歸問(wèn)題方面的具體應(yīng)用,在各種預(yù)測(cè)領(lǐng)域表現(xiàn)出了較好的能力,支持向量機(jī)基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論,普遍認(rèn)為其泛化能力要比神經(jīng)網(wǎng)絡(luò)的強(qiáng)。此外,數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)問(wèn)題具有確定性評(píng)價(jià),而用區(qū)間數(shù)表示不確定性更加符合思維習(xí)慣。鑒于此,本文擬采用區(qū)間數(shù)和SVR理論相結(jié)合的方法對(duì)數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)問(wèn)題進(jìn)行研究,以期為數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)問(wèn)題提供一種新的智能評(píng)價(jià)方法。
構(gòu)建一個(gè)科學(xué)有效的圖書(shū)館數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系,是優(yōu)化發(fā)展圖書(shū)館數(shù)字資源、提高數(shù)字資源服務(wù)質(zhì)量效益的關(guān)鍵。和媛媛等人基于用戶(hù)滿(mǎn)意度,建立了以數(shù)據(jù)庫(kù)內(nèi)容、檢索系統(tǒng)及功能和數(shù)據(jù)庫(kù)利用情況為一級(jí)指標(biāo)的電子資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系[3];隸屬于美國(guó)研究圖書(shū)館協(xié)會(huì)(ARL)的統(tǒng)計(jì)和測(cè)度委員會(huì)于2000年開(kāi)始啟動(dòng)的數(shù)字資源評(píng)估項(xiàng)目中,將指標(biāo)體系分為網(wǎng)絡(luò)統(tǒng)計(jì)和績(jī)效統(tǒng)計(jì)兩部分,其中網(wǎng)絡(luò)統(tǒng)計(jì)指標(biāo)包含用戶(hù)可使用的數(shù)字資源、網(wǎng)絡(luò)資源的使用、網(wǎng)絡(luò)資源與相關(guān)設(shè)施的花費(fèi)和圖書(shū)館數(shù)字化工作四類(lèi)一級(jí)指標(biāo);梁冬瑩等人參照美國(guó)研究圖書(shū)協(xié)會(huì)ARL E?Metrics項(xiàng)目推薦的高校圖書(shū)館數(shù)字資源統(tǒng)計(jì)和測(cè)評(píng)數(shù)據(jù)指標(biāo)的體系結(jié)構(gòu)的基礎(chǔ)上,結(jié)合我國(guó)數(shù)字資源使用的實(shí)際情況和相關(guān)研究成果,構(gòu)建了我國(guó)高校圖書(shū)館數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系[1];周慶梅以文獻(xiàn)[1]構(gòu)建的指標(biāo)體系為基礎(chǔ),利用模糊神經(jīng)網(wǎng)絡(luò)方法開(kāi)展了圖書(shū)館數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)研究,取得了較好的效果。綜合上述研究成果中的評(píng)價(jià)指標(biāo)體系,本文構(gòu)建多層次的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系,如圖1所示。
近年來(lái),區(qū)間數(shù)理論在不確定數(shù)學(xué)規(guī)劃和不確定多屬性決策等領(lǐng)域得到了廣泛的應(yīng)用。區(qū)間數(shù)是指用區(qū)間表示的數(shù),具有不確定性,實(shí)際上是一個(gè)閉區(qū)間上所有實(shí)數(shù)所組成的集合。假設(shè)[a]是實(shí)數(shù)[x]的集合,[a=[a1,a2]={a1≤x≤a2,a1,a2∈R}],[a1]和[a2]是區(qū)間的下界和上界,則[a]定義為區(qū)間數(shù)。如果[a1≥0],那么[a]為正區(qū)間數(shù)。區(qū)間數(shù)的運(yùn)算法則一般與集合的運(yùn)算法則類(lèi)似,設(shè)[a=[a1,a2]]和[b=[b1,b2]]為兩個(gè)區(qū)間數(shù),[k≥0],則區(qū)間數(shù)的運(yùn)算法則為[6]:
核函數(shù)[K(x,y)]的形式有多種,常用的有徑向基核函數(shù)、多項(xiàng)式核函數(shù)、Sigmoid感知核函數(shù)和多二次曲面核函數(shù)等。
通過(guò)數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系的建立以及對(duì)區(qū)間數(shù)和支持向量回歸機(jī)模型原理的介紹,構(gòu)建基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)模型,模型的具體實(shí)現(xiàn)步驟如下:
1) 建立圖書(shū)館數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系,確定支持向量回歸機(jī)的輸入和輸出參數(shù)。依據(jù)前面的分析,本文選用評(píng)價(jià)指標(biāo)體系中數(shù)字資源內(nèi)容、供應(yīng)商提供服務(wù)、用戶(hù)使用情況、檢索系統(tǒng)和資源成本5個(gè)一級(jí)指標(biāo)下的29個(gè)二級(jí)指標(biāo)作為數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)模型的輸入?yún)?shù),數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)等級(jí)作為評(píng)價(jià)模型的輸出參數(shù)。
2) 為提高預(yù)測(cè)的準(zhǔn)確性,對(duì)實(shí)驗(yàn)樣本數(shù)據(jù)進(jìn)行規(guī)范化處理,使各指標(biāo)值均處于[0,1]區(qū)間內(nèi)。將“優(yōu)”“良”“一般”“較差”和“差”作為數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)等級(jí),各等級(jí)對(duì)應(yīng)的規(guī)范化區(qū)間數(shù)分別為[0.8,1.0],[0.6,0.8],[0.4,0.6],[0.2,0.4]和[0,0.2]。
3) 確定最佳的支持向量回歸機(jī)核函數(shù)。通過(guò)比較分析和測(cè)試,最終選擇應(yīng)用最為廣泛的徑向基核函數(shù),其表達(dá)式為:[K(x,y)=exp-x-y22σ2]。
4) 利用基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)模型對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,在訓(xùn)練過(guò)程中不斷調(diào)整徑向基核函數(shù)的寬度參數(shù)[σ],以及支持向量回歸機(jī)的正則化參數(shù)C和不敏感值[ε],直到訓(xùn)練誤差達(dá)到相應(yīng)的精度要求為止。
5) 通過(guò)校驗(yàn)樣本檢驗(yàn)預(yù)測(cè)模型的泛化能力。利用基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)模型對(duì)校驗(yàn)樣本進(jìn)行評(píng)價(jià)研究。
為了驗(yàn)證基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)模型的合理性和有效性,現(xiàn)以文獻(xiàn)[5]中的樣本數(shù)據(jù)為例進(jìn)行仿真實(shí)驗(yàn)驗(yàn)證。樣本數(shù)據(jù)中共有11個(gè)樣本,各指標(biāo)數(shù)值通過(guò)邀請(qǐng)多位專(zhuān)家進(jìn)行打分后取平均值獲得,打分過(guò)程中,評(píng)價(jià)等級(jí)為{“優(yōu)”,“良”,“一般”,“較差”,“差”},對(duì)應(yīng)的取值范圍為{[4,5],[3,4],[2,3],[1,2],[0,1]},具體的打分情況見(jiàn)表1。這里以前8個(gè)樣本為訓(xùn)練樣本,后3個(gè)樣本為校驗(yàn)樣本進(jìn)行仿真驗(yàn)證。文獻(xiàn)[5]采用模糊神經(jīng)網(wǎng)絡(luò)方法對(duì)這11個(gè)樣本進(jìn)行仿真分析,所得的前8個(gè)樣本的模糊綜合評(píng)價(jià)結(jié)果如表2所示。
利用Matlab 7.0編寫(xiě)基于區(qū)間數(shù)SVR的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)模型的仿真程序。通過(guò)多次仿真測(cè)試,得到SVR最優(yōu)的仿真參數(shù):[ε]=0.001,懲罰參數(shù)[C]=800,參數(shù)[σ=]10。在仿真過(guò)程中,首先將各指標(biāo)值進(jìn)行歸一化處理,然后將歸一化的29個(gè)指標(biāo)值作為SVR的輸入?yún)?shù),分別將區(qū)間數(shù)評(píng)價(jià)值的下界和上界作為輸出參數(shù)對(duì)8個(gè)訓(xùn)練樣本進(jìn)行訓(xùn)練仿真,訓(xùn)練效果較好,相對(duì)誤差均小于0.36%。為了驗(yàn)證評(píng)價(jià)模型的推廣能力,對(duì)后3組樣本進(jìn)行校驗(yàn)預(yù)測(cè),可得預(yù)測(cè)的區(qū)間數(shù)評(píng)價(jià)值分別為[0.564,0.764],[0.482,0.694]和[0.226,0.426],相應(yīng)的區(qū)間評(píng)價(jià)中值分別為0.652,0.588和0.326,分別對(duì)應(yīng)評(píng)價(jià)等級(jí)“好”“一般”和“較差”。該評(píng)價(jià)結(jié)果與文獻(xiàn)[5]所得的結(jié)論完全一致。由校驗(yàn)樣本的預(yù)測(cè)結(jié)果可知,本文所建立的評(píng)價(jià)模型預(yù)測(cè)效果較好,具有較強(qiáng)的推廣能力。文獻(xiàn)[5]采用模糊神經(jīng)網(wǎng)絡(luò)方法得到的評(píng)價(jià)結(jié)果為模糊數(shù)形式,難以對(duì)處于同一評(píng)價(jià)等級(jí)的樣本進(jìn)行有效排序,而利用本文所提出的評(píng)價(jià)模型所得到的區(qū)間數(shù)形式的評(píng)價(jià)結(jié)果,可以依據(jù)區(qū)間數(shù)的排序法則或區(qū)間數(shù)取中間值的方法對(duì)各個(gè)樣本進(jìn)行評(píng)價(jià)排序,評(píng)價(jià)結(jié)果更加科學(xué)合理。
科學(xué)合理地評(píng)價(jià)圖書(shū)館數(shù)字資源服務(wù)績(jī)效水平,可以為圖書(shū)館提高數(shù)字資源服務(wù)能力和優(yōu)化數(shù)字資源建設(shè)策略提供理論依據(jù)和參考。本文基于構(gòu)建的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)指標(biāo)體系,采用區(qū)間數(shù)理論和支持向量回歸機(jī)相結(jié)合的方法建立了數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)模型。在此基礎(chǔ)上利用Matlab 7.0工具箱編寫(xiě)了評(píng)價(jià)模型的仿真程序。在將模糊評(píng)價(jià)結(jié)果轉(zhuǎn)化為區(qū)間數(shù)的基礎(chǔ)上,利用區(qū)間數(shù)的下界和上界分別對(duì)樣本進(jìn)行預(yù)測(cè),進(jìn)一步對(duì)得到的區(qū)間數(shù)形式的評(píng)價(jià)結(jié)果進(jìn)行分析。通過(guò)與文獻(xiàn)[5]的評(píng)價(jià)結(jié)果進(jìn)行對(duì)比分析,說(shuō)明本文提出的智能評(píng)價(jià)方法是合理有效的,為數(shù)字資源服務(wù)績(jī)效智能評(píng)價(jià)提供了新的思路,有助于圖書(shū)館提高數(shù)字資源服務(wù)質(zhì)量和水平。
參考文獻(xiàn)
[1] 梁冬瑩,周慶梅,王克奇.基于層次分析法的數(shù)字資源服務(wù)績(jī)效評(píng)價(jià)體系構(gòu)建[J].情報(bào)科學(xué),2013,31(1):78?81.
LIANG Dongying, ZHOU Qingmei, WANG Keqi. An improved AHP?based performance evaluation system of digital resources service [J]. Information science, 2013, 31(1): 78?81.
[2] 李迎迎,王煥景,鄭春厚.高校圖書(shū)館數(shù)字資源服務(wù)的擬熵權(quán)糊綜合評(píng)價(jià)[J].圖書(shū)館論壇,2014,34(5):71?78.
LI Yingying, WANG Huanjing, ZHENG Chunhou. The quasi?entropy weight fuzzy comprehensive evaluation of digital resources service in university library [J]. Library tribune, 2014, 34(5): 71?78.
[3] 和媛媛,鞏在武.基于模糊多屬性決策的高校圖書(shū)館電子資源服務(wù)績(jī)效評(píng)價(jià)研究[J].情報(bào)科學(xué),2011,29(3):412?415.
HE Yuanyuan, GONG Zaiwu. Study on the service evaluation of academic library electronic resources based on multi?attribute decision making [J]. Information science, 2011, 29(3): 412?415.
[4] 賀秀英,王曉文,呼翠俠.基于模糊語(yǔ)義法的高校圖書(shū)館電子資源績(jī)效評(píng)價(jià)研究[J].情報(bào)理論與實(shí)踐,2016,39(2):113?115.
HE Xiuying, WANG Xiaowen, HU Cuixia. Research on the performance evaluation of university library electronic resources based on fuzzy semantic method [J]. Information studies: theory & application, 2016, 39(2): 113?115.
[5] 周慶梅,王克奇.圖書(shū)館數(shù)字資源服務(wù)績(jī)效模糊神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)研究[J].情報(bào)科學(xué),2015,33(2):41?45.
ZHOU Qingmei, WANG Keqi. FBP based evaluation on performance of digital resource service of library [J]. Information science, 2015, 33(2): 41?45.
[6] 王根霞,王祖和,段德宏,等.基于區(qū)間數(shù)層次分析法的民用建筑太陽(yáng)能熱水系統(tǒng)評(píng)價(jià)[J].沈陽(yáng)建筑大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,28(5):897?903.
WANG Genxia, WANG Zuhe, DUAN Dehong, et al. Evaluation based on interval number analytic hierarchy process for solar water heating system of civil buildings [J]. Journal of Shenyang Jianzhu University (Natural science), 2012, 28(5): 897?903.
[7] 關(guān)山,聶鵬.L?M優(yōu)化算法BP網(wǎng)絡(luò)在刀具磨損量預(yù)測(cè)中的應(yīng)用[J].機(jī)床與液壓,2012,40(15):22?26.
GUAN Shan, NIE Peng. Application of improved L?M optimization algorithm BP neural network in tool wear prediction [J]. Machine tool & hydraulics, 2012, 40(15): 22?26.
[8] 侍紅巖,吳曉強(qiáng),張春友.基于支持向量回歸機(jī)的刀具壽命預(yù)測(cè)[J].工具技術(shù),2015,49(11):47?50.
SHI Hongyan, WU Xiaoqiang, ZHANG Chunyou. Prediction of cutting tool life based on support vector regression [J]. Tool engineering, 2015, 49(11): 47?50.
[9] 安文森,孫彥廣.一種新的支持向量回歸核函數(shù)構(gòu)建方法[J].信息與控制,2006,35(3):378?381.
AN Wensen, SUN Yanguang. A new method for constructing kernel function of support vector regression [J]. Information and control, 2006, 35(3): 378?381.
[10] 沈曉安.基于支持向量回歸機(jī)的反卷積技術(shù)[J].機(jī)床與液壓,2009,37(3):105?107.
SHEN Xiaoan. Study on deconvolution technique based on support vector regression [J]. Machine tool & hydraulics, 2009, 37(3): 105?107.