孫達(dá)辰,金松根,周廣群
(牡丹江醫(yī)學(xué)院 圖書館,黑龍江 牡丹江 157011)
隨著圖書館電子資料與日俱增,電子資料越來越成為廣大用戶不可缺少的服務(wù)內(nèi)容,而且需求量不斷增加。如何不斷提高圖書館電子資料借閱服務(wù)的質(zhì)量,為這種服務(wù)建立一個(gè)科學(xué)可靠的服務(wù)質(zhì)量評(píng)價(jià)模型,是文中研究的內(nèi)容。依靠人工問卷調(diào)查方式進(jìn)行服務(wù)質(zhì)量評(píng)價(jià),費(fèi)時(shí)費(fèi)力,工作量大,且不可避免地存在誤差。文中在研究本館電子資料借閱服務(wù)情況的基礎(chǔ)上,對(duì)代表這種服務(wù)質(zhì)量的要素進(jìn)行量化,構(gòu)造了基于GRNN神經(jīng)網(wǎng)絡(luò)的圖書館電子資料借閱服務(wù)評(píng)價(jià)模型。
圖書館電子資料借閱服務(wù)要素主要包括館員的服務(wù)態(tài)度、服務(wù)效率和電子資料本身的質(zhì)量3個(gè)方面,這3個(gè)方面相促進(jìn)與限制,具體細(xì)化為以下內(nèi)容:1)服務(wù)態(tài)度包括耐心與細(xì)心程度兩項(xiàng);2)服務(wù)效率包括目標(biāo)電子資料的查找效率及相關(guān)電子資料的推薦兩項(xiàng);3)電子資料本身的質(zhì)量包括同一電子資料的數(shù)量、數(shù)據(jù)類型,電子資料種類與數(shù)量。其中,電子資料本身的質(zhì)量是服務(wù)能力的最終體現(xiàn),起到了很大的作用,在量化的時(shí)候占的分值要高一些。
神經(jīng)網(wǎng)絡(luò)也稱為人工神經(jīng)網(wǎng)絡(luò)(Artifical Neural Network,ANN),起源于對(duì)生理學(xué)和神經(jīng)學(xué)中有關(guān)神經(jīng)細(xì)胞計(jì)算本質(zhì)的模擬和演化的研究工作。就是一組相互連接的輸入輸出單元(人工神經(jīng)元),這些單元之間的每個(gè)連接都關(guān)聯(lián)一個(gè)權(quán)重值。
人工神經(jīng)元相當(dāng)于一個(gè)多輸入單輸出的非線性閾值器件,如圖1所示。
圖1 人工神經(jīng)元Fig.1 Artifical neural
這里的 X1,X2,…,Xn表示它的 N 個(gè)輸入;W1,W2,…,Wn表示與它相連的n個(gè)連接強(qiáng)度,其值稱為權(quán)值;∑Wi×Xi稱為激活值,表示這個(gè)人工神經(jīng)元的輸入總和,o表示這個(gè)人工神經(jīng)元的輸出;θ表示這個(gè)人工神經(jīng)元的閾值。如果輸入信號(hào)的加權(quán)和超過θ,則人工神經(jīng)元被激活。這樣,人工神經(jīng)元的輸出可描述為: o=f(∑Wi×Xi-θ)。
對(duì)于建立后的神經(jīng)網(wǎng)絡(luò),通過調(diào)整權(quán)重值來實(shí)現(xiàn)輸入樣本與其相應(yīng)類別的對(duì)應(yīng),這一過程主要是針對(duì)網(wǎng)絡(luò)內(nèi)部各個(gè)連接權(quán)重值的調(diào)整,而這一過程就是神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,也是網(wǎng)絡(luò)的訓(xùn)練過程。這一過程,使得神經(jīng)網(wǎng)絡(luò)能以一種新的方式對(duì)外部環(huán)境做出反應(yīng),使網(wǎng)絡(luò)能從外部環(huán)境中學(xué)習(xí)和在學(xué)習(xí)提高自身的性能,這是神經(jīng)網(wǎng)絡(luò)最有意義的性質(zhì)。
神經(jīng)網(wǎng)絡(luò)不同的連接方式形成了不同網(wǎng)絡(luò)結(jié)構(gòu),由于產(chǎn)生了不同的網(wǎng)絡(luò)性能;不同的網(wǎng)絡(luò)結(jié)構(gòu)相應(yīng)地需要不同的學(xué)習(xí)算法,也就是學(xué)習(xí)過程會(huì)有差別。學(xué)習(xí)算法是指針對(duì)學(xué)習(xí)問題的規(guī)則的集合,不同的學(xué)習(xí)算法對(duì)神經(jīng)元連接的調(diào)整表達(dá)式也有所不同。
模仿人的學(xué)習(xí)過程,神經(jīng)網(wǎng)絡(luò)的有兩種學(xué)習(xí)過程,可以相應(yīng)地分為兩種對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型,即有導(dǎo)師學(xué)習(xí)網(wǎng)絡(luò)、無導(dǎo)師學(xué)習(xí)網(wǎng)絡(luò)。有導(dǎo)師學(xué)習(xí)網(wǎng)絡(luò)是在有指導(dǎo)和考察的情況下進(jìn)行的,如果學(xué)完了沒有達(dá)到目標(biāo)要求,則還要繼續(xù)學(xué)習(xí)。無導(dǎo)師學(xué)習(xí)是靠學(xué)習(xí)或者說神經(jīng)網(wǎng)絡(luò)本身自行完成。無導(dǎo)師學(xué)習(xí)包括強(qiáng)化學(xué)習(xí)與無監(jiān)督學(xué)習(xí)或自組織學(xué)習(xí),在強(qiáng)化學(xué)習(xí)中,對(duì)于輸入輸出映射的學(xué)習(xí)通過與外界環(huán)境的連續(xù)作用最小化性能的標(biāo)量索引來完成的。在無監(jiān)督學(xué)習(xí)中沒有外界部導(dǎo)師或評(píng)價(jià)監(jiān)測學(xué)習(xí)過程,只是提供一個(gè)關(guān)于網(wǎng)絡(luò)學(xué)習(xí)表示方法質(zhì)量的測量尺度,依據(jù)這個(gè)尺度將網(wǎng)絡(luò)的可變參數(shù)進(jìn)行最優(yōu)化。
神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)就是對(duì)噪聲數(shù)據(jù)具有較好的適應(yīng)能力,并且對(duì)未知數(shù)據(jù)也具有較好的預(yù)測與分類能力,同時(shí)神經(jīng)網(wǎng)絡(luò)本身具有較好的并行性[1]。
徑向基神經(jīng)網(wǎng)絡(luò)包括兩層神經(jīng)元,第一層是由S1個(gè)徑向基神經(jīng)元組成的隱層,第二層是由S2個(gè)線性神經(jīng)元組成的輸出層。其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
徑向基神經(jīng)元具有多種不同的傳遞函數(shù),最常用的是高斯函數(shù)。徑向基神經(jīng)元傳遞函數(shù)的輸入是權(quán)值向量和輸入向量之間的向量距離與偏差b的乘積。徑向基神經(jīng)元的模型如圖3所示,圖中||dist||表示的是權(quán)值與輸入向量的點(diǎn)積。
圖2 徑向基神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Regularization network
廣義回歸神經(jīng)網(wǎng)絡(luò) (Generalregression Neuml Network,GRNN)具有訓(xùn)練過程不需迭代、人為調(diào)節(jié)的參數(shù)值只有一個(gè)閾值、學(xué)習(xí)速度較快等優(yōu)點(diǎn),獲得了較廣泛的應(yīng)運(yùn)[2]。GRNN神經(jīng)網(wǎng)絡(luò)是由一個(gè)徑向基層與一個(gè)特殊線性層構(gòu)成的神經(jīng)網(wǎng)絡(luò),通常被用來做函數(shù)逼近[3]。GRNN神經(jīng)網(wǎng)絡(luò)的模型如圖2所示。
圖3 徑向基網(wǎng)絡(luò)神經(jīng)元Fig.3 Reglarization neural
圖4 廣義回歸神經(jīng)網(wǎng)絡(luò)Fig.4 Geneml reg1arization neural network
廣義回歸神經(jīng)網(wǎng)絡(luò)在逼近能力、分類能力和學(xué)習(xí)速率上較BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)有著較強(qiáng)的優(yōu)勢,網(wǎng)絡(luò)最后收斂于樣本量集聚較多的優(yōu)化回歸面,并且在樣本數(shù)據(jù)缺乏時(shí),效果也較好,另外,該網(wǎng)絡(luò)還可以處理不穩(wěn)定的數(shù)據(jù)[1],所以,文中使用廣義回歸神經(jīng)網(wǎng)絡(luò)為圖書館電子資料借閱服務(wù)評(píng)價(jià)系統(tǒng)建立評(píng)價(jià)模型。
文中以2009年3月份到2011年7月份每月份的圖書館電子資料借閱服務(wù)的服務(wù)質(zhì)量問卷調(diào)查數(shù)據(jù)為原始數(shù)據(jù),并依據(jù)文中的分析進(jìn)行量化,得到最終所需要的試驗(yàn)數(shù)據(jù),部分?jǐn)?shù)據(jù)及其對(duì)應(yīng)服務(wù)質(zhì)量等級(jí)的如表1所示,其中服務(wù)質(zhì)量等級(jí)中:不合格為 0~0.59,合格為 0.60~0.69,良好為 0.70~0.79,優(yōu)秀為 0.80~1.00。
共有25個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)包括耐心程度、細(xì)心程度、目標(biāo)電子資料的查找效率、相關(guān)電子資料的推薦情況、同一電子資料的數(shù)量、數(shù)據(jù)類型和電子資料種類與數(shù)量7個(gè)屬性。這25個(gè)數(shù)據(jù)中前21個(gè)數(shù)據(jù)為訓(xùn)練樣本,后4個(gè)數(shù)據(jù)為檢驗(yàn)樣本。
由于每個(gè)數(shù)據(jù)包括耐心程度、細(xì)心程度、目標(biāo)電子資料的查找效率、相關(guān)電子資料的推薦情況、同一電子資料的數(shù)量、數(shù)據(jù)類型和電子資料種類與數(shù)量7個(gè)屬性,所以輸入樣本為具有7個(gè)屬性的向量;輸出層結(jié)點(diǎn)對(duì)現(xiàn)實(shí)中的服務(wù)質(zhì)量等級(jí),所以目標(biāo)樣本是具有一個(gè)屬性的樣本。還有一個(gè)重要的參數(shù)需要設(shè)置,這個(gè)參數(shù)為光滑因子,它對(duì)網(wǎng)絡(luò)性能具有較大影響,目前只能采取嘗試的方法才能獲得最佳的值。
本網(wǎng)絡(luò)模型在Matlab2008a環(huán)境中進(jìn)行構(gòu)建,依據(jù)前面的分析構(gòu)建網(wǎng)絡(luò)的代碼為:
P為輸入樣本數(shù)據(jù),它是具有7個(gè)屬性的向量;T為目標(biāo)樣本數(shù)據(jù),它具有一個(gè)屬性;i為光滑因子,在同樣的樣本集上,通過調(diào)整這個(gè)光滑因子,來比較本網(wǎng)絡(luò)的效果,通過不斷的調(diào)整來達(dá)到最佳的運(yùn)行效果。
將4個(gè)檢驗(yàn)數(shù)據(jù)對(duì)已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行檢驗(yàn),再把所得的結(jié)果與服務(wù)質(zhì)量等級(jí)對(duì)比,通過多次比較,當(dāng)光滑因子i為0.1時(shí),網(wǎng)絡(luò)的效果最為理想。
表1 服務(wù)質(zhì)量量化表Tab.1 Quantization table of service quality
文中以圖書館電子資料借閱服務(wù)的服務(wù)質(zhì)量問卷調(diào)查數(shù)據(jù)為原始數(shù)據(jù),依據(jù)GRNN神經(jīng)網(wǎng)絡(luò)自身的特點(diǎn),構(gòu)建了基于GRNN神經(jīng)網(wǎng)絡(luò)的圖書館電子資料借閱服務(wù)評(píng)價(jià)模型,對(duì)量化后的數(shù)據(jù)進(jìn)行計(jì)算,得到了良好的結(jié)果,這證明本評(píng)價(jià)模型可以在實(shí)際中使用。
[1]張德豐.MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:機(jī)械工業(yè)出版社,2009.
[2]黃崇珍,梁靜國.基于GRNN的海上鉆井平臺(tái)建造質(zhì)量預(yù)測研究[J].哈爾濱工程大學(xué)學(xué)報(bào),2009,30(3):339-342.
HUANG Chong-zhen,LIANC Jing-guo.Predicting construction quality of a marine drilling platform based on GRNN[J].Journa1 of Harbin Engineering University,2009,30(3):339-342.
[3]朱凱,王正林.精通MATLAB神經(jīng)網(wǎng)絡(luò)[M].北京:電子工業(yè)出版社,2010.
[4]劉世平.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[M].北京:高等教育出版,社2010.
[5]Watkins C.Learning from delayed rewards[D].Cambridge,England:King’s College,1989.
[6]徐麗娜.神經(jīng)網(wǎng)絡(luò)控制[M].北京:人民交通出版社,2002.