?
基于SPSS統(tǒng)計(jì)分析的高校圖書館圖書最優(yōu)復(fù)本率研究——以北京工商大學(xué)圖書館為例
宰姣姣
(北京工商大學(xué)圖書館,北京100048)
[摘要]為了合理配置高校圖書館的圖書復(fù)本量,本文借助SPSS軟件中的相關(guān)分析和回歸分析方法,實(shí)現(xiàn)了圖書復(fù)本率主要影響因子的選定,構(gòu)建了復(fù)本率的線性回歸模型。同時(shí),以北京工商大學(xué)圖書館經(jīng)濟(jì)類圖書為例,驗(yàn)證了復(fù)本率的線性回歸模型,預(yù)測(cè)了該校2014—2015學(xué)年經(jīng)濟(jì)類圖書復(fù)本率,為該校圖書采購部門提供采購借鑒。
[關(guān)鍵詞]高校圖書館;復(fù)本率;相關(guān)分析;線性回歸;SPSS
復(fù)本率作為衡量讀者需求程度的指標(biāo),直接影響圖書館藏書的利用情況和讀者服務(wù)工作的質(zhì)量。在經(jīng)費(fèi)一定的情況下,過低的復(fù)本率會(huì)增加讀者的等待時(shí)間,提高圖書的拒借率;過高的復(fù)本率則會(huì)縮小圖書館藏書范圍,延長圖書的滯架時(shí)間[1]。因此,如何合理確定復(fù)本率成為我國高校圖書館館藏建設(shè)中亟待解決的難題。然而,在現(xiàn)有高校圖書館的運(yùn)行過程中,圖書復(fù)本率通常只是根據(jù)圖書館工作人員的相關(guān)工作經(jīng)驗(yàn)進(jìn)行確定,并未根據(jù)高校圖書館的性質(zhì)、服務(wù)對(duì)象和館藏范圍以及圖書館的購書經(jīng)費(fèi)、讀者數(shù)量和流通情況等因素進(jìn)行定性定量分析。因此,本文以北京工商大學(xué)圖書館經(jīng)濟(jì)類圖書為例,借助于SPSS統(tǒng)計(jì)軟件,首先利用相關(guān)分析確定復(fù)本率的主要影響因子,并利用回歸分析進(jìn)一步探求這些相關(guān)因素與復(fù)本率之間的關(guān)系。
1.1確定主要影響因子
影響圖書復(fù)本率的因素頗多,如:購買經(jīng)費(fèi)、圖書價(jià)格、采購的品種數(shù)、讀者需求、品質(zhì)指數(shù)、科等級(jí)、學(xué)術(shù)水平、生命周期、需求程度、作者知名度、出版社知名度、價(jià)格水平等[2]。但這些指標(biāo)難以量化,進(jìn)而影響數(shù)學(xué)模型的建立。因此,本文通過對(duì)高校圖書館的相關(guān)流通數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,選取圖書借閱冊(cè)數(shù)、新書總冊(cè)數(shù)、新書種數(shù)以及總藏書冊(cè)數(shù)等數(shù)據(jù),結(jié)合相關(guān)性分析方法確定其與新書復(fù)本率之間的線性關(guān)系,并最終選定影響高校圖書復(fù)本率的主要影響因子。
相關(guān)分析是利用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)衡量變量之間相關(guān)程度及相關(guān)方向的統(tǒng)計(jì)分析方法[3]。本文主要以Pearson相關(guān)系數(shù)作為統(tǒng)計(jì)指標(biāo)來衡量各影響因子之間的關(guān)系。Pearson相關(guān)系數(shù)通常用r表示,其取值范圍為[-1,1],其中,當(dāng)r取值為正數(shù)時(shí),表示xi和yi兩變量之間為正相關(guān)關(guān)系,一個(gè)變量會(huì)隨著另一個(gè)變量的增加或減少呈現(xiàn)相同的趨勢(shì);當(dāng)r取值為負(fù)數(shù)時(shí),表示xi和yi兩變量之間為負(fù)相關(guān),一個(gè)變量會(huì)隨著另一個(gè)變量的增加或減少呈現(xiàn)相反的變化趨勢(shì);當(dāng)r取值為零時(shí),表示xi和yi兩變量之間不存在線性相關(guān)關(guān)系。另外,如果變量xi和yi之間為線性相關(guān)關(guān)系,則針對(duì)不同的r值,可以反映兩者之間線性相關(guān)的微弱關(guān)系,當(dāng)|r|<0.3時(shí),則兩者之間的線性相關(guān)關(guān)系微弱,近似為不相關(guān);當(dāng)0.3≤|r|<0.5時(shí),則兩者之間的線性相關(guān)關(guān)系較弱;而當(dāng)0.5<|r|<0.8則兩變量之間的線性相關(guān)度較顯著;當(dāng)|r|=1時(shí),表示變量xi和yi完全相關(guān)。
1.2預(yù)測(cè)復(fù)本率
通過上節(jié)相關(guān)分析確定對(duì)復(fù)本率產(chǎn)生影響的主要影響因子之后,還需要根據(jù)相關(guān)統(tǒng)計(jì)分析工具建立主要影響因子與復(fù)本率之間的線性回歸模型。本文主要采用SPSS中的線性回歸方法進(jìn)行分析。
在具體的線性回歸模型建立過程中,假設(shè)(xi1,xi2,…,xip;yi),i=1,2,…,n是變量(x1,x2,…,xp;y)的一組樣本數(shù)據(jù),則模型可表示為
其中:β0,β1,β2,…,βP為線性回歸系數(shù),εi為隨機(jī)誤差且εi~N(0,σ2)。
對(duì)于未知系數(shù)β0,β1,β2,…,βP,需要選用最小二乘法進(jìn)行估計(jì)。即:尋找估計(jì)值,…,使得公式1達(dá)到極小[4],即
同時(shí),根據(jù)SPSS獲取回歸方程顯著性檢驗(yàn)參數(shù)t值和其概率p值,通過對(duì)其概率p值和給定的顯著水平α進(jìn)行比較,確定回歸方程系數(shù)的顯著性。如果線性方程滿足顯著性檢驗(yàn),且每個(gè)系數(shù)都顯著不為0時(shí),則可以利用該線性方程進(jìn)行復(fù)本率預(yù)測(cè)。
在具體的復(fù)本率預(yù)測(cè)過程中,將相應(yīng)的預(yù)測(cè)變量代入線性回歸方程得:
對(duì)于預(yù)測(cè)問題,給定點(diǎn)估計(jì)的預(yù)測(cè)值后,為了得到更多與估計(jì)有關(guān)的信息,還應(yīng)該知道預(yù)測(cè)的精度[5]??梢宰C明:
從而可以求得置信水平為1-α的預(yù)測(cè)區(qū)間為:
其中:
(X為回歸方程的系數(shù)矩陣)。
2.1數(shù)據(jù)選擇
北京工商大學(xué)是北京市重點(diǎn)建設(shè)的以經(jīng)、管、工為主的多科性大學(xué),因此,合理配置F經(jīng)濟(jì)類(中圖法)圖書的復(fù)本率尤為重要,它是保障科研和教學(xué)所需文獻(xiàn)資源的前提,進(jìn)而影響著學(xué)校的發(fā)展方向。本文從金盤圖書館net集成系統(tǒng)中統(tǒng)計(jì)出:2004年至2014年的10個(gè)學(xué)年中,本館F類圖書的借閱冊(cè)數(shù)、新書總種數(shù)、新書總冊(cè)數(shù)和總藏書冊(cè)數(shù)作為研究對(duì)象(如表1所示)。
表1 北京工商大學(xué)圖書館F類圖書近10年來流通數(shù)據(jù)
2.2F類圖書的最優(yōu)復(fù)本率的預(yù)測(cè)
利用SPSS進(jìn)行簡單相關(guān)分析,分析結(jié)果如表2所示。從中可以看出,新書復(fù)本率與總藏書冊(cè)數(shù)的Pearson相關(guān)系數(shù)為-0.722,且相關(guān)系數(shù)右側(cè)帶一個(gè)星號(hào),表示在0.05的顯著水平下,兩影響因子線性相關(guān)關(guān)系顯著,且為負(fù)相關(guān);新書復(fù)本率與文獻(xiàn)利用率的Pearson相關(guān)系數(shù)為0.868,且相關(guān)系數(shù)右側(cè)帶兩個(gè)星號(hào),表示在0.01的顯著水平下,兩因子高度正線性相關(guān)。
確定主要影響因子后,以總藏書冊(cè)數(shù)和文獻(xiàn)利用率為自變量,通過他們之間的最優(yōu)線性組合對(duì)因變量新書復(fù)本率進(jìn)行預(yù)測(cè)或估計(jì),建立如下新書復(fù)本率的二元回歸模型:y=β0+β1x1+β2x2,其中變量x1表示文獻(xiàn)利用率,x2表示總藏書冊(cè)數(shù),變量y表示新書復(fù)本率。利用SPSS進(jìn)行回歸分析,得到如下結(jié)果。
表2 新書復(fù)本率與各影響因子相關(guān)分析結(jié)果
從回歸系數(shù)的顯著性檢驗(yàn)結(jié)果(如表3)可以看出,總藏書冊(cè)數(shù)的t值為1.318,其概率P值大于顯著性水平0.05,故自變量x2與因變量y之間不存在顯著的線性關(guān)系,應(yīng)剔除出回歸方程;文獻(xiàn)利用率的t值為3.155,其概率P值為0.016且小于顯著性水平0.05,故自變量x1與因變量y之間存在顯著的線性關(guān)系,應(yīng)保留在回歸方程中,其回歸系數(shù)為3.636;常數(shù)項(xiàng)的t值為2.962,其概率P值為0.021且小于顯著性水平0.05,故常數(shù)項(xiàng)同樣要保留在回歸方程中,其值為2.111。于是得到回歸方程如下:
表3 回歸系數(shù)表
X1—文獻(xiàn)利用率;X2—總藏書冊(cè)數(shù)
由表4可以知,新書復(fù)本率y的殘差介于-0.3091與0.48857之間,且均值為0,可見預(yù)測(cè)值與實(shí)際值之間差異較小,模型的擬合效果比較好。因此,可根據(jù)公式5對(duì)我校2014—2015學(xué)年度經(jīng)濟(jì)類圖書復(fù)本率進(jìn)行預(yù)測(cè)。由于我校近兩年用于購買紙本圖書的經(jīng)費(fèi)基本保持穩(wěn)定,故可預(yù)測(cè)2014—2015學(xué)年度經(jīng)濟(jì)類新書冊(cè)數(shù)約25 000冊(cè),為保證其得到充分利用,可估算其利用率最低約為x0=0.089,結(jié)合公式5得到復(fù)本率=5.347 04。最后,取α=0.01,將x0代入公式4得到置信水平為99%的置信區(qū)間(4.523 8,6.170 3)。
表4 殘差分析表
本文針對(duì)高校圖書館新書復(fù)本率如何確定的問題,通過選取圖書館的相關(guān)流通數(shù)據(jù),結(jié)合線性回歸分析理論和SPSS數(shù)據(jù)分析軟件,實(shí)現(xiàn)了對(duì)影響高校圖書館圖書復(fù)本率的影響因子的確定,并以北京工商大學(xué)圖書館內(nèi)經(jīng)濟(jì)類圖書的流通數(shù)據(jù)為例,實(shí)現(xiàn)了對(duì)相關(guān)方法的實(shí)證分析,并求得了2014—2015年度經(jīng)濟(jì)類圖書復(fù)本率的預(yù)測(cè)值以及相應(yīng)的置信區(qū)間,為該校圖書采購部門提供采購借鑒。
參考文獻(xiàn):
[1]李華.回歸分析在測(cè)定最佳圖書復(fù)本量中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,1994(5):39-42.
[2]劉新文.圖書館圖書復(fù)本量的定量分析[J].西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4):87-89.
[3]汪冬華.多元統(tǒng)計(jì)分析與SPSS應(yīng)用[M].上海:華東理工大學(xué)出版社,2010.
[4]薛薇.基于SPSS的數(shù)據(jù)分析[M].中國人民大學(xué)出版社,2006.
[5]孫寶,付曉艷,劉玲,陳曉紅.基于回歸分析的高校圖書館平均復(fù)本量研究[J].情報(bào)雜志,2009(4):189-192.
The Book Best Duplicate Rate Research in the University Library Based on SPSS——Based on the Library of Beijing Technology and Business University
Zai Jiaojiao
(Library of Beijing Technology and Business University, Beijing 100048)
Abstract:Aiming to determine a reasonable amount of the book copies, with the help of correlation analysis and regression analysis in SPSS, this paper realized the selection of major impact factor and constructed linear regression model of the duplicate rate. Meanwhile the linear regression model of the duplicate rate was verified based on the economic books in library of Beijing Technology and Business University. Moreover, the duplicate rate of the economic books in 2014-2015 of this university can be estimated, and the result can provide reference for this university’s books procurement.
Keywords:university library; duplicate rate; correlation analysis; linear regression.
作者簡介:宰姣姣(1987-),女,碩士研究生,助理館員,研究方向:圖書情報(bào)。
收稿日期:2015-4-25
文章編號(hào):1671-0037(2015)05-80-3
[文獻(xiàn)標(biāo)識(shí)碼]A
[中圖分類號(hào)]G251.4