溫麗花
(深圳市龍崗區(qū)圖書館,廣東 深圳 518000)
隨著用戶服務(wù)模式和服務(wù)內(nèi)容的變革,圖書館致力于愉悅感和滿意度提升,為讀者提供持續(xù)的個性化服務(wù),導(dǎo)致用戶服務(wù)數(shù)據(jù)、系統(tǒng)管理數(shù)據(jù)、系統(tǒng)運(yùn)行監(jiān)控?cái)?shù)據(jù)和用戶行為數(shù)據(jù)呈爆炸式增長態(tài)勢,圖書館跨入大數(shù)據(jù)時代。大數(shù)據(jù)時代產(chǎn)生了海量的服務(wù)數(shù)據(jù),如流通借閱數(shù)據(jù)、咨詢服務(wù)數(shù)據(jù)、各類系統(tǒng)平臺數(shù)據(jù)、各類社交媒體數(shù)據(jù)等,這些服務(wù)數(shù)據(jù)的作用日益凸顯,大數(shù)據(jù)背景下圖書館服務(wù)相關(guān)研究已成為圖情領(lǐng)域的熱點(diǎn)。
回顧已有研究成果,圖書館服務(wù)數(shù)據(jù)的功能主要分為圖書館層面、館員層面和讀者層面,圖書館層面又可以細(xì)分為優(yōu)化館藏資源和改善服務(wù)內(nèi)容,館員層面又可以細(xì)分為提高館員素養(yǎng)和提升館員服務(wù)能力,讀者層面又可以細(xì)分為滿足讀者需求和引導(dǎo)讀者閱讀。為了更好地評估大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)功能,筆者設(shè)計(jì)問卷收集數(shù)據(jù)測算平均值并進(jìn)行評估。
基于圖書館服務(wù)數(shù)據(jù)功能,調(diào)查問卷主要包括6個題項(xiàng):①大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)是否可以幫助圖書館優(yōu)化館藏資源。②大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)是否可以幫助圖書館改善服務(wù)內(nèi)容。③大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)是否可以有效提高館員素養(yǎng)。④大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)是否可以有效提升館員服務(wù)能力。⑤大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)是否可以高效滿足讀者需求。⑥大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)是否可以合理引導(dǎo)讀者閱讀。
筆者界定變量衡量標(biāo)準(zhǔn),對圖書館服務(wù)數(shù)據(jù)的上述6大功能進(jìn)行衡量,數(shù)值越大,表示功能發(fā)揮越好。每個題目均采用5級李克特量表進(jìn)行衡量,設(shè)置五個選項(xiàng):1=非常不同意,2=比較不同意;3=一般;4=比較同意;5=非常同意。
筆者隨機(jī)抽取50家基層圖書館的館員發(fā)送線上調(diào)查問卷,邀請他們進(jìn)行1~5級評分,回收得到有效問卷41份。
筆者采用SPSS軟件進(jìn)行描述性統(tǒng)計(jì)分析,統(tǒng)計(jì)題項(xiàng)答案頻數(shù)分布和平均值見下頁表1。
2.4.1 大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)優(yōu)化館藏資源功能方面。調(diào)查結(jié)果顯示,選擇“非常不同意”“比較不同意”“一般”“比較同意”“非常同意”的分別為1人、5人、6人、8人、21人,平均值為4.0488,顯著大于5級李克特量表的中位數(shù)3,說明大數(shù)據(jù)時代基層圖書館的服務(wù)數(shù)據(jù)在優(yōu)化圖書館館藏資源方面可以發(fā)揮很大效用。
表1 調(diào)查結(jié)果
2.4.2 大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)改善服務(wù)內(nèi)容功能方面。調(diào)查結(jié)果顯示,選擇“非常不同意”“比較不同意”“一般”“比較同意”“非常同意”的分別為2人、3人、5人、9人、22人,平均值為4.1220,顯著大于5級李克特量表的中位數(shù)3,說明大數(shù)據(jù)時代基層圖書館的服務(wù)數(shù)據(jù)在改善圖書館服務(wù)內(nèi)容方面可以發(fā)揮很大效用。
2.4.3 大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)提高館員素養(yǎng)功能方面。調(diào)查結(jié)果顯示,選擇“非常不同意”“比較不同意”“一般”“比較同意”“非常同意”的分別為7人、7人、9人、10人、8人,平均值為3.1220,略大于5級李克特量表的中位數(shù)3,說明大數(shù)據(jù)時代基層圖書館的服務(wù)數(shù)據(jù)在提高館員素養(yǎng)方面可以發(fā)揮一定效用。
2.4.4 大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)提升館員服務(wù)能力功能方面。調(diào)查結(jié)果顯示,選擇“非常不同意”“比較不同意”“一般”“比較同意”“非常同意”的分別為6人、8人、8人、9人、10人,平均值為3.2195,略大于5級李克特量表的中位數(shù)3,說明大數(shù)據(jù)時代基層圖書館的服務(wù)數(shù)據(jù)在提升館員服務(wù)能力方面可以發(fā)揮一定效用。
2.4.5 大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)滿足讀者需求功能方面。調(diào)查結(jié)果顯示,選擇“非常不同意”“比較不同意”“一般”“比較同意”“非常同意”的分別為1人、2人、4人、7人、27人,平均值為4.3902,明顯大于5級李克特量表的中位數(shù)3,說明大數(shù)據(jù)時代基層圖書館的服務(wù)數(shù)據(jù)在滿足讀者需求方面可以發(fā)揮很大效用。
2.4.6 大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)引導(dǎo)讀者閱讀功能方面。調(diào)查結(jié)果顯示,選擇“非常不同意”“比較不同意”“一般”“比較同意”“非常同意”的分別為4人、6人、10人、11人、10人,平均值為3.4146,略大于5級李克特量表的中位數(shù)3,說明大數(shù)據(jù)時代基層圖書館的服務(wù)數(shù)據(jù),在引導(dǎo)讀者閱讀方面可以發(fā)揮一定效用。
綜上,大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)在優(yōu)化圖書館館藏資源、改善圖書館服務(wù)內(nèi)容、滿足讀者需求方面可以發(fā)揮很大作用,在提高館員素養(yǎng)、提升館員服務(wù)能力、引導(dǎo)讀者閱讀方面也可以發(fā)揮一定作用。
筆者通過查看已有研究成果發(fā)現(xiàn),服務(wù)數(shù)據(jù)功能的發(fā)揮與服務(wù)數(shù)據(jù)的采集、清洗、整合、分析、處理密切相關(guān),為了更好地界定大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)的優(yōu)化路徑,以上述相關(guān)因素作為影響因素,分析其對服務(wù)數(shù)據(jù)功能具有怎樣的影響關(guān)系,并由此提出建議和措施。
基于因果影響關(guān)系,構(gòu)建多元回歸分析模型,即: Yi=α+βiXi+ε,其中,Y是因變量,這里指圖書館服務(wù)數(shù)據(jù)功能,X是自變量,這里包括數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)整合、數(shù)據(jù)分析、數(shù)據(jù)處理。
在界定變量衡量標(biāo)準(zhǔn)時,為了與上述圖書館服務(wù)數(shù)據(jù)功能的測量一致,筆者采用1~5級李克特量表進(jìn)行衡量,數(shù)值越大,表示程度越高。其中,1=非常不同意,2=比較不同意,3=一般,4=標(biāo)同意,5=非常同意。
筆者采用問卷調(diào)查收集數(shù)據(jù),隨機(jī)抽取50家基層圖書館的館員發(fā)送線上調(diào)查問卷,邀請他們針對數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)整合、數(shù)據(jù)分析、數(shù)據(jù)處理進(jìn)行1~5級評分,回收得到有效問卷41份。
筆者采用SPSS軟件調(diào)查問卷進(jìn)行多元回歸分析,結(jié)果見表2。
表2 多元回歸分析結(jié)果
3.4.1 根據(jù)R2結(jié)果可知。模型調(diào)整后R值為0.913,模型調(diào)整后R2值為0.834,即擬合優(yōu)度為83.4%。也就是說,自變量數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)整合、數(shù)據(jù)分析、數(shù)據(jù)處理對因變量圖書館服務(wù)數(shù)據(jù)功能的解釋程度為83.4%,具有較高的解釋力。
3.4.2 根據(jù)F值結(jié)果可知。模型分析中的F值為87.729,顯著性水平為0.000,小于0.05,說明模型通過F檢驗(yàn),也就是說,模型分析結(jié)果是有效的,可以進(jìn)行進(jìn)一步討論。
3.4.3 根據(jù)回歸結(jié)果可知?!皵?shù)據(jù)采集”變量的Beta值為0.651,為正,顯著水平為0.001,小于0.01,說明數(shù)據(jù)采集對基層圖書館服務(wù)數(shù)據(jù)功能具有非常顯著的正向影響,也就是說,大數(shù)據(jù)時代可以通過提高基層圖書館的數(shù)據(jù)采集質(zhì)量提升其服務(wù)數(shù)據(jù)功效?!皵?shù)據(jù)清洗”變量的Beta值為0.632,為正,顯著水平為0.002,小于0.01,說明數(shù)據(jù)清洗對基層圖書館服務(wù)數(shù)據(jù)功能具有非常顯著的正向影響,也就是說,大數(shù)據(jù)時代可以通過提高基層圖書館的數(shù)據(jù)清洗質(zhì)量提升其服務(wù)數(shù)據(jù)功效?!皵?shù)據(jù)整合”變量的Beta值為0.759,為正,顯著水平為0.000,小于0.01,說明數(shù)據(jù)整合對基層圖書館服務(wù)數(shù)據(jù)功能具有非常顯著的正向影響,也就是說,大數(shù)據(jù)時代可以通過提高基層圖書館的數(shù)據(jù)整合質(zhì)量提升其服務(wù)數(shù)據(jù)功效?!皵?shù)據(jù)分析”變量的Beta值為0.706,為正,顯著水平為0.000,小于0.01,說明數(shù)據(jù)分析對基層圖書館服務(wù)數(shù)據(jù)功能具有非常顯著的正向影響,也就是說,大數(shù)據(jù)時代可以通過提高基層圖書館的數(shù)據(jù)分析質(zhì)量提升其服務(wù)數(shù)據(jù)功效。“數(shù)據(jù)處理”變量的Beta值為0.596,為正,顯著水平為0.009,小于0.01,說明數(shù)據(jù)處理對基層圖書館服務(wù)數(shù)據(jù)功能具有非常顯著的正向影響,也就是說,大數(shù)據(jù)時代可以通過提高基層圖書館的數(shù)據(jù)處理質(zhì)量提升其服務(wù)數(shù)據(jù)功效。綜上,大數(shù)據(jù)時代基層圖書館服務(wù)數(shù)據(jù)的采集、清洗、整合、分析、處理對服務(wù)數(shù)據(jù)功能的發(fā)揮均具有非常顯著的正向影響。
大數(shù)據(jù)時代更強(qiáng)調(diào)數(shù)據(jù)的完整性和混雜性,需要收集盡可能多的數(shù)據(jù),以便進(jìn)行深度探討?;鶎訄D書館在采集數(shù)據(jù)時應(yīng)保證數(shù)據(jù)來源的多樣性:一是自建系統(tǒng)數(shù)據(jù)庫,全面采集讀者的相關(guān)數(shù)據(jù),如讀者的借閱數(shù)據(jù),閱讀習(xí)慣數(shù)據(jù),閱讀行為數(shù)據(jù)等,同時還可以將SqlServer、MySql、Oracle、Access等數(shù)據(jù)庫的讀者數(shù)據(jù)導(dǎo)入系統(tǒng)數(shù)據(jù)庫。二是精準(zhǔn)捕捉網(wǎng)絡(luò)數(shù)據(jù),采用網(wǎng)絡(luò)工具和程序收集網(wǎng)絡(luò)相關(guān)數(shù)據(jù),如網(wǎng)站的點(diǎn)擊量、訪問駐留數(shù)據(jù)、用戶的各種網(wǎng)絡(luò)使用行為數(shù)據(jù)等。三是有針對性地將紙質(zhì)數(shù)據(jù)轉(zhuǎn)換為電子數(shù)據(jù),即選取圖書館在信息化建設(shè)前存留的紙質(zhì)數(shù)據(jù)中有價值的部分轉(zhuǎn)化為電子數(shù)據(jù)。
大數(shù)據(jù)時代追求數(shù)據(jù)的完整性會帶來數(shù)據(jù)量的大幅增加,從而造成數(shù)據(jù)質(zhì)量下降,原因在于采集的元數(shù)據(jù)可能存在重復(fù)數(shù)據(jù)、錯誤數(shù)據(jù)、缺失數(shù)據(jù)、不一致數(shù)據(jù)、異常數(shù)據(jù)等。因此,圖書館需要對這些數(shù)據(jù)進(jìn)行清洗,數(shù)據(jù)清洗的目的是檢測數(shù)據(jù)本身的非清潔和數(shù)據(jù)間的非清潔,并予以剔除或改正,提高數(shù)據(jù)質(zhì)量。數(shù)據(jù)清洗的具體步驟如下:首先獲取元數(shù)據(jù),分析數(shù)據(jù)存在的問題;其次定義清洗規(guī)則,確定清洗方案;再次選擇數(shù)據(jù)樣本驗(yàn)證數(shù)據(jù)清洗方案的正確性和清洗效率;最后進(jìn)行數(shù)據(jù)清洗,并將清洗過的數(shù)據(jù)代替原有數(shù)據(jù)。
大數(shù)據(jù)時代可以實(shí)現(xiàn)數(shù)據(jù)可視化,而要想將數(shù)據(jù)可視化就必須知道數(shù)據(jù)的具體表達(dá),數(shù)據(jù)表達(dá)和相互之間的關(guān)聯(lián)是數(shù)據(jù)可視化的關(guān)鍵,也是全面分析數(shù)據(jù)的關(guān)鍵,同樣還是深層次理解數(shù)據(jù)的關(guān)鍵。為了能完整展示數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,圖書館需要對數(shù)據(jù)進(jìn)行整合,單個數(shù)據(jù)表中的數(shù)據(jù)往往不能反映一種行為或現(xiàn)象的全貌,需要結(jié)合其他數(shù)據(jù)源中的數(shù)據(jù)一起進(jìn)行分析,這里的數(shù)據(jù)整合可以被理解為對數(shù)據(jù)進(jìn)行組織、整理、合并和完整性補(bǔ)充。
大數(shù)據(jù)時代可以做到數(shù)據(jù)的多層次分析和深度分析,數(shù)據(jù)分析的根本目標(biāo)是根據(jù)需求從數(shù)據(jù)中提取有用的知識,并將其應(yīng)用到具體領(lǐng)域中。服務(wù)數(shù)據(jù)經(jīng)過整合后依然數(shù)量龐大、結(jié)構(gòu)復(fù)雜,圖書館員需要通過進(jìn)一步分析才能得到很多隱藏在數(shù)據(jù)背后的意義。
大數(shù)據(jù)時代可以實(shí)現(xiàn)數(shù)據(jù)的自動化處理,圖書館日常工作多而復(fù)雜,產(chǎn)生的服務(wù)數(shù)據(jù)種類和數(shù)量也日益繁多,實(shí)現(xiàn)服務(wù)數(shù)據(jù)的自動化處理對數(shù)據(jù)資源的管理、數(shù)據(jù)資源利用具有重要的現(xiàn)實(shí)意義。服務(wù)數(shù)據(jù)的自動化處理特別要突出自動統(tǒng)計(jì)分析,就是基于整合后的服務(wù)數(shù)據(jù)為用戶使用提供服務(wù),按照編寫好的程序提供統(tǒng)一應(yīng)用界面,實(shí)現(xiàn)數(shù)據(jù)的匯總、統(tǒng)計(jì)、查詢以及報表自動生成等功能,方便用戶獲得各類統(tǒng)計(jì)信息。