摘 要:基于上海對外經貿大學師生圖書借閱的歷史數(shù)據(jù)與藏書的外經貿特色,通過統(tǒng)計分析與數(shù)學建模方法,發(fā)展和應用用戶個性化分析模型與技術,預測上海對外經貿大學用戶薦購行為,為圖書館采購提供量化參考。具體擬達到以下目的:從讀者出發(fā),討論未收錄新書選擇增添問題,為圖書館采購提供科學化參考,更精準的滿足讀者需求。為圖書館考慮,為圖書采購提供推薦新書通報,從而在購書預算限制下,最大限度的提高我校師生借書體驗,提高圖書借閱率與紙質圖書流通率。
關鍵字:圖書借閱;用戶薦購;統(tǒng)計分析;個性化模型
1 國內外研究現(xiàn)狀及發(fā)展動態(tài)
1.在圖書復本量優(yōu)化決策方向已有研究:
我國圖書采購管理的研究很多基于復本量優(yōu)化決策問題[1],主要分為兩種方法,第一種通過影響圖書復本量的因素進行定性分析,主要因素有實際讀者人數(shù)、圖書館的借閱制度、圖書文獻的使用年限、圖書館舍得分布情況、原有資源的規(guī)模與布局、信息媒體的類型文種載體及專業(yè)水平、信息服務機構提供的信息媒體復制能力和、預計丟失和損壞的數(shù)量;第二種類型是把影響圖書采購復本量的影響因素作為變量,建立數(shù)學模型,并通過對流通數(shù)據(jù)進行統(tǒng)計分析,找出它們之間的關系,用來指導圖書采購計劃的制定與執(zhí)行。
盡管人們已經提出許多計算信息媒體采集復本量的數(shù)學模型,但由于復本問題與眾多的變動因素緊密聯(lián)系,隨機性很強,難以給出確定的數(shù)值,以至于這些模式通常把簡單的問題復雜化,因此,真正能夠投入實際應用的統(tǒng)計方法至今仍很少見到[2]。
2.在數(shù)據(jù)挖掘領域已有相關探索:
近年來,利用一般性的數(shù)據(jù)挖掘算法,如聚類算法、關聯(lián)挖掘等技術,對圖書借閱數(shù)據(jù)中的用戶偏好進行數(shù)據(jù)挖掘,受到了越來越多的討論?,F(xiàn)有研究,如文獻,多針對實際問題,應用數(shù)據(jù)挖掘相關算法,解決圖書借閱之間的關聯(lián)規(guī)則挖掘,從而對圖書館的館藏布局提供意見,實現(xiàn)圖書推薦功能[3]。
2 研究方法
首先關于圖書采購、原則、組織結構以及業(yè)務流程等方面對上海對外經貿大學圖書采購工作與目標進行訪談。
針對數(shù)據(jù)庫現(xiàn)有的借閱數(shù)據(jù)進行描述性統(tǒng)計分析,了解我校圖書流通現(xiàn)狀。
結合以上兩步內容從圖書館信息管理的實際需求出發(fā),以圖書、讀者、時間等多個維度進行統(tǒng)計推斷與分析,從大量的圖書借閱數(shù)據(jù)中量化規(guī)律,討論未收錄新書選擇增添問題,為圖書館采購提供科學化參考,更精準的滿足讀者需求。探索利用用戶個性化分析,實現(xiàn)圖書館采購推薦的關鍵統(tǒng)計技術,并以技術報告呈現(xiàn)。
3 研究成果
以下成果均基于2010-2015年度上海對外經貿大學圖書館圖書借閱數(shù)據(jù)
1.圖書類別維度
6年內,累計借閱量前十名圖書類別及借閱比重分別是文學15.97%、經濟9.82%、語言、文字9.64%、哲學類6.59%、政治法律5.87%、數(shù)理科學和化學5.36%、社科總論5.14%、歷史、地理5.13%、文化、科學、教育、體育4.65%、工業(yè)技術4.44%。
2.借閱總量維度
以2010-2014前五年的借閱數(shù)據(jù)作為訓練樣本,2015年作為驗證樣本,去除重復的圖書,前五年被借閱過的不同圖書數(shù)量分別為1078、1236、1467、1372、2092,從數(shù)據(jù)源中舍棄重復的圖書,共有4032本不同的圖書。2015年被借閱數(shù)量為2403,其中前五年出現(xiàn)的圖書共有3086本。
3.推薦結果評估
在六年的借閱數(shù)據(jù)中,會同時出現(xiàn)在前五年及最后一年的借閱資料中的讀者共6772名,根據(jù)回歸預測可得共有788位讀者的借閱圖書至少含有一本,那么推薦圖書的出現(xiàn)率為11.64%(788/6772)。因此圖書推薦系統(tǒng)可以根據(jù)推薦率,為目標讀者只能推薦圖書,促進提升借閱量,也同時為我校學生提供更加智能的數(shù)據(jù)推薦服務,提升目標化、鎖定式閱讀體驗[2]。
參考文獻
[1]張金連.NS學院圖書館圖書采購管理優(yōu)化研究[D].華南理工大學,2014.
[2]劉斌.基于數(shù)據(jù)挖掘的高校圖書館借閱數(shù)據(jù)特性分析與應用[D].蘇州大學,2010.
[3]王正宇.數(shù)據(jù)挖掘在讀者偏好研究中的應用[D].上海交通大學,2010.
作者簡介
時嘉遙(1995-),女,山東省,本科在讀,學生,研究方向:統(tǒng)計分析。