, ,
據統(tǒng)計,我國高校圖書館館藏圖書的平均流通率低于40%,個別圖書館不足20%,全國高校近4億冊圖書在“睡覺”[1],而讀者又常常抱怨在圖書館中找不到自己需要的書。
目前,高校圖書館館藏建設工作中存在2個突出的矛盾:預算經費有限,但是可選購的圖書種類繁多并且價格日益增長;用戶需求不能得到滿足導致讀者流失,文獻利用率下降。智能手機的普及,使我們有條件采用基于讀者驅動采購微信應用(Reader Driven Acquisition WeChat Application,RDAWA)的參與式感知、眾包、社交推薦、公共平臺支持等方法和技術,建立起讓讀者可以即時即地提交閱讀需求的移動應用平臺,通過群智感知的方式,以較低的成本更廣泛、更及時、更全面地感知讀者的需求。這也使精確預測讀者需要和圖書需求量成為可能,進一步優(yōu)化館藏建設。
在館藏建設的文獻采購工作中,圖書館和文獻情報機構早在20世紀中葉就已經開始注意吸收大批學科專家專門從事文獻選擇工作。為了提高文獻收集的質量,許多圖書館聘請館外人員協(xié)助或參加文獻選擇,如請用戶推薦文獻,或咨詢某方面的專家。目前圖書館借力館外人員或機構組織幫助選擇文獻的形式主要有以下幾種。一是利用各種平臺和方法吸引讀者參與圖書館選擇文獻,如綱目采購、網絡薦購、書目選購、現(xiàn)場采購、閱選購書;二是眾多文獻情報機構(如大學圖書館)所設的“文獻資源建設委員會”或“圖書情報工作委員會”常常由教授或研究人員組成,他們擔負著協(xié)助圖書館選擇文獻的職責;三是圖書館請書商或出版商協(xié)助進行文獻初選。為了提高文獻的采購速度,克服圖書出版與到館利用之間的“時差”,采取送審定購、大宗訂購和長期定購等文獻收集方式[2]。
近年來,隨著網絡技術的不斷發(fā)展和數(shù)字文獻的出現(xiàn),虛擬館藏的存在給圖書館選擇文獻提供了極大的方便,圖書館用戶可以克服時空和載體形態(tài)的局限,網絡化、全方位、多渠道、多方法地選擇文獻。
用戶驅動采購模式(Patron Driven Acquisition,PDA)是一種全新的館藏建設模式,是指將讀者的閱讀需求量化成一定指標,作為圖書館文獻采購和館藏建設的決策依據[3]。通過讀者多次選擇而確定某種圖書采購的一種方法是由讀者驅動,根據讀者個性需求為選擇依據的文獻即時采購策略。這種基于用戶需求進行資源采購的方式,更能體現(xiàn)圖書館“以用戶為中心”的館藏建設理念。通過借助于現(xiàn)代網絡技術、數(shù)字化技術帶來的便利。引入PDA概念,不僅可以提高科技信息資源的使用效率,還可提供一種更好的圖書館員與研究人員和學生用戶之間的交流渠道[4]。
RDAWA是基于微信公眾平臺實現(xiàn)的采用群智感知技術獲取讀者需求并形成圖書采購決策的微信應用。群智感知(Collective Intelligent Perception)是指將普通用戶的移動設備作為基本感知單元,通過移動互聯(lián)網進行有意識或無意識的協(xié)作,實現(xiàn)感知任務分發(fā)與感知數(shù)據收集,完成大規(guī)模的、復雜的社會感知任務[5]。群智感知以大量用戶參與作為基礎,發(fā)揮“人多力量大”的特點,形成隨時隨地、無孔不入、與人們生活密切相關的感知系統(tǒng)。最常見的群智感知技術有眾包(Crowdsourcing)和參與式感知(Participatory Sensing)兩種[6]。眾包指的是公司或機構把過去由員工執(zhí)行的工作任務,以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網絡的做法[7]。眾包本質上是一種任務分發(fā)的機制,眾包的關鍵是提供一個在線協(xié)作平臺。參與式感知是指用戶出于個人或經濟興趣,有意識地響應感知需求,用戶既是數(shù)據的提供者又是數(shù)據的消費者[8]。傳統(tǒng)傳感網絡的特點是信息由傳感器產生、搜集,然后自動(可以是主動的也可以是被動的)上傳至某個區(qū)域節(jié)點或中心節(jié)點。而參與式感知則以用戶創(chuàng)造內容 (User Generated Content,UGC)的方式產生信息,即數(shù)據由用戶創(chuàng)建、篩選、控制和上傳。RDAWA應用的總體框架由4個功能模塊組成(圖1)。
圖1 RDAWA應用的總體框架
圖1中的采購推薦模塊以參與式感知的方式收集讀者購書需求,解決采購決策中書的種類問題;投票模塊以眾包方式更大范圍地感知讀者對擬購買圖書的閱讀興趣,解決采購決策中書的冊數(shù)問題;采購訂單生成模塊根據讀者采購推薦和投票結果,結合借閱規(guī)律、讀者群興趣分布等,綜合考慮館藏資源建設長遠規(guī)劃和經費使用計劃,生成采購訂單;數(shù)據分析模塊采用數(shù)據挖掘技術和社會網絡分析技術對讀者信息、借閱歷史數(shù)據、采購推薦歷史數(shù)據等數(shù)據進行分析,挖掘讀者興趣、借閱規(guī)律、發(fā)現(xiàn)書友圈,為基于社交推薦實現(xiàn)采購推薦模塊中的分享推薦條目功能和投票模塊中的投票條目分配功能提供依據。
移動信息服務需關注用戶使用體驗,RDAWA可讓讀者通過智能手機即時即地提交需要采購的圖書條目。考慮移動應用的限制,RDAWA應盡可能簡化讀者需要進行的輸入操作并減少需要輸入的內容(讀者習慣使用的是書名、作者、叢書名、ISBN)。RDAWA提供了多樣化的輸入方式:讀者可以以文本方式輸入(漢字、拼音首字母、拼音全拼),也可以采用語音方式輸入,還可以以“掃書”的方式進行輸入(微信5.0增加了掃描條形碼和圖書封面的功能)。讀者通過移動端提交輸入至服務器終端后,RDAWA處理讀者輸入的流程如圖2所示。
圖2 讀者輸入的處理流程圖(局部)
從圖2可看出,根據輸入方式將用戶輸入轉換成標準檢索關鍵字(語音進行語音識別,條形碼進行條碼識別,封面進行圖像識別,拼音轉換成漢字),轉換過程中如有歧義或出現(xiàn)錯誤會提示讀者重新輸入。使用標準檢索關鍵字從書目庫檢索圖書信息,并檢查是否已有館藏(需要修改書目數(shù)據的表結構,增加標示是否已有館藏屬性列,該列0表示無館藏,1表示有館藏),移動端顯示圖書信息時,館藏有則顯示“館藏已有”,館藏無則顯示“推薦采購”按鈕。
一個人的視野和判別能力畢竟是有限的。群智感知的核心理念就是以大量用戶參與作為基礎,一個用戶的感知數(shù)據可以是沒有實用價值的,但千千萬萬這樣的數(shù)據匯聚到一起,會產生質的飛躍。合理地利用方法可以從大量平凡的數(shù)據中挖掘出有價值的信息。參與式感知通過來源多樣化以擴大覆蓋范圍,基于社交的推薦和眾包則通過廣泛推送以擴大知情范圍。
依據讀者參與采購推薦的歷史情況,我們將讀者劃分為活躍薦購者和不活躍讀者?;钴S薦購者是采購推薦的熱心貢獻者,他們的薦購意見往往信息量大且價值很高。為了提供讓他們能更加充分表達需求的途徑,RDAWA采購推薦模塊中提供了分享推薦條目的功能,以基于社會關系推薦的方式定期把最新的薦購條目推送給有相同閱讀興趣的活躍薦購者,征求他們對同樣條目的薦購意見。實現(xiàn)這一功能的核心技術難點在于選擇哪些條目推送給哪些活躍推薦人。
此外,為了感知那些在采購推薦活動中不活躍讀者的需求,RDAWA通過投票模塊提供了投票功能,館員定期發(fā)起擬采購書目投票活動,將書目信息推送給那些不活躍讀者。實現(xiàn)這一功能的核心技術難點在于怎樣決定將哪些條目發(fā)送給哪些讀者進行投票、一次投票活動發(fā)送給投票者多少個條目等。
RDAWA的核心基礎包括書目信息數(shù)據庫、數(shù)據分析模塊、采購訂單生成算法。
書目信息數(shù)據庫的建設是圖書館所有業(yè)務系統(tǒng)的基礎,現(xiàn)在我國絕大多數(shù)圖書館按照CN MARC格式部分或全部建立了書目信息數(shù)據庫??陀^上,圖書館、出版社、圖書發(fā)行部門之間在書目信息上存在不一致,主要由以下幾點因素導致:原圖書的分類不正確或著錄項不全,所選字段較少或缺少某些字段信息,某些信息所歸字段不正確或某些字段信息錯誤,錄入中造成的錯字、錯詞或漏錄的字、詞等[9]。書目信息的不一致會影響讀者使用RDAWA。
數(shù)據分析模塊是RDAWA的信息引擎。挖掘讀者興趣、借閱規(guī)律、發(fā)現(xiàn)書友圈,生成相同閱讀興趣的活躍推薦人列表、生成潛在相同閱讀興趣的投票人列表,都是基于社會關系進行推薦和生成采購訂單的基礎依據。數(shù)據分析的核心技術難點在于如何根據讀者基本信息(性別、民族、專業(yè)、所屬年級)構建隸屬網絡,如何根據借閱歷史按知識結構、閱讀興趣構建社交網絡。
根據讀者薦購的條目和投票的結果生成采購訂單是一個典型的線性回歸問題,再將館藏建設規(guī)劃、采購經費、借閱規(guī)律等因素考慮進去時,采購訂單生成又是一個典型的帶約束的最優(yōu)化問題。因此,采購訂單生成算法采用了線性回歸方法和帶約束的線性規(guī)劃方法。
讀者的閱讀興趣非常廣泛,并且隨著時間的推移在不斷地變化。其知識結構、專業(yè)方向、個人狀態(tài)都會導致讀者閱讀需求的多樣化,甚至外部事件的發(fā)生也會引起讀者興趣和需求的改變,例如莫言獲得諾貝爾文學獎,使很多讀者開始關注他的作品。使用RDAWA簡化了讀者輸入流程,全面覆蓋了讀者的閱讀需求感知,可實現(xiàn)更優(yōu)化的館藏建設。
但大量的圖書文獻在不斷產生,讀者參與選擇的權威信和可信度將會下降,甚至會影響圖書館的整個館藏計劃和經費控制,有可能出現(xiàn)購入圖書不符合圖書館館藏要求的情況,或者由于讀者薦購踴躍而超出采購經費能夠承受的范圍[10]。如何提高讀者薦購的質量是我們需要深入研究的又一個課題。