邱煜炎,方習(xí)國
(蚌埠醫(yī)學(xué)院,233030)
試用數(shù)據(jù)庫主要是指數(shù)據(jù)庫生產(chǎn)商或發(fā)行商為了擴(kuò)大影響、爭取更多的客戶,為圖書館用戶提供的訂購前免費(fèi)試用及演示的各種商業(yè)化電子資源[1]。其特點(diǎn)是短期內(nèi)豐富了圖書館的電子館藏,為讀者爭取更多的電子資源,以滿足讀者的需求。
目前,各高等學(xué)校圖書館普遍重視基于開源軟件構(gòu)建個性化的應(yīng)用,通過開源軟件的二次開發(fā),不僅可掌握其核心技術(shù),而且可以最低的成本提升圖書館個性化服務(wù)水平[2]。本文從SNS系統(tǒng)設(shè)計出發(fā),選擇ThinkSNS作為二次開發(fā)軟件,通過對試用數(shù)據(jù)庫進(jìn)行采集挖掘,構(gòu)建基于SNS平臺的試用資源推薦系統(tǒng)。
從2011年12月至2012年3月,作者通過CNZZ對蚌埠醫(yī)學(xué)院圖書館網(wǎng)站進(jìn)行月流量跟蹤,發(fā)現(xiàn)試用數(shù)據(jù)庫利用率不高。試用數(shù)據(jù)資源與館藏電子資源使用流量對比,如表1所示。
表1 館藏資源與試用資源對比
表1列舉了試用資源和館藏資源流量排名前三名的數(shù)據(jù)庫進(jìn)行對比,發(fā)現(xiàn)館藏資源的點(diǎn)擊量明顯高于試用資源,這一方面與數(shù)據(jù)資源的內(nèi)容質(zhì)量有關(guān),另一方面,短期內(nèi)對試用資源宣傳力度和推薦力度不夠也是造成其使用率不高的原因。
SNS,全稱 Social Networking Services,即社會性網(wǎng)絡(luò)服務(wù),專指旨在幫助人們建立社會性網(wǎng)絡(luò)的互聯(lián)網(wǎng)應(yīng)用服務(wù)[3]。在年輕人密度較高的社會化網(wǎng)絡(luò)站點(diǎn)中,圖書館可利用此平臺加強(qiáng)對外宣傳,吸引更多的網(wǎng)絡(luò)用戶,樹立起圖書館網(wǎng)絡(luò)時代服務(wù)的新形象。國外圖書館通過SNS平臺主要開展了如下四個方面的服務(wù)。
(1)公關(guān)宣傳。國外不少圖書館都在Facebook和Myspace兩大站點(diǎn)擁有自己的主頁,其中加拿大多倫多公共圖書館和英國曼切斯特圖書館的Facebook主頁的關(guān)注者數(shù)量高達(dá)4043人[4]和1294人[5],是利用Facebook主頁開展公關(guān)推廣較為成功的案例。
(2)參考咨詢。密歇根大學(xué)圖書館在Facebook上建立名為”Mlibrary2.0 facebook group”的小組專門開展基于SNS的數(shù)字參考咨詢服務(wù)[6]。
(3)用戶互動。美國布魯克林大學(xué)圖書館的Myspace主頁的日志更新頻率較高,通過這些日志,宣傳了圖書館現(xiàn)有的和即將開展的各種活動,包括書展、藝術(shù)比賽、音樂鑒賞會等[7]。
(4)專業(yè)社區(qū)。2004年,美國費(fèi)城大學(xué)和賓州州立大學(xué)貝克斯分校共同建立了BlendedLibrarian網(wǎng)絡(luò)學(xué)習(xí)社區(qū)[8]。該社區(qū)旨在營造一個創(chuàng)新、合作、交流的平臺,使成員可以通過虛擬網(wǎng)絡(luò)得到職業(yè)發(fā)展和學(xué)習(xí)的機(jī)會。2009年底,成員總數(shù)接近4000人,是較成熟的圖情專業(yè)人員社區(qū)[9]。
目前,國內(nèi)圖書館開展基于SNS的服務(wù)工作處于初級階段,普及率不是很高。不過許多商業(yè)運(yùn)營的知識型SNS網(wǎng)站,如“豆瓣網(wǎng)”,“360doc”等,其用戶參與度很高,影響力也比較大。
本文根據(jù)SNS社區(qū)聚集的特點(diǎn)以及用戶對社區(qū)活動的興趣特征,通過用戶之間的交流與推廣,短期內(nèi)充分利用試用數(shù)據(jù)資源,作為具有鮮明Web2.0特征和功能的SNS網(wǎng)站對服務(wù)型圖書館的建設(shè)是一種新的有益嘗試。
網(wǎng)絡(luò)信息抓取軟件定期通過對網(wǎng)絡(luò)試用資源進(jìn)行信息采集,提取網(wǎng)址URL、標(biāo)題、摘要、作者、文件格式等相關(guān)信息,以標(biāo)題、摘要、作者作為元數(shù)據(jù)關(guān)鍵字進(jìn)行信息標(biāo)引,構(gòu)建索引數(shù)據(jù)庫[10]。在SNS社交平臺中添加信息檢索模塊,檢索查詢試用資源內(nèi)容,以用戶推薦方式進(jìn)行對試用資源進(jìn)行宣傳和推廣,以達(dá)到短期內(nèi)充分利用試用資源目的。系統(tǒng)工作原理,如圖1所示。
圖1 系統(tǒng)工作原理[11]
(1)SNS的基本功能。SNS開源軟件具備了微博系統(tǒng)(包括@功能、轉(zhuǎn)發(fā)、評論)和SNS應(yīng)用(包括日志、相冊、活動、群組、投票、禮物)兩大主要功能。基于試用數(shù)據(jù)的推廣為目的,網(wǎng)絡(luò)用戶A通過“@功能”可以對試用資源的瀏覽內(nèi)容進(jìn)行評價,社區(qū)網(wǎng)絡(luò)其他好友B可以隨時跟蹤用戶A的動態(tài)對其評價內(nèi)容進(jìn)行瀏覽點(diǎn)擊,并可以轉(zhuǎn)發(fā)評論給其他好友C,以達(dá)到試用資源推廣的目的[12]。社區(qū)用戶也可以發(fā)起投票對試用資源進(jìn)行評價,排名較高的不僅可以起到宣傳的目的,也對圖書館館藏電子資源采購提供了客觀的參考意見。
(2)試用資源統(tǒng)一檢索。SNS社區(qū)平臺嵌入了試用資源統(tǒng)一檢索平臺,網(wǎng)絡(luò)讀者可以采用模糊查詢的方式進(jìn)行關(guān)鍵字查詢。查詢結(jié)果按照其相關(guān)內(nèi)容點(diǎn)擊量降序的排列方式羅列出來,用戶根據(jù)檢索需要點(diǎn)擊并在新頁面瀏覽相關(guān)內(nèi)容,而在SNS頁面提交窗口顯示此內(nèi)容相關(guān)信息如URL及題名信息,且預(yù)留需要添加的附加內(nèi)容。
(3)試用資源到期排行。根據(jù)筆者對本圖書館網(wǎng)站流量跟蹤顯示,單一試用資源在即將到期時,點(diǎn)擊量比以往有顯著上升趨勢?;诖?,特在SNS系統(tǒng)平臺首頁加入公告系統(tǒng),以15天為即將到期期限,采用天數(shù)遞增的順序方式對即將到期的數(shù)據(jù)資源進(jìn)行自動羅列,以提醒讀者抓緊瀏覽點(diǎn)擊以免延誤。
圖2 系統(tǒng)功能流程演示
(4)試用資源評價排行。試用資源評價排行包括點(diǎn)擊量排行和投票排行兩大功能模塊,點(diǎn)擊量是基于某試用資源內(nèi)所有資源點(diǎn)擊量的總和進(jìn)行排序匯總,投票排行中,得分較高的顯示在前作為優(yōu)質(zhì)試用資源以方便網(wǎng)絡(luò)讀者瀏覽。
(5)標(biāo)簽排序。當(dāng)用戶通過平臺每檢索一次的時候,后臺服務(wù)器就記錄一次關(guān)鍵詞標(biāo)簽并載入關(guān)鍵詞表,根據(jù)關(guān)鍵詞使用量的排名,對標(biāo)簽進(jìn)行排序并降序顯示在用戶欄目中以方便用戶進(jìn)行點(diǎn)擊查詢?;谝陨瞎δ?,系統(tǒng)圖如圖2所示。
網(wǎng)絡(luò)神采是一款專業(yè)的網(wǎng)絡(luò)信息采集系統(tǒng),通過靈活的規(guī)則可以從任何類型的網(wǎng)站采集信息,如新聞網(wǎng)站、論壇、博客、電子商務(wù)網(wǎng)站、招聘網(wǎng)站等等。支持網(wǎng)站登錄采集、網(wǎng)站跨層采集、POST采集、腳本頁面采集、動態(tài)頁面采集等高級采集功能。支持存儲過程、插件等,可以通過二次開發(fā)擴(kuò)展功能。[13]其良好的操作界面和靈活的挖掘指令可以按照其要求對相關(guān)數(shù)據(jù)進(jìn)行元數(shù)據(jù)提取并構(gòu)建索引數(shù)據(jù)庫,以方便數(shù)據(jù)管理與查詢操作。
ThinkSNS是由北京智士軟件有限公司開發(fā)的一款開源社區(qū)軟件,定位于基于微博客的多用戶SNS系統(tǒng)。ThinkSNS2.0內(nèi)核使用優(yōu)化的ThinkPHP框架,并預(yù)留豐富的二次開發(fā)接口,使網(wǎng)站開發(fā)者能夠快速理解ThinkSNS的系統(tǒng)架構(gòu)和開發(fā)方法(應(yīng)用、插件、模板等),方便二次開發(fā),以滿足個性化功能需求[14]。
利用MySQL構(gòu)建后臺數(shù)據(jù)庫系統(tǒng),該數(shù)據(jù)庫共有四個表。首先構(gòu)建信息抓取表ts_crawl,用來存放遍歷試用資源內(nèi)網(wǎng)頁以抓取相關(guān)信息。
試用資源表ts_trialbase,用來存放網(wǎng)絡(luò)爬蟲抓取的試用數(shù)據(jù)庫內(nèi)每個網(wǎng)頁的相關(guān)信息,包括以下字段,主鍵id,資源標(biāo)題title,資源內(nèi)容body,資源地址url,抓取時間gettime,以及外鍵字段baseid以關(guān)聯(lián)試用數(shù)據(jù)庫信息表ts_source。
試用數(shù)據(jù)庫信息表ts_source記錄現(xiàn)有試用資源相關(guān)信息,字段包括主鍵sid,試用數(shù)據(jù)庫名稱stitle,試用數(shù)據(jù)庫地址surl,試用開始時間starttime,試用結(jié)束時間endtime。
標(biāo)簽表ts_keyword,接收用戶提交的檢索條件信息,以空格字符將此信息進(jìn)行分割,提取出標(biāo)簽關(guān)鍵詞。另外,此表的hotcount字段記錄本關(guān)鍵詞的檢索次數(shù),以作為標(biāo)簽排序索引條件。
圖3 ts_trialbase試用資源表
試用數(shù)據(jù)庫采用外網(wǎng)訪問方式而非本地鏡像瀏覽,因此本文有必要對試用數(shù)據(jù)庫資源進(jìn)行抓取及采集用以微博轉(zhuǎn)發(fā)。此外,需要對類目進(jìn)行實(shí)例化操作以執(zhí)行文件,本文主要采用網(wǎng)頁分別提取的方式進(jìn)行信息采集,由于每個試用資源的網(wǎng)頁內(nèi)容設(shè)計結(jié)構(gòu)不同,所以在進(jìn)行采集的時候要根據(jù)每個資源的特征進(jìn)行代碼修改,利用正則表達(dá)對內(nèi)容進(jìn)行提取以構(gòu)建 ts_trialbase試用資源表,如圖3所示。
主要采用Select語句對試用資源表ts_trailbase進(jìn)行相關(guān)字段查詢,網(wǎng)絡(luò)用戶通過SNS平臺統(tǒng)一檢索模塊向瀏覽器發(fā)出請求,php執(zhí)行頁面請求,查詢試用資源表,并把數(shù)據(jù)庫中的所有信息返回客戶端。檢索語句是用sql的like語句實(shí)現(xiàn),對keyword實(shí)現(xiàn)查找。同時以baseid為外鍵關(guān)聯(lián)的ts_sourse表,可以顯示試用資源所在試用數(shù)據(jù)庫的相關(guān)信息,如試用數(shù)據(jù)庫名稱、到期時間等。
ThinkSNS2.0內(nèi)核使用優(yōu)化的ThinkPHP框架,ThinkPHP使用面向?qū)ο蟮拈_發(fā)結(jié)構(gòu)和MVC模式。MVC模式強(qiáng)制性地使應(yīng)用程序的輸入、處理和輸出分開,包括三個核心部件:模型(M)、視圖(V)和控制器(C),它們各自處理自己的任務(wù)。由于開源軟件ThinkSNS已具有相關(guān)數(shù)據(jù)排行和轉(zhuǎn)發(fā)功能,本文需要按照MVC開發(fā)模式將信息檢索模塊嵌入ThinkSNS平臺。
首先,在IndexAction.class.php控制器內(nèi)添加搜索方法,代碼如下:
//注釋:以表trialbase的baseid為外鍵關(guān)聯(lián)表source,以做關(guān)聯(lián)查詢
圖4 trialbase_share_weibo分享模板管理界面[15]
其次,創(chuàng)建視圖代碼,同時要增加微博分享轉(zhuǎn)發(fā)功能,根據(jù)ThinkSNS二次開發(fā)手冊要求,在顯示搜索結(jié)果的模板文件里添加WeiboWidget引用,此外在后臺管理界面內(nèi)容模板管理里創(chuàng)建trialbase_share_weibo模板,如圖4所示。
搜索結(jié)果視圖界面為html文件,核心代碼如下
{:W('Weibo',array('tpl_name'= >'trialbase_share_weibo','button_title'= >'分享'))} <!- -注釋:添加WeiboWidget引用-->
ThinkSNS采用的是MySQL作為系統(tǒng)后臺數(shù)據(jù)庫,其數(shù)據(jù)庫名稱為thinksns,通過后臺權(quán)限設(shè)置禁止注冊功能,用戶可直接通過圖書證號和OPEC登錄密碼作為登錄號和初始密碼進(jìn)行登錄訪問。蚌埠醫(yī)學(xué)院圖書館采用的是金盤圖書管理系統(tǒng),其后臺采用MSSQL2000(MicroSoftSQL)作為數(shù)據(jù)庫系統(tǒng),需要通過MSSQL與MySQL的數(shù)據(jù)交換,通過安裝mysql ODBC數(shù)據(jù)源,借助mssql的數(shù)據(jù)導(dǎo)出功能將關(guān)鍵字段姓名、讀者證號、密碼、性別進(jìn)行數(shù)據(jù)轉(zhuǎn)移。
本系統(tǒng)開發(fā)重點(diǎn)在于將檢索模塊嵌入到SNS平臺,ThinkSNS繼承優(yōu)化的ThinkPHP程序sociax,其難點(diǎn)在于在二次開發(fā)過程中,不能完全采用ThinkPHP寫的項目進(jìn)行直接移植,因此要參考已開發(fā)應(yīng)用程序進(jìn)行代碼規(guī)整。此外,通過PHPCrawl程序抓取下來的網(wǎng)頁在構(gòu)建trailbase數(shù)據(jù)庫時,除了自動保存下的URL外,還要對試用資源其他屬性的抽取,包括題名、內(nèi)容等。為此,本文根據(jù)不同試用數(shù)據(jù)庫中各個元素分別建立規(guī)則集,比如類比標(biāo)題前后的html標(biāo)簽,這種基于規(guī)則的方法能有效地提取大部分試用資源的相關(guān)信息[16]。
ThinkSNS2.0搭建環(huán)境:WindowsServer2003、Apache2.2.8、PHP5.2.6、MySQL5.0.51。本文在此系統(tǒng)中以“護(hù)士”做為搜索題名關(guān)鍵詞,搜索結(jié)果如圖5所示:
圖5 搜索結(jié)果界面
分享功能界面如圖6所示:
圖6 分享功能界面
分享成功后,在平臺首頁可以瀏覽到此分享信息,截圖如圖7所示,由于ThinkSNS內(nèi)嵌諸如收藏、轉(zhuǎn)發(fā)和評論等功能,其他用戶可以及時查閱并轉(zhuǎn)發(fā)此條微博信息,以實(shí)現(xiàn)試用信息資源的交流與共享。此外以雙“#”符號標(biāo)注的試用數(shù)據(jù)庫名稱可以自動形成話題,熱門話題將提高試用資源的點(diǎn)擊率。
圖7 分享發(fā)布后界面
本系統(tǒng)是對試用資源的充分利用而進(jìn)行的有效管理嘗試,在以后的工作中可以逐步開發(fā)館藏電子資源與SNS平臺結(jié)合,以及圖書管理系統(tǒng)與SNS相整合的模式,靈活圖書館服務(wù)結(jié)構(gòu),作為以網(wǎng)絡(luò)終端用戶作為信息主體的標(biāo)志產(chǎn)物,SNS必將使圖書館服務(wù)上升到新的高度。
[1]吳 麟.論高校圖書館試用數(shù)據(jù)庫的管理與利用[J].內(nèi)蒙古民族大學(xué)學(xué)報,2010,(1):157-158.
[2]李 欣,于亞秀.基于開源KBPublisher構(gòu)建圖書館個性化FAQ系統(tǒng)[J].現(xiàn)代圖書情報技術(shù),2011,(9):78-82.
[3]百度百科[EB/OL].http://baike.baidu.com/view/8258.htm.2009-10-6.
[4]Toronto public library on.facebook[EB/OL].http://www.facebook.com/home.php.?!/torontopubliclibrary?ref=search&sid=10344084805270463521.2010 - 05-16.
[5]Manchester library & information service on facebook[EB/OL].http://www.facebook.com/home.php?!/manchesterli&braries?ref=search&sid=10344084 8040741 400561.2010-05-16.
[6]圖書館2.0工作室.圖書館2.0:升級你的服務(wù)[M].北京:北京圖書館出版社,2008.212-213.
[7]Brooklyn college library on myspace[EB/OL].http://www.myspace.com/brooklyncollegelibrary.2010-05-17.
[8]Blended librarian profile[EB/OL].http://blendedlibrarian.org/profiles.html.2010-05-17.
[9]About blended librarian[EB/OL].http://blendedlibrarian.org/overview.html.2010-05-16.
[10]孫立偉,何國輝,吳禮發(fā).網(wǎng)絡(luò)爬蟲技術(shù)研究[J].電腦知識與技術(shù),2010,(15):286-289.
[11]周 寧,吳佳鑫.信息組織[M].武漢:武漢大學(xué)出版社,2010.375-377.
[12]楊建勇,張成波,鄒宇瑞.關(guān)于圖書館社交網(wǎng)絡(luò)(Lib-SNS)構(gòu)建的研究[J].圖書館學(xué)研究,2010,(15):29-33.
[13]《網(wǎng)絡(luò)神采》是什么?[EB/OL].http://www.sensite.cn/bget/default.htm.2011-12-07.
[14]About Thinksns[EB/OL].http://www.thinksns.com/document.html.2011-07-08.
[15]ThinkSNS2.0二次開發(fā)手冊[EB/OL].http://www.thinksns.com/document.html.2011-7-8.
[16]張 輝,徐朝軍,王 蔚.教育游戲資源智能搜索系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2008,(6):46-50.
[17]谷 綺,陳國榮,杜 剛等.網(wǎng)絡(luò)信息資源組織管理與利用[M].北京:科學(xué)出版社,2008.96-104.