陳冬梅
(廣西民族師范學(xué)院圖書館,廣西 崇左 532200)
數(shù)字參考咨詢服務(wù)在現(xiàn)代參考咨詢中的地位越來越重要,圖書館咨詢員可以與讀者通過網(wǎng)上參考咨詢系統(tǒng)進(jìn)行交流,接受提問并給出問題的解決辦法。它突破了用戶與咨詢員在時(shí)間和空間上的界限,提供了網(wǎng)上咨詢和交流的渠道。系統(tǒng)還建立了問答數(shù)據(jù)庫,將所有問題進(jìn)行整理保存,為以后進(jìn)行相似問題的咨詢積累經(jīng)驗(yàn),不僅有助于圖書館員對咨詢問題和答案的管理,而且有利于讀者對咨詢系統(tǒng)的利用。國外典型的參考咨詢系統(tǒng)主要有英國公共圖書館的Ask A Librarian、美國的虛擬咨詢臺系統(tǒng)(Virtual Reference Desk)等,國內(nèi)有國家科學(xué)數(shù)字圖書館數(shù)字參考咨詢系統(tǒng)、CALIS分布式聯(lián)合虛擬參考咨詢系統(tǒng)等[1]。筆者主要對參考咨詢系統(tǒng)的設(shè)計(jì)模式及開發(fā)技術(shù)進(jìn)行分析,為圖書館的信息化建設(shè)提供一些參考依據(jù)。
參考咨詢服務(wù)首先由用戶提出問題,圖書館工作人員收到咨詢問題后,對問題進(jìn)行分析和判斷,剔除不當(dāng)問題并給出拒絕回答的理由,將表達(dá)不夠清楚的問題重新發(fā)給用戶確認(rèn),問題明確后對其進(jìn)行分類,然后將問題分別發(fā)送給相應(yīng)解答人員或者咨詢專家,收到提交的答案后要進(jìn)行檢查,如果答案不合格,應(yīng)發(fā)回相關(guān)人員進(jìn)行修改,直到讀者對答案感到滿意為止。
從圖1可以知道系統(tǒng)主要包括3類用戶:參考咨詢員(咨詢專家)、讀者和系統(tǒng)管理員。參考咨詢員主要的工作就是接受用戶的咨詢請求,傾聽并理解用戶的提問,與之進(jìn)行交流,通過交流對用戶問題有更清晰的理解,掌握用戶的真正目的,回答問題后及時(shí)將答案發(fā)送給用戶并詢問用戶是否滿意。保存和整理已結(jié)束的咨詢記錄,對常見問題庫(FAQ)進(jìn)行分類整理,以方便用戶查找所需問題的答案。
讀者主要指登錄到系統(tǒng),使用系統(tǒng)中咨詢功能瀏覽問題、查詢答案、利用咨詢軟件咨詢問題的個(gè)人。讀者利用系統(tǒng)提供的手段,例如咨詢表單、實(shí)時(shí)咨詢等方式提出問題,與咨詢館員進(jìn)行交流和探討。進(jìn)行咨詢的用戶最大的特點(diǎn)就是無論何時(shí)何地,只要有網(wǎng)絡(luò)連接的地方,登錄系統(tǒng)就可以進(jìn)行咨詢,不受時(shí)空限制。
圖1 咨詢業(yè)務(wù)過程
管理員主要的工作就是對系統(tǒng)的日常維護(hù)和管理,包括讀者用戶的管理、專家管理、個(gè)人信息管理等。
軟件體系結(jié)構(gòu)主要有客戶機(jī)/服務(wù)器模式(C/S模式)和瀏覽器/服務(wù)器模式(B/S模式)。客戶機(jī)/服務(wù)器結(jié)構(gòu)主要包括一個(gè)客戶機(jī)(或稱前端)和一個(gè)服務(wù)器(或稱后端),客戶機(jī)的作用是訪問和處理遠(yuǎn)程服務(wù)器上的數(shù)據(jù),服務(wù)器的作用是接收和處理客戶機(jī)的數(shù)據(jù)請求。B/S模式主要包括表示層(Presentation)、功能層(Business)、數(shù)據(jù)層(Data Service)。表示層主要為Web瀏覽器,用戶通過瀏覽器網(wǎng)頁輸入信息提交與系統(tǒng)交互,也可通過網(wǎng)頁瀏覽相關(guān)信息。功能層是具有應(yīng)用程序擴(kuò)展功能的Web服務(wù)器,主要響應(yīng)瀏覽器的請求,啟動相應(yīng)的程序并處理請求,然后將處理的結(jié)果返回給客戶端瀏覽器。數(shù)據(jù)層是數(shù)據(jù)庫服務(wù)器,主要接受Web服務(wù)器的數(shù)據(jù)庫操作請求,實(shí)現(xiàn)對數(shù)據(jù)庫更刪改查等功能,然后將結(jié)果提交給Web服務(wù)器。圖2為基于Web訪問數(shù)據(jù)庫過程。與C/S模式相比,采用3層的B/S模式具有分布靈活、伸縮性好、管理能力強(qiáng)的特點(diǎn)。
系統(tǒng)開發(fā)環(huán)境包括硬件環(huán)境和軟件環(huán)境兩部分,硬件環(huán)境要根據(jù)圖書館自身的經(jīng)費(fèi)來確定購買什么樣的計(jì)算機(jī),配置什么樣的設(shè)備。筆者重點(diǎn)分析系統(tǒng)的軟件環(huán)境,主要的軟件開發(fā)環(huán)境可分為商業(yè)軟件和開源軟件兩種,商業(yè)軟件大多是以微軟服務(wù)器技術(shù)IIS、SQLserver及ASP、.NET技術(shù)為開發(fā)環(huán)境;開源軟件是以服務(wù)器技術(shù)Tomcat、Ecilicpse、MySQL為開發(fā)環(huán)境,主要以J2EE(JSP、JavaBean、Sevlet)、SSH(Struts、Spring、Hibernate)為核心技術(shù)框架。
按技術(shù)開發(fā)環(huán)境可分為結(jié)構(gòu)化開發(fā)技術(shù)和面向?qū)ο箝_發(fā)技術(shù),如ASP和JSP技術(shù)主要用于結(jié)構(gòu)化開發(fā),.NET和SSH技術(shù)主要用于面向?qū)ο箝_發(fā)。系統(tǒng)分析也可分為結(jié)構(gòu)化分析和面向?qū)ο蠓治?,面向?qū)ο蠓治鍪乾F(xiàn)在比較流行的系統(tǒng)開發(fā)方法,利用UML語言(Unified Modeling Language,統(tǒng)一建模語言)對系統(tǒng)模型進(jìn)行分析設(shè)計(jì),UML是運(yùn)用統(tǒng)一的、標(biāo)準(zhǔn)化的標(biāo)記和概念來實(shí)現(xiàn)對軟件的面向?qū)ο蠓治龊驮O(shè)計(jì),它主要由一系列的圖以及定義的各種關(guān)系組成,綜合了軟件工程領(lǐng)域的最新的思想和技術(shù),是一種占主導(dǎo)地位、功能強(qiáng)大、使用廣泛的建模語言。
由于開發(fā)時(shí)的要求不同,我們可以選擇不同的開發(fā)方法,對于比較簡單的參考咨詢系統(tǒng)我們可用結(jié)構(gòu)化分析方法對系統(tǒng)進(jìn)行需求分析及詳細(xì)設(shè)計(jì),在開發(fā)上可采用ASP+Access開發(fā)環(huán)境或Tomcat+JSP環(huán)境;如果是較大型的系統(tǒng)我們可采用面向?qū)ο蠓治黾夹g(shù),采用ASP.NET+SQLserver或SSH+MySQL等,在實(shí)際開發(fā)中可以根據(jù)自身的條件靈活選擇。筆者建議使用面向?qū)ο蠓治龇椒俺墒斓拈_源組合SSH進(jìn)行系統(tǒng)開發(fā),這些軟件一方面應(yīng)用比較廣泛,另外它們還屬于開源軟件,在經(jīng)濟(jì)和技術(shù)上有著獨(dú)到的優(yōu)勢。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,讀者的許多問題可通過網(wǎng)絡(luò)搜索引擎找到答案;另外還出現(xiàn)了百度知道、新浪愛問等網(wǎng)絡(luò)問答系統(tǒng),這些都影響了參考咨詢系統(tǒng)的發(fā)展,也為咨詢系統(tǒng)提高自身服務(wù)水平提供了借鑒。
許多網(wǎng)站有自己的網(wǎng)絡(luò)導(dǎo)航功能,如分類導(dǎo)航系統(tǒng),現(xiàn)在流行的網(wǎng)址導(dǎo)航便是其中的代表,導(dǎo)航系統(tǒng)主要是通過對本地資源分類展示,由用戶進(jìn)入相關(guān)類目進(jìn)行瀏覽和檢索。參考咨詢系統(tǒng)一般都有一個(gè)FAQ瀏覽系統(tǒng),按照一定的分類體系對問題和答案進(jìn)行分類,用戶則根據(jù)給定的分類界面選擇所問問題的類別進(jìn)行瀏覽。文獻(xiàn)[2]中的技術(shù)就是一種導(dǎo)航幫助系統(tǒng),其主要特點(diǎn)是,把問題類型分成咨詢問題類型、已知條件類型、信息資源類型和檢索技巧類型4個(gè)大類,每一分支又細(xì)分為更小的若干類型。系統(tǒng)通過用戶選擇查詢目的、已知條件類型、答案的信息資源類型、具體檢索工具等,判斷提供各種檢索技巧知識,幫助用戶通過學(xué)習(xí)來尋找答案。這種導(dǎo)航系統(tǒng)的特點(diǎn)是將檢索技巧作為系統(tǒng)知識庫的一個(gè)分支類型,讓用戶通過學(xué)習(xí)和掌握檢索技巧來達(dá)到自己解決問題的目標(biāo),提高其信息素養(yǎng)。
信息檢索技術(shù)主要包括自然語言分詞技術(shù)、索引技術(shù)、檢索技術(shù)3方面。部分FAQ庫使用一些簡單的數(shù)據(jù)庫搜索技術(shù),如通過關(guān)鍵詞進(jìn)行搜索。用戶可通過咨詢系統(tǒng)的搜索入口提交問題關(guān)鍵詞,系統(tǒng)先對問題進(jìn)行分析,然后搜索本地資源給出相關(guān)的檢索信息。關(guān)系數(shù)據(jù)庫檢索主要適合結(jié)構(gòu)化數(shù)據(jù),全文檢索技術(shù)適用于非結(jié)構(gòu)化數(shù)據(jù)如文本數(shù)據(jù)、圖像聲音等多媒體數(shù)據(jù),Lucene全文搜索技術(shù)就是其中一個(gè)典型代表。Lucene是一個(gè)純Java實(shí)現(xiàn)的成熟、自由、開源的軟件項(xiàng)目,是一個(gè)高性能的、可擴(kuò)展的全文索引工具包。它可以方便地嵌入到各種應(yīng)用,實(shí)現(xiàn)針對應(yīng)用的全文索引檢索功能?;贚ucene可建立數(shù)據(jù)庫、文檔、網(wǎng)頁、圖片等多數(shù)據(jù)源搜索引擎,這非常適合咨詢系統(tǒng),因?yàn)樽稍兿到y(tǒng)的問答庫資料往往比較復(fù)雜,包含各種格式和內(nèi)容的數(shù)據(jù)信息。
Lucene提供中文分詞擴(kuò)展功能來提高中文分析能力,對中文文本進(jìn)行分詞,然后再由Lucene進(jìn)行索引,如圖3,Lucene主要通過文檔索引和數(shù)據(jù)檢索兩項(xiàng)來實(shí)現(xiàn)其搜索功能。Lucene最核心的特征是通過特殊的索引結(jié)構(gòu),實(shí)現(xiàn)傳統(tǒng)數(shù)據(jù)庫不擅長的全文索引機(jī)制,并提供擴(kuò)展接口以方便不同應(yīng)用的定制,Lucene在維護(hù)索引文件方面也有其獨(dú)到之處。lucene建立索引的過程有4步:提取、構(gòu)建、分析、建立索引。Lucene檢索可以分為兩大部分:計(jì)算查詢語句與文檔的相似度,計(jì)算檢索排序得分返回結(jié)果文檔。Lucene的檢索方法是基于向量空間模型的,查詢語句和文檔都被表示成向量[3]。
參考咨詢系統(tǒng)的另一發(fā)展方向是智能化,其功能主要包括當(dāng)用戶提出問題后,系統(tǒng)會搜索與此問題相似的已答問題供用戶參考;當(dāng)回答某問題后,系統(tǒng)會向相關(guān)專家推薦與其相似且有待解決的問題來幫助回答;還可通過系統(tǒng)直接向讀者推薦一些其感興趣的問題,或向讀者推薦咨詢員。這些功能和方法有利于調(diào)動相關(guān)用戶參與回答問題,增加系統(tǒng)的主動性和智能化,對提高問題的回答率有益。根據(jù)不同的推薦機(jī)制形成不同的推薦方法,目前主要包括基于內(nèi)容的推薦機(jī)制、基于協(xié)同過濾的推薦機(jī)制以及結(jié)合型推薦機(jī)制3種?;趦?nèi)容的推薦機(jī)制就是分析問題本身的各項(xiàng)信息與被推薦用戶興趣的相關(guān)度來推薦問題;基于協(xié)同過濾的推薦機(jī)制是比較提問用戶興趣和被推薦用戶興趣,并找出與提問用戶最為相近的人來回答推薦問題;結(jié)合型推薦機(jī)制是將以上兩種方法相結(jié)合來推薦問題,不但要考慮待推薦問題與用戶興趣的相關(guān)性,還要考慮該問題的提出者與每個(gè)用戶興趣的相關(guān)度,然后通過一種加權(quán)算法來推薦問題。
圖3 Lucene索引和檢索流程
文獻(xiàn)[4]提出了基于負(fù)載平衡的問題推薦方法,在推薦時(shí)通過抽取問題相關(guān)的知識領(lǐng)域以及學(xué)習(xí)用戶的知識模型來進(jìn)行分析和比較,通過用戶對各個(gè)領(lǐng)域的興趣度和權(quán)威性來推薦相關(guān)問題,提高了問題的回答率以及答案的準(zhǔn)確率。同時(shí)還利用負(fù)載平衡技術(shù)分析用戶負(fù)載能力以控制某個(gè)專家被推薦的問題數(shù)量,以便將問題盡量推薦給興趣相近的不同用戶,挖掘出潛在專家。文獻(xiàn)[5]提出了基于層次分析方法(AHP)解決高校虛擬參考咨詢系統(tǒng)中的專家調(diào)度問題,按照層次結(jié)構(gòu)模型通過綜合運(yùn)算,計(jì)算出各專家的調(diào)度綜合評分,根據(jù)評分的高低為提問者分配一位最適合的專家來回答問題,加強(qiáng)系統(tǒng)的輔助決策功能。
[1] 張智雄,等.國家科學(xué)數(shù)字圖書館數(shù)字參考咨詢系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].大學(xué)圖書館學(xué)報(bào),2003(5):14-17.
[2] 周群芳,吳云標(biāo).自助式咨詢知識庫的組織設(shè)計(jì)[J].圖書情報(bào)工作,2008(3):80-83.
[3] 索紅光,孫鑫.針對中文檢索的Lucene改進(jìn)策略[J].計(jì)算機(jī)應(yīng)用與軟件,2009(6):175-177.
[4] 呼大為,陳恩紅,劉文印.即時(shí)交互式問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].小型微型計(jì)算機(jī)系統(tǒng),2009(9):1761-1766.
[5] 廖黎莉,等.高校參考咨詢系統(tǒng)中專家調(diào)度模式的研究[J].計(jì)算機(jī)工程,2007(4):272-275.