胡雪環(huán)
摘 要:為降低讀者獲取信息的成本,提升咨詢服務(wù)質(zhì)量,圖書館應(yīng)順應(yīng)時代發(fā)展潮流,主動開展智能參考咨詢服務(wù)。文章探究了智能咨詢前期知識庫構(gòu)建的相關(guān)工作,以期為后期機(jī)器學(xué)習(xí)和各平臺智能咨詢系統(tǒng)的構(gòu)建提供參考和借鑒。
關(guān)鍵詞:參考咨詢;智能咨詢;知識庫;構(gòu)建原則;公共圖書館
中圖分類號:G258.2?? 文獻(xiàn)標(biāo)識碼:A?? 文章編號:1003-1588(2023)05-0018-04
1 背景
圖書館參考咨詢服務(wù)是指館員針對用戶需求,以各類權(quán)威信息資源為依托,幫助或指導(dǎo)用戶檢索獲取所需信息或提供相關(guān)數(shù)據(jù)資料、文獻(xiàn)查引查證和專題內(nèi)容等形式的信息服務(wù)??萍嫉倪M(jìn)步正在助推圖書館朝著數(shù)字化、網(wǎng)絡(luò)化、智能化的方向發(fā)展,參考咨詢服務(wù)從最初的現(xiàn)場咨詢擴(kuò)大到以現(xiàn)場咨詢、電話咨詢、表單咨詢、QQ實時咨詢、網(wǎng)頁在線咨詢、電子郵件咨詢、微信咨詢?yōu)橹鞯亩嗲雷稍?,有效打破了圖書館咨詢服務(wù)的時間空間限制。
隨著各類移動智能終端和即時通信軟件的廣泛應(yīng)用,讀者對信息的即時獲取和快速響應(yīng)需求不斷增多,圖書館需要以便捷、精準(zhǔn)、高效和人性化的方式為讀者提供參考咨詢服務(wù),以降低讀者獲取信息的時間成本,提升咨詢服務(wù)效率。目前,互聯(lián)網(wǎng)技術(shù)的成熟應(yīng)用、人工智能產(chǎn)業(yè)的快速發(fā)展、移動智能設(shè)備的廣泛普及,為參考咨詢服務(wù)向智能化轉(zhuǎn)變提供了支撐,智能參考咨詢服務(wù)逐漸成為圖書館領(lǐng)域的研究熱點之一。
2 圖書館智能咨詢服務(wù)研究現(xiàn)狀
近年來,部分高校圖書館和公共圖書館正在積極開展智能咨詢服務(wù)的相關(guān)研究實踐,如:清華大學(xué)圖書館基于核心語料庫自主研發(fā)的智能客服清小圖、上海圖書館與企業(yè)合作研發(fā)的智能客服圖小二、東南大學(xué)圖書館基于詞向量語義擴(kuò)展技術(shù)的智能咨詢系統(tǒng)、浙江工業(yè)大學(xué)圖書館基于微信公眾平臺和百度AI平臺設(shè)計開發(fā)的智能參考咨詢機(jī)器人圖小學(xué)等。與傳統(tǒng)的基于單一關(guān)鍵詞匹配的自動問答系統(tǒng)相比,智能咨詢系統(tǒng)在理解自然語言方面展現(xiàn)出更多的優(yōu)越性。
人工智能技術(shù)在參考咨詢服務(wù)領(lǐng)域得到廣泛應(yīng)用,本是一件提升服務(wù)水平、惠及讀者的好事,但在實際調(diào)研及試用中發(fā)現(xiàn),部分圖書館在高價購置智能機(jī)器人等硬件設(shè)備設(shè)施后,由于對數(shù)據(jù)后臺和知識庫建設(shè)的投入力度不足,出現(xiàn)智能設(shè)備淪為擺設(shè)的尷尬局面;部分圖書館雖然自主研發(fā)或與公司合作開發(fā)上線了問答系統(tǒng),但僅僅是基于單一化關(guān)鍵詞的匹配應(yīng)答,內(nèi)容并不涉及自然語言處理及語義擴(kuò)展方面的相關(guān)工作,難以應(yīng)對讀者基于自然語言的多樣性問答,測試中暴露出無法應(yīng)答或答非所問的種種缺陷,因而并非真正意義上的智能咨詢系統(tǒng)。不管是實體機(jī)器人,還是微信智能客服、網(wǎng)頁智能問答,設(shè)備、系統(tǒng)、技術(shù)固然重要,但也不再是唯一難點,真正實現(xiàn)智能化咨詢應(yīng)答,還離不開一個關(guān)鍵核心——智能咨詢知識庫。知識庫作為機(jī)器人的核心部分,是深度學(xué)習(xí)和數(shù)據(jù)挖掘的基礎(chǔ),雖然機(jī)器人的智能性取決于智能算法,但知識庫的構(gòu)建也至關(guān)重要[1]。知識庫的有效構(gòu)建離不開參考咨詢館員的參與,隨著人工智能技術(shù)的快速發(fā)展,智能咨詢知識庫的構(gòu)建不應(yīng)被置于技術(shù)的邊緣之外。
3 智能咨詢知識庫構(gòu)建的若干原則
移動設(shè)備及各類信息搜索軟件的廣泛應(yīng)用,使普通大眾獲取信息的渠道日益多樣化,圖書館主要面向線上線下讀者提供服務(wù),因此,圖書館構(gòu)建智能咨詢知識庫既無須像百科知識一樣面面俱到,也不能僅僅局限于本館服務(wù)資源。因此,合理的構(gòu)建原則可為公共圖書館構(gòu)建智能咨詢知識庫提供指導(dǎo)。
3.1 一個中心原則
一個中心原則是指始終堅持以圖書館業(yè)務(wù)為中心的原則。公共圖書館開展智能咨詢服務(wù)變的是服務(wù)形式和手段,不變的是服務(wù)內(nèi)容,即始終圍繞讀者證辦理、館藏文獻(xiàn)查詢借閱、各類數(shù)字資源檢索利用、特色數(shù)據(jù)庫及特色活動推介等核心業(yè)務(wù)逐步展開。參考咨詢館員在長期工作的過程中收集整理的常見問題解答庫(FAQ)是圖書館重點咨詢業(yè)務(wù)的高度總結(jié),因此,公共圖書館在智能咨詢知識庫構(gòu)建的初期,往往都會以FAQ為基礎(chǔ),但智能咨詢知識庫的內(nèi)容豐富程度高于FAQ。FAQ以高頻業(yè)務(wù)問題為主,知識覆蓋面窄,對于讀者來說耗時耗力且缺少互動和人文關(guān)懷。智能咨詢服務(wù)需要參考咨詢館員全面收集讀者日常咨詢的館情問題及相關(guān)問題,并根據(jù)長期積累的工作經(jīng)驗思考預(yù)判讀者可能問及的問題。智能咨詢知識庫的構(gòu)建環(huán)節(jié)比FAQ復(fù)雜,公共圖書館在構(gòu)建智能咨詢知識庫的過程中不僅要以豐富的服務(wù)內(nèi)容為基礎(chǔ),還要根據(jù)讀者自然語言的復(fù)雜性,結(jié)合參考咨詢館員總結(jié)的工作經(jīng)驗,構(gòu)建咨詢常用同近義詞庫(表)或語料庫,引入知識模型與語義擴(kuò)展等技術(shù)對基于自然語言提問的業(yè)務(wù)問題進(jìn)行有效識別與精準(zhǔn)回復(fù)。
3.2 多點覆蓋原則
公共圖書館構(gòu)建智能咨詢知識庫要堅持多點覆蓋原則,以讀者為中心,把圖書館服務(wù)和館藏資源利用相關(guān)的高頻咨詢問題及讀者關(guān)心或可能問到的問題納入知識庫體系,并根據(jù)讀者需求不斷完善知識庫體系。這些問題主要包括以下內(nèi)容:一是圖書館配套服務(wù)設(shè)施相關(guān)問題,如:熱水在哪里、圖書館有雨傘提供嗎、哪里有充電寶、有無自助售賣機(jī)、哪里可以吃午飯、有免費(fèi)存包柜嗎、有殘疾人通道嗎等。二是圖書館所在區(qū)域周邊服務(wù)相關(guān)問題,如:文德路少兒館和農(nóng)講所附近的少兒館是同一家嗎、附近有哪些地鐵線路經(jīng)過、這里離烈士陵園遠(yuǎn)不遠(yuǎn)、附近有沒有打印店、旁邊的魯迅紀(jì)念館是否需要單獨預(yù)約等。三是文旅融合相關(guān)問題,如:廣州有哪些值得去的旅游景點、圖書館附近有什么好玩的地方推薦、廣東的特色美食有哪些、不同季節(jié)適合去廣東哪里游玩等。
基于以上分析,廣東省立中山圖書館把智能咨詢知識庫的業(yè)務(wù)問題分為館情概況、入館須知、讀者證業(yè)務(wù)、借還及復(fù)印服務(wù)、數(shù)字資源及數(shù)字化服務(wù)、特殊群體服務(wù)等13個一級類目和若干二級類目,類目下的每一個問題的標(biāo)準(zhǔn)答案由參考咨詢館員進(jìn)行整理提煉,并由相關(guān)部門負(fù)責(zé)人審核確認(rèn),以確?;貜?fù)準(zhǔn)確可靠,具體內(nèi)容如下頁表1所示。
3.3 精準(zhǔn)化原則
公共圖書館的服務(wù)對象十分廣泛,由于不同讀者對同一個問題的提問方式不同,讀者的咨詢提問往往以較復(fù)雜的自然語言形式存在。如何確保智能咨詢系統(tǒng)能準(zhǔn)確識別讀者意圖并精準(zhǔn)匹配到知識庫中的答案,而非模糊匹配至若干個相似問題答案,是智能咨詢系統(tǒng)體現(xiàn)其智能化的關(guān)鍵所在,也是主要難點所在。
對從問題中抽取出的關(guān)鍵詞進(jìn)行語義擴(kuò)展,是提高答案匹配效果的關(guān)鍵[2]。因此,構(gòu)建圖書館參考咨詢同(近)義詞庫或語料庫既是智能咨詢知識庫構(gòu)建的一個重點工作,也是智能咨詢系統(tǒng)實現(xiàn)精準(zhǔn)解答的關(guān)鍵。同(近)義詞庫或語料庫越完備,可組配共現(xiàn)的關(guān)鍵詞組合就越多,可解答的咨詢問題場景就越豐富。智能咨詢系統(tǒng)在識別到讀者的自然語言后,往往需要進(jìn)行一系列的分詞切詞操作,對提取出的關(guān)鍵詞進(jìn)行組合匹配并映射到主問題,以實現(xiàn)自然語言提問與知識庫答案的精準(zhǔn)對接。
構(gòu)建同(近)義詞庫需要參考咨詢館員結(jié)合同(近)義詞字典和圖書館工作經(jīng)驗做具體分析。針對開館時間,不同讀者會有不同的表達(dá)方式,如:什么時候開館、幾點可以進(jìn)館、何時開放、幾時開門等;有的讀者甚至?xí)枅D書館幾點開始營業(yè)、營業(yè)到幾點下班、幾點開始上班。在其他社交場景下,開門和進(jìn)館并非同義,但在該場景下,開門和進(jìn)館二者是同義特征詞。另外,“營業(yè)”一詞一般出現(xiàn)在營利性機(jī)構(gòu)的咨詢問題中,從咨詢員角度幾乎不考慮該詞的納入,但面對讀者的咨詢提問,參考咨詢館員必須將“營業(yè)”一詞收錄到開館時間的同(近)義詞庫。針對未成年人辦證這一常見問題,讀者可能會有幾百種表達(dá)方式,關(guān)鍵詞有主語“未成年人”、謂語動詞“辦”和賓語“證”,在該語境下,“未成年人”的擴(kuò)展表達(dá)有小朋友、寶寶、小孩子、兒童、幼兒、少兒、小學(xué)生、初中生、高中生、未滿18周歲的、18周歲以下的等,“辦”的同義詞有申請、辦理、領(lǐng)取,“證”的同義詞有卡、讀者證、讀者卡、圖書證、圖書卡、借閱證、借書證、借書卡等。參考咨詢館員據(jù)此對關(guān)鍵詞進(jìn)行組配,可構(gòu)建出幾百個問題場景組合,這些場景組合能基本覆蓋讀者關(guān)于該問題的提問。由此可見,構(gòu)建相應(yīng)的知識庫是實現(xiàn)智能問答的重要前提[3]。構(gòu)建智能問答同(近)義詞庫具有較強(qiáng)的圖書館咨詢場景特征,對于智能問答系統(tǒng)的構(gòu)建及后期機(jī)器自主訓(xùn)練學(xué)習(xí)來說是一項基礎(chǔ)性工作。
3.4 人性化原則
智能咨詢系統(tǒng)既能提供精準(zhǔn)的主動式問答,也力求接近人工咨詢服務(wù)。因此,公共圖書館在構(gòu)建智能咨詢知識庫的過程中不僅要考慮知識層面問題體系的構(gòu)建,還要考慮自動應(yīng)答流程的設(shè)計,如問答內(nèi)容和問答邏輯。流程設(shè)計原則以《參考咨詢服務(wù)規(guī)范》中對人的要求為依據(jù),設(shè)置禮貌解答常用語及符合人性思維的問答邏輯。以目前廣東省立中山圖書館已投入使用的智能語音系統(tǒng)為例,主干流程主要包括:當(dāng)讀者電話撥通后,如何設(shè)置智能語音機(jī)器人的問候語;當(dāng)智能語音機(jī)器人初次識別不了讀者的提問語音時,如何回應(yīng)讀者;當(dāng)讀者無語音反饋時,如果進(jìn)一步引導(dǎo)讀者提問或結(jié)束提問;當(dāng)讀者提問一直不被智能語音機(jī)器人識別時,設(shè)置幾次問答轉(zhuǎn)入人工;當(dāng)讀者明顯出現(xiàn)不滿情緒,請求人工服務(wù),應(yīng)該如何快速響應(yīng);當(dāng)人工線路繁忙,如何設(shè)置回復(fù)答語等。雖然語音公司針對此類主干問答一般會有邏輯問答流程,但問答內(nèi)容和應(yīng)答邏輯往往與圖書館館情服務(wù)并不貼合,需要參考咨詢館員根據(jù)工作經(jīng)驗對主干流程問答內(nèi)容進(jìn)行干預(yù)更改。
為了凸顯人性化的服務(wù)原則,公共圖書館應(yīng)針對特色資源和特色活動設(shè)置專門的問答引導(dǎo),以降低讀者獲取知識的時間成本。例如,針對“你悅讀,我采購”活動,廣東省立中山圖書館需要針對采購書店、借閱流程、適用范圍等讀者關(guān)心的問題設(shè)置詳細(xì)具體的問答條目;針對特色數(shù)字文獻(xiàn)庫——縮微文獻(xiàn)全文數(shù)據(jù)庫,廣東省立中山圖書館需要考慮到很多讀者不知道數(shù)字化縮微庫的存在這一問題。因此,在諸如此類多途徑可選的特色資源問題設(shè)置上,廣東省立中山圖書館應(yīng)以最優(yōu)方案優(yōu)先推送為準(zhǔn)則,并輔以其他方案回復(fù)讀者。當(dāng)讀者提問怎么查找古籍資源時,廣東省立中山圖書館應(yīng)先推薦讀者選擇特色數(shù)字資源庫,并附上詳細(xì)的查找途徑,再推薦讀者到館特藏部現(xiàn)場查找,以降低讀者獲取知識的時間成本。
此外,在日常咨詢服務(wù)工作中,部分讀者雖然得到了解決方案,但仍會在咨詢臺與咨詢員繼續(xù)交談,為了展現(xiàn)圖書館的人文關(guān)懷,咨詢員需要以一個傾聽者或朋友的身份與讀者繼續(xù)交流。為了提高讀者的智能咨詢體驗,拉近讀者與智能客服的距離,公共圖書館需要設(shè)置人性化的自動應(yīng)答聊天環(huán)節(jié),以滿足讀者的情感交流需求。
3.5 可持續(xù)性原則
在智能咨詢知識庫初步構(gòu)建完成后,技術(shù)人員負(fù)責(zé)知識庫內(nèi)容的添加工作;咨詢員作為熟悉和了解讀者需求的館員,負(fù)責(zé)測試工作,并及時與技術(shù)人員溝通反饋測試中出現(xiàn)的各類問題。
前期測試重點圍繞以下內(nèi)容進(jìn)行更新完善:一是針對已有知識,讀者提問后,系統(tǒng)識別不了或答非所問,公共圖書館需要對該知識的問題場景進(jìn)行同(近)義詞增加或修正,以提升問題匹配的精確度。二是針對開放測試期間,已有知識的服務(wù)變更,如服務(wù)時間、活動地點等,公共圖書館需要對這些信息進(jìn)行及時更新完善。三是針對測試期讀者提出的新問題及館里發(fā)布的新通知等信息,公共圖書館需要及時把這些信息添加補(bǔ)充到知識庫。四是針對常規(guī)問候語和問答邏輯進(jìn)行測試修正,以期更符合人性化問答思維。五是收集情緒關(guān)鍵詞,針對讀者的情緒反饋,優(yōu)化智能機(jī)器人的情感性問答,提升讀者的情感服務(wù)體驗。
后期維護(hù)是一個長期過程,可有效避免工作爛尾現(xiàn)象的發(fā)生。公共圖書館除要做好前期維護(hù)工作外,還要做好以下工作:一是及時抓取最新活動信息,并將其添加到知識庫,避免活動信息漏更。二是定期收集匯總各個平臺的機(jī)器人與讀者的對話記錄,分析用戶的問答行為,擴(kuò)展同(近)義詞庫或語料庫,持續(xù)優(yōu)化智能知識庫,以滿足讀者的真實需求。三是建立公共圖書館聯(lián)合參考咨詢知識組織模型,規(guī)范智能參考咨詢行業(yè)詞庫和用語,加強(qiáng)與其他圖書館的交流與溝通。
4 結(jié)語
公共圖書館可把智能問答知識庫嵌入多種平臺,實現(xiàn)多平臺全方位的24小時實時智能咨詢。目前,廣東省立中山圖書館智能咨詢知識庫已被成功應(yīng)用于智能語音問答系統(tǒng)和網(wǎng)站在線咨詢客服“智能小書童”?;谥R庫的智能咨詢系統(tǒng)可有效推動參考咨詢服務(wù)工作的開展,拓寬參考咨詢服務(wù)的范圍,提高參考咨詢服務(wù)的用戶分析能力[4]。未來,圖書館智能參考咨詢服務(wù)必將朝著多端平臺協(xié)同、人機(jī)協(xié)同的方向發(fā)展,不論是基于網(wǎng)頁端、微信端的智能咨詢服務(wù),還是基于電話語音端、App客戶端、實體機(jī)器人設(shè)備的智能咨詢服務(wù),都需要以智能問答知識庫的構(gòu)建及參考咨詢館員的人工干預(yù)等為基礎(chǔ)工作。公共圖書館參考咨詢館員應(yīng)進(jìn)一步提高智能參考咨詢服務(wù)知識庫的數(shù)據(jù)質(zhì)量,探討未來參考咨詢服務(wù)的智能化發(fā)展方向。
參考文獻(xiàn):
[1] 陳鋒平.人工智能咨詢機(jī)器人在公共圖書館的應(yīng)用與探索:以杭州圖書館為例[J].圖書館研究與工作,2018(11):73-76.
[2] 張樂.詞向量語義擴(kuò)展技術(shù)在圖書館智能咨詢系統(tǒng)的應(yīng)用與實現(xiàn)[J].圖書情報工作,2020(18):126-136.
[3] 胡瀟戈,戚越,王玉琦,等.面向智能問答的圖書館參考咨詢知識庫體系設(shè)計及構(gòu)建[J].圖書情報知識,2019(5):101-108.
[4] 楊倩.智能咨詢機(jī)器人對圖書館參考咨詢服務(wù)的革新[J].農(nóng)業(yè)圖書情報學(xué)報,2021(5):93-99.
(編校:孫新梅)