陳安琪
(南京圖書館,江蘇南京210000)
人工智能技術的發(fā)展給圖書館界帶來了深刻的變化,信息過載現(xiàn)象加劇,讀者需求的差異化程度越來越高,圖書館的知識服務方式亟需轉(zhuǎn)型升級,以滿足讀者的個性化需求。人工智能應用于圖書館知識服務,能夠通過智能化地采集讀者的個人信息和行為信息,掌握讀者的個性化需求和偏好,同時能夠深度整合和挖掘文獻信息,形成知識產(chǎn)品,從而有效提高知識服務的智能化和個性化水平,推動圖情領域的創(chuàng)新和發(fā)展。本文對人工智能融入圖書館知識服務的研究熱點和成果做了總結梳理,列舉了人工智能在知識服務中的典型應用,并構建了個性化的知識服務框架,對未來圖書館應用人工智能提供知識服務的實踐提出了建議和思考,以期為圖情領域的相關工作和研究提供借鑒。
人工智能(Artificial Intelligence)指的是研究和開發(fā)能夠模擬人的智能的技術方法,即讓機器模仿人的思考方式,擁有自主思考和學習的能力[1]。人工智能技術包括認知和感知兩大類,感知技術能夠賦予機器與人類相似的感官能力,如文字和語音識別技術,認知技術賦予機器與人相似的思考和學習能力,如自然語言處理、深度學習、智能搜索等技術。人工智能目前已廣泛應用于金融、醫(yī)療、教育和零售等多個行業(yè),代替人類從事簡單、重復的勞動,大大提高了效率。
知識服務是指通過整合和挖掘各種隱性和顯性知識,提供知識產(chǎn)品和深層次的信息服務,滿足用戶需求的過程[2]。知識服務源自國外,最初被稱為企業(yè)知識管理,旨在幫助企業(yè)提高效益和競爭力。美國圖書館協(xié)會率先嘗試將知識服務融入圖情領域,并于2001年指出,知識服務是圖書館未來的發(fā)展方向[3]。圖書館擁有大量的文獻信息資源,以及能夠挖掘、整合資源,形成知識產(chǎn)品的專業(yè)館員,具備提供知識服務的能力。
未來圖書館將在人工智能的支持下,隨時隨地提供知識服務,實現(xiàn)知識的互聯(lián)互通[4]。人工智能在知識服務中的應用體現(xiàn)在知識生產(chǎn)、用戶分析和智能服務三個方面。人工智能的深度學習、自然語言處理、知識圖譜、神經(jīng)網(wǎng)絡等技術,能夠?qū)崿F(xiàn)智能化的知識生產(chǎn);情境感知和智能穿戴技術的發(fā)展,有助于圖書館進一步搜集用戶信息,分析用戶的偏好和需求;應用人機交互技術和智能機器人提供知識服務,能夠替代館員簡單、重復的勞動,提高服務效率。
圖情領域已經(jīng)有眾多學者注意到了人工智能的發(fā)展,并開始研究如何將其應用于圖書館知識服務中。本研究基于文獻分析法,對該領域的主要研究進行了梳理,發(fā)現(xiàn)目前的研究熱點和研究成果主要體現(xiàn)在以下幾個方面:
(1)在信息智能化檢索中的應用。自然語言處理、文字和圖像識別、視覺搜索、深度學習等人工智能技術在信息檢索中的應用優(yōu)化了檢索方式,能夠使檢索結果的準確性更高,且檢索速度更快,推動了個性化、智能化搜索的發(fā)展。謝智敏和郭倩玲介紹了引入深度學習技術的智能搜索引擎Semantic Scholar[5],周偉等則研究了基于差分進化算法的智能搜索引擎[6]。
(2)智能機器人在知識服務中的應用。隨著語音識別、人機交互技術、自然語言處理和傳感技術的發(fā)展,智能機器人技術越來越成熟,被廣泛應用于圖書館知識服務。學者在該領域的研究主要通過實證分析,探究當前智能機器人服務存在的不足之處,從而指出如何進一步將圖書館服務與智能機器人相結合,發(fā)揮其優(yōu)勢。如鮑劼等論述了中國礦業(yè)大學圖書館引入智能機器人提供服務的實踐[7],樊慧麗和邵波論述了智能機器人在國內(nèi)外圖書館的應用實踐,并指出要培養(yǎng)專業(yè)人才,積極構建語料庫,開發(fā)相關技術[8]。
(3)在信息分類和數(shù)據(jù)挖掘中的應用。該領域研究者主要圍繞神經(jīng)網(wǎng)絡、數(shù)據(jù)抽取、自動分類算法和大數(shù)據(jù)技術,研究在對信息進行處理和分類的過程中,如何提高速度和準確性,并設計了多種數(shù)據(jù)挖掘工具,如Spss Clementine、Knowledge Mine等[9],以及如何在海量數(shù)據(jù)中挖掘有價值的信息,并應用于用戶需求分析,如付斌等研究了如何在預測需求的過程中,基于BP神經(jīng)網(wǎng)絡技術進行數(shù)據(jù)挖掘[10]。
(4)在研究前沿及熱點探測中的應用。對研究前沿和熱點的探測和發(fā)現(xiàn),是圖書館提供知識服務的重要依據(jù)。該領域?qū)W者的研究重點在如何將自然語言處理、K-means算法、知識元共現(xiàn)技術融入主題演化分析,從而優(yōu)化現(xiàn)有的分析方法,更準確地探測研究前沿和熱點,如孫震和冷伏海基于知識元共現(xiàn)技術,提出了一種ESI研究前沿知識演進分析方法[11]。
(5)知識服務框架構建和展望。圖情領域有眾多研究者基于對人工智能的研究及其在圖書館知識服務中的應用,構建了基于人工智能的知識服務體系和框架,并對知識服務未來的創(chuàng)新路徑提出了思考和建議。張曉林認為,人工智能技術的發(fā)展將重新定義知識服務,對知識服務進行創(chuàng)新和供給側(cè)改革[12];柳益君等基于人工智能技術和以用戶為中心的服務理念,構建了知識服務體系和路徑,對圖書館知識服務進行了創(chuàng)新[13];MINSKY等指出,人工智能技術能夠根據(jù)個體在不同情境下的具體需求,定制個性化的服務方案[14]。
紙質(zhì)文獻資源的數(shù)字化,是圖書館一項重要的工作,也是圖書館為讀者提供數(shù)字化知識服務的基礎。圖書館目前一般采用人工的方式對紙質(zhì)文獻進行數(shù)字化,但效率較低,且可能損害珍貴的紙質(zhì)文獻[15]。人工智能技術可以完成對紙質(zhì)文獻資源的自動化掃描,并基于精準的文字識別和圖片識別技術,識別文獻的內(nèi)容。Kirtas是知名的機器人制造商,其制造的全新掃描機器Kabis采用真空吸附技術,能夠模擬人手翻書的動作進行掃描,同時盡可能避免人手可能對珍貴文獻造成的損害,且掃描速度高達每小時3300頁,大大超過人工掃描的速度。劍橋大學圖書館、哈佛大學圖書館和微軟在線圖書館,都曾在文獻數(shù)字化項目中應用Kabis[16]。
知識發(fā)現(xiàn)泛指通過對數(shù)據(jù)的處理,在海量的信息資源中識別、檢索、分類、表示、存儲有用的知識,并發(fā)掘知識之間的關聯(lián)的過程[17]。隨著“互聯(lián)網(wǎng)+”的發(fā)展,數(shù)據(jù)和信息出現(xiàn)爆炸式增長,海量的非結構化信息,導致用戶獲得有用信息的難度越來越大。傳統(tǒng)的數(shù)據(jù)發(fā)現(xiàn)和挖掘工具,已經(jīng)無法適應當下的數(shù)據(jù)環(huán)境,存在檢索準確率低、無法實現(xiàn)個性化知識發(fā)現(xiàn)的問題。人工智能環(huán)境下,基于Ontology和Agent的智能檢索技術被廣泛應用于圖書館的知識檢索和發(fā)現(xiàn)系統(tǒng)??的螤柎髮W圖書館的“My Library”系統(tǒng)能夠預測用戶的需求和興趣,具有智能化的信息過濾和推送功能,實現(xiàn)了知識發(fā)現(xiàn)的智能化和知識服務的個性化[18]。此外,基于位置的檢索和移動視覺檢索也已經(jīng)被應用于圖書館信息檢索實踐,大幅降低了用戶的檢索成本。
隨著技術的發(fā)展,用戶使用知識服務的方式和習慣也發(fā)生了改變,對服務的便捷性、即時性提出了更高的要求。過去,圖書館主要采取表單、郵件等方式提供參考咨詢服務,這種服務方式效率較低,難以即時響應用戶的需求,實時知識服務成為了必然的選擇。國內(nèi)的部分圖書館開始嘗試用智能機器人替代館員,例如清華大學的參考咨詢機器人“小圖”,以及深圳圖書館的“小圖丁”[19]。人機交互和自然語言處理技術的發(fā)展,使得用戶以自然語言表達的需求也能被機器人理解,并迅速得到回應。與真人館員相比,機器人的響應速度更快,可以通過調(diào)用圖書館的知識庫,實時地與讀者進行交互,解決讀者的需求。
知識圖譜使用“實體—關系—實體”模型描述數(shù)據(jù),不僅能夠表現(xiàn)各種客觀存在的實體和知識,還能體現(xiàn)個體間的關聯(lián),從而形成語義網(wǎng)絡,引入知識圖譜可以挖掘知識之間的關聯(lián),將其組織成有一定內(nèi)在邏輯、能夠滿足用戶需求的知識體系[20]。自動抽取技術實現(xiàn)了準確地在大數(shù)據(jù)中抽取實體和關系,從而發(fā)現(xiàn)知識之間的關聯(lián),是智能化構建知識圖譜的核心技術。具有可視化功能的本體編輯工具RelFinder、RDF-Gravity和LD-VOWL等正逐步完善,并應用于實踐中,可見基于人工智能的知識圖譜構建平臺已成為現(xiàn)實,實現(xiàn)了智能化的知識組織。上海圖書館建成了用于編輯本體知識的本體服務中心OSC平臺,包括檢索中心和校驗中心兩部分,能夠查詢和校驗本體[21]。此外,壓縮感知技術和區(qū)塊鏈的引入,能夠解決知識圖譜在數(shù)據(jù)傳輸和安全方面存在的隱患,進一步完善知識圖譜技術。
本研究結合人工智能和圖情領域現(xiàn)有的相關研究成果,以及目前圖書館引入人工智能進行知識服務的實踐,結合用戶畫像技術對讀者需求的預測,構建了個性化的知識服務框架,包含數(shù)據(jù)采集層、畫像應用層、知識生產(chǎn)層和個性化服務層,具體如圖1所示。
用戶數(shù)據(jù)的采集包括靜態(tài)和動態(tài)的數(shù)據(jù)。靜態(tài)數(shù)據(jù)又稱顯性數(shù)據(jù),主要包括用戶的性別、年齡、學歷、專業(yè)、研究方向等基本屬性;動態(tài)數(shù)據(jù)又稱隱性數(shù)據(jù),主要是指用戶使用圖書館知識服務時的行為軌跡,以及對知識服務內(nèi)容的偏好,如瀏覽歷史、搜索記錄、咨詢信息等,這些數(shù)據(jù)需要清洗、過濾、整合之后才能加以利用[22]。初次接觸和使用知識服務的新用戶,其有效數(shù)據(jù)集中在靜態(tài)的顯性數(shù)據(jù),關于用戶行為的動態(tài)數(shù)據(jù)較少,而用戶使用圖書館知識服務的過程,也是圖書館不斷收集動態(tài)數(shù)據(jù),完善用戶畫像的過程。
人工智能的發(fā)展使圖書館能夠以更高的效率,采集規(guī)模更為龐大的用戶數(shù)據(jù)。人機交互系統(tǒng)能夠在與用戶交互的過程中,記錄用戶的需求和反饋;情境感知和智能感知技術使得用戶數(shù)據(jù)的來源更為廣泛,通過可穿戴設備和傳感器,能夠?qū)崟r識別入館讀者,并采集其行為信息,包括讀者在圖書館的位置、移動路線、停留時長等,有效記錄讀者所處的位置和動態(tài);視覺搜索、語義搜索等智能搜索技術的發(fā)展,有助于掌握用戶的信息搜索習慣。
智能化的知識信息采集包括讀者驅(qū)動采購、開放資源獲取和資源的智能數(shù)字化。人工智能在情境感知、知識圖譜、人機交互方面的技術優(yōu)勢,能夠即時抓取讀者信息并進行分析,幫助圖書館針對讀者的興趣和習慣,進一步優(yōu)化采訪工作。對于互聯(lián)網(wǎng)上隨處可見的開放資源,人工智能軟件能夠自動采集,及時更新,并構建專題數(shù)據(jù)庫。此外,基于人工智能技術開發(fā)的智能機器人可以實現(xiàn)紙質(zhì)資源的自動化掃描,并識別其中的文字和圖片,完成紙質(zhì)文獻的數(shù)字化。
通過用戶畫像的構建,可以對各類用戶對于圖書館知識服務的個性化需求和偏好進行更加精準的分析和預測,為圖書館后續(xù)整合資源、設計個性化服務提供基礎和依據(jù)。
畫像生成模塊基于采集到的用戶數(shù)據(jù)對用戶進行標簽化,然后基于人工智能的知識圖譜技術,對數(shù)據(jù)進行深度挖掘,將標簽可視化,生成用戶的個體畫像。在個體畫像繪制完成后,通過K-Means等聚類算法,從海量個體畫像中抽取一定數(shù)量作為簇的中心,然后計算其他畫像到中心的距離,根據(jù)計算結果,把每一個個體畫像都歸到一個類中,構建出不同用戶群體的群體畫像。
在服務設計方面,為了加強服務的針對性,需要保證所提供的服務和資源與用戶群體之間具有較高的匹配度。圖書館可以引入?yún)f(xié)同過濾算法,包括基于內(nèi)容的協(xié)同過濾,和基于用戶的協(xié)同過濾。前者根據(jù)用戶使用知識服務的行為和偏好,為其推薦相似的內(nèi)容,即將用戶對于知識服務的偏好作為向量,計算內(nèi)容之間的相似度,然后找出相似的內(nèi)容推薦給用戶;后者通過比對用戶的個體畫像,找出與該用戶的個人屬性和行為偏好相似度較高的其他用戶,然后根據(jù)其他用戶的畫像分析其對內(nèi)容的偏好,從而預測該用戶的偏好和需求,為其推送類似的資源和服務。此外,還可以引入KNN(K最近鄰,K-Nearest Neighbor)分類算法,即如果與某個樣本相似的k個樣本都屬于某一群體,則將該樣本也可歸入這一群體,然后計算資源和服務與每一個群體的匹配度,根據(jù)每一個用戶群體的自身特性,為其適配相應的資源和服務[23],從而設計出個性化的知識服務產(chǎn)品。
人工智能可以實現(xiàn)智能化的知識發(fā)現(xiàn)、知識檢索,以及自動化的知識組織,使知識生產(chǎn)更加高效。
人工智能能夠?qū)崿F(xiàn)智能化的知識發(fā)現(xiàn)。人工智能運用文本挖掘、機器學習、聚類分析、自然語言處理等技術,抓取和分析各類信息資源中所蘊含的知識內(nèi)容,抽取其中有用的部分進行知識組織,形成知識庫。
人工智能的跨庫檢索、智能檢索、自然語言處理和神經(jīng)網(wǎng)絡技術應用于圖書館的信息檢索系統(tǒng),能夠提高信息檢索的準確率,并實現(xiàn)全文搜索和預測性搜索。同時,人工智能的應用和發(fā)展,使讀者檢索信息的方式更為多樣化,得到的結果也更為豐富。過去,讀者通過輸入關鍵詞在圖書館系統(tǒng)中檢索,得到的結果通常為數(shù)字或紙質(zhì)文本信息。人工智能使用戶可以通過圖片、語音等方式檢索,并結合移動視覺檢索和位置檢索,得到更為精準和豐富的檢索結果。
人工智能通過算法和技術的革新,可以基于知識自動抽取繪制知識圖譜,實現(xiàn)知識組織的自動化,并可視化地展示知識之間的關聯(lián)。此外,人工智能可以自動檢索元數(shù)據(jù),并創(chuàng)建MARC記錄或MODS文件,達到理想的知識揭示和標引效果,解決過去各個圖書館之間由于沒有制定統(tǒng)一和完善的元數(shù)據(jù)標準,無法實現(xiàn)統(tǒng)一的信息組織的問題[24]。
基于人工智能所構建的個性化知識服務層,包括知識導航、知識推薦、知識共享和知識咨詢四大功能模塊。
知識導航能夠整合多個知識庫,并基于可視化知識圖譜技術,將知識關聯(lián)起來,實時展示知識之間的動態(tài)關系、學科熱點和研究前沿,將知識體系清晰地呈現(xiàn)在用戶眼前[25]。智能化的知識導航系統(tǒng)能夠?qū)崿F(xiàn)自助式的讀者服務,幫助讀者自主發(fā)現(xiàn)感興趣的知識,全面把握知識脈絡,同時也大幅減輕館員的服務壓力。
知識推薦是人工智能在圖書館信息服務中的典型應用場景,不需要用戶主動提出明確的需求,可以自動根據(jù)用戶畫像和信息檢索行為實時分析用戶的信息需求,智能化地向用戶推薦他們最需要、最感興趣的資源,提升信息利用效率和用戶滿意度[26]。知識推薦系統(tǒng)主要運用人工智能的情境感知技術,實時感知讀者所處的位置和動態(tài),然后運用數(shù)據(jù)挖掘技術對海量用戶數(shù)據(jù)進行處理,生成用戶的個體畫像和群體畫像,分析用戶的個性化需求和所處的具體場景,為其匹配嵌入式的知識服務,通過多種渠道向用戶推送,并根據(jù)用戶的行為和反饋實時調(diào)整。
知識共享模塊包括用戶之間,以及圖書館之間的知識共享。首先,圖書館鼓勵用戶通過分享、傳遞和交流,將個體的知識轉(zhuǎn)化為個體的知識,實現(xiàn)協(xié)作共贏?;谌斯ぶ悄芗夹g進行數(shù)據(jù)挖掘,構建社會圖譜,可以發(fā)現(xiàn)知識傳播網(wǎng)絡中的關鍵節(jié)點,從而構建知識共享社區(qū),實現(xiàn)知識的社會化傳播。其次,圖書館可以通過館際協(xié)作,構建共享知識服務平臺,有機整合各個成員館所開發(fā)的知識產(chǎn)品,形成統(tǒng)一的數(shù)據(jù)格式和服務標準,實現(xiàn)資源和服務的共建共享。
知識咨詢模塊引入人工智能技術,可以實現(xiàn)針對簡單咨詢的自動問答,以及針對復雜需求的嵌入式服務。自動問答主要依靠智能機器人實現(xiàn),能夠通過語音識別和文字識別技術理解讀者的問題,并自動匹配答案。智能機器人能夠大幅減輕咨詢館員的工作壓力,讓館員可以集中精力進行知識產(chǎn)品開發(fā),提供深度服務。
為進一步發(fā)揮人工智能在圖書館知識服務中的作用,圖書館應在協(xié)同合作的基礎上,實現(xiàn)知識資源的共建共享,以及知識服務的智能化、精準化和個性化。
首先,圖書館之間要加強溝通與合作,包括不同地區(qū)的圖書館,以及高校館和公共館之間的合作,成立專業(yè)性的圖書館聯(lián)盟和區(qū)域圖書館聯(lián)盟,乃至國際圖書館聯(lián)盟,并基于大數(shù)據(jù)和人工智能技術,共同建設智能化的知識服務平臺,結成基于人工智能技術的智慧圖書館聯(lián)盟。其次,要加強圖書館與企業(yè)、政府之間的協(xié)同合作。圖書館的優(yōu)勢在于擁有大量文獻資源以及用戶數(shù)據(jù),但技術力量比較薄弱,缺少相關的技術型人才,因此需要相關企業(yè)提供技術支持,為圖書館量身定做符合圖書館定位、能夠向用戶提供個性化和智能化服務的產(chǎn)品,如機器人館員等。但是,由于圖書館本身具有非營利性,與企業(yè)追求經(jīng)濟利益的目標有天然的矛盾,因此還需要政府發(fā)揮協(xié)調(diào)作用,提供必要的資金支持,在企業(yè)和圖書館之間搭建統(tǒng)籌協(xié)作平臺,幫助圖書館順利引入人工智能技術,實現(xiàn)知識服務的智慧化升級。
知識服務是一個動態(tài)的過程,知識服務團隊也應該在人工智能的推動下積極探索和嘗試,不斷自我完善。人工智能將使知識服務團隊向“小而精”的方向發(fā)展,即隊伍規(guī)模縮小,人員素質(zhì)提高。隨著人工智能的發(fā)展,館員的一些簡單、重復,標準化程度高的人力勞動將被機器取代,例如服務咨詢、資源上架、資源采編等,使館員有精力從事更多的知識密集型工作,提供更深入的知識服務。同時,人工智能的機器學習、神經(jīng)網(wǎng)絡和深度學習等技術,需要有海量訓練數(shù)據(jù)作準備,因此也會出現(xiàn)一些專業(yè)化程度更高的新興崗位,如負責挖掘、整合圖書館海量用戶數(shù)據(jù)的數(shù)據(jù)分析師,負責對機器進行訓練的人工智能訓練師等。未來,知識服務館員應持續(xù)發(fā)揮主觀能動性,積極學習和應用新的技術,在堅持用戶為中心的基礎上,進一步將人工智能融入知識服務實踐。
海量用戶信息的采集和挖掘,是圖書館分析用戶畫像,提供精準化服務的基礎,但基于人工智能的用戶信息挖掘,會導致信息安全和用戶個人隱私面臨風險。
為了防范數(shù)據(jù)泄露,保護用戶隱私,政府和圖書館首先應進一步健全相關的法規(guī)和制度。歐盟制定了《通用數(shù)據(jù)保護法》,明確規(guī)定了企業(yè)和政府應如何使用用戶信息和隱私數(shù)據(jù),并對利用大數(shù)據(jù)獲利的行為做了限制[27]。我國也應加強相關立法,特別是圖書館領域的立法,合理規(guī)范人工智能在圖書館的應用,明確用戶隱私信息的邊界,加強信息安全的管理。
此外,人工智能的生物識別技術,如指紋識別、人臉識別、語音識別等,已經(jīng)逐步應用于圖書館領域,在有效采集必要的用戶信息用于分析的同時,避免了傳統(tǒng)身份認證和信息采集方式可能造成的數(shù)據(jù)泄露問題。例如,在采取指紋識別方式的時候,不需要完整獲取和保存用戶指紋信息,只需要進行矢量測量,然后用算法轉(zhuǎn)換成一串數(shù)字,與讀者的身份信息綁定[28]。當讀者通過指紋識別獲取知識服務時,圖書館可以有效識別讀者身份,記錄其行為數(shù)據(jù),且不會泄露隱私信息。
在“互聯(lián)網(wǎng)+”時代,信息總量迅速增長,圖書館僅憑文獻借閱等傳統(tǒng)服務很難繼續(xù)吸引用戶,融入人工智能的新型知識服務能夠滿足讀者的個性化需求,將成為圖書館新的服務方向。目前,人工智能領域的深度學習、自然語言識別和處理、人機交互、視覺搜索等技術已經(jīng)廣泛應用于圖書館知識服務,實現(xiàn)了信息檢索和組織的智能化。但從總體發(fā)展進程來開,圖書館探索將人工智能應用于知識服務的實踐尚處于起步階段,如何使知識服務進一步普及,提高信息的傳播和交流效率,推進服務的智能化、個性化和精準化,將是今后的研究重點。