董 彥
(國家圖書館,北京 100081)
隨著《新一代人工智能發(fā)展規(guī)劃》的提出與實施,預示著人工智能技術已經(jīng)成為科技發(fā)展的重要戰(zhàn)略計劃,這將給圖書館行業(yè)帶來深刻的變化[1]。深入研究基于人工智能的圖書館知識服務創(chuàng)新問題有著重要的實踐意義[2]?;谌斯ぶ悄艿闹腔蹐D書館將是未來圖書館的發(fā)展形態(tài),并且智慧圖書館的服務離不開互聯(lián)網(wǎng)、數(shù)據(jù)挖掘、模式識別、多媒體和數(shù)字化等多項技術的支持[3]。人工智能背景下的圖書館服務,并不只是人工智能技術和圖書館服務之間的簡單疊加,而是二者之間的深度融合與交互。建設智慧圖書館服務體系,深化圖書館知識服務,是未來圖書館的發(fā)展方向[4]。
圖書館依靠人工智能技術強大的數(shù)據(jù)處理與分析功能,通過數(shù)據(jù)收集、知識發(fā)現(xiàn)、知識融合、深度推理,在信息資源和知識需求之間構建出知識服務與應用模式,通過傳感與認知技術,協(xié)助圖書館用戶更方便、快捷地完成知識獲取和應用。
利用數(shù)字化和多媒體化工具,圖書館可以通過各種渠道收集文獻資源數(shù)據(jù)和用戶信息、行為以及社交數(shù)據(jù),形成多元異構的大數(shù)據(jù),包含有結構化數(shù)據(jù)、半結構化數(shù)據(jù)以及非結構化數(shù)據(jù),在數(shù)據(jù)的類型上也包括文本、圖像、音頻以及視頻等多種數(shù)據(jù)形式。隨著人工智能應用的深入,圖書館的數(shù)據(jù)來源將會越來越多樣化,除了鍵盤鼠標等傳統(tǒng)輸入設備,數(shù)據(jù)的收集還可來自傳感器、可穿戴設備以及眼動儀等高科技設備[5]。當圖書館收集到海量數(shù)據(jù)之后,需要對數(shù)據(jù)進行挖掘并發(fā)現(xiàn)蘊含在數(shù)據(jù)中的學科、資源和用戶知識。在對文本數(shù)據(jù)的知識發(fā)現(xiàn)上,可采用人工智能中的自然語言處理技術,通過對文本的理解和挖掘,采用關聯(lián)規(guī)則分析、偏差分析和聚類等方法,從數(shù)據(jù)中提取出知識元,以知識元為基礎構建知識實體及其屬性,從而形成知識元數(shù)據(jù)庫。在知識元數(shù)據(jù)庫基礎上,很容易提取用戶行為、興趣偏好,以及理解文獻中的知識。
在知識發(fā)現(xiàn)的基礎上,基于知識推理和深度學習,可以構建出知識圖譜,實現(xiàn)對較復雜的數(shù)據(jù)語義深度推理和理解,是圖書館知識服務的有力支撐?;谥R圖譜的深度推理主要包括兩個主要方面,分別是符號推理和統(tǒng)計推理。其中,符號推理不需要用戶自定義推理過程,可直接發(fā)現(xiàn)不同知識元實體之間的語義關聯(lián)關系。統(tǒng)計推理則通過統(tǒng)計方法從知識圖譜中獲取隱藏在其中的隱含知識。深度學習的超強數(shù)據(jù)挖掘能力和圖書館積累的大數(shù)據(jù)和云計算平臺,使得圖書館獲得了對知識圖譜深度推理的能力。深度推理將應用卷積神經(jīng)網(wǎng)絡以及循環(huán)神經(jīng)網(wǎng)絡,從知識圖譜中挖掘出更有意義的內(nèi)容,包括在圖書館的專家問答系統(tǒng)、知識推薦系統(tǒng)、資源搜索系統(tǒng)中,都將提供穩(wěn)定的知識挖掘和識別結果,為讀者提供專業(yè)的創(chuàng)新服務。
在知識圖譜及其深度推理的基礎上,還需要構建知識的服務與應用,分別包括知識挖掘結果的查找、推理、學習和計算。針對知識圖譜構建的知識服務,能夠為圖書館用戶提供智能化、智慧化的多種知識服務。其中,通過對用戶行為、偏好和資源檢索的知識圖譜進行深度推理,可以為不同的用戶構建精準的用戶畫像,在用戶畫像基礎上完成對用戶的個性化知識服務建設[6]。另外,基于圖書館的學科資源知識圖譜構建的深度推理,可以為用戶提供某個學科的知識關聯(lián)、發(fā)展前景、研究熱點,以及更為細致化的學科知識導航。最后,基于專家信息、交流信息等構建的知識圖譜,結合自然語言處理技術可以構建出自動問答系統(tǒng),通過自動問答系統(tǒng)能夠有效解決用戶的基礎需求,解放專家資源去完成更有深度的交互和問答。同時,自動問答系統(tǒng)可以方便、快捷地彌補學科中的短板,讓圖書管理員起到主導作用,為用戶提供更細致的知識問答服務。
計算機網(wǎng)絡與智能技術促進了知識獲取方式的長足發(fā)展,同時也帶來了知識迷航的問題。如今,海量的大數(shù)據(jù)涌入讀者的眼簾,容易使讀者產(chǎn)生疲勞,無法從大量數(shù)據(jù)中獲取自己所需要的數(shù)據(jù)。因此,圖書館知識服務創(chuàng)新首要解決的問題便是知識導航與知識檢索,并且需要構建出自助式的導航與檢索,提升獲取數(shù)據(jù)的效率,并減少不必要的消耗。為了構建自助式導航,依托于學科之間的知識圖譜的可視化過程,可以形成知識與知識、知識與資源之間的關聯(lián)關系。由知識圖譜中推理出的資源關聯(lián)關系,可以導航出實體之間的動態(tài)關聯(lián)。讀者通過自助的方式,即可方便地把握知識的發(fā)展過程,可以及時發(fā)現(xiàn)知識主體和學科熱點,了解當前的研究動態(tài)和發(fā)展。
此外,依托于知識圖譜,將知識和資源關聯(lián)起來,設計出智能知識檢索系統(tǒng),通過關鍵詞的搜索,該系統(tǒng)不但返回搜索關鍵詞的匹配結果,還能夠根據(jù)讀者的歷史檢索記錄以及資源檢索結果,為用戶建立符合其興趣的知識卡片,分別包括相應作者的介紹、作品信息以及學術鏈接等。另外,資源之間的相關關系,可以通過知識圖譜與跨庫資源共同建設,對讀者的知識檢索結果設計深度關聯(lián),提升資源的延展性。
圖書館面臨的用戶群體越來越年輕化,該群體更需要圖書館服務的場景化與個性化。其中,場景化不同于傳統(tǒng)的情景感知,需要將讀者的動態(tài)化、多樣化場景結合起來,更強調(diào)讀者與場景的交互?;谝苿訄D書館基礎設計個性化知識推薦,可采用機器學習與模式識別技術,從不同讀者的終端上讀取行為數(shù)據(jù)、時間數(shù)據(jù)、定位數(shù)據(jù)等行為數(shù)據(jù)和傳感數(shù)據(jù),對讀者的閱讀地點、行為軌跡、行為模式進行挖掘與分析,通過分析結果對場景建模,隨后采用Spark 內(nèi)存分析技術,實時完成場景匹配。最后,對于匹配到的場景,實現(xiàn)場景知識推薦。場景知識推薦可以讓讀者獲取更真實的體驗,并增強讀者對于圖書館創(chuàng)新服務的需求。
其次,個性化服務也是年輕讀者的需求之一。個性化服務是主要以讀者為中心,設計出與個體相關度大的高質(zhì)量知識服務[7]。通過知識圖譜構建的用戶畫像,精準地給出了讀者的年齡、學歷、性別、興趣愛好分布,通過這些分布即可實現(xiàn)個性化知識推送服務。在推送形式上,可以傳統(tǒng)的郵件形式,也可以采用新興的微博、微信公眾號等形式,以滿足個性化的知識需求。
知識問答與咨詢是圖書館創(chuàng)新服務不可或缺的一環(huán),經(jīng)典的知識問答與咨詢由讀者采用自然語言輸入問題,系統(tǒng)通過檢索和決策給出問題的答案。圖書館則需要構建自動化的知識問答系統(tǒng),該系統(tǒng)不但可以通過自然語言輸入,還可以通過語言、圖像、視頻等多種個性化輸入方式,在知識回答上也應該采用各種不同的方式,結合讀者的使用場景,有針對性地給出知識回答。例如,當讀者使用移動設備時,回答的方式就可采用圖文方式;而一旦讀者采用PC 終端,即可推送視頻回答方式。通過這種方式,不但能夠提升個性化的知識問答服務,還能夠培養(yǎng)讀者的使用習慣。
此外,自動化的知識咨詢服務,主要包括泛在知識環(huán)境、嵌入式用戶場景以及科研過程3個主要方面[8]。在自動化的知識咨詢服務中,圖書館可以通過人工智能技術,分析讀者的用戶精準畫像,從用戶畫像中發(fā)現(xiàn)用戶的實際特征,然后通過實際特征對知識進行深入挖掘,發(fā)現(xiàn)創(chuàng)新型知識與關聯(lián)規(guī)則,最后完成知識獲取、整合和應用相結合的自動化知識咨詢服務,可用于學科創(chuàng)新以及科學前瞻。
圖書館從統(tǒng)籌規(guī)劃以及分類指導層面做好國家《新一代人工智能發(fā)展規(guī)劃》,積極推動圖書館這一知識載體的戰(zhàn)略轉型以及服務創(chuàng)新。在統(tǒng)籌規(guī)劃中,各圖書館之間應該構建人工智能服務聯(lián)盟,促進相互學習與合作。不同于其他技術,人工智能技術需要建立在足夠的數(shù)據(jù)與計算資源之上,因此多個圖書館之間的合作,可以獲得更全面的數(shù)據(jù),從而形成更精準的用戶畫像,且多個圖書館之間的計算資源共享,也能夠進一步提升數(shù)據(jù)挖掘和深度推理的效率。
圖書館通過對管理、技術以及服務模式的改革,實現(xiàn)基于人工智能的圖書館管理、技術和服務模式的創(chuàng)新,盡量滿足不同個體的個性化需求。此外,還需要廣泛調(diào)研學科的發(fā)展前景,為不同學科制定科學的發(fā)展藍圖,通過明確的發(fā)展路線與方向,形成可持續(xù)發(fā)展的科學規(guī)劃。通過全面落實整體戰(zhàn)略布局,才能形成真正意義上的人工智能創(chuàng)新服務,建設與數(shù)據(jù)挖掘和智能分析相關的配套設施以及整體規(guī)劃,發(fā)揮出人工智能在圖書館知識服務中的良好作用。
圖書館由傳統(tǒng)的紙質(zhì)書籍圖書館,發(fā)展到數(shù)字化多媒體圖書館,再到智能圖書館的進程中,科技是驅動圖書館發(fā)展和轉型的最重要條件。因此,圖書館在知識服務創(chuàng)新過程中,還需要突破關鍵的智能技術。在數(shù)字化、多媒體化、互聯(lián)網(wǎng)化圖書館基礎上,人工智能在數(shù)據(jù)挖掘和深度推理上的創(chuàng)新及其應用,使得圖書館的發(fā)展翻開了全新的篇章。圖書館從跨結構數(shù)據(jù)分析、混合群體智能增強技術、虛擬現(xiàn)實技術、增強現(xiàn)實技術以及智能硬件芯片等技術入手,與知識服務相結合,突破這些關鍵的智能技術應用。
其中,跨媒體分析技術主要應用在多類型數(shù)據(jù)的共同挖掘上,實際上由于圖書館需要接收不同終端的需求并完成不同媒介類型的回答,因此會產(chǎn)生結構化、半結構化以及非結構化數(shù)據(jù)。然而,不同結構的數(shù)據(jù)不能同時完成分析,因此需要采用跨結構數(shù)據(jù)分析方法。此外,群體智能在模擬讀者群體中也能起到關鍵作用,通過分析和模擬讀者群體之間的相關關系,也可以進一步提升圖書館的知識服務效能。虛擬現(xiàn)實和增強現(xiàn)實技術則是與圖書館物理場館相結合的技術,建設真實感較強的圖書館場景,可以進一步提升圖書館的智能服務。最后,圖書館中的人工智能技術需要強大的計算能力支撐,這也是圖書館需要開發(fā)和設計適合自身業(yè)務的智能硬件芯片的主要原因。
人工智能技術集合了多種不同技術,因此在運營和管理上將會涉及復雜的系統(tǒng)工程。然而,當前的大多數(shù)圖書館都采用外包的形式,通過第三方科技公司的開發(fā)、運營和管理,這種方式使得人工智能技術與圖書館相關業(yè)務結合不緊密,喪失了人工智能技術在圖書館知識服務中的創(chuàng)新作用。因此,為了提升人工智能技術的實際效用,圖書應該組建專業(yè)服務團隊,并培養(yǎng)核心科技人才。在培養(yǎng)核心科技人才時,一方面可以通過人力資源優(yōu)惠政策吸引高科技人才的加盟,負責人工智能的整體規(guī)劃服務管理,以及在服務器和終端上的技術維護和數(shù)據(jù)分析。核心科技人才可以通過講座、活動等加強與圖書館管理人員之間的交流,加強科技與核心服務之間的結合,讓人工智能技術能夠切實地解決圖書館的相關問題。
另外,圖書館不但需要培養(yǎng)自己的核心科技人才,還需要加強與科技機構之間的合作,通過訪問交流的方式,學習人工智能技術在圖書館應用中的管理、運維經(jīng)驗,這類交流人員可作為核心科技的輔助人才,協(xié)助引進的人才,共同完成知識服務的創(chuàng)新。最后,圖書館還應該基于核心科技人才構建專家智庫,并使專家智庫應用于知識服務過程中,為圖書館的知識服務提供更科學、更優(yōu)化的解決方案。
一般來說,圖書館服務的考核主要包括智能交互系統(tǒng)、讀者群體、運行和管理模式等方面的內(nèi)容。實際上,對于圖書館知識服務的考核,需要劃分為不同階段。在人工智能服務的初期,應該充分考慮人工智能技術的可持續(xù)發(fā)展,通過對各項服務進行前期的小范圍調(diào)試與測試,收集讀者的反饋信息,充分考慮反饋信息之間的耦合性,提升服務器的穩(wěn)定性,改善服務邏輯中存在的問題。在反饋與評估過程中主要指標為服務效果和讀者滿意程度,服務效果包括服務的成本、質(zhì)量、收益和反饋等。讀者滿意程度則包括使用方式、科學背景、隱私保護以及興趣偏好等。圖書館可采用問卷調(diào)查的形式完成,通過對兩個主要指標建立考評制度和體系,形成評估報告,完善考核制度。
作為讀者方,在使用圖書館提供的人工智能知識服務中,由于人工智能的開放性,通常會造成個人隱私的安全問題。因此,圖書館還應該考慮信息安全問題,尊重讀者的個人隱私信息,通過安全加密的手段,傳輸與用戶信息相關的知識圖譜與用戶畫像。在服務器與不同形式終端之間,應該設計防火墻和入侵檢測系統(tǒng),并在系統(tǒng)中植入智能檢測和判斷,對高風險的個人隱私信息發(fā)出預警,保障讀者的所有信息都在低風險范圍內(nèi),建立可靠的安全制度。
人工智能背景下,實現(xiàn)圖書館知識服務創(chuàng)新的主要路徑是通過數(shù)據(jù)挖掘和模式分析方法,對海量的異構數(shù)據(jù)進行分析,形成多種類型的知識圖譜,并通過對知識圖譜的深度推理,建設智能導航、檢索、推薦、咨詢以及問答系統(tǒng),讓讀者享受更方便、快捷的知識服務。同時,人工智能帶來的信息安全問題,尚待完善的考核制度問題,以及核心科技人才培養(yǎng)等問題,將是今后研究和探索的重點。