申 悅
(國家圖書館 北京 100081)
隨著大數據、云計算、AR、VR、物聯網等技術不斷發(fā)展,人工智能技術的研究和應用領域不斷蔓延。人工智能技術的發(fā)展極其迅速,已滲透到各行各業(yè)和社會生活的各個領域。機器人開始具有能夠依托云服務和大數據挖掘自主學習、不斷完善自己的智能交互能力和對環(huán)境的感知能力。在圖書館領域,人工智能機器人也有了很大的應用空間,上海圖書館前臺咨詢機器人“圖小靈”,沈陽市圖書館智能機器人“伴讀”,南京大學圖書館交互機器人“圖寶”等都是人工智能技術在圖書館服務中的應用實例[1]。國家圖書館數字圖書館體驗區(qū)探索新技術在圖書館的創(chuàng)新應用,引入人工智能機器人承擔部分體驗參觀的引導講解,輔助辦理圖書館日常業(yè)務等工作,不僅可以吸引讀者,增強體驗區(qū)智能科技感及互動感,同時也能提高參觀率,優(yōu)化體驗區(qū)參觀模式,更好地為讀者提供服務。國家圖書館數字圖書館體驗區(qū)人工智能機器人“小圖”(以下簡稱體驗區(qū)機器人)是國家圖書館引入的首個機器人,在國家圖書館數字圖書館體驗區(qū)的應用目前處于探索階段,相信在未來幾年會有很大的發(fā)展。
表1 國家圖書館數字圖書館體驗區(qū)展項列表
國家圖書館數字圖書館體驗區(qū)是國家數字圖書館建設與服務成果展示和宣介的重要窗口,利用新穎的展示技術及創(chuàng)新科技向公眾進行數圖宣傳及推介,自開放以來吸引了大量的來訪嘉賓和讀者參觀體驗。
國家圖書館數字圖書館體驗區(qū)位于國家圖書館總館北區(qū)二層,于2014年9月9日正式面向公眾開放。整個展區(qū)占地面積約1 300平米,分為“國家數字圖書館工程”展示區(qū)域、“公共數字文化工程”展示區(qū)域以及互動體驗展示區(qū)域。體驗區(qū)運用科技手段,通過靈活、趣味、互動的方式向讀者全面展示國家數字圖書館建設成果,讓更多的讀者通過“零距離”體驗的方式,了解、使用、分享國家數字圖書館提供的資源與服務。國家圖書館數字圖書館體驗區(qū)展項列表如表1所示。
體驗區(qū)機器人分為兩部分,其中本地化的智能云平臺和移動端APP是本系統(tǒng)的軟件部分,機器人客戶端為硬件部分,系統(tǒng)結構如圖1所示。機器人主要實現的功能有語音交互、人證識別、導航避障、講解演示、OPAC檢索、任務管理、統(tǒng)計報表和日志管理等。
圖1 系統(tǒng)結構圖
智能云平臺主要是對機器人終端設備的傳感器搜集的數據進行處理、分揀,判斷讀者意圖,并提供相應服務,主要分為感知處理(語音交互、圖像識別、動作控制等)模塊、信息展示模塊、外部查詢模塊、任務配置模塊、統(tǒng)計報表模塊、系統(tǒng)管理模塊。其中的語音交互部分,包括語音識別、語義分析、答案生成、監(jiān)督學習、語音播報等功能。
機器人客戶端為本系統(tǒng)硬件部分,包括多種傳感器、核心控制板、安卓板、電源管理模塊、移動導航避障模塊及其他物理裝置。
體驗區(qū)機器人系統(tǒng)基于安卓SDK編寫。機器人通過語音、視覺、觸控等交互調用機器人應用層接口,機器人內部程序通過REST API向服務器端發(fā)送任務請求,機器人根據請求結果執(zhí)行相應任務,同時通過Socket與服務器端同步機器人狀態(tài),機器人架構如圖2所示。
圖2 體驗區(qū)機器人架構圖
體驗區(qū)機器人語音部分的功能貫穿整個機器人執(zhí)行任務始終。機器人的語音服務,調用科大訊飛的語音識別服務將機器人識別到的音頻流轉換為文本發(fā)送給機器人后臺服務器,經過處理后發(fā)送給機器人SDK,調用科大訊飛的語音合成,播放文本內容。具體的語音交互流程如圖3所示,用戶對機器人說話,機器人通過六麥陣列麥克風進行聲音采集,機器人語音模塊監(jiān)聽到聲音,調用科大訊飛語音識別服務,將監(jiān)聽到的音頻流轉換文本返回給機器人語音處理模塊。語音模塊再調用機器人服務器端的語義模塊,發(fā)送識別出的文本,服務器端經過語義處理返回機器人回答的語音文本。機器人通過外網調用科大訊飛的語音合成服務,返回音頻流,語音處理模塊再將音頻流播放出去。
圖3 語音交互流程圖
圖4 網絡連接圖
體驗區(qū)機器人服務器接入的網絡與OPAC服務器網絡以及無線網絡同時在國家圖書館網絡區(qū)域內,網絡連接如圖4所示,三個網絡均可互相訪問。機器人與手機APP接入無線網絡,該無線網絡可訪問機器人服務器。當機器人使用語音功能時,通過無線網絡調用外網的科大訊飛服務器。機器人通過獲取到的檢索信息,發(fā)送給服務器,服務器經過對文本的處理,格式化成檢索條件,機器人服務器所在網絡開通權限可調用OPAC的檢索接口,獲取書籍信息,再將書籍信息返回給機器人,機器人將結果顯示在大屏幕上。
圖5 內部接口設計圖
體驗區(qū)機器人各個功能內部即軟件邏輯模塊之間是需要調用接口來完成的,內部接口設計規(guī)約定義內部模塊之間的調用關系和傳遞的數據結構。體驗區(qū)機器人內部接口設計分為應用層邏輯、Presenter業(yè)務邏輯層和Diver底層,如圖5所示。應用層邏輯包含國家圖書館機器人項目UI、界面跳轉邏輯和調用底層庫的方法。Presenter業(yè)務邏輯層是串聯底層庫與應用層的封裝層,主要包含與硬件相關、驅動相關的封裝,方便二次開發(fā)時調用。Diver底層是分模塊進行底層驅動開發(fā)的,包括了底盤、身份證讀卡、語音、人臉處理以及其他串口通行設備。針對底層邏輯,在設計時采用了額外的UDP通訊協議,UDP不屬于連接型協議,因而具有資源消耗小、處理速度快的優(yōu)點,所以成為底盤處理傳輸的主要選取協議。底盤需要在運行時保持局域網暢通,并且設置了UDP連接重連4次若失敗,則不可重復連接,防止假死狀態(tài)。
圖6 主功能界面
體驗區(qū)機器人具有五大功能(如圖6所示),可以進行人臉識別,主動問候,打招呼;能夠進行智能問答,回答讀者提出的常見問題,如開閉館時間、借閱室位置、廁所位置等,實現圖書館領域的專業(yè)語音交互;能進行導引講解,帶領讀者嘉賓參觀數圖體驗區(qū),并自主規(guī)避行進途中的障礙物和人;實現與國家圖書館OPAC系統(tǒng)對接,可以通過語音進行書目檢索和讀者信息查詢。
3.5.1 智能迎賓及問答
體驗區(qū)機器人的智能迎賓和問答功能優(yōu)先級較高,可隨時觸發(fā)并完成。體驗區(qū)機器人可進行人臉識別,在讀者嘉賓靠近時對其進行主動問候,打招呼。鑒于人臉識別技術涉及個人隱私問題,機器人后臺在錄入人員信息前會經當事人允許,并且可以隨時更新和配置并預先設定數據庫中人員信息內容,遇見并識別該人員匹配在數據庫中已錄入的信息,能準確地稱呼問候,如:候主任,您好!
智能問答功能是隨時隨地可以進行的,讀者嘉賓可從主界面進入問百科界面,然后進行問答,也可隨時在其他功能頁面與機器人互動問答,這是機器人智能性的體現之一。讀者可以咨詢一般性問題,如天氣情況、百科知識,也可以咨詢圖書館領域專業(yè)問題和讀者常見問題,如中文圖書館借閱規(guī)則、開閉館時間、廁所位置等。針對讀者嘉賓提出的問題,機器人后臺完成記錄,工作人員可以對讀者熱點問題或者機器人無法回答的問題進行設置,實現持續(xù)優(yōu)化FAQ語料庫。
3.5.2 講解展示
機器人講解展示功能分為全部展項講解和單獨展項講解,如圖7所示。選擇單獨展項講解時,機器人引導讀者嘉賓到達所選展項開始講解。選擇全部展項講解時,機器人帶領讀者嘉賓按照事先規(guī)劃的路線參觀體驗區(qū),參觀體驗路線可按不同需求進行配置,講解內容能靈活配置,錄入的文字和圖片可按需替換修改。
圖7 講解展示界面
機器人兩種講解模式可根據需要進行選擇,機器人進行講解引導時可自主規(guī)避行進途中的障礙物和人,參觀途中讀者嘉賓可隨時語音控制機器人開始或者暫停講解,并且進行智能問答,問答結束可恢復語音講解。針對全部展項講解功能,當機器人恢復講解后讀者可以重新選擇繼續(xù)講解該展項,也可以跳至下一個展項進行講解或可取消講解。
3.5.3 導航指引
讀者嘉賓通過語音或點擊查找機器人小屏幕左側顯示的目標位置名稱(如圖8所示),機器人可完成導航任務,帶領讀者嘉賓到達指定位置。機器人在導航行走過程中,可自主規(guī)避障礙物,并且自動規(guī)劃路線,完成任務。
圖8 導航指引界面
3.5.4 書籍檢索
書籍檢索功能對接國家圖書館OPAC系統(tǒng),通過語音實現書籍查詢,書籍列表可通過語音進行翻頁、選中,并顯示用戶所找書籍的館藏信息、索書號、單冊狀態(tài)等。如,讀者可語音對機器人說出找書等相關話語,機器人會進入書籍檢索頁面,對機器人說出“小圖+【書籍名稱】”或者點擊屏幕上的內容進行書籍檢索,如果成功檢索到書籍,則檢索結果將顯示在大屏幕上(最多400條)。如果未檢索到書籍,機器人將提示未檢索到書籍。例:“小圖,紅樓夢”,在機器人大屏幕上顯示的搜索結果如圖9所示。也可以點擊或者說“第n條”進入該書籍的詳細頁面。例:“第x條”,顯示如圖10所示。
圖9 書籍檢索結果界面
圖10 書籍詳情界面
3.5.5 讀者信息查詢
圖11 讀者基本信息
圖12 借閱信息
主界面中讀者可以通過語音命令說出“讀者信息查詢”,或者直接點擊“讀者信息查詢”圖標進入讀者信息查詢功能頁面。進入讀者信息查詢功能頁面后,機器人會通過語音提示刷二代身份證,將身份證放到機器人的肩部讀卡識別區(qū),系統(tǒng)將自動識別身份證的信息。如果查詢成功,小屏幕上將顯示您預留的個人信息如圖11所示,大屏幕上將顯示您的外借信息,外借信息如圖12所示,可顯示外借書籍明細、外借書籍歷史數量。如未查詢成功,機器人將提示您信息查詢未能獲取,可到咨詢臺詢問。
圖書館與人工智能技術的融合與應用是圖書館自身發(fā)展創(chuàng)新的方向,未來人工智能機器人要從根本上提高自身學習能力,在機器人的語義理解、邏輯判斷和系統(tǒng)控制等方面研發(fā)更有效的算法應用,為用戶提供更精準貼心的服務[2]。另一方面也特別需要注意機器人有些功能可能會涉及用戶隱私,要注意避免由于數據使用不當而使用戶的合法權益受到損害等問題。筆者相信人工智能機器人將很快可以探索網絡資源,整合云端龐大的數據,實現信息的整合篩選和處理,加快智能化進程。