孫雨生 祝 博
(湖北工業(yè)大學(xué)經(jīng)濟與管理學(xué)院 武漢 430068)
伴隨數(shù)智化技術(shù)革新、知識應(yīng)用類型和服務(wù)內(nèi)容激增,圖書館逐步轉(zhuǎn)向以泛在化、數(shù)字化和智能化為核心特征的智慧化方向。同時,大數(shù)據(jù)時代智慧圖書館類型多樣、規(guī)模巨大、格式復(fù)雜,海量數(shù)據(jù)與讀者有限認(rèn)知能力間矛盾日益加劇,難以提供符合讀者需求的知識服務(wù)進而面臨嚴(yán)峻的數(shù)據(jù)迷霧、信息過載、知識迷航等挑戰(zhàn)。在此形勢下,智慧圖書館信息推薦備受關(guān)注,其利用物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù)動態(tài)感知讀者興趣、協(xié)同創(chuàng)新服務(wù)形式、語義管理知識資源,主動提供智慧推薦服務(wù),將服務(wù)方式由傳統(tǒng)閱讀轉(zhuǎn)向泛在服務(wù),服務(wù)內(nèi)容由紙質(zhì)為主轉(zhuǎn)向多載體多模態(tài)數(shù)字資源為主,服務(wù)形式由被動、大眾、單一轉(zhuǎn)向主動、個性、多元,為此客觀急需利用新型知識服務(wù)技術(shù)構(gòu)建新一代智慧圖書館信息推薦系統(tǒng),尤其是具備全局關(guān)聯(lián)、聚合管理、智能推理優(yōu)勢的知識圖譜:依托語義邏輯符號以圖結(jié)構(gòu)形式描述圖書館推薦場景中相關(guān)實體及關(guān)系[1],提升推薦系統(tǒng)關(guān)聯(lián)擴展、機讀處理、多維感知能力,支持推薦系統(tǒng)精準(zhǔn)量化、立體描述讀者需求以動態(tài)響應(yīng)其請求,語義賦能智慧圖書館推薦機制以創(chuàng)新協(xié)同推薦策略,匯聚融合、關(guān)聯(lián)重構(gòu)圖書館海量多源異構(gòu)數(shù)據(jù)以規(guī)范組織知識資源,最終滿足用戶數(shù)智化、泛在化服務(wù)需求。
當(dāng)前知識圖譜加持的智慧圖書館推薦系統(tǒng)理論研究較少且多研究知識圖譜用于智慧圖書館推薦的方式及策略,實踐應(yīng)用尚無明確將知識圖譜引入到智慧圖書館推薦服務(wù)案例,僅吳榮[2]提出基于端到端框架用交替學(xué)習(xí)方式將知識圖譜融入推薦系統(tǒng),以提升圖書推薦結(jié)果多樣性、圖書館個性化服務(wù)水平。業(yè)界多通過傳統(tǒng)項目式場景維護、單機式推薦算法進行體系構(gòu)建、規(guī)劃設(shè)計,缺乏系統(tǒng)性,難以適應(yīng)智慧社會情境下服務(wù)內(nèi)容知識化、業(yè)務(wù)應(yīng)用集成化、技術(shù)構(gòu)成多元化、語義資源協(xié)同化、基礎(chǔ)設(shè)施智能化等要求,客觀需要從架構(gòu)體系視角研究知識圖譜加持的智慧圖書館信息推薦問題:明晰系統(tǒng)規(guī)劃,以適應(yīng)推薦業(yè)務(wù)場景多樣性、數(shù)據(jù)異構(gòu)性、技術(shù)時效性及推薦系統(tǒng)架構(gòu)復(fù)雜性、模塊擴展性;強化業(yè)務(wù)協(xié)同,以融合圖書館推薦服務(wù)與其他業(yè)務(wù)應(yīng)用;優(yōu)化技術(shù)體系,以用新型信息技術(shù)升級推薦服務(wù)模式并提升推薦主動性及質(zhì)量;規(guī)范資源建設(shè),以突破傳統(tǒng)基于主題分類法[3]、學(xué)科隸屬關(guān)系及OPAC書目索引的圖書館資源管理模式,提升資源利用效率[4]、挖掘資源語義,進而關(guān)聯(lián)化組織、一體化管理資源以降低讀者認(rèn)知負(fù)荷;升級基礎(chǔ)設(shè)施,以依托大數(shù)據(jù)基礎(chǔ)設(shè)施、分布式架構(gòu)改造業(yè)務(wù)流程[1],融合智能設(shè)備與智慧化服務(wù)。
本文參考知識中臺思想,遵循圖書館行業(yè)規(guī)范與技術(shù)標(biāo)準(zhǔn),應(yīng)用分布式架構(gòu)整合知識挖掘、知識集成及共享等知識服務(wù)技術(shù)及并行化計算、分布式存儲、動態(tài)負(fù)載均衡等大數(shù)據(jù)技術(shù)、數(shù)智基礎(chǔ)設(shè)施;依托體系結(jié)構(gòu)分層構(gòu)建智慧圖書館推薦業(yè)務(wù)架構(gòu)以優(yōu)化推薦流程、重構(gòu)系統(tǒng)要素,通過功能模塊分模塊封裝系統(tǒng)組件以按圖書館應(yīng)用場景協(xié)同、集成,通過運行機理按場景描述推薦策略,滿足知識圖譜加持的智慧圖書館推薦系統(tǒng)核心功能性、關(guān)鍵非功能性需求,提供深層次、泛在化智慧推薦服務(wù)。前者涉及讀者需求導(dǎo)向、推薦智慧化,后者涉及進程高效協(xié)同、組件遷移復(fù)用、模塊按需擴展、系統(tǒng)安全易維護等,最終揭示知識圖譜加持的智慧圖書館信息推薦架構(gòu)體系全貌。
遵循以讀者需求為服務(wù)導(dǎo)向、技術(shù)為驅(qū)動手段、業(yè)務(wù)流程為主線、知識為增值內(nèi)容、資源為核心載體、圖書館空間為基礎(chǔ)環(huán)境的思路,設(shè)計知識圖譜加持的智慧圖書館信息推薦體系結(jié)構(gòu),其構(gòu)成見圖1。
圖1 知識圖譜加持的智慧圖書館信息推薦體系結(jié)構(gòu)
其按數(shù)據(jù)、知識、智慧演進層次[5]分為基礎(chǔ)設(shè)施層、業(yè)務(wù)平臺層、智慧服務(wù)層以匯聚數(shù)據(jù)、升華知識、凝練智慧,進而融合重組空間環(huán)境、人、資源等服務(wù)要素,深入揭示各層目標(biāo)及核心問題,關(guān)聯(lián)發(fā)現(xiàn)要素間知識流動,高效提升推薦系統(tǒng)拓展性及適應(yīng)性。此外,運維與安全標(biāo)準(zhǔn)支持推薦系統(tǒng)高效管理組件模塊、智能監(jiān)控系統(tǒng)資源,進而保障系統(tǒng)安全及風(fēng)險控制;數(shù)據(jù)管理標(biāo)準(zhǔn)支持規(guī)范數(shù)據(jù)格式、管理元數(shù)據(jù)體系、保障數(shù)據(jù)安全并提高數(shù)據(jù)質(zhì)量,支持平臺化管理館內(nèi)資源、標(biāo)準(zhǔn)化業(yè)務(wù)流程、動態(tài)化治理數(shù)據(jù)。
遵循以人為本服務(wù)原則,面向圖書館應(yīng)用場景、讀者閱讀需求,并依托館內(nèi)設(shè)備及移動終端提供泛在化、融合化、實時化服務(wù)[5],為讀者提供轉(zhuǎn)知成慧服務(wù)契機,其構(gòu)成見圖2。
圖2 智慧服務(wù)層構(gòu)成
a.用戶交互層。依據(jù)讀者需求,結(jié)合自主借還、閱讀盒子等智能終端設(shè)計交互門戶,為讀者提供知識服務(wù)并支持系統(tǒng)采集讀者交互信息、顯示推薦結(jié)果。提供登錄注冊、瀏覽、評價、反饋接口及結(jié)果可視化等基礎(chǔ)功能,對接智慧應(yīng)用層實現(xiàn)門戶功能及系統(tǒng)調(diào)用,最終依托移動終端、智能交互系統(tǒng)、VR/AR設(shè)備及PC等,支持推薦系統(tǒng)場景化感知、動態(tài)化響應(yīng)用戶請求[6]。
b.智慧應(yīng)用層。遵循圖書館應(yīng)用標(biāo)準(zhǔn)集成應(yīng)用接口、封裝服務(wù)模塊,依托多樣化應(yīng)用平臺按用戶需求返回推薦結(jié)果及服務(wù)方案。一體化部署公共服務(wù)組件支持監(jiān)控推薦系統(tǒng)運維、軟硬件協(xié)同狀態(tài);內(nèi)嵌多種服務(wù)模塊感知、挖掘讀者需求,并按用戶興趣用語義技術(shù)加工融合、重組分析學(xué)科知識元以定制知識服務(wù)方案,提供數(shù)據(jù)驅(qū)動型、用戶驅(qū)動型智慧推薦服務(wù)。
遵循組件化思想,面向圖書館知識管理流程[6]、多場景推薦業(yè)務(wù)共性需求,依托知識圖譜優(yōu)勢,模塊化系統(tǒng)各層業(yè)務(wù)單元構(gòu)建知識中臺,以統(tǒng)一規(guī)范管理圖書館業(yè)務(wù)數(shù)據(jù)、共建共享海量館藏資源,分解、組合推薦策略,進行匹配讀者興趣與圖書資源并高效、實時推薦,其構(gòu)成見圖3。
圖3 業(yè)務(wù)平臺層構(gòu)成
a.推薦平臺層。遵循模塊化思想,針對圖書館推薦場景下業(yè)務(wù)流程,調(diào)用推薦模型分析讀者交互數(shù)據(jù)以感知其需求,處理圖書館知識資源以優(yōu)化資源配置,精準(zhǔn)匹配讀者興趣及知識資源,按用戶需求生成易解釋推薦結(jié)果,實現(xiàn)推薦結(jié)果多樣化、服務(wù)功能動態(tài)配置及靈活調(diào)用[3]。讀者興趣建模組件采集讀者實時行為、歷史交互信息以抽取興趣實體及關(guān)系,用知識圖譜節(jié)點及邊表示讀者興趣標(biāo)簽及關(guān)系,依托概念間關(guān)聯(lián)用機器學(xué)習(xí)、社交網(wǎng)絡(luò)技術(shù)處理讀者社交數(shù)據(jù),并基于讀者實時反饋學(xué)習(xí)其新興趣屬性以進化興趣模型,深度挖掘讀者閱讀興趣、咨詢需求,最終構(gòu)建讀者興趣模型。資源特征建模組件通過數(shù)據(jù)接口調(diào)用圖書館基礎(chǔ)知識庫資源,依托知識計算、知識發(fā)現(xiàn)組件用概念層次結(jié)構(gòu)向量表示與讀者興趣相關(guān)紙質(zhì)、數(shù)字等資源屬性及關(guān)系,基于機器學(xué)習(xí)技術(shù)按知識圖譜節(jié)點跳數(shù)、關(guān)系路徑相似度閾值預(yù)處理文獻、著作等資源知識圖譜以初篩資源特征并初始化特征模型,再基于情境圖譜向量化跨載體、跨模態(tài)圖書館資源及閱讀、科研等服務(wù)場景以賦權(quán)情境屬性并與資源特征組合,用知識發(fā)現(xiàn)組件挖掘符合讀者需求的隱性知識以進化資源特征模型、補全資源體系,最終構(gòu)建圖書館資源特征模型,滿足服務(wù)情境化、資源多樣化需求。通過組合讀者興趣實體及資源、場景等特征數(shù)據(jù)構(gòu)建讀者-資源模型,并在輸入推薦模型前離線訓(xùn)練、在線更新以處理海量讀者歷史數(shù)據(jù)、實時響應(yīng)讀者交互請求,進而提升模型訓(xùn)練效率及準(zhǔn)確性,最優(yōu)化推薦模型相關(guān)算法、策略中參數(shù)取值;輸入推薦模型后用知識圖譜學(xué)習(xí)框架多維度關(guān)聯(lián)主題、細(xì)粒度處理知識,快速高效召回海量碎片化資源中與用戶興趣相關(guān)候選資源集并按相似度精準(zhǔn)排序,再面向讀者業(yè)務(wù)場景及知識需求融合新書新穎度、主題關(guān)聯(lián)度等多維評價指標(biāo)重排序,最后優(yōu)化推薦結(jié)果組合方式,確定符合讀者興趣及認(rèn)知的推薦服務(wù)方案。此外,通過離線評估、線上A/B測試等評估模塊離線延遲、實時同步訓(xùn)練推薦數(shù)據(jù)集以迭代模型特征,適應(yīng)圖書館服務(wù)過程中讀者需求、情境變化并提升服務(wù)模型智能性、魯棒性。
b.知識分析層。面向智慧圖書館推薦服務(wù)精準(zhǔn)協(xié)同、知識資源整序重構(gòu)、文獻數(shù)據(jù)創(chuàng)新組織需求[3],通過數(shù)據(jù)接口調(diào)用圖書館知識圖譜庫中各類知識圖譜,用知識計算、知識發(fā)現(xiàn)組件匯聚、融合、計算智慧圖書館平臺知識,促進知識群落協(xié)同優(yōu)化、服務(wù)方式創(chuàng)新重構(gòu)及隱性知識動態(tài)挖掘,為圖書館推薦服務(wù)提供知識基礎(chǔ)。知識計算組件基于知識圖譜節(jié)點及邊,通過圖譜嵌入、路徑召回、兩者混合方式選擇知識表示方式,支持推薦系統(tǒng)組織、管理、挖掘圖書館資源語義信息[7];通過知識圖譜推理挖掘圖書資源隱性主題關(guān)聯(lián)以補全圖書館知識體系,支持業(yè)務(wù)處理。知識發(fā)現(xiàn)組件面向讀者需求,通過關(guān)聯(lián)挖掘、情感分析、模型預(yù)測等機器學(xué)習(xí)技術(shù)組合推薦場景特征,實現(xiàn)面向讀者的知識檢索與價值發(fā)現(xiàn),支持精準(zhǔn)推薦。
遵循圖書館全面感知、智慧服務(wù)泛在互聯(lián)、紙電資源一體融合思想,按多節(jié)點協(xié)同管理平臺應(yīng)用成熟、工業(yè)級大數(shù)據(jù)基礎(chǔ)設(shè)施及圖書館場景下硬件設(shè)備,敏捷化集成各類技術(shù)支持高效協(xié)同平臺架構(gòu)及業(yè)務(wù)處理,一體化管理資源服務(wù)支持整合互聯(lián)總分館模式下業(yè)務(wù)數(shù)據(jù)及知識要素,動態(tài)化創(chuàng)新實體與虛擬空間環(huán)境支持深度拓展智慧服務(wù)模式思路。通過構(gòu)建多層次、全方位智慧空間,為智慧圖書館信息推薦融入?yún)⒖甲稍?、書目閱讀、智庫服務(wù)等服務(wù)鏈提供環(huán)境基礎(chǔ)[7],其構(gòu)成見圖4。
圖4 基礎(chǔ)設(shè)施層構(gòu)成
a.數(shù)據(jù)管理層。面向圖書館推薦流程、遵循圖書館數(shù)據(jù)管理標(biāo)準(zhǔn),用多類采集技術(shù)采集并處理讀者交互數(shù)據(jù),按知識圖譜生命周期關(guān)聯(lián)重構(gòu)知識單元、組織再造閱讀資源,以構(gòu)建圖書館基礎(chǔ)知識庫進而知識化數(shù)據(jù)價值、支撐推薦系統(tǒng)。按圖書館數(shù)據(jù)源類型及特點,依托基礎(chǔ)設(shè)施層設(shè)備選擇采集方式,面向圖書館業(yè)務(wù)全程整合主動提交(終端提交、用戶生成)、被動抓取(爬蟲、數(shù)據(jù)庫導(dǎo)入、工具采集)等方式,細(xì)粒度、全方位采集半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù);遵循清洗集成、規(guī)約轉(zhuǎn)換等流程,用分布式計算、云計算、內(nèi)存計算等計算框架預(yù)處理所采集圖書館數(shù)據(jù)集;遵循知識圖譜構(gòu)建流程機讀化處理、實體化鏈接、形式化表示處理后用戶、資源數(shù)據(jù)集,結(jié)合圖書館本體概念層次結(jié)構(gòu)構(gòu)建面向圖書館應(yīng)用場景的知識圖譜;按圖書館數(shù)據(jù)存儲標(biāo)準(zhǔn),依托虛擬化、數(shù)據(jù)備份技術(shù),基于多節(jié)點協(xié)同管理中心,組合使用分布式存儲、云計算存儲及圖數(shù)據(jù)庫存儲系統(tǒng)存儲線下館藏、數(shù)字資源及推薦系統(tǒng)業(yè)務(wù)數(shù)據(jù),以協(xié)同共享數(shù)據(jù)資源并高效集成服務(wù)應(yīng)用。按數(shù)據(jù)管理標(biāo)準(zhǔn)組合數(shù)據(jù)庫配置與存取、元數(shù)據(jù)、安全與審計、數(shù)據(jù)集成等管理模塊,構(gòu)建圖書館資源管理引擎以分布式存取、一體化管理、低延遲安全傳輸數(shù)據(jù)資源;面向推薦系統(tǒng)及業(yè)務(wù)邏輯,集成用戶模型庫、推薦業(yè)務(wù)庫、館藏資源庫、知識圖譜庫、知識本體庫等知識庫,構(gòu)建圖書館基礎(chǔ)知識庫以整合發(fā)現(xiàn)、分類積淀知識資源,推動跨領(lǐng)域、跨學(xué)科知識間協(xié)同創(chuàng)新、關(guān)聯(lián)整合,支撐智慧推薦服務(wù)、滿足數(shù)據(jù)管理需求。
b.基礎(chǔ)設(shè)備層。通過合理部署感知設(shè)備以主動采集用戶需求,高效利用物理設(shè)備以提升服務(wù)體驗,動態(tài)集成系統(tǒng)設(shè)備以按需調(diào)用系統(tǒng)資源,智能聯(lián)接網(wǎng)絡(luò)服務(wù)以低延時整合圖書館數(shù)據(jù),加強總分館間、館內(nèi)業(yè)務(wù)部門間互聯(lián)互通并優(yōu)化資源配置,匯聚融合數(shù)據(jù)資源并為數(shù)據(jù)管理層提供工具支持[7]。感知設(shè)備通過感知硬件實時感知館內(nèi)事務(wù)并自動采集圖書館服務(wù)環(huán)境、設(shè)備運行狀態(tài)、讀者交互行為及位置、推薦系統(tǒng)業(yè)務(wù)等數(shù)據(jù);物理設(shè)備面向圖書館服務(wù)場景、應(yīng)用標(biāo)準(zhǔn),通過部署智能終端構(gòu)建全館自助化集成方案、優(yōu)化讀者借閱流程及體驗、簡化館員日常運維并提升服務(wù)效率;系統(tǒng)設(shè)備通過按需配置軟硬件資源、合理部署中間件方案、集成管理服務(wù)器集群,支持圖書館數(shù)據(jù)高性能并行計算、多策略分布存儲與柔性管理;網(wǎng)絡(luò)服務(wù)通過互聯(lián)網(wǎng)、移動網(wǎng)等通信技術(shù)實現(xiàn)智慧圖書館多網(wǎng)融合方案,支持?jǐn)?shù)據(jù)泛在互通、用戶快速接入,通過物聯(lián)網(wǎng)、云計算網(wǎng)絡(luò)服務(wù)實現(xiàn)圖書館設(shè)施廣泛互聯(lián)、數(shù)智管理,通過網(wǎng)絡(luò)保護設(shè)施加強網(wǎng)絡(luò)安全防護。
依托系統(tǒng)體系結(jié)構(gòu)、面向圖書館服務(wù),場景化、標(biāo)準(zhǔn)化、組件化推薦業(yè)務(wù)邏輯并遵循黑盒子原則封裝模塊功能,涉及讀者興趣建模、推薦處理、知識發(fā)現(xiàn)、知識計算、知識圖譜構(gòu)建等模塊。
遵循層次化、結(jié)構(gòu)化思路,基于概念層次結(jié)構(gòu)立體化表示、機讀化處理、動態(tài)化更新讀者興趣,以基于知識圖譜表示、初始化及進化讀者興趣模型。
2.1.1模型表示
遵循模型易擴展、復(fù)用遷移、高內(nèi)聚低耦合等原則,用本體法、知識圖譜法語義化讀者興趣實體及關(guān)系,以多元組形式映射實體間語義關(guān)聯(lián)至知識圖譜節(jié)點、邊等,以全面動態(tài)描述讀者興趣項;綜合標(biāo)簽法、評分矩陣法數(shù)值化讀者興趣度。
2.1.2模型初始化
通過交互門戶及設(shè)備感知采集讀者信息,用機器學(xué)習(xí)技術(shù)識別興趣項、量化興趣度以初始化讀者興趣模型。
a.數(shù)據(jù)采集。涉及采集來源、類型、內(nèi)容及方式,來源涉及圖書館數(shù)據(jù)庫、感知設(shè)備及館內(nèi)自動化系統(tǒng)等,采集類型、內(nèi)容及方式見表1。此外,為最大限度獲取讀者興趣,可通過公共服務(wù)機構(gòu)間合作、參考商業(yè)網(wǎng)絡(luò)平臺自選標(biāo)簽由讀者自錄入等方式采集讀者興趣信息。
表1 讀者興趣采集類型、內(nèi)容及方式
b.數(shù)據(jù)處理。分興趣項識別及興趣度量化,前者遵循清洗過濾、轉(zhuǎn)化集成、特征提取等流程,按知識圖譜處理流程細(xì)粒度、概念化讀者興趣,映射讀者興趣實體及標(biāo)簽屬性等元素至用戶知識圖譜,基于圖神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)挖掘等機器學(xué)習(xí)技術(shù)挖掘聚類讀者感興趣資源主題類別,以語義描述、精準(zhǔn)識別興趣項;后者基于讀者閱讀評分綜合借閱頻次、時滯加權(quán)計算并賦值讀者圖譜節(jié)點間距離、邊權(quán)值進而多維量化興趣度。
2.1.3模型進化
依托大數(shù)據(jù)處理平臺實時采集讀者顯隱式反饋、跟蹤交互行為,基于時間窗口、漸進遺忘機制,用機器學(xué)習(xí)、社交網(wǎng)絡(luò)技術(shù)處理海量交互數(shù)據(jù),以動態(tài)調(diào)整圖譜節(jié)點及其相似度、多維挖掘興趣間隱性關(guān)聯(lián)、增量更新興趣項進而進化讀者興趣模型,精準(zhǔn)揭示智慧圖書館場景下讀者興趣遷移、認(rèn)知提升。
作為圖書館推薦系統(tǒng)核心,按推薦業(yè)務(wù)邏輯通過高效召回、精準(zhǔn)排序、多維策略補充等方式情境化感知推薦場景、并行化組合推薦策略、流程化分解推薦任務(wù)[8],以多樣化推薦結(jié)果。
a.高效召回。按圖書館業(yè)務(wù)場景選擇召回策略,從海量資源集召回讀者可能感興趣資源?;谇度敕ㄏ蛄炕硎举Y源圖譜中節(jié)點等特征,并將多路召回中的圖書主題、館藏屬性、新書流行度等信息融入到特征向量,結(jié)合讀者興趣標(biāo)簽計算向量相似度以篩選強相關(guān)候選資源集,提高資源召回率并滿足讀者多樣需求。
b.精準(zhǔn)排序。遵循推薦邏輯通過知識概念體系感知讀者場景、分解推薦任務(wù),按讀者興趣精排序初篩所得候選集。依托大數(shù)據(jù)技術(shù)分布式計算、并行化挖掘優(yōu)勢,基于資源、用戶知識圖譜結(jié)合機器學(xué)習(xí)框架向量化表示、語義化分析、多維度關(guān)聯(lián)用戶興趣、資源特征及場景信息等,通過依次學(xué)習(xí)(先生成低維向量再引入推薦算法)、聯(lián)合學(xué)習(xí)(遵循端到端思想,用知識圖譜表示學(xué)習(xí)并行化改進推薦算法及目標(biāo)函數(shù),生成關(guān)聯(lián)化、語義化特征向量進而優(yōu)化算法性能、提高匹配精準(zhǔn)度)、交替學(xué)習(xí)(基于多任務(wù)學(xué)習(xí)框架關(guān)聯(lián)學(xué)習(xí)知識圖譜特征向量、推薦算法中相關(guān)向量以高效計算)等方式,考慮知識圖譜語義路徑連通性、知識結(jié)構(gòu)關(guān)聯(lián)性等特點優(yōu)化讀者、資源間特征組合方式以再排序、篩選候選資源集,提升推薦結(jié)果精準(zhǔn)度、可解釋性。
c.多維策略補充。通過調(diào)整指標(biāo)權(quán)重優(yōu)化候選資源集以合并、組合推薦結(jié)果,提升讀者體驗。面向智慧圖書館應(yīng)用場景,兼顧多樣性、流行度、新穎性等指標(biāo),用補充策略結(jié)合讀者興趣及反饋重排推薦結(jié)果,返回全面性、多樣化推薦方案。此外,推薦模型需通過模型訓(xùn)練最優(yōu)化推薦算法及機器學(xué)習(xí)模型參數(shù),以支持推薦任務(wù)分解、推薦策略組合,按模型訓(xùn)練環(huán)境分離線訓(xùn)練、在線更新:前者用分布式平臺批處理全量交互樣本信息,通過高效訓(xùn)練模型挖掘隱性關(guān)聯(lián)、配置讀者場景信息,以迭代模型并確定參數(shù)全局最優(yōu)解;后者動態(tài)跟蹤、匯聚讀者反饋并采集其顯隱性信息,通過流計算框架在線學(xué)習(xí)交互數(shù)據(jù),快速更新讀者興趣特征及模型參數(shù),以提升系統(tǒng)響應(yīng)速度、揭示數(shù)據(jù)變化趨勢,提升模型實效性。
面向主體知識需求,用知識管理技術(shù)深層挖掘、語義分析層級明晰及內(nèi)容關(guān)聯(lián)的資源組織網(wǎng)絡(luò),支持推薦應(yīng)用挖掘、標(biāo)注讀者興趣相關(guān)資源,進而創(chuàng)新推薦服務(wù)方式、優(yōu)化資源配置[4],實現(xiàn)用戶驅(qū)動的知識創(chuàng)造與服務(wù)創(chuàng)新?;诰垲惙治?、相關(guān)分析、主成分分析等數(shù)據(jù)挖掘方法,按關(guān)聯(lián)模式發(fā)現(xiàn)類別間、節(jié)點間語義關(guān)系,揭示知識間隱性關(guān)聯(lián);基于機器學(xué)習(xí)計算資源知識圖譜節(jié)點特征以訓(xùn)練特征模型,預(yù)測知識節(jié)點間演化規(guī)律;通過分解圖書館推薦應(yīng)用場景標(biāo)簽化處理、形式化描述情境信息,支持推薦模型感知讀者情境并組合場景特征以調(diào)整推薦策略;基于用戶交互行為與情境信息間關(guān)系,用深度學(xué)習(xí)技術(shù)結(jié)合本體概念規(guī)則推理感知讀者推薦情感取向并分析其需求;通過知識檢索方法按主題語義、學(xué)科專題深層挖掘、聚類重構(gòu)資源知識元形成內(nèi)在邏輯關(guān)聯(lián)的知識鏈,結(jié)合用戶需求通過整合加工構(gòu)建內(nèi)容層次化、語義關(guān)聯(lián)化知識網(wǎng)絡(luò),實現(xiàn)知識深層組織、資源二次開發(fā)。
基于概念層次結(jié)構(gòu)支持推薦系統(tǒng)向量化表示、機讀化處理圖書館知識資源,以挖掘推理知識潛在關(guān)聯(lián)、隱性價值并動態(tài)補全圖書館知識體系[4],分知識表示、知識圖譜推理。
a.知識表示。按圖書館元數(shù)據(jù)存儲格式選擇表示方式,用圖譜嵌入(通過翻譯模型、語義匹配模型映射館藏資源圖譜實體及關(guān)系至低維向量空間,以豐富讀者、圖書資源特征語義表示)、路徑召回(依托知識圖譜網(wǎng)狀結(jié)構(gòu)及連通性優(yōu)勢,計算圖譜實體關(guān)系路徑相似度以挖掘主題關(guān)聯(lián)資源、提高推薦可解釋性)及混合(通過結(jié)合知識圖譜向量表示、路徑傳遞語義表示讀者、資源實體屬性及關(guān)聯(lián))方法支持推薦系統(tǒng)智能理解、機讀處理語義知識,實現(xiàn)資源內(nèi)容統(tǒng)一加工、立體描述及語義集成。
b.知識圖譜推理。基于深度學(xué)習(xí)技術(shù)挖掘推理知識資源、讀者興趣實體及關(guān)系,以發(fā)現(xiàn)知識單元間深層關(guān)聯(lián)、演化趨勢,常用基于規(guī)則(用圖書館資源本體間規(guī)則及統(tǒng)計特征自動挖掘隱性實體及關(guān)系)、表示學(xué)習(xí)(向量化知識圖譜以分布式表示、語義化描述資源實體及關(guān)聯(lián),支持概念邏輯推理)、神經(jīng)網(wǎng)絡(luò)(通過機器學(xué)習(xí)高效訓(xùn)練、自動學(xué)習(xí)特征模型以挖掘隱性資源特征表示,補全知識圖譜)等方法,構(gòu)建內(nèi)在邏輯關(guān)聯(lián)的知識體系。
依據(jù)圖書館資源特點、著錄規(guī)則及知識組織體系與規(guī)范構(gòu)建圖書館知識圖譜庫,以細(xì)粒度組織圖書館資源、關(guān)聯(lián)聚合主題知識鏈進而序化整合、共建共享圖書館知識體系,支持智慧圖書館推薦服務(wù)。通過知識建模選擇框架法、語義標(biāo)注等表示機制形式化描述知識間關(guān)聯(lián)以進行模式層構(gòu)建,再按知識抽取、加工、更新、存儲等流程進行數(shù)據(jù)層構(gòu)建:針對知識抽取,依托機器學(xué)習(xí)技術(shù),混合中圖分類法、OPAC識別實體、融合知識元、標(biāo)準(zhǔn)化書目、電子資源描述等元數(shù)據(jù)接口以高效整合期刊、專利、音視頻等紙質(zhì)、電子資源;針對知識加工,量化知識置信度[1]以評估知識質(zhì)量、推理知識進而補全優(yōu)化知識體系,構(gòu)建關(guān)聯(lián)化、跨學(xué)科語義知識資源網(wǎng)絡(luò);針對知識更新,增量、按需擴展知識體系以滿足圖書館知識資源增長需求;針對知識存儲,基于RDF數(shù)據(jù)庫存儲實體、概念等圖譜數(shù)據(jù)及圖書館資源語義數(shù)據(jù)以按需擴展、調(diào)用數(shù)據(jù)資源。
遵循場景多樣化、推薦機制智能化原則,按用戶角色關(guān)聯(lián)推薦系統(tǒng)相應(yīng)功能模塊,揭示業(yè)務(wù)場景下面向讀者、館員及領(lǐng)域?qū)<业鹊耐扑]流程及服務(wù)形式,詳見圖5。
圖5 知識圖譜加持的智慧圖書館信息推薦運行機理
主要通過智慧門戶中應(yīng)用接口調(diào)用推薦平臺功能,分布式采集讀者閱讀、請求、評價等交互行為信息,基于知識圖譜語義化讀者興趣及行為信息以初始化、進化讀者興趣模型[8]。依據(jù)讀者興趣從圖書館專利、文獻、圖書等資源知識圖譜中映射相關(guān)資源實體以構(gòu)建符合讀者興趣特征的資源知識圖譜子圖,輸入資源特征建模模塊后通過公共服務(wù)調(diào)用知識計算組件向量化子圖數(shù)據(jù)以快速建模特征工程、精準(zhǔn)提取關(guān)聯(lián)特征,用知識發(fā)現(xiàn)組件關(guān)聯(lián)挖掘隱性知識及資源間關(guān)系并配置場景參數(shù)擴充特征,進而通過特征預(yù)處理及組合構(gòu)建符合讀者需求的資源特征模型并依據(jù)用戶反饋動態(tài)進化[9]?;跈C器學(xué)習(xí)框架將讀者興趣模型、資源特征模型組合成讀者-資源模型輸至推薦處理組件,通過離線處理、在線更新按召回、排序、策略補充邏輯智能分解推薦任務(wù)、動態(tài)組合推薦策略,進而生成候選推薦結(jié)果并存入待推薦項目集,然后按圖書館應(yīng)用場景以列表、知識卡片、圖譜等形式,分別從資源、用戶角度提供數(shù)據(jù)驅(qū)動型、用戶驅(qū)動型智慧推薦,滿足讀者個性化、泛在化閱讀需求。
3.1.1數(shù)據(jù)驅(qū)動型智慧推薦
依托高性能算力支持集成各類數(shù)據(jù)處理技術(shù)全域采集多模態(tài)數(shù)據(jù)、深層挖掘隱性知識,基于知識圖譜賦能資源組織機制以關(guān)聯(lián)整序、動態(tài)重組知識元,進而發(fā)現(xiàn)圖書館資源科學(xué)規(guī)律及語義關(guān)聯(lián)[10],構(gòu)建泛在互聯(lián)、充分共享資源環(huán)境,實現(xiàn)數(shù)據(jù)驅(qū)動的知識資源增值及智慧圖書館推薦服務(wù)內(nèi)涵與維度提升。
a.館藏資源推薦。核心是通過知識圖譜重構(gòu)知識元、關(guān)聯(lián)知識鏈、聚合知識體系,以發(fā)揮知識集群效應(yīng)[11],提供智慧知識定制、館藏知識推薦服務(wù)。前者考慮注冊讀者興趣、類型、科研屬性等特征及其知識領(lǐng)域、層次及粒度需求,依托知識圖譜概念知識體系匯聚多學(xué)科資源,重組多源渠道及多模態(tài)知識要素構(gòu)建并推薦全方位、定制化知識服務(wù)體系或知識鏈路,提升推薦結(jié)果可理解性;后者依托知識圖譜結(jié)構(gòu)化描述、語義化表示資源體系以深層推理、挖掘發(fā)現(xiàn)館藏資源文化價值,將讀者興趣模型中館藏實體映射至資源知識圖譜,精準(zhǔn)匹配并以圖譜形式推薦特色館藏、關(guān)聯(lián)主題,提升讀者體驗。
b.泛在化場景推薦。依托內(nèi)嵌iBeacon、物聯(lián)網(wǎng)等技術(shù)[10]的泛在感知設(shè)備及終端協(xié)同技術(shù),用情境知識圖譜精準(zhǔn)感知、語義描述注冊讀者情境要素及相關(guān)行為,由推薦系統(tǒng)通過在線更新模塊實時采集、流式處理讀者交互行為信息并賦權(quán)行為特征、情境屬性,結(jié)合離線處理模塊調(diào)用用戶歷史情境信息并配置場景參數(shù),進而場景化用戶需求以實時推薦圖書館知識資源。
3.1.2用戶驅(qū)動型智慧推薦
面向圖書館場景集成智慧終端,基于情景感知、機器學(xué)習(xí)等技術(shù)多渠道采集、立體化描述用戶交互行為及情景屬性、社交關(guān)聯(lián)等信息,提升興趣表示維度及處理粒度進而感知用戶個性化知識需求;拓展推薦系統(tǒng)服務(wù)形式、提升推薦性能以優(yōu)化用戶體驗,有效整合與協(xié)同創(chuàng)新圖書館服務(wù),提供主動、精準(zhǔn)智慧推薦。
a.讀者閱讀推薦。依托智能設(shè)備、物聯(lián)網(wǎng)等技術(shù)采集讀者閱讀行為以感知其需求,在知識服務(wù)過程中動態(tài)推薦,涉及檢索時推薦、相似用戶推薦。前者根據(jù)讀者查閱、檢索等行為遴選館藏資源并映射至資源知識圖譜,用知識發(fā)現(xiàn)模塊中相應(yīng)算法遍歷資源知識圖譜,以確定候選資源集并排序后動態(tài)推薦,以便用戶延伸閱讀;后者基于用戶圖譜中用戶節(jié)點關(guān)系通過知識計算模塊發(fā)現(xiàn)用戶近鄰并推薦其潛在感興趣資源[12]。
b.無差異智能推薦。通過智慧門戶采集各類讀者資源興趣及借閱、收藏等行為,依托語義技術(shù)多維融合資源特征,向匿名讀者提供無差異智能推薦服務(wù)[11],涉及熱門排序推薦、新書推薦。前者用推薦系統(tǒng)采集、分析讀者固定周期借閱、評分等交互行為初始化熱門館藏集并映射至資源知識圖譜中館藏知識圖譜,結(jié)合資源標(biāo)簽、曝光度、流行度等指標(biāo)加權(quán)計算、匯總排序后推薦熱門館藏資源;后者結(jié)合讀者薦購、館藏資源建設(shè)需求周期性采購資源,以專欄形式推薦匿名讀者可能感興趣新書資源。
c.特殊群體智慧推薦。面向老年人、未成年人、殘障人等弱勢群體,依托盲文打印機、語音識別等智能終端及無障礙工具構(gòu)建數(shù)智化圖書館空間環(huán)境,按特殊群體知識需求創(chuàng)新服務(wù)模式以提供多層次、多元化推薦服務(wù)。重點集成數(shù)據(jù)挖掘、機器學(xué)習(xí)等技術(shù),細(xì)粒度采集特殊群體用戶基本信息并全方位感知其交互行為以精準(zhǔn)建模用戶興趣,通過知識計算輔助推薦系統(tǒng)預(yù)測感知用戶狀態(tài),構(gòu)建與用戶興趣實體相關(guān)的候選資源集,并按其需求智能調(diào)用輔助閱讀工具主動、實時智慧推薦。
圖書館信息部門館員負(fù)責(zé)推薦系統(tǒng)運維及安全管理,通過智慧門戶的業(yè)務(wù)網(wǎng)關(guān)集成各管理模塊接口,通過后臺管理功能設(shè)置安全管理、事務(wù)管理、用戶管理、反饋管理等系統(tǒng)功能,通過系統(tǒng)部署運維管理及管理標(biāo)準(zhǔn)規(guī)范化系統(tǒng)部署運維,通過監(jiān)控管理、容災(zāi)管理動態(tài)均衡系統(tǒng)負(fù)載;領(lǐng)域?qū)<颐嫦驁D書館場景及功能需求,通過專家管理功能規(guī)劃設(shè)計智慧圖書館應(yīng)用體系并審核、維護領(lǐng)域知識,進而優(yōu)化業(yè)務(wù)平臺功能、明晰智慧推薦邏輯邊界。
本文以知識圖譜為知識傳導(dǎo)媒介及整合工具,融合重構(gòu)、協(xié)同創(chuàng)新智慧圖書館應(yīng)用場景下空間環(huán)境、人、資源等服務(wù)要素,從體系結(jié)構(gòu)、功能模塊、運行機理三方面闡述了知識圖譜加持的智慧圖書館信息推薦架構(gòu)體系:體系結(jié)構(gòu)按數(shù)據(jù)、知識、智慧演進層次分為基礎(chǔ)設(shè)施層、業(yè)務(wù)平臺層、智慧服務(wù)層;功能模塊關(guān)注圖書館應(yīng)用場景下關(guān)鍵模塊間調(diào)用協(xié)同,涉及讀者興趣建模、推薦處理、知識發(fā)現(xiàn)、知識計算、知識圖譜構(gòu)建等模塊;運行機理為基于讀者智慧化閱讀、泛在化獲取、個性化服務(wù)需求分解推薦任務(wù)、組合推薦策略、規(guī)劃推薦流程,提供數(shù)據(jù)驅(qū)動及用戶驅(qū)動型智慧推薦服務(wù),基于圖書館館員系統(tǒng)運維部署需求明確業(yè)務(wù)職責(zé),基于領(lǐng)域?qū)<抑R管理需求界定服務(wù)范圍。
本文利用知識圖譜感知用戶興趣、創(chuàng)新推薦機制、聚合知識資源,以提升智慧圖書館推薦系統(tǒng)服務(wù)水平及智能性,但仍具有以下拓展空間。首先,本研究仍處方案總體設(shè)計階段,后續(xù)智慧圖書館平臺構(gòu)建及規(guī)劃落地需深入研討服務(wù)需求和業(yè)務(wù)流程,并將其標(biāo)準(zhǔn)化以達成業(yè)界共識;其次,本研究僅以推薦系統(tǒng)為例參考中臺概念設(shè)計,后續(xù)需研究推薦系統(tǒng)與參考咨詢、情報服務(wù)等服務(wù)形式融合問題,進而從業(yè)務(wù)、技術(shù)、數(shù)據(jù)等層面設(shè)計智慧圖書館知識服務(wù)系統(tǒng)整套方案,真正促進讀者“轉(zhuǎn)知成慧”;最后,本研究核心闡述知識圖譜賦能推薦系統(tǒng)的業(yè)務(wù)邏輯,利用知識圖譜集成管理智慧圖書館資源的方法研究不夠,后續(xù)需從數(shù)據(jù)標(biāo)準(zhǔn)化、資源規(guī)范化角度研究知識組織路徑以語義描述知識元、序化重組知識體系,進而充分發(fā)揮智慧圖書館海量知識優(yōu)勢。