摘?? 要:數(shù)字圖書館需要在海量的網(wǎng)絡(luò)資源中以用戶滿意度為目的,檢索符合用戶需求的信息,為用戶提供更多更優(yōu)質(zhì)的資源,滿足用戶的信息需求。文章介紹了數(shù)字圖書館層次查詢模型的功能和模塊,針對(duì)數(shù)字圖書館層次結(jié)構(gòu)服務(wù)存在的數(shù)據(jù)處理能力低、資源內(nèi)容匱乏、互動(dòng)性不足等問題,提出了增加數(shù)據(jù)清洗環(huán)節(jié)、分模塊細(xì)化檢索過程、引入社交關(guān)系網(wǎng)等優(yōu)化數(shù)字圖書館層次檢索平臺(tái)服務(wù)的策略。
關(guān)鍵詞:數(shù)字圖書館;信息資源融合;層次查詢;用戶服務(wù)
中圖分類號(hào):G251?? 文獻(xiàn)標(biāo)識(shí)碼:A?? DOI:10.11968/tsyqb.1003-6938.2020070
Research on the Construction of Digital Library Platform in the Age of Digital Economy
Abstract The digital library has to retrieve in the mass information what the users need to provide users with more and higher quality resources. In this paper the author analyzes the information resources and hierarchical query model of the digital library platform, introduces grid technology, explains the specific advantages and service connotation of the digital library, and analyzes the degree of realizing the hierarchical service of the digital library to meet the actual needs of users. In view of the problems of low data processing ability, lack of resources and content, and lack of interaction in the digital library, this paper puts forward a series of strategies to optimize the service ability of the digital library's hierarchical retrieval platform, so as to provide users with accurate and all-round personalized information that can meet their query semantics and provide users with satisfactory services.
Key words digital library; information resources integration; hierarchical query; user service
1?? 引言
在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)字圖書館將分散分布、孤島式存儲(chǔ)的數(shù)字資源整合為一個(gè)完整的“大數(shù)據(jù)”,但在這個(gè)過程中,存在數(shù)據(jù)來源多元化、數(shù)據(jù)存儲(chǔ)方式多樣化、數(shù)據(jù)形式非結(jié)構(gòu)性等問題[1-4],在服務(wù)能力和競爭能力方面走出一條新路至關(guān)重要,因此該領(lǐng)域?qū)W者紛紛投入到數(shù)字圖書館平臺(tái)檢索研究中。
童忠勇[5]基于公共圖書館數(shù)字信息資源構(gòu)建、互聯(lián)網(wǎng)技術(shù)與國家有關(guān)政策,描述了數(shù)字圖書館資源平臺(tái)構(gòu)建整體思路,同時(shí)根據(jù)圖書館工程與推廣工程的構(gòu)建成果,通過云計(jì)算和大數(shù)據(jù)等一系列技術(shù)描繪出了平臺(tái)總結(jié)構(gòu)與核心功能模塊,設(shè)計(jì)并構(gòu)建了基于各個(gè)省市圖書館所具優(yōu)勢(shì)、面向大眾和共享開放的圖書館資源服務(wù)平臺(tái);常飛[6]指出云計(jì)算和云資源的共享模式能夠?yàn)閿?shù)字圖書館平臺(tái)構(gòu)建奠定技術(shù)基礎(chǔ)。混合云服務(wù)是適合應(yīng)用至云共享平臺(tái)間的一種云共享模式,在混合云平臺(tái)結(jié)構(gòu)下,數(shù)字圖書館平臺(tái)組成部分需要妥善解決服務(wù)平臺(tái)中資源利用過程中的版權(quán)問題,優(yōu)化平臺(tái)中資源共享體制,通過平臺(tái)自身具備的優(yōu)勢(shì)提高服務(wù)質(zhì)量,并統(tǒng)一與規(guī)范組成部分?jǐn)?shù)據(jù)庫標(biāo)準(zhǔn);李彩寧[7]基于文獻(xiàn)綜述,利用追蹤相對(duì)前沿的信息技術(shù),分析當(dāng)前用戶需求存在的特征,說明智慧圖書館定義與內(nèi)涵。依據(jù)用戶資源的二元視角,給出隱性和顯性相互結(jié)合下的圖書館服務(wù)模式。根據(jù)信息系統(tǒng)設(shè)計(jì)法,設(shè)計(jì)并構(gòu)建圖書館平臺(tái)結(jié)構(gòu)。
但是以往的研究中忽略了用戶體驗(yàn)感即用戶滿意程度,僅以平臺(tái)資源和用戶單方面需求為出發(fā)點(diǎn)和落腳點(diǎn),沒有很好地展現(xiàn)數(shù)字圖書館檢索平臺(tái)的服務(wù)性主旨,因此,本文針對(duì)圖書館設(shè)計(jì)構(gòu)建中此類用戶滿意度低、搜索過程冗長的問題,提出數(shù)字圖書館信息資源融合下層次查詢優(yōu)化策略研究,為未來數(shù)字圖書館創(chuàng)新發(fā)展提供參考。本次研究創(chuàng)新性在于以結(jié)合平臺(tái)信息資源與層次查詢模型的結(jié)合,引入網(wǎng)格技術(shù),闡述數(shù)字圖書館具體優(yōu)勢(shì)與服務(wù)內(nèi)涵,并從查詢檢索、用戶個(gè)人偏好和語義實(shí)體庫三個(gè)方面分析數(shù)字圖書館層次結(jié)構(gòu),優(yōu)化數(shù)字圖書館層次檢索平臺(tái),以圖緩解數(shù)字圖書館平臺(tái)存在用戶滿意度低的問題,改善和優(yōu)化圖書館服務(wù)流程與服務(wù)方式。
2?? 數(shù)字圖書館查詢平臺(tái)優(yōu)化
2.1??? 平臺(tái)信息資源融合
網(wǎng)格技術(shù)具備很強(qiáng)的優(yōu)勢(shì),其降低了構(gòu)建網(wǎng)站與提供服務(wù)的投資成本[8],將分布于各個(gè)地方的計(jì)算機(jī)和數(shù)據(jù)信息等融合為一個(gè)邏輯體?,F(xiàn)代軟件工程公共操作在最大程度上將各種各樣的新知識(shí)與新服務(wù)集成,且在任何操作平臺(tái)中都可完成資源交換與程序連接,以此為基礎(chǔ),為數(shù)字圖書館層次化信息服務(wù)平臺(tái)的構(gòu)建提供可靠支撐,實(shí)現(xiàn)圖書館資源共享操作(具體數(shù)字圖書館平臺(tái)信息資源融合結(jié)構(gòu)見圖1)。
用戶之間的分享、交流不夠多是造成數(shù)字圖書館用戶與用戶間的互動(dòng)性不足的主要原因。閱讀是重建自身知識(shí)結(jié)構(gòu)及體系的行為,思考是對(duì)閱讀知識(shí)的消化和吸收,分享和交流是思維后的結(jié)果。數(shù)字圖書館是在網(wǎng)絡(luò)環(huán)境下開展的服務(wù),應(yīng)充分發(fā)揮網(wǎng)絡(luò)的交互性特點(diǎn)。但目前很少有建立用戶個(gè)性化服務(wù)交流平臺(tái)體系的數(shù)字圖書館。圖書館資源被用戶與用戶間孤立地使用,用戶間無法聯(lián)系,不能順利進(jìn)行彼此間的交流和分享。
4?? 數(shù)字圖書館優(yōu)化策略
為了提高檢索服務(wù)過程中的準(zhǔn)確率和用戶滿意度,依據(jù)圖書館平臺(tái)和數(shù)據(jù)集成融合結(jié)果,對(duì)數(shù)字圖書館平臺(tái)層次檢索優(yōu)化策略進(jìn)行分析與設(shè)計(jì)。
4.1??? 增加清洗數(shù)據(jù)環(huán)節(jié)
圖書館數(shù)據(jù)處理實(shí)際為閱讀者的需求處理和閱讀者閱讀記錄的信息數(shù)據(jù)處理,因此在數(shù)據(jù)處理過程中,針對(duì)數(shù)據(jù)處理過程繁瑣的問題,應(yīng)進(jìn)行多維、實(shí)時(shí)、關(guān)聯(lián)性方面的分析,實(shí)現(xiàn)數(shù)據(jù)挖掘;應(yīng)對(duì)信息資源進(jìn)行深層次挖掘、分析、整理與組織利用,構(gòu)建一條依靠數(shù)字信息服務(wù)的新型數(shù)字圖書館發(fā)展模式。如智能出行,高德地圖利用 GPS技術(shù)為人們導(dǎo)航各城市各景區(qū)的路線,智慧圖書館也可根據(jù)用戶需求,設(shè)計(jì)為用戶智能導(dǎo)覽服務(wù)功能,依托圖書館 APP,向用戶提供當(dāng)?shù)芈糜沃改?、“館友”旅游心得等;或根據(jù)用戶參觀圖書館的時(shí)間記錄,提醒用戶到圖書館充實(shí)休閑生活。智慧型圖書館情境感知服務(wù)內(nèi)容設(shè)計(jì)需要設(shè)計(jì)者挖掘人的需求,不斷為人提供服務(wù),以達(dá)到增加圖書館的工作量的目的。
在采集的數(shù)據(jù)中,涵蓋了各種類型的信息資源,并不是所有數(shù)據(jù)均具備利用價(jià)值,由此要針對(duì)圖書館數(shù)據(jù)進(jìn)行相應(yīng)處理,進(jìn)而提升數(shù)據(jù)的代表性、可處理性以及準(zhǔn)確性。圖書館數(shù)據(jù)處理可從數(shù)據(jù)源到數(shù)據(jù)抽取、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化、數(shù)據(jù)加載環(huán)節(jié)。在數(shù)據(jù)抽取環(huán)節(jié),主要任務(wù)為連接與訪問源數(shù)據(jù)和其模型,得到變化數(shù)據(jù)。在數(shù)據(jù)清洗環(huán)節(jié),主要任務(wù)為清洗與增補(bǔ)數(shù)據(jù)整體結(jié)構(gòu)和規(guī)則等,構(gòu)建源數(shù)據(jù)庫用來表征數(shù)據(jù)的質(zhì)量。在數(shù)據(jù)轉(zhuǎn)換環(huán)節(jié),主要任務(wù)為處理數(shù)據(jù),并將源數(shù)據(jù)轉(zhuǎn)換成目標(biāo)數(shù)據(jù)。在數(shù)據(jù)加載環(huán)節(jié),主要任務(wù)為將數(shù)據(jù)加載為維度不同的維度表以及事實(shí)表,并將處理之后的數(shù)據(jù)傳輸至存儲(chǔ)模塊(數(shù)據(jù)清洗過程見圖4)。
由圖可知,在圖書館數(shù)據(jù)采集中,通過ETL工具針對(duì)圖書館數(shù)據(jù)進(jìn)行相應(yīng)處理,將平臺(tái)檢索響應(yīng)延遲控制在30ms內(nèi),具有很快的響應(yīng)速度,有效提升了數(shù)據(jù)的代表性、可處理性以及準(zhǔn)確性,在一定程度上提高了數(shù)據(jù)質(zhì)量,進(jìn)而提高用戶滿意度。
4.2?? 分模塊細(xì)化檢索過程
語義處理模塊:在實(shí)際應(yīng)用中,將語義處理模塊針對(duì)用戶申請(qǐng)進(jìn)行分析和處理,利用對(duì)表達(dá)式執(zhí)行抽詞、詞性標(biāo)注等一系列操作將檢索式中詞語抽取出來,在這個(gè)過程中可通過當(dāng)前的抽詞工具,同時(shí)充分利用本體庫中包含的專業(yè)詞典挖掘檢索式中涵蓋的專有詞匯,將出現(xiàn)在檢索式中虛詞以及沒有利用價(jià)值的助詞刪除,在抽詞后,將結(jié)果根據(jù)詞性標(biāo)注進(jìn)行處理,以此進(jìn)一步實(shí)現(xiàn)語法分析,并通過概念識(shí)別用戶檢索的類型,將用戶需求描述為具體概念模式,在語義實(shí)體庫中執(zhí)行配準(zhǔn)操作,以此完成語義級(jí)別查詢優(yōu)化。
資源查詢檢索模塊:在圖書館數(shù)據(jù)存儲(chǔ)中,多種存儲(chǔ)方式結(jié)合可實(shí)現(xiàn)數(shù)據(jù)的高度匯總,降低數(shù)據(jù)冗余,進(jìn)而降低服務(wù)延遲,因此要在用戶登錄用戶模型之后平臺(tái)依據(jù)用戶提出的查詢檢索申請(qǐng),平臺(tái)進(jìn)入用戶個(gè)人偏好庫進(jìn)行配準(zhǔn);如果偏好庫中含有則增加權(quán)重,反之更新用戶行為庫;查詢檢索模塊針對(duì)用戶申請(qǐng)對(duì)領(lǐng)域知識(shí)本體中的信息進(jìn)行語義擴(kuò)展;對(duì)語義擴(kuò)展之后的信息申請(qǐng)生成相應(yīng)概念圖;將概念圖在語義實(shí)體庫中根據(jù)概念圖配準(zhǔn)法進(jìn)行配準(zhǔn)和相似程度計(jì)算;如果概念圖示匹配到檢索項(xiàng)則將排序之后的最終檢索結(jié)果返回給用戶,如果沒有匹配成功則返回后臺(tái),形成檢索需求項(xiàng),待后臺(tái)工作人員添加檢索資源(具體流程見圖5)。
4.3??? 引入社交關(guān)系網(wǎng)
用戶密切關(guān)注社交網(wǎng)絡(luò),通過該平臺(tái)用戶可以結(jié)識(shí)到新朋友,與朋友們的交流變得簡便,可以快速地收集、分享并傳遞各種信息資源。當(dāng)今社會(huì),每天都有很多用戶通過各種社交平臺(tái)發(fā)布自己的動(dòng)態(tài)或查詢好友信息。在數(shù)字圖書館的信息推送服務(wù)里,引入這種社交網(wǎng)絡(luò)的思想,將數(shù)字圖書館的受眾面擴(kuò)大,同時(shí)也使數(shù)字圖書館與用戶間的真實(shí)溝通和用戶與用戶間的真實(shí)溝通得到加強(qiáng),把用戶在現(xiàn)實(shí)中的生活圈、興趣喜好、工作研習(xí)等方面與數(shù)字圖書館的信息推送服務(wù)有機(jī)的結(jié)合在一起,了解用戶及與用戶相關(guān)人的實(shí)時(shí)信息需求,參與到用戶的文化世界中去,使數(shù)字圖書館在用戶個(gè)人文化生活中的作用提升,影響力擴(kuò)大。
將經(jīng)過上述處理之后的圖書館數(shù)據(jù)應(yīng)用至平臺(tái)服務(wù)中,實(shí)現(xiàn)圖書館資源平臺(tái)信息資源的融合,并在用戶檢索信息處理中完成層次查詢,實(shí)現(xiàn)數(shù)據(jù)的高度匯總,利于降低數(shù)據(jù)冗余,提高數(shù)據(jù)整體質(zhì)量,降低服務(wù)延遲,實(shí)現(xiàn)數(shù)字圖書館層次檢索平臺(tái)優(yōu)化。
5?? 結(jié)語
數(shù)字圖書館的高效應(yīng)用是時(shí)代發(fā)展的必然需求,但數(shù)字圖書館建設(shè)相關(guān)研究成果在用戶滿意度等方面的問題有待解決。本文分析數(shù)字圖書館數(shù)據(jù)采集過程、處理與存儲(chǔ)實(shí)現(xiàn)數(shù)字圖書館資源融合程度,總結(jié)數(shù)字圖書館在平臺(tái)層次檢索性能方面的不足之處,并提出數(shù)字圖書館在檢索準(zhǔn)確性、滿足用戶檢索需求等方面的發(fā)展策略,將其應(yīng)用數(shù)字圖書館平臺(tái)服務(wù)中,可完善語義處理模塊實(shí)現(xiàn)語義級(jí)別檢索,降低檢索信息平臺(tái)數(shù)據(jù)冗余,提高數(shù)據(jù)整體質(zhì)量,使得用戶滿意度高,層次檢索延遲低,具有較強(qiáng)可靠性,實(shí)現(xiàn)資源查詢的高效檢索,為構(gòu)建數(shù)字圖書館檢索能力的發(fā)展提供重要的理論依據(jù)。
參考文獻(xiàn):
[1]? 吳宗大,謝堅(jiān),鄭城仁,等.數(shù)字圖書館用戶的行為偏好隱私保護(hù)框架[J].中國圖書館學(xué)報(bào),2018,44(2):72-85.
[2]? 張寧,李雪.國家圖書館數(shù)據(jù)管理與分析平臺(tái)建設(shè)[J].國家圖書館學(xué)刊,2016,25(6):80-89.
[3]? 龔曉林.嵌入高校教學(xué)過程的數(shù)字圖書館教學(xué)支撐平臺(tái)構(gòu)想[J].圖書館,2018(8):74-78.
[4]? 李青維,婁策群.數(shù)字圖書館信息生態(tài)鏈價(jià)值平衡的標(biāo)志及影響因素[J].情報(bào)科學(xué),2019,37(3):19-23.
[5]? 童忠勇.國家數(shù)字圖書館特色資源云平臺(tái)的建設(shè)與實(shí)踐[J].國家圖書館學(xué)刊,2018,27(5):101-107.
[6]? 常飛.基于混合云服務(wù)平臺(tái)的數(shù)字圖書館聯(lián)盟建構(gòu)[J].山西檔案,2018(4):111-113.
[7]? 李彩寧,畢新華,陳立軍.智慧圖書館服務(wù)模式及平臺(tái)構(gòu)建研究[J].圖書館,2018(12):1-7.
[8]? 孫倩.數(shù)字圖書館網(wǎng)站建設(shè)視角下資源可視化揭示的實(shí)踐探索[J].圖書館理論與實(shí)踐,2017(5):84-87.
[9]? 任精舉.“互聯(lián)網(wǎng)+”時(shí)代高校圖書館學(xué)習(xí)平臺(tái)構(gòu)建研究[J].圖書館工作與研究,2017(3):43-46.
[10]? 史美靜,解金蘭.數(shù)字圖書館移動(dòng)視覺搜索平臺(tái)的框架與功能研究[J].圖書館工作與研究,2018(2):42-47.
[11]? 張秉軍.移動(dòng)圖書館平臺(tái)構(gòu)建——以天津職業(yè)技術(shù)師范大學(xué)移動(dòng)圖書館建設(shè)為例[J].圖書館工作與研究,2016(3):47-49.
[12]? Schneider B I,Miller B R,Saunders B V.NIST's Digital Library of Mathematical Functions[J].Physics Today,2018,71(2):48-53.
[13]? 周莉.基于OAI-PMH協(xié)議數(shù)字圖書館中數(shù)據(jù)提供者的研究[J].現(xiàn)代電子技術(shù),2016,39(9):27-30.
[14]? 畢強(qiáng),閆晶,李潔,等.基于扎根理論的數(shù)字圖書館資源聚合質(zhì)量影響因素研究[J].情報(bào)理論與實(shí)踐,2018,41(5):42,65-70.
[15]? 吳宗大,謝堅(jiān),鄭城仁,等.數(shù)字圖書館用戶的行為偏好隱私保護(hù)框架[J].中國圖書館學(xué)報(bào),2018,44(2):72-85.
[16]? Cox J.Communicating New Library Roles to Enable Digital Scholarship:A Review Article[J].New Review of Academic Librarianship,2016,22(2):1-16.
[17]? 謝人強(qiáng),葉福蘭.數(shù)字圖書館網(wǎng)站信息服務(wù)生態(tài)性評(píng)價(jià)及實(shí)證研究[J].圖書館工作與研究,2018(7):76-82.
[18]? 楊國棟.用戶需求視野下的數(shù)字圖書館微信平臺(tái)信息自助服務(wù)研究[J].山西檔案,2018(3):113-115.
[19]? Hu X,Ho E M Y,Qiao C.Digitizing Dunhuang Cultural Heritage:A User Evaluation of Mogao Cave Panorama Digital Library[J].Journal of Data and Information Science,2017,2(3):49-67.
[20]? 徐彤陽,張國標(biāo),任浩然.基于鏡頭的數(shù)字圖書館視頻資源檢索框架構(gòu)建與實(shí)現(xiàn)[J].情報(bào)科學(xué),2017,35(5):92-96.
作者簡介:施少芳(1979-),女,閩南理工學(xué)院圖書館副研究館員,研究方向:數(shù)字化信息管理。
本文系教育部2018年第二批產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目(項(xiàng)目編號(hào):201802343010)與2019年福建省本科高校重大教育教學(xué)改革研究項(xiàng)目(項(xiàng)目編號(hào):FBJG20190316)研究成果之一。
收稿日期:2020-01-04;責(zé)任編輯:胡剛;通訊作者:施少芳(ssf@mnust.cn)