李小清
摘 要:文章在概述科研決策、高校智慧圖書館科學(xué)數(shù)據(jù)共享空間的基礎(chǔ)上,從數(shù)據(jù)采集融合層、應(yīng)用體驗(yàn)層、服務(wù)應(yīng)用層、支持建設(shè)層四個層面構(gòu)建了面向科研決策的高校智慧圖書館科學(xué)數(shù)據(jù)共享空間總體框架,并從科學(xué)數(shù)據(jù)融合處理、科學(xué)數(shù)據(jù)發(fā)現(xiàn)采集、科學(xué)數(shù)據(jù)聚合分析三個維度,歸納了高校智慧圖書館科學(xué)數(shù)據(jù)共享空間面向科研決策提供的數(shù)據(jù)服務(wù),旨在提升高??蒲腥藛T科研決策的精準(zhǔn)性與科學(xué)性。
關(guān)鍵詞:科研決策;高校智慧圖書館;科學(xué)數(shù)據(jù)共享空間
中圖分類號:G258.6 文獻(xiàn)標(biāo)識碼:A 文章編號:1003-1588(2024)05-0075-04
隨著人工智能時代的到來,高校每天都會產(chǎn)生大量科學(xué)研究數(shù)據(jù),且這些數(shù)據(jù)快速迭代、快速變化,高校智慧圖書館面向科研決策的科學(xué)數(shù)據(jù)共享面臨數(shù)據(jù)采集周期長、數(shù)據(jù)存儲周期長、數(shù)據(jù)時效性低等難題。雖然高校智慧圖書館近年來致力于增強(qiáng)科研數(shù)據(jù)服務(wù)能力,建設(shè)科研數(shù)據(jù)庫和科研數(shù)據(jù)服務(wù)平臺,支持高校的科研決策,但取得的效果有限,難以滿足高校應(yīng)用科研數(shù)據(jù)快速咨詢、分析、調(diào)查的需求,一定程度上影響了重大科研項(xiàng)目的推進(jìn)。因此,高校智慧圖書館科研決策更需要建立一個科學(xué)、穩(wěn)定、高效的集成化數(shù)據(jù)平臺提供數(shù)據(jù)支持。源于國外的數(shù)據(jù)共享空間(Data Commons,DC)是當(dāng)前在科學(xué)數(shù)據(jù)服務(wù)領(lǐng)域被廣泛應(yīng)用的數(shù)據(jù)基礎(chǔ)設(shè)施,其不僅能滿足高校智慧圖書館科學(xué)數(shù)據(jù)的共享要求,還具備科研數(shù)據(jù)管理、發(fā)布、標(biāo)準(zhǔn)化處理、大數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)可視化展示等功能,能在促進(jìn)高校管理科研數(shù)據(jù)、開發(fā)數(shù)據(jù)管理工具、制定數(shù)據(jù)使用標(biāo)準(zhǔn)的同時,構(gòu)建科研數(shù)據(jù)生態(tài)共享平臺,集成多種科研數(shù)據(jù)服務(wù)項(xiàng)目,為科研決策提供全方位支持。
1 科研決策、高校智慧圖書館科學(xué)數(shù)據(jù)共享空間概述
1.1 科研決策
科研決策是圍繞各類高??茖W(xué)研究活動、學(xué)術(shù)會議、學(xué)科研究活動、課題研究、科學(xué)數(shù)據(jù)使用、科學(xué)項(xiàng)目等活動開展情況進(jìn)行的決策行為,是與現(xiàn)代科學(xué)研究活動具有密切聯(lián)系的領(lǐng)導(dǎo)決策方式[1]??蒲袥Q策有兩個方面特點(diǎn):一是重視科學(xué)數(shù)據(jù)及過往的決策經(jīng)驗(yàn),基于科研活動的特點(diǎn)建立科學(xué)的決策體制,實(shí)現(xiàn)集體決策。二是重視通過對科研項(xiàng)目、科學(xué)研究活動的科學(xué)分析和應(yīng)用科學(xué)方法進(jìn)行決策[2]。同時,科研決策是高校論證科研項(xiàng)目、確定科研成果、開展科研管理的核心工作,科學(xué)的決策行為對制訂科研計劃、編制科研項(xiàng)目規(guī)劃、制定科學(xué)研究政策具有重要意義。
1.2 高校智慧圖書館科學(xué)數(shù)據(jù)共享空間
1990年,信息情報服務(wù)機(jī)構(gòu)為解決大規(guī)模復(fù)雜的信息情報處理問題,將“信息共享空間理論”引入人文社科領(lǐng)域的信息處理,建立了信息共享空間,為用戶提供多樣化的信息服務(wù)。隨著數(shù)字技術(shù)快速發(fā)展,圖書館共享空間逐步向多元化發(fā)展,衍生出知識共享空間、智慧學(xué)習(xí)空間、智慧閱讀空間、信息交互空間、創(chuàng)客空間等[3]。此后,高校圖書館科學(xué)數(shù)據(jù)服務(wù)受E-Science密集型科研環(huán)境影響,針對大量異構(gòu)化、半結(jié)構(gòu)化科研數(shù)據(jù)的全生命周期管理就成為圖書館亟待解決的問題。為此,高校圖書館建設(shè)了數(shù)據(jù)共享空間,幫助高校解決科研數(shù)據(jù)全生命周期管理問題,致力于為生命科學(xué)、生物學(xué)、醫(yī)學(xué)、物理學(xué)等領(lǐng)域的科研工作提供數(shù)據(jù)支持。相潤等人認(rèn)為,數(shù)據(jù)共享空間是圍繞科研項(xiàng)目或科研數(shù)據(jù)管理的標(biāo)準(zhǔn)化數(shù)據(jù)共享平臺,本質(zhì)上是開放的數(shù)據(jù)網(wǎng)絡(luò)和數(shù)據(jù)庫工具,能夠?qū)I(yè)研究主題數(shù)據(jù)進(jìn)行知識拓展,并促進(jìn)數(shù)據(jù)共享[4]。吳雅威等人提出,科學(xué)數(shù)據(jù)共享空間能夠?qū)茖W(xué)數(shù)據(jù)進(jìn)行長期存儲、提供研究工具、提供高效檢索,并支持?jǐn)?shù)據(jù)分析、圖像分析、云服務(wù)和API服務(wù),是處理大規(guī)模科學(xué)數(shù)據(jù)集并進(jìn)行復(fù)雜網(wǎng)絡(luò)分析的數(shù)據(jù)服務(wù)平臺[5]。張向先等人在數(shù)據(jù)共享空間研究過程中,結(jié)合科學(xué)數(shù)據(jù)的特點(diǎn)及面向?qū)ο蟮牟煌?,從?shù)據(jù)資源層、平臺管理層、用戶應(yīng)用層、數(shù)據(jù)服務(wù)層四個維度構(gòu)建了互聯(lián)網(wǎng)背景下的圖書館數(shù)據(jù)共享空間框架模型,旨在為各學(xué)科用戶的科學(xué)數(shù)據(jù)管理提供支持[6]。高校智慧圖書館作為融合人工智能、AR/VR、5G、物聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)實(shí)現(xiàn)智能化改造升級的新一代圖書館,具有感知智慧化、服務(wù)智慧化、資源數(shù)據(jù)化、閱讀場景化等特點(diǎn),其擁有的數(shù)據(jù)共享空間可以基于AI系統(tǒng)強(qiáng)大的算力和數(shù)據(jù)處理能力為機(jī)構(gòu)用戶、普通用戶的科研數(shù)據(jù)全生命周期管理、長期存儲及標(biāo)準(zhǔn)化共享提供支持,并提供科研數(shù)據(jù)分析、數(shù)據(jù)可視化、大數(shù)據(jù)預(yù)測等服務(wù),為用戶的科研決策提供支撐。
2 面向科研決策的高校智慧圖書館科學(xué)數(shù)據(jù)共享空間框架構(gòu)建
面向科研決策的高校智慧圖書館科學(xué)數(shù)據(jù)共享空間總體框架由科學(xué)數(shù)據(jù)采集融合層、應(yīng)用參與層、服務(wù)應(yīng)用層、支持建設(shè)層四部分構(gòu)成,形成了面向科研決策的科學(xué)數(shù)據(jù)共享空間結(jié)構(gòu)框架,見圖1。
2.1 數(shù)據(jù)采集融合層
數(shù)據(jù)采集融合層主要是針對各學(xué)科領(lǐng)域產(chǎn)生的科學(xué)數(shù)據(jù)進(jìn)行采集、清洗、挖掘、融合,根據(jù)學(xué)科領(lǐng)域的劃分,將數(shù)據(jù)歸類到與之對應(yīng)的科學(xué)數(shù)據(jù)集中,并根據(jù)數(shù)據(jù)的分布態(tài)勢、種類制定元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)共享標(biāo)準(zhǔn)、數(shù)據(jù)共享使用協(xié)議等。數(shù)據(jù)共享標(biāo)準(zhǔn)和數(shù)據(jù)共享使用協(xié)議的制定可以擴(kuò)大科學(xué)數(shù)據(jù)的共享范圍和使用范圍,使機(jī)構(gòu)或用戶在科研決策時有更全面的數(shù)據(jù)支持,更規(guī)范、更合理地進(jìn)行科研決策[7]。同時,高校智慧圖書館科學(xué)數(shù)據(jù)共享空間需重視數(shù)據(jù)的復(fù)用性、可靠性、安全性,在機(jī)構(gòu)和用戶使用過程中進(jìn)行身份認(rèn)證,并給予一定的數(shù)據(jù)使用權(quán)限。
2.2 應(yīng)用體驗(yàn)層
應(yīng)用體驗(yàn)層是高校智慧圖書館科學(xué)數(shù)據(jù)共享空間的重要組織層,包括科學(xué)數(shù)據(jù)共享空間物理層、科學(xué)數(shù)據(jù)共享空間虛擬層及關(guān)聯(lián)者參與層,各層功能明確、分工明晰。
2.2.1 科學(xué)數(shù)據(jù)共享空間物理層。物理層主要指科學(xué)數(shù)據(jù)共享空間的物理空間,由科研討論區(qū)、創(chuàng)意交流區(qū)、數(shù)據(jù)服務(wù)區(qū)、決策支持區(qū)組成,為高校與科研人員的科研決策提供了基礎(chǔ)服務(wù)設(shè)施,可以促進(jìn)高校與科研人員深化對高校智慧圖書館科學(xué)數(shù)據(jù)共享空間的了解,也能使科學(xué)數(shù)據(jù)共享空間的科學(xué)數(shù)據(jù)服務(wù)滲透到科研決策全過程。
2.2.2 科學(xué)數(shù)據(jù)共享空間虛擬層。虛擬層主要包括數(shù)字終端、API接口、科學(xué)數(shù)據(jù)服務(wù)平臺??茖W(xué)數(shù)據(jù)服務(wù)平臺針對機(jī)構(gòu)與用戶的科研決策需求提供科學(xué)數(shù)據(jù)產(chǎn)品及咨詢報告,是科學(xué)數(shù)據(jù)與用戶互動交流的主要渠道;API接口為機(jī)構(gòu)與用戶用于科研決策的核心數(shù)據(jù)標(biāo)準(zhǔn)獲取、應(yīng)用程序開發(fā)及程序工具訪問提供支持;數(shù)字終端面向機(jī)構(gòu)與用戶的科研決策需求提供專業(yè)的數(shù)字服務(wù),如云存儲、在線教學(xué)、知識圖譜等。
2.2.3 關(guān)聯(lián)者參與層。關(guān)聯(lián)者包括高校智慧圖書館、科學(xué)數(shù)據(jù)中心、政府、高校和科研人員,其中高校智慧圖書館在政府、高校、科學(xué)數(shù)據(jù)中心的支持下規(guī)劃建設(shè)科學(xué)數(shù)據(jù)共享空間,并由高校、數(shù)據(jù)中心為科學(xué)數(shù)據(jù)共享空間提供科學(xué)數(shù)據(jù)資源,并運(yùn)營和管理科學(xué)數(shù)據(jù)共享空間。政府負(fù)責(zé)制定科學(xué)數(shù)據(jù)共享空間的運(yùn)營管理制度,暢通高校智慧圖書館與各級高校的數(shù)據(jù)共享渠道。高校和科研用戶在科研決策過程中利用科學(xué)數(shù)據(jù)共享空間,享受科學(xué)數(shù)據(jù)共享空間提供的科學(xué)數(shù)據(jù)服務(wù),并對服務(wù)進(jìn)行反饋,幫助高校智慧圖書館優(yōu)化科學(xué)數(shù)據(jù)共享空間的功能。
2.3 服務(wù)應(yīng)用層
服務(wù)應(yīng)用層是高校智慧圖書館面向科研決策提供科學(xué)數(shù)據(jù)服務(wù)的直接作用層,提供科學(xué)數(shù)據(jù)分析、預(yù)測、聚合、可視化、價值挖掘等服務(wù),促進(jìn)科學(xué)數(shù)據(jù)共享空間功能直接與高校和科研人員的決策機(jī)制相耦合。其中,高校智慧圖書館科學(xué)數(shù)據(jù)共享空間需要與高校和科研人員在科研決策上形成良好的交互機(jī)制,及時了解機(jī)構(gòu)和科研人員的決策需求,并提供科學(xué)數(shù)據(jù)支持,提升科研決策效率。
2.4 支持建設(shè)層
支持建設(shè)層是構(gòu)建科學(xué)數(shù)據(jù)共享空間的基礎(chǔ),包括各類支持性條件,如專業(yè)技術(shù)、人員配置、基礎(chǔ)設(shè)施、經(jīng)費(fèi)、政策等[8]。技術(shù)支持性條件有數(shù)字終端、計算機(jī)設(shè)備、大數(shù)據(jù)技術(shù)、元數(shù)據(jù)標(biāo)準(zhǔn)等;人員配置包括科學(xué)數(shù)據(jù)共享空間管理人員、技術(shù)人員、數(shù)據(jù)專家等;基礎(chǔ)設(shè)施包括數(shù)字設(shè)備、網(wǎng)絡(luò)設(shè)施、通信設(shè)備等;經(jīng)費(fèi)是高校智慧圖書館建設(shè)科學(xué)數(shù)據(jù)共享空間的財力支持;政策保障則是政府對科學(xué)數(shù)據(jù)共享法律的制定、共享標(biāo)準(zhǔn)的制定、存儲標(biāo)準(zhǔn)的制定、數(shù)據(jù)服務(wù)政策的制定等,保障科學(xué)數(shù)據(jù)服務(wù)高效支持科研決策。
3 面向科研決策的高校智慧圖書館科學(xué)數(shù)據(jù)共享空間的科學(xué)數(shù)據(jù)服務(wù)
3.1 科學(xué)數(shù)據(jù)融合處理服務(wù)
高校智慧圖書館科學(xué)數(shù)據(jù)共享空間會對各類科學(xué)數(shù)據(jù)的存儲及使用進(jìn)行監(jiān)控,尤其注重高校和科研人員在科學(xué)數(shù)據(jù)使用過程中的權(quán)益保護(hù),促進(jìn)科學(xué)數(shù)據(jù)得到科學(xué)合理的使用。但是,一些異構(gòu)化、非結(jié)構(gòu)化的科學(xué)數(shù)據(jù)不能滿足機(jī)構(gòu)或用戶的科研決策需求,其在數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)格式方面可能存在較大的偏差,為此高校智慧圖書館科學(xué)數(shù)據(jù)共享空間應(yīng)對這些數(shù)據(jù)進(jìn)行科學(xué)排序,增強(qiáng)科學(xué)數(shù)據(jù)的價值性、完整性、可用性。通常情況下,高校智慧圖書館會構(gòu)建一套通用的元數(shù)據(jù)標(biāo)準(zhǔn),依托元數(shù)據(jù)標(biāo)準(zhǔn)對科學(xué)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,并根據(jù)數(shù)據(jù)內(nèi)容確定數(shù)據(jù)主題,融合具有相同內(nèi)容的科學(xué)數(shù)據(jù),構(gòu)建學(xué)科主題數(shù)據(jù)集,實(shí)現(xiàn)科學(xué)數(shù)據(jù)的集中化應(yīng)用。例如,“A-Engineering Project Space”是美國建設(shè)的工程數(shù)據(jù)共享空間,收集了大量工程領(lǐng)域的科學(xué)數(shù)據(jù),使用Spark、MuleSoft、Keboola進(jìn)行科學(xué)數(shù)據(jù)的處理與融合,向有科研決策需求的機(jī)構(gòu)和人員及時提供高密度集成的工程科學(xué)數(shù)據(jù)集,及時推送工程數(shù)據(jù)研究報告,高?;蚩蒲腥藛T根據(jù)科學(xué)數(shù)據(jù)共享協(xié)議可隨時查詢工程數(shù)據(jù)研究報告或獲取工程科學(xué)數(shù)據(jù)集,借助操作平臺及時修改科學(xué)數(shù)據(jù),對數(shù)據(jù)使用的全流程進(jìn)行監(jiān)控,隨時由數(shù)據(jù)專家提供支持,保證了科研決策質(zhì)量。
3.2 科學(xué)數(shù)據(jù)發(fā)現(xiàn)采集服務(wù)
為滿足機(jī)構(gòu)和用戶的科研決策需求,高校智慧圖書館科學(xué)數(shù)據(jù)共享空間通過數(shù)據(jù)發(fā)現(xiàn)技術(shù)對科學(xué)數(shù)據(jù)進(jìn)行研究,發(fā)現(xiàn)科學(xué)數(shù)據(jù)的價值,與數(shù)據(jù)中心及其他高校進(jìn)行策略關(guān)聯(lián),采集可滿足科研決策需求的數(shù)據(jù),并進(jìn)行計量統(tǒng)計、分析與挖掘,從數(shù)據(jù)中挖掘知識,進(jìn)行知識關(guān)聯(lián),更有效地支持科研決策。科學(xué)數(shù)據(jù)共享空間的知識發(fā)現(xiàn)與采集可以與館員的知識技能和采集工具聯(lián)系起來,通過發(fā)現(xiàn)、采集、觀測和挖掘數(shù)據(jù),發(fā)現(xiàn)科學(xué)數(shù)據(jù)潛在的分布態(tài)勢、存在特征及運(yùn)動規(guī)律,探尋科學(xué)數(shù)據(jù)的內(nèi)在關(guān)聯(lián),采集顯著特征相似的科學(xué)數(shù)據(jù)構(gòu)建知識地圖、數(shù)據(jù)導(dǎo)航圖、數(shù)據(jù)線路圖,在科研決策過程中提供可視化結(jié)果,使科研人員能夠看到科學(xué)數(shù)據(jù)的深層次聯(lián)系,更高效地做出決策。例如,華盛頓大學(xué)“Cultural and artistic data space”共享空間是典型的知識發(fā)現(xiàn)空間,應(yīng)用Python爬蟲工具采集最新的文化藝術(shù)數(shù)據(jù),通過數(shù)據(jù)清洗去除冗余、不完整的數(shù)據(jù),使用Cite-Space構(gòu)建文化藝術(shù)數(shù)據(jù)地圖、數(shù)據(jù)導(dǎo)航圖、藝術(shù)知識圖譜,在人文藝術(shù)學(xué)院科研項(xiàng)目立項(xiàng)決策時直接將可視化結(jié)果呈現(xiàn)給學(xué)者,使他們能夠針對最新文化藝術(shù)科研項(xiàng)目的可行性快速做出決策。
3.3 科學(xué)數(shù)據(jù)聚合分析服務(wù)
高校、科研人員針對科研項(xiàng)目的論證決策及可行性分析依賴科學(xué)數(shù)據(jù)的質(zhì)量、完整性、精準(zhǔn)性、預(yù)測性等,科學(xué)數(shù)據(jù)共享空間提供的科學(xué)數(shù)據(jù)越準(zhǔn)確、完整,高校和科研人員就越能快速進(jìn)行科研決策,決策的效率也就越高。為此,高校智慧圖書館科學(xué)數(shù)據(jù)共享空間需要基于機(jī)構(gòu)和用戶的科研決策需求建立一套完善的科學(xué)數(shù)據(jù)聚合分析機(jī)制,通過搭建大數(shù)據(jù)Hadoop集群、建立科學(xué)數(shù)據(jù)分析矩陣、嵌入數(shù)據(jù)聚合分析算法,對科學(xué)數(shù)據(jù)進(jìn)行有效聚合和精準(zhǔn)分析,挖掘科學(xué)數(shù)據(jù)的深層次價值。高校智慧圖書館可根據(jù)高校的科研決策流程,使用不同的科學(xué)數(shù)據(jù)分析方法在科學(xué)數(shù)據(jù)共享空間對科學(xué)數(shù)據(jù)進(jìn)行聚合分析,將不同的分析結(jié)果提供給有科研決策需求的高?;蛴脩簦阌谒麄兏咝Q策。高校智慧圖書館還可以搭建密集型科學(xué)數(shù)據(jù)聚合分析環(huán)境,優(yōu)化科學(xué)數(shù)據(jù)共享空間算法,提高科學(xué)數(shù)據(jù)分析效率。例如,Science Big Data Miner是基于爬蟲工具、數(shù)據(jù)挖掘、數(shù)據(jù)聚合分類的密集型開源化科學(xué)數(shù)據(jù)分析環(huán)境,既適用人文社科領(lǐng)域科學(xué)數(shù)據(jù)的分析挖掘,也適用自然科學(xué)領(lǐng)域科研試驗(yàn)數(shù)據(jù)的大規(guī)模分析,既可以通過Linux語言進(jìn)行操作,也可以通過Java語言進(jìn)行大規(guī)模進(jìn)程操作,能在短時間內(nèi)快速生成數(shù)據(jù)模型并進(jìn)行數(shù)據(jù)分析,預(yù)測科研決策結(jié)果,幫助科研人員提升決策效率。
參考文獻(xiàn):
[1] Zhao X,Shuning L,Yanan X,et al.Digital Humanities Scholarly Commons at Beijing Normal University Library[J].Library Trends,2020(1).
[2] Science-Library Science;University of Nebraska-Lincoln Researchers Update Current Data on Library Science (Interiors,Affect, and Use:How Does an Academic Librarys Learning Commons Support Students Needs?)[J].Information Technology Newsweekly,2020.
[3] 袁先文,程結(jié)晶.圖書館用戶數(shù)據(jù)共享空間的構(gòu)建及應(yīng)用研究[J].圖書館理論與實(shí)踐,2021(4):113-120.
[4] 相潤,韓明杰.基于用戶應(yīng)用場景的圖書館知識循環(huán)共享空間建設(shè)研究[J].圖書館建設(shè),2020(S1):184-188.
[5]吳雅威,魏來.圖書館Data Commons的服務(wù)建設(shè)研究[J].圖書館學(xué)研究,2017(19):46-52.
[6] 吳雅威,張向先.我國Data Commons平臺的建設(shè)策略研究[J].圖書館學(xué)研究,2019(18):46-53.
[7] 張果果,鄧海波.基于大資源理念下的高校圖書館LC構(gòu)建研究[J].長沙大學(xué)學(xué)報,2019(4):43-45.
[8] 吳雅威,魏來.國外Data Commons的發(fā)展及其構(gòu)建初探[J].情報資料工作,2017(6):41-48.