邱金水,莊會富,王 朋
(中國科學(xué)院昆明植物研究所科技信息中心,昆明 650201)
隨著計算機(jī)技術(shù)與網(wǎng)絡(luò)技術(shù)的高速發(fā)展,推動了實驗室管理朝著信息化和智能化方向發(fā)展,涌現(xiàn)了大量采用信息技術(shù)手段設(shè)計和實現(xiàn)的實驗室管理系統(tǒng)和共享平臺,如在實驗室管理系統(tǒng)建設(shè)方面:吳荻等[1]設(shè)計和實現(xiàn)了涵蓋實驗室管理各方面的綜合信息管理系統(tǒng);王攀等[2]設(shè)計和實現(xiàn)了儀器設(shè)備資產(chǎn)管理系統(tǒng);王洋洋等[3]構(gòu)建和實現(xiàn)了高校試劑全生命周期管理平臺;張無奇等[4]研究的實驗室教學(xué)管理系統(tǒng);以及黃雅婕等[5]設(shè)計和實現(xiàn)的對實驗室區(qū)域的環(huán)境狀態(tài)進(jìn)行感知和對儀器設(shè)備監(jiān)控的安全管理系統(tǒng)等。在實驗室共享平臺建設(shè)方面:俞超等[6]對實驗室資源共享平臺的建設(shè)進(jìn)行了相關(guān)研究,闡述了實驗室資源共享平臺建設(shè)在擴(kuò)大共享深度和廣度等方面的必要性;方三華等[7]和孫歆等[8]設(shè)計和實現(xiàn)了針對大型儀器的共享服務(wù)平臺;王雪紅等[9]構(gòu)建了針對材料的開放共享平臺并取得了良好的效果。由此可見,在實驗室的綜合管理、設(shè)備資產(chǎn)管理、試劑管理、教學(xué)管理、安全管理以及大型儀器共享和材料共享等方面均比較成熟。
在實驗數(shù)據(jù)管理方面,徐磊[10]和林偉君[11]對實驗數(shù)據(jù)的管理系統(tǒng)建設(shè)進(jìn)行了相關(guān)的研究;王月婷等[12]設(shè)計和實現(xiàn)了針對EAST實驗數(shù)據(jù)的管理系統(tǒng);黃飛等[13]設(shè)計了針對脈沖電源實驗數(shù)據(jù)的管理平臺;夏良松[14]設(shè)計和實現(xiàn)了針對臨床實驗數(shù)據(jù)的管理系統(tǒng)。在實驗數(shù)據(jù)共享方面,邊紅霞等[15]探討了實驗小組內(nèi)部共享實驗數(shù)據(jù)的實驗教學(xué)模式;林昀軒等和劉升光等實現(xiàn)了特定實驗區(qū)域內(nèi)通過無線傳輸技術(shù)實現(xiàn)實驗數(shù)據(jù)的采集、傳輸和共享方案。由此可見,在實驗數(shù)據(jù)的管理系統(tǒng)建設(shè)方面,目前僅針對特定領(lǐng)域的實驗數(shù)據(jù),而在實驗數(shù)據(jù)的共享平臺建設(shè)方面,目前僅停留在特定區(qū)域范圍內(nèi)或?qū)嶒炐〗M內(nèi)部。
2004 年科技部印發(fā)《2004—2010 年國家科技基礎(chǔ)條件平臺建設(shè)綱要》著手推動我國科技資源的整合與共享。2015 年國務(wù)院印發(fā)《關(guān)于國家重大科研基礎(chǔ)設(shè)施和大型科研儀器向社會開放的意見》后,推動了高校和科研院所的實驗室紛紛建設(shè)大型儀器共享平臺。2018 年國務(wù)院印發(fā)《科學(xué)數(shù)據(jù)管理辦法》提出科學(xué)數(shù)據(jù)分級管理、安全可控、充分利用的原則和“開放為常態(tài)、不開放為例外”的共享理念,標(biāo)志著我國科學(xué)數(shù)據(jù)管理和共享新的歷史階段,實驗數(shù)據(jù)作為最基礎(chǔ)和最原始的科學(xué)數(shù)據(jù),是科學(xué)數(shù)據(jù)不可分割的一部分,因此對實驗數(shù)據(jù)進(jìn)行管理和共享是未來科技資源發(fā)展的必然趨勢,建設(shè)一個科學(xué)實驗數(shù)據(jù)管理與共享平臺對提高實驗室信息化水平和為實驗室管理提前進(jìn)行布局具有重要的戰(zhàn)略意義。
中國科學(xué)院昆明植物研究所有1 個國家重點實驗室、1 個中國科學(xué)院重點實驗室和多個云南省重點實驗室,各個實驗室的實驗數(shù)據(jù)分散在從事實驗活動的工作人員或研究生手中,對實驗數(shù)據(jù)缺乏系統(tǒng)性管理和共享容易出現(xiàn)較多問題:
(1)實驗數(shù)據(jù)流失。從事實驗活動的工作人員或研究生缺乏實驗數(shù)據(jù)的備份意識,一旦存儲實驗數(shù)據(jù)的設(shè)備出現(xiàn)故障或丟失時,容易造成實驗數(shù)據(jù)的流失;同時,相關(guān)工作人員離職或研究生畢業(yè)離開時也容易忽略實驗數(shù)據(jù)的移交工作,從而造成實驗數(shù)據(jù)的流失。
(2)未充分發(fā)揮實驗數(shù)據(jù)的價值。對實驗數(shù)據(jù)進(jìn)行一定程度的開放共享,不僅可以幫助需要進(jìn)行相同或相近實驗的科研人員,為其提供一定的參考價值,同時也為相關(guān)科研人員進(jìn)行進(jìn)一步的實驗或?qū)嶒灁?shù)據(jù)進(jìn)行分析提供基本的支撐條件,從而充分發(fā)揮實驗數(shù)據(jù)的價值。
(3)難以獲取實驗數(shù)據(jù)。科研人員需要獲取他人的實驗數(shù)據(jù)時,一般通過互聯(lián)網(wǎng)上的相關(guān)論文獲取,而論文中數(shù)據(jù)僅僅是實驗數(shù)據(jù)的一部分,并不能反映實驗的完整過程,因此科學(xué)實驗數(shù)據(jù)共享平臺的建設(shè)可以幫助科研人員更容易獲取完整的實驗數(shù)據(jù)。
中國科學(xué)院昆明植物研究所科技信息中心是研究所的信息化部門,鑒于以上背景和現(xiàn)狀分析,科技信息中心基于.Net MVC技術(shù)為研究所的各大實驗室設(shè)計和實現(xiàn)了一個通用的科學(xué)實驗數(shù)據(jù)共享平臺,為實驗人員提供對科學(xué)實驗數(shù)據(jù)進(jìn)行管理和共享的服務(wù)。
科學(xué)實驗數(shù)據(jù)共享平臺主要由前臺網(wǎng)站和后臺管理系統(tǒng)組成,前臺網(wǎng)站主要提供給用戶注冊、登錄、實名認(rèn)證、賬號管理、上傳實驗數(shù)據(jù)、管理實驗數(shù)據(jù)、好友分享以及檢索、查看和下載開放共享的實驗數(shù)據(jù)等功能。后臺管理系統(tǒng)主要提供給系統(tǒng)管理員對用戶上傳的實驗數(shù)據(jù)進(jìn)行審核和管理,同時還提供用戶管理、日志管理、權(quán)限管理和其他系統(tǒng)管理等功能。具體的功能模塊如圖1 所示。
圖1 共享平臺功能模塊
科學(xué)實驗數(shù)據(jù)共享平臺是一個為實驗人員提供實驗數(shù)據(jù)上傳、存儲、管理和共享的網(wǎng)站平臺,因此其核心的業(yè)務(wù)流程主要包括上傳實驗數(shù)據(jù)資源業(yè)務(wù)流程和共享實驗數(shù)據(jù)資源業(yè)務(wù)流程。上傳實驗數(shù)據(jù)資源時,用戶需要登錄并填寫資源信息,然后針對不同的實驗數(shù)據(jù)資源類型進(jìn)行不同的處理流程,最后提交系統(tǒng)管理員審核,其具體業(yè)務(wù)流程如圖2 所示。
圖2 上傳實驗數(shù)據(jù)資源業(yè)務(wù)流程
共享實驗數(shù)據(jù)資源時,用戶需要先檢索到相應(yīng)的資源,然后對當(dāng)前用戶的權(quán)限進(jìn)行判斷,確保資源提供者設(shè)置的資源共享權(quán)限與當(dāng)前用戶的權(quán)限是一致時方可進(jìn)行實驗數(shù)據(jù)資源的共享,其具體業(yè)務(wù)流程如圖3所示。
圖3 共享實驗數(shù)據(jù)資源業(yè)務(wù)流程
考慮到研究所實驗室眾多,各種實驗產(chǎn)生的實驗數(shù)據(jù)在具體的描述字段以及文件格式均不太一致,因此共享平臺不可能在實驗數(shù)據(jù)具體表達(dá)的含義的粒度層面進(jìn)行詳細(xì)設(shè)計和實現(xiàn),因此共享平臺的數(shù)據(jù)庫設(shè)計,采用對實驗數(shù)據(jù)的基本描述進(jìn)行設(shè)計,即設(shè)計了實驗數(shù)據(jù)的元數(shù)據(jù)字段,如:實驗數(shù)據(jù)來源的項目名稱、類型和編號,實驗數(shù)據(jù)的標(biāo)題、作者、關(guān)鍵字、摘要和數(shù)據(jù)共享引用格式等元數(shù)據(jù)字段。通過存儲實驗數(shù)據(jù)的元數(shù)據(jù)字段,可以使共享平臺能兼容各種類型實驗的數(shù)據(jù),從而提高了共享平臺的通用性。
考慮到有的實驗數(shù)據(jù)是以文件形式保存在本地,有的則保存在特定的FTP 服務(wù)器或互聯(lián)網(wǎng)的某個存儲空間,因此共享平臺支持用戶以文件形式上傳實驗數(shù)據(jù)資源,也支持用戶以URL 形式共享實驗數(shù)據(jù)資源。同時考慮到資源文件大小不一,可分為普通文件和大文件,文件小于500 MB 的稱為普通文件,可以快速上傳后提交審核,而有的實驗數(shù)據(jù)文件大于500 MB甚至達(dá)幾十GB的稱為大文件,針對大文件資源,可以先建立一個資源草稿,然后分步上傳資源文件,且共享平臺支持文件的斷點續(xù)傳功能,即無須擔(dān)心上傳資源文件時網(wǎng)絡(luò)或服務(wù)器中斷,網(wǎng)絡(luò)或服務(wù)器恢復(fù)正常后可以接著續(xù)傳文件,從而提高資源上傳的效率和平臺的可用性。
考慮到共享資源尤其是實驗數(shù)據(jù)的敏感性,共享平臺為用戶提供了多層級和定時共享的資源共享權(quán)限控制。用戶可以設(shè)置資源為不共享、僅共享元數(shù)據(jù)或完全共享3 個級別的共享權(quán)限,不共享即資源僅上傳保存?zhèn)浞?,僅自己可見;僅共享元數(shù)據(jù)是資源的元數(shù)據(jù)共享但資源文件不共享;完全共享即資源元數(shù)據(jù)和資源文件都對外共享。用戶也可以設(shè)置資源在某個日期之后進(jìn)行不共享、僅共享元數(shù)據(jù)或完全共享。此外,共享平臺還支持用戶針對非完全共享的資源指定給特定的某個或某些用戶進(jìn)行內(nèi)部共享。
科學(xué)實驗數(shù)據(jù)共享平臺支持對實驗數(shù)據(jù)的多字段模糊檢索和排序功能。用戶可以通過實驗數(shù)據(jù)的標(biāo)題、關(guān)鍵字或作者信息進(jìn)行快速模糊檢索可共享的實驗數(shù)據(jù)資源,并支持按實驗數(shù)據(jù)的標(biāo)題、提交時間或熱度對檢索結(jié)果進(jìn)行排序,用戶可以快速檢索到自己需要的資源并查看資源詳情,在符合資源提供者設(shè)置的共享權(quán)限條件下可下載相應(yīng)的資源。
科學(xué)實驗數(shù)據(jù)共享平臺是基于.Net MVC 技術(shù)設(shè)計和實現(xiàn),數(shù)據(jù)庫系統(tǒng)采用了SqlServer 2014 數(shù)據(jù)庫管理系統(tǒng),開發(fā)工具是Visual Studio 2013,編程語言和技術(shù)包括C#、ASP.NET、MVC、JQuery LigerUI、Bootstrap、JavaScript、CSS等。
用戶注冊并登入共享平臺后,可以在線提交實驗數(shù)據(jù)資源,提交資源前需要填寫資源的相關(guān)信息,如實驗數(shù)據(jù)的來源、資源的元數(shù)據(jù)信息(如圖4 所示),并根據(jù)資源的不同的形式上傳文件或填寫URL信息,然后設(shè)置資源的共享權(quán)限并提交審核。
圖4 提交資源元數(shù)據(jù)信息
用戶提交資源后,系統(tǒng)將通過短信和郵件形式通知系統(tǒng)管理員進(jìn)行資源審核,管理員登入后臺管理系統(tǒng)對新提交的資源進(jìn)行審核,如圖5 所示。管理員對資源的元數(shù)據(jù)信息和資源文件進(jìn)行形式審查,如無問題則可以審核通過,審核通過且資源共享權(quán)限設(shè)置為僅公開元數(shù)據(jù)或完全共享的資源才會在共享平臺門戶網(wǎng)站進(jìn)行展示。
圖5 管理員審核資源
用戶在共享平臺門戶網(wǎng)站首頁可以查看最新上傳的實驗數(shù)據(jù)資源,或利用檢索框根據(jù)資源的標(biāo)題、關(guān)鍵字或作者信息進(jìn)行模糊檢索相應(yīng)的資源。找到需要的資源后,用戶可以查看資源的相關(guān)描述信息,并根據(jù)資源所有者設(shè)置的共享權(quán)限進(jìn)行共享,如當(dāng)前用戶擁有該資源的共享權(quán)限,則可以通過單個或打包的形式下載該實驗數(shù)據(jù)資源的相關(guān)文件,如圖6 所示。
圖6 用戶查看并下載資源
科學(xué)實驗數(shù)據(jù)共享平臺已初步建設(shè)完成,共享平臺為實驗人員提供了在線上傳、存儲、發(fā)布、檢索、查看和下載實驗數(shù)據(jù)資源等功能。共享平臺通用性較強(qiáng),能實現(xiàn)各種類型實驗數(shù)據(jù)的上傳,同時支持多種形式的實驗數(shù)據(jù)資源共享,還支持靈活的共享權(quán)限設(shè)置,不僅為實驗人員提供了實驗數(shù)據(jù)的備份存儲空間,同時為科研人員提供了便捷的實驗數(shù)據(jù)的獲取渠道,充分發(fā)揮了實驗數(shù)據(jù)的價值,并促進(jìn)了實驗人員之間的溝通與交流。共享平臺的建設(shè)獲得了研究所科研人員的認(rèn)可,提高了實驗室的信息化和實驗室管理水平。
實驗數(shù)據(jù)是實驗室的核心產(chǎn)物,但目前各大高校和科研院所對實驗數(shù)據(jù)尚缺乏系統(tǒng)性的管理與共享,國內(nèi)以實驗數(shù)據(jù)為核心的科學(xué)數(shù)據(jù)管理與共享尚處于起步階段,因此本文嘗試探索在研究所建設(shè)科學(xué)實驗數(shù)據(jù)共享平臺,目前存在的主要問題有以下幾個:
(1)尚未界定哪些實驗數(shù)據(jù)可以不共享、應(yīng)該共享、必須共享和不能共享。由于實驗數(shù)據(jù)存在敏感性甚至有些可能還是涉密信息,因此關(guān)于實驗數(shù)據(jù)的共享性質(zhì),研究所尚未出臺相關(guān)的政策文件進(jìn)行界定,因此目前科學(xué)實驗數(shù)據(jù)的共享是基于自愿原則。
(2)目前共享平臺系統(tǒng)管理員僅對實驗數(shù)據(jù)的元數(shù)據(jù)信息和數(shù)據(jù)文件進(jìn)行形式審查,雖然基本上能確保實驗數(shù)據(jù)的真實性,但無法確保實驗數(shù)據(jù)的準(zhǔn)確性,下一步工作需要成立共享平臺專家委員會,讓專家對實驗數(shù)據(jù)進(jìn)行實質(zhì)性的審查從而確保數(shù)據(jù)的準(zhǔn)確性。
(3)科研人員的共享意識還有待提高,下一步工作需要探討實驗數(shù)據(jù)的共享激勵制度建設(shè),進(jìn)一步提高科研人員的共享意識。
2004 年科技部印發(fā)的《2004~2010 年國家科技基礎(chǔ)條件平臺建設(shè)綱要》里提出重點建設(shè)的6 個平臺中包括了科學(xué)數(shù)據(jù)共享平臺,2018 年國務(wù)院印發(fā)《科學(xué)數(shù)據(jù)管理辦法》后,中國科學(xué)院和各省均相繼出臺了相應(yīng)的科學(xué)數(shù)據(jù)管理辦法,研究所目前也已經(jīng)出臺了科學(xué)數(shù)據(jù)管理辦法,各級政府和單位均在逐步推進(jìn)對科學(xué)數(shù)據(jù)的管理和共享政策的落地實施,實驗數(shù)據(jù)作為最原始、最基礎(chǔ)和最核心的科學(xué)數(shù)據(jù),對實驗數(shù)據(jù)進(jìn)行管理和共享是未來科技資源發(fā)展的必然趨勢,也是實驗室管理未來的重要方向和工作任務(wù),因此建設(shè)實驗數(shù)據(jù)共享平臺為實驗室管理提前進(jìn)行布局具有重要的戰(zhàn)略意義。