林文
(福建師范大學實驗室與設備管理處,福建 福州 35007)
隨著高校教學科研需求的不斷增長,大型科研儀器設備購置逐漸變得頻繁,大型科研儀器的購前查重工作也逐漸顯現(xiàn)出其必要性。由于大型科研儀器設備分布在學校的相關學院(系),且由于相關學科的多樣性,儀器的購置時間、性能、型號及技術參數(shù)紛繁復雜,另一方面,信息不集中也造成購前查重工作十分復雜。雖然許多高校建立了儀器設備資產(chǎn)管理系統(tǒng)或大儀管理平臺,但是購前查重通行的做法仍然是借助儀器設備資產(chǎn)管理系統(tǒng)或大儀管理平臺提供的目錄瀏覽功能開展人工查重。
通常,資產(chǎn)管理系統(tǒng)會提供擬購置大儀器的同類儀器設備的一些簡要信息,如儀器型號、規(guī)格、單價、國別等信息,但這些現(xiàn)有數(shù)據(jù)作為被檢索特征并不夠全面,尤其是大儀的重要性能技術指標、使用情況和已使用機時等方面信息不完備。究其原因資產(chǎn)管理系統(tǒng)的設計初衷是面向資產(chǎn)賬務管理,通常不涉及儀器設備深層次的技術和使用信息,資產(chǎn)管理系統(tǒng)也不會圍繞這些信息開展信息匹配查找等設計。
基于上述背景,本文在高校普遍建有的計算機資產(chǎn)管理系統(tǒng)上開展大型科研儀器設備購前查重實踐探索。本文根據(jù)大型科研儀器設備購置論證查重需求,針對高校資產(chǎn)管理系統(tǒng)存在的這些不足進行功能改進,使資產(chǎn)管理系統(tǒng)具備大型科研儀器設備購置論證查重功能。
基于傳統(tǒng)的資產(chǎn)管理需要,在儀器設備資產(chǎn)數(shù)據(jù)庫中通常設立了如儀器名稱、型號、規(guī)格、價格、廠家、購置日期等字段。根據(jù)需求,首先在此信息項基礎上,拓展出若干能反映大儀的性能與技術指標和使用情況的數(shù)據(jù),如添加大儀技術參數(shù)、已發(fā)表論文和已使用機時等。這些數(shù)據(jù)的生命周期應當完整地跟隨大儀的采購、使用流程,例如,當資產(chǎn)管理系統(tǒng)在日常使用過程中遇到大儀設備資產(chǎn)入賬時,通過資產(chǎn)系統(tǒng)內(nèi)部的儀器分類號和單價,根據(jù)規(guī)則匹配識別出屬大儀的記錄的,系統(tǒng)自動添加大儀相關技術參數(shù)信息。另外,借助大儀定期或不定期的使用效益考核,及時將大儀已發(fā)表論文數(shù)和已使用機時等信息反饋到資產(chǎn)管理系統(tǒng)的儀器設備資產(chǎn)數(shù)據(jù)庫中。經(jīng)過上述數(shù)據(jù)處理過后,資產(chǎn)管理系統(tǒng)就具備了包含大儀設備性能、技術指標和使用情況等在內(nèi)的可供大儀查重的基礎數(shù)據(jù)。
目前,已有Lucene、Elasticsearch等文本搜索引擎,但考慮到大型儀器數(shù)據(jù)的特殊性,并為了與原資產(chǎn)管理系統(tǒng)保持統(tǒng)一的編程界面與用戶界面,尤其是想簡便地利用現(xiàn)有代碼獲取儀器設備資產(chǎn)數(shù)據(jù)庫,本文采選擇了與原系統(tǒng)相同的編程語言開展查重程序設計。作為示范,本文以北京化工大學早期基于Visual FoxPro平臺開發(fā)的“高校資產(chǎn)管理系統(tǒng)(單機版)”軟件,開展大儀購置查重功能改進,具體改進內(nèi)容由以下四個步驟加以實現(xiàn)。
第一步,擬購置的大儀設備信息輸入。用戶通過新開發(fā)的界面輸入擬購置的大儀相關信息。作為例子,這些信息可以包括擬購置大儀的名稱、大儀型號、大儀規(guī)格、大儀技術參數(shù)、大儀廠家、購置日期、大儀單價等,如圖1所示。作為示范,該界面中的技術參數(shù)信息采用虛擬的同類儀器技術參數(shù),實際中的大儀信息可能更多。為更廣泛且一次性地采集用戶需求,允許用戶在每個信息項下輸入多個關鍵詞??紤]到現(xiàn)有自動分詞工具對專業(yè)術語的判別能力存在局限性,允許用戶在錄入時使用“逗號”或“空格”隔開以示區(qū)別,從而便于后續(xù)的匹配查找。
圖1 大儀查重條件輸入界面
第二步,查找符合輸入關鍵詞的大儀信息。系統(tǒng)自動調(diào)用大儀信息關鍵詞分解程序,將每個信息項的每個關鍵詞逐個拆解,并調(diào)用原儀器設備資產(chǎn)數(shù)據(jù)庫對輸入的信息項關鍵詞開展匹配查重。為保證準確度,在信息項查重時,首次按照完整關鍵詞開展一次性查重,其次再按由"空格"或"逗號"隔開的關鍵詞開展查重。以技術參數(shù)數(shù)據(jù)項關鍵詞查重程序為例,其VFoxPro代碼如圖2所示。程序對與擬購置的大儀信息關鍵詞相匹配的原資產(chǎn)數(shù)據(jù)庫中的大儀設備信息轉存到查重結果庫中,以便后續(xù)對大儀查重結果進行分析。
圖2 大儀信息關鍵詞查重程序
第三步:查重結果的排序輸出。系統(tǒng)自動調(diào)用查重結果庫,通過關鍵詞頻率排序,將多次被提及的原儀器設備資產(chǎn)數(shù)據(jù)庫中的大儀數(shù)據(jù)提取出來,判斷與擬購置大儀名稱相同或相近的、儀器技術參數(shù)相同或相近的、型號規(guī)格相同或相近的等儀器設備,同時根據(jù)查找結果,統(tǒng)計與擬購置相同或將近的原資產(chǎn)數(shù)據(jù)庫大儀的出現(xiàn)頻度,以出現(xiàn)頻度高的為首選,依次推薦輸出出現(xiàn)頻度低的查重儀器設備清單,本文采用與Excel兼容的csv數(shù)據(jù)格式輸出查詢結果(如圖3),供大儀論證專家參考評判。圖片中加深部分是按規(guī)格信息項開展的多個關鍵詞查找到結果,因為本次規(guī)格項中擬輸入的信息中有用“空格”隔開,所以系統(tǒng)會逐個查,但結果都指向同臺設備。
圖3 大儀查重結果輸出界面
第四步:大儀查重結果分析。以上述輸出結果為例,從中我們可以得出:“流式細胞儀”在原儀器設備資產(chǎn)數(shù)據(jù)庫中共查到5臺同類儀器設備,其中與擬購置的“流式細胞儀”在名稱、型號、規(guī)格及其國別4個信息項上匹配度較高(同一臺儀器出現(xiàn)的頻度值和為8)的有一臺。其余的4臺(同一臺儀器出現(xiàn)的頻度值和均為1)只在名稱上與擬購置的儀器相同。這一程序所提供的查重分析報告,極大地方便了在現(xiàn)有高校資產(chǎn)管理系統(tǒng)下,對大型科研儀器設備購置論證查重工作。
基于高校資產(chǎn)管理系統(tǒng)的大型科研儀器設備購置論證查重功能改進,響應了高校大型科研儀器設備購置查重論證管理的實際需要,實現(xiàn)了資產(chǎn)管理系統(tǒng)的儀器設備信息資源的有效利用,為高校大型儀器設備購置論證查重提供方便。