馬瑾男,王志文
(山西省信息產(chǎn)業(yè)技術(shù)研究院有限公司,山西 太原 030012)
隨著信息技術(shù)的發(fā)展,我國(guó)的信息資源管理發(fā)展由最初的傳統(tǒng)管理時(shí)代進(jìn)入了信息管理時(shí)代,伴隨著網(wǎng)絡(luò)信息的快速發(fā)展,“大數(shù)據(jù)”也逐漸引起人們的關(guān)注。大數(shù)據(jù)是指以多元形式,許多來源搜集而來的龐大數(shù)據(jù)組,它的特色在于對(duì)海量數(shù)據(jù)的挖掘、提純。簡(jiǎn)言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有效價(jià)值信息的能力,稱為大數(shù)據(jù)技術(shù)。
本文所提到的科技資源信息化管理主要是政府為有效整合和優(yōu)化全省的科技資源,實(shí)現(xiàn)科技資源的數(shù)據(jù)集成、數(shù)據(jù)展示、在線預(yù)約、服務(wù)評(píng)價(jià)和監(jiān)督等功能而建設(shè)的山西省科技資源開放共享網(wǎng)絡(luò)管理服務(wù)平臺(tái)(以下簡(jiǎn)稱“科技資源管理服務(wù)平臺(tái)”)。
在科技資源管理服務(wù)平臺(tái)中,大數(shù)據(jù)技術(shù)成為了一項(xiàng)重要的工具和手段。目前大型科研設(shè)施與儀器、科技文獻(xiàn)、重點(diǎn)實(shí)驗(yàn)室、創(chuàng)新團(tuán)隊(duì)、創(chuàng)新平臺(tái)、工程技術(shù)研究中心等都通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)了數(shù)據(jù)的集成、挖掘、展示及管理。大數(shù)據(jù)技術(shù)的出現(xiàn),為科技資源的共享服務(wù)帶來了極大的便捷。
山西省科技資源開放共享網(wǎng)絡(luò)管理服務(wù)平臺(tái)是山西省科技廳根據(jù)國(guó)發(fā)[2014]70號(hào)文要求搭建的布局合理、功能完善、體系健全、共享高效的管理服務(wù)平臺(tái)。服務(wù)于儀器管理單位,主管部門、科技廳以及廣大科技資源用戶,實(shí)現(xiàn)全要素科技資源開放共享管理服務(wù),大型科研設(shè)施與儀器平臺(tái)(落實(shí)國(guó)務(wù)院70號(hào)文)、科技基礎(chǔ)條件平臺(tái)、生物(物種)資源與實(shí)驗(yàn)材料、科技文獻(xiàn)、科學(xué)數(shù)據(jù)、重點(diǎn)科技創(chuàng)新平臺(tái)、重點(diǎn)實(shí)驗(yàn)室、工程技術(shù)研究中心、創(chuàng)新團(tuán)隊(duì)、科技創(chuàng)新券等向社會(huì)開放共享,提高科技資源的利用率。
在該系統(tǒng)中,我們通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)了大型科研設(shè)施與儀器資源庫(kù)的建立,重點(diǎn)實(shí)驗(yàn)室、創(chuàng)新團(tuán)隊(duì)、工程技術(shù)研究中心、重點(diǎn)科技創(chuàng)新平臺(tái)的信息收集與共享,搭建了近50家在線服務(wù)平臺(tái),實(shí)現(xiàn)在線預(yù)約、在線搜索等功能;利用大數(shù)據(jù)技術(shù)還配套建設(shè)“山西省科技創(chuàng)新券管理系統(tǒng)”,促使形成具有個(gè)性化、專門化服務(wù)的信息資源。通過大數(shù)據(jù)的應(yīng)用將信息搜集和開發(fā)利用作為目標(biāo),有效解決了信息整合、數(shù)據(jù)挖掘、隱性知識(shí)的顯性化及信息資源的知識(shí)管理、信息共享等問題,促使科技資源的有效共享和管理。
將傳統(tǒng)工具與大數(shù)據(jù)工具有效結(jié)合,收錄入網(wǎng)儀器2000余臺(tái),并對(duì)儀器進(jìn)行整合分類;收錄重點(diǎn)科技創(chuàng)新平臺(tái)、創(chuàng)新團(tuán)隊(duì)、工程技術(shù)研究中心等近400余家,建立后臺(tái)數(shù)據(jù)庫(kù),前臺(tái)數(shù)據(jù)分類;搭建在線服務(wù)平臺(tái)群49家,實(shí)現(xiàn)數(shù)據(jù)的高級(jí)分類搜索,建立儀器庫(kù),對(duì)儀器庫(kù)進(jìn)行數(shù)據(jù)分析,實(shí)現(xiàn)數(shù)據(jù)預(yù)約排行榜;搭建山西科技創(chuàng)新券管理系統(tǒng),對(duì)中小微企業(yè)、平臺(tái)基地、管理機(jī)構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)分類、數(shù)據(jù)處理及展示、數(shù)據(jù)分析統(tǒng)計(jì)、數(shù)據(jù)存儲(chǔ)等。
圖1 系統(tǒng)圖
針對(duì)科技資源系統(tǒng)并不是單純的對(duì)信息資源進(jìn)行整合,我們?cè)谡系幕A(chǔ)上積極了解用戶遇到的數(shù)據(jù)問題,如數(shù)據(jù)的查詢、使用等,對(duì)數(shù)據(jù)進(jìn)行了加工、處理、分類、優(yōu)化、展示,從而給用戶提供更好的科技資源信息。
針對(duì)大量有效數(shù)據(jù),利用數(shù)據(jù)網(wǎng)絡(luò)技術(shù),搭建數(shù)據(jù)接口,強(qiáng)化數(shù)據(jù)關(guān)聯(lián),實(shí)現(xiàn)平臺(tái)與平臺(tái)之間,用戶與企業(yè)之間、部門與部門之間的有效連接,達(dá)成了數(shù)據(jù)共享、數(shù)據(jù)留痕、數(shù)據(jù)匯集、數(shù)據(jù)關(guān)聯(lián)、數(shù)據(jù)分析、數(shù)據(jù)智能的目標(biāo),促使科技資源信息的有效共享和利用。
通過標(biāo)準(zhǔn)化的流程和工具對(duì)科技資料中的數(shù)據(jù)分類進(jìn)行處理,保證預(yù)先定義和設(shè)定好的高質(zhì)量數(shù)據(jù)分析結(jié)果。
無論是對(duì)大型科研設(shè)施中的儀器設(shè)施數(shù)據(jù)還是對(duì)創(chuàng)新券管理系統(tǒng)中的各類用戶,應(yīng)用數(shù)據(jù)可視化的直觀展示,通過數(shù)據(jù)說話,增強(qiáng)用戶體驗(yàn)感。
利用集群、分割、孤立點(diǎn)分析等算法深入科技資料各類數(shù)據(jù)內(nèi)部,挖掘數(shù)據(jù)的價(jià)值,最終形成科技資源各類統(tǒng)計(jì)表,為用戶提供參考,為政府部門提供下一步?jīng)Q策預(yù)測(cè)的依據(jù)。
相似匹配是通過一定的方法,來計(jì)算兩個(gè)數(shù)據(jù)的相似程度,本系統(tǒng)中相似匹配方法用于科技資源管理服務(wù)平臺(tái)的各項(xiàng)網(wǎng)頁搜索,及創(chuàng)新券系統(tǒng)、大型科研設(shè)施與儀器管理平臺(tái)的評(píng)分功能。
本文通過對(duì)大數(shù)據(jù)技術(shù)的應(yīng)用,對(duì)山西省科技資源開放共享管理服務(wù)平臺(tái)的探討,得出大數(shù)據(jù)技術(shù)是解決科技資源管理信息化的重要手段,通過大數(shù)據(jù)技術(shù)提高了科技資源信息的有效性、實(shí)時(shí)性、便利性,為儀器管理單位、儀器使用者、主管部門、科技廳等廣大科技資源用戶提供了便利。
注:本論文依托于“山西科技成果轉(zhuǎn)化和知識(shí)產(chǎn)權(quán)交易服務(wù)平臺(tái)運(yùn)營(yíng)服務(wù)”項(xiàng)目。