俞嘯 袁文濤 金宏飛 萬紅 張立
摘 要:在高??蒲泄芾磉^程中,不斷增長的統(tǒng)計指標和數(shù)據(jù)量成為影響教師科研數(shù)據(jù)統(tǒng)計與分析的重要問題,文章利用智能信息處理和數(shù)據(jù)挖掘方法建立高??蒲谐晒畔⒅悄芙y(tǒng)計分析平臺。一方面,通過系統(tǒng)平臺的構(gòu)建,統(tǒng)計科研成果信息,提供各種分析報表,為科研工作者和相關(guān)管理人員提供實時的科研成果動態(tài)信息。另一方面,將關(guān)聯(lián)分析算法應(yīng)用到分析系統(tǒng)中,挖掘出科研成果與影響因素之間的內(nèi)在的關(guān)聯(lián)關(guān)系,為科學(xué)的科研管理和服務(wù)方法提供決策支持。
關(guān)鍵詞:科研成果;統(tǒng)計管理;智能分析;決策支持
中圖分類號:TP391 文獻標志碼:A 文章編號:2095-2945(2018)29-0085-03
Abstract: In the process of scientific research management in colleges and universities, the increasing statistical indexes and the amount of data have become an important problem that affects the statistics and analysis of teachers' scientific research data. This paper uses intelligent information processing and data mining methods to set up an intelligent statistical analysis platform of scientific research information in colleges and universities. On the one hand, through the construction of the system platform, statistical information of scientific research results, provide a variety of analysis reports, to provide real-time dynamic information of scientific research results for scientific research workers and relevant managers. On the other hand, the association analysis algorithm is applied to the analysis system to find out the internal relationship between the scientific research results and the influencing factors, so as to provide decision support for scientific research management and service methods.
Keywords: scientific research achievements, statistical management, intelligent analysis, decision support
2018年7月24日國務(wù)院發(fā)布了《國務(wù)院關(guān)于優(yōu)化科研管理提升科研績效若干措施的通知》,《通知》中指出要強化科研項目績效評價,實行科研項目績效分類評價,充分調(diào)動科研人員積極性,多出高水平成果[1]??蒲谐晒臄?shù)量和質(zhì)量是衡量高校科研能力的重要指標,同時也是反映高校綜合校力的標準之一。及時準確的將科研成果信息進行統(tǒng)計分析,對于掌握學(xué)??蒲邪l(fā)展現(xiàn)狀,合理制定發(fā)展規(guī)劃,推動科研工作發(fā)展有著重要作用[2]。隨著高校招生規(guī)模和師資力量的擴大,高校科研成果的數(shù)據(jù)量大幅增加,若使用傳統(tǒng)的半人工方式進行管理和數(shù)據(jù)分析,不僅會大大增大管理工作復(fù)雜程度,而且容易發(fā)生錯誤。面對海量的數(shù)據(jù),如何實現(xiàn)科研成果信息高效維護和管理,充分對數(shù)據(jù)進行整合挖掘并提取有用的信息,進而為高校的科研發(fā)展提供決策支持是當前亟待解決的問題[3]。
針對高??蒲谐晒芾硇实拖碌默F(xiàn)狀,本文提出通過引進高??蒲谐晒芾硐到y(tǒng),提高管理效率,同時加強我國的高??蒲行畔⒒芾斫ㄔO(shè),進而促進我國高??蒲兴降奶岣叩南敕?。利用現(xiàn)代信息技術(shù)搭建高??蒲谐晒畔⒅悄芙y(tǒng)計分析系統(tǒng),實現(xiàn)科研成果的統(tǒng)計、檢索、轉(zhuǎn)化和管理的統(tǒng)一化標準化。建立以高??蒲泄芾砉ぷ髦袨橹鲗?dǎo)的綜合信息管理平臺,充分發(fā)揮信息技術(shù)的優(yōu)勢將云計算、智能信息處理、數(shù)據(jù)挖掘等技術(shù)應(yīng)用在科研成果的管理和統(tǒng)計分析上來,提高信息的安全性和信息統(tǒng)計分析的準確性高效性,為高??蒲泄芾砗拖嚓P(guān)計劃的制定提供真實有效的依據(jù),具有重要的理論意義及推廣價值。
1 系統(tǒng)分析與研究內(nèi)容
1.1 數(shù)據(jù)存儲與服務(wù)接口設(shè)計
系統(tǒng)需要為各類科研成果數(shù)據(jù)提供統(tǒng)一的服務(wù)標準和接口,在科研成果內(nèi)容訪問方面需要綜合考慮服務(wù)接口的兼容性、有效性和服務(wù)效率。要求數(shù)據(jù)存儲中心能夠滿足服務(wù)訪問量和數(shù)據(jù)存儲邏輯結(jié)構(gòu)的需要,即利用各種手段,為不同種類的科研成果數(shù)據(jù)建立統(tǒng)一的存儲結(jié)構(gòu),并提供標準的服務(wù)層抽象,建立研究成果信息分析庫,為后續(xù)利用信息、提煉知識、解決問題等應(yīng)用提供基礎(chǔ)條件。
1.2 系統(tǒng)模塊設(shè)計與性能需求
系統(tǒng)的軟件模塊包含用戶信息管理模塊、權(quán)限管理模塊、科研人員信息管理模塊,科研成果信息管理模塊(論文、著作、知識產(chǎn)權(quán)等),科研項目信息管理模塊等部分組成。為了提高系統(tǒng)的訪問效率和安全性,還需要增加相關(guān)的算法模塊,主要包括信息過濾算法模塊、快速搜索算法模塊、隱私保護模塊、關(guān)聯(lián)分析算法模塊、推薦算法模塊等。在提供科研成果信息管理與查詢服務(wù)的同時滿足系統(tǒng)訪問性能的需求。
1.3 感興趣信息推送與科研成果關(guān)聯(lián)因素分析
依據(jù)科研工作者和管理人員的訪問行為構(gòu)建模型并從成果分析平臺中挖掘出用戶感興趣的信息,針對不同用戶的需求,為用戶提供個性化定制和精確推薦兩種方式。信息定制是主動獲取信息的方式,用戶通客戶端的平臺,向信息綜合服務(wù)平臺定制感興趣的信息;精確推薦方式是以用戶訪問的行為為統(tǒng)計分析的基礎(chǔ),為用戶提供科研成果信息的定期推送服務(wù)。采用關(guān)聯(lián)因素分析算法對科研成果的多種影響因素進行關(guān)聯(lián)分析,從而更好為科研和管理提供決策支持,采用Apriori算法來提高系統(tǒng)分析的整體性能。
2 系統(tǒng)研發(fā)
2.1 軟件系統(tǒng)研發(fā)
系統(tǒng)的研發(fā)采用開發(fā)平臺是Microsoft Visual Studio 2013,該平臺軟件由微軟公司2010年4月推出,是目前最為流行的平臺開發(fā)軟件,其操作界面簡潔,功能強大,可以實現(xiàn)C、C++、C#、VB、SQLServer 等諸多語言的編程開發(fā)。并且 Microsoft Visual Studio 2013還支持在Windows Server 2012平臺下的創(chuàng)建智能設(shè)備應(yīng)用程序、應(yīng)用程序、網(wǎng)絡(luò)應(yīng)用程序、網(wǎng)絡(luò)服務(wù)和Office插件等。
采用WPF(Windows Presentation Foundation)技術(shù)完成應(yīng)用系統(tǒng)界面設(shè)計,WPF是由微軟公司發(fā)布的新型的計算機圖形學(xué)表現(xiàn)層技術(shù)[4],WPF技術(shù)是基于.NET的,需要HTML、XML以及Flash等軟件技術(shù)和硬件圖形化技術(shù)的支持。它為模塊化顯示接口、二維三維圖形開發(fā)、多媒體業(yè)務(wù)以及文檔接口提供了統(tǒng)一的描述和操作方法,WPF可以給開發(fā)人員和設(shè)計人員提供更優(yōu)良的開發(fā)平臺,用于開發(fā)客戶端應(yīng)用程序,給用戶創(chuàng)造更優(yōu)的視覺效果。WPF技術(shù)的出現(xiàn)使得豐富功能的實現(xiàn)成為可能,其中Windows系統(tǒng)中個性化的半透明效果的窗體是WPF技術(shù)的一個具體實例,總體來說,WPF技術(shù)的出現(xiàn)使用戶對于視覺沖擊的追求得到滿足。WPF能夠提升終端用戶的體驗質(zhì)量以及對界面接口的高級需求,采用基于XML的XAML為界面描述語言,便于前臺界面的設(shè)計與維護。系統(tǒng)論文信息管理與查詢分析界面如圖1所示。
在數(shù)據(jù)庫方面,系統(tǒng)采用開源的MySQL數(shù)據(jù)庫。MySqL的核心數(shù)據(jù)操作支持多線程編程機制,在線程方面,它是一個輕量級的過程,不僅為用戶提供了靈活性,而且還較少的利用了系統(tǒng)資源[5]。MySqL的內(nèi)存調(diào)配系統(tǒng)基于線程,具備快速和穩(wěn)定的特性,所以可以不間斷使用而不用擔(dān)心其穩(wěn)定性,當面對大規(guī)模的數(shù)據(jù)庫查詢時,MySqL可以提供高效率的的運行支持。MySqL能夠支持有WHERE語句和查詢的SELECT語句的一切函數(shù)和操作符。在同一個查詢中,MySqL可以混合并使用不同的數(shù)據(jù)庫表,并且查詢將變得更加簡單快捷。
2.2 關(guān)聯(lián)分析算法設(shè)計
為了綜合分析各因素對科研成果產(chǎn)出的影響,從而為科研和相關(guān)管理工作提供決策支持,需要在科研成果信息統(tǒng)計分析綜合服務(wù)平臺中挖掘多個影響因素之間的關(guān)聯(lián)規(guī)則。挖掘數(shù)據(jù)中關(guān)聯(lián)規(guī)則可以抽象為兩個步驟:第一,在數(shù)據(jù)中挖掘出所有頻繁項集。第二,對頻繁項集進行迭代,尋找同時滿足最小置信度以及最小支持度強關(guān)聯(lián)規(guī)則。采用Apriori算法[6]分析科研成果相關(guān)科研人員、成果數(shù)量、研究經(jīng)歷等信息的關(guān)聯(lián)模型,挖掘出科研成果與影響因素之間的內(nèi)在的關(guān)聯(lián)關(guān)系。經(jīng)過關(guān)聯(lián)分析后,系統(tǒng)統(tǒng)計的科研人員之間的關(guān)聯(lián)度結(jié)果如圖2所示。
2.3 數(shù)據(jù)安全設(shè)計
科研成果信息管理系統(tǒng)中存在部分科研者隱私相關(guān)的信息,系統(tǒng)面向公共網(wǎng)絡(luò)開放接口時,需要增加對數(shù)據(jù)安全的考慮。同時考慮保證數(shù)據(jù)的私密性和傳輸速度兩個方面的因素,這里采用AES算法對隱私數(shù)據(jù)進行加密處理。
AES算法主要包含:有限域(GF,28)、有限域上的多項式、有限域上的字節(jié)運算、有限域上的字運算[7]。其中有限域的定義為:結(jié)構(gòu)
圖3所示為AES算法加密過程。解密過程是加密過程的逆過程。這兩個過程使用同一個密鑰,明文P為未經(jīng)過加密的數(shù)據(jù),密鑰K是用來加密明文的密碼。在對稱加密算法中,加密與解密的密鑰相同,為加密者與解密者協(xié)商產(chǎn)生,不可泄露,否則會被攻擊者還原密文。C為經(jīng)過加密函數(shù)處理后的數(shù)據(jù)。設(shè)定AES算法加密函數(shù)為E,則C=E(K,P)。P表示明文、K代表密鑰、C是密文。處理過程中,把明文P與密鑰K當作加密函數(shù)的輸入,那么加密函數(shù)E將會把密文C輸出。同樣,將密文和密鑰作為輸入,經(jīng)過AES算法解密函數(shù)將會得到明文P。
3 結(jié)束語
高??蒲谐晒畔⒅悄芙y(tǒng)計分析系統(tǒng)實現(xiàn)了高??蒲腥藛T科研成果信息的常規(guī)管理操作,利用AES算法保證了數(shù)據(jù)的安全性,同時利用關(guān)聯(lián)算法挖掘出科研人員與科研成果間的關(guān)聯(lián)關(guān)系,為學(xué)校有關(guān)決策部門提供了準確的數(shù)據(jù),克服了當前高校各部門間數(shù)據(jù)交流的障礙,實現(xiàn)了數(shù)據(jù)的高效共享。實現(xiàn)了科研成果記錄、檢索、轉(zhuǎn)化、統(tǒng)計分析的智能化,提高了科研管理人員的工作效率,同時對高校科研成果轉(zhuǎn)化具有指導(dǎo)性意義。
參考文獻:
[1]國務(wù)院.國務(wù)院關(guān)于優(yōu)化科研管理提升科研績效若干措施的通知[EB/OL].http://www.gov.cn/zhengce/content/2018-07/24/content_53
08787.htm.2018-07-24.
[2]楊麗英.高校教師科研信息管理系統(tǒng)的設(shè)計與實現(xiàn)[D].吉林大學(xué),2016.
[3]周麗琴.高校科研統(tǒng)計信息數(shù)字化管理研究——基于江蘇高校的實證研究[J].科技管理研究,2015,35(21):102-106.
[4]趙燕東,涂佳炎,劉圣波,等.基于WPF的糧倉三維激光測繪系統(tǒng)設(shè)計與開發(fā)[J].農(nóng)業(yè)工程學(xué)報,2016,32(11):265-270.
[5]康文杰,王勇,俸皓.云平臺中MySQL數(shù)據(jù)庫高可用性的設(shè)計與實現(xiàn)[J].計算機工程與設(shè)計,2018,39(01):296-301.
[6]黃文成,賈立,彭道剛,等.基于Apriori的關(guān)聯(lián)規(guī)則算法及其在電廠中的應(yīng)用[J].系統(tǒng)仿真學(xué)報,2018,30(01):266-271.
[7]崔琦,王思翔,段曉毅,等.一種AES算法的快速模板攻擊方法[J].計算機應(yīng)用研究,2017,34(06):1801-1804.
[8]陳莊,葉成蔭.基于AES和ECC的云審計數(shù)據(jù)加密方案[J].計算機科學(xué),2017,44(S1):333-335+371.
[9]張偉.基于ARM的數(shù)據(jù)加密算法實現(xiàn)[D].南京理工大學(xué),2006.