張友海
(安徽職業(yè)技術(shù)學(xué)院,安徽 合肥 230011)
科研績(jī)效評(píng)價(jià)是對(duì)科研從事人員所取得的科研成果的綜合評(píng)估。目前,國(guó)內(nèi)高校的現(xiàn)有科研績(jī)效評(píng)價(jià)體系中,就評(píng)價(jià)技術(shù)而言,具有指標(biāo)體系和評(píng)價(jià)系統(tǒng)設(shè)計(jì)不合理等問(wèn)題??偟膩?lái)說(shuō),應(yīng)采用怎樣的方法來(lái)提升科研績(jī)效評(píng)價(jià)系統(tǒng)的合理性和正確性,減少盲目性,激發(fā)科研活力,是當(dāng)前各高校都十分關(guān)注的熱點(diǎn)問(wèn)題。BP神經(jīng)網(wǎng)絡(luò)作為最接近人類(lèi)大腦思維方式的技術(shù)手段,對(duì)于構(gòu)建智能化的科研績(jī)效評(píng)價(jià)系統(tǒng)有著重要作用。
1985年,BP(Error Back Propagation )算法是Williams、Hinton以及Rumelhart提出的,是一種前饋型神經(jīng)網(wǎng)絡(luò)其主要思想是通過(guò)一邊向后傳遞誤差,一邊修正誤差的方法來(lái)不斷調(diào)節(jié)網(wǎng)絡(luò)參數(shù)(權(quán)、閾值),以實(shí)現(xiàn)或逼近所希望的輸入、輸出映射關(guān)系。它可以較好的解決多層網(wǎng)絡(luò)中隱含單元連接權(quán)及閾值的學(xué)習(xí)問(wèn)題,其結(jié)構(gòu)有3層,分別是輸入層、隱含層、輸出層,其中輸入層和輸出層均有1個(gè),而隱含層的數(shù)量則不確定,可以是1個(gè),也可以是多個(gè),如圖1所示。
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
采用BP神經(jīng)網(wǎng)絡(luò)建模的的一個(gè)重要前提條件就是要有足夠多的典型性好和精度高的樣本集。而且為了保證學(xué)習(xí)過(guò)程中不發(fā)生“過(guò)擬合”及有效監(jiān)控、評(píng)價(jià)建立的網(wǎng)絡(luò)模型的性能和泛化能力,必須將收集到的數(shù)據(jù)集隨機(jī)的分成訓(xùn)練樣本、檢驗(yàn)樣本和測(cè)試樣本3部分。在進(jìn)行網(wǎng)絡(luò)訓(xùn)練的過(guò)程中,我們需要對(duì)隱層節(jié)點(diǎn)與輸入節(jié)點(diǎn)的連接權(quán)值、輸出節(jié)點(diǎn)和隱層節(jié)點(diǎn)之間的連接權(quán)值進(jìn)行不斷的調(diào)整,進(jìn)而使得網(wǎng)絡(luò)模型輸出值和已知的訓(xùn)練樣本輸出值之間的偏差平方和達(dá)到最小或小于某一期望值。BP神經(jīng)網(wǎng)絡(luò)在經(jīng)過(guò)有限樣本的學(xué)習(xí)訓(xùn)練之后,找到數(shù)據(jù)所蘊(yùn)含的規(guī)律。
主成分分析法即為分析樣本集中的相關(guān)性,將多個(gè)相關(guān)變量化為少數(shù)幾個(gè)不相關(guān)變量。目前,在高校的科研績(jī)效評(píng)價(jià)中,主要的評(píng)價(jià)指標(biāo)有:發(fā)表論文的類(lèi)型及數(shù)量如SCI收錄論文數(shù)等、主辦學(xué)術(shù)會(huì)議次數(shù)及級(jí)別、發(fā)表論文的作者排序、科研項(xiàng)目類(lèi)型及數(shù)量、科研或教學(xué)成果獎(jiǎng)勵(lì)等級(jí)和項(xiàng)數(shù)、團(tuán)隊(duì)精神與創(chuàng)新文化建設(shè)、科研交流與活動(dòng)、外派訪問(wèn)學(xué)者人數(shù)、獲獎(jiǎng)成果總數(shù)、科技專(zhuān)著總數(shù)、發(fā)表論文的刊物影響因子、科技獎(jiǎng)勵(lì)及成果、科研經(jīng)費(fèi)與項(xiàng)目、知識(shí)產(chǎn)權(quán)轉(zhuǎn)讓或使用授權(quán)數(shù)、省部級(jí)成果獎(jiǎng)勵(lì)項(xiàng)數(shù)、召開(kāi)學(xué)術(shù)報(bào)告次數(shù)、發(fā)明專(zhuān)利等級(jí)、科研項(xiàng)目資助規(guī)模、地市級(jí)成果獎(jiǎng)勵(lì)項(xiàng)數(shù)、國(guó)家自然科學(xué)基金項(xiàng)目金額、科研成果鑒定、唯一主編著作篇數(shù)、科技成果轉(zhuǎn)化專(zhuān)利授權(quán)及著作專(zhuān)利、發(fā)明專(zhuān)利項(xiàng)數(shù)、專(zhuān)著總部數(shù)、合作主編著作篇數(shù)、科研總經(jīng)費(fèi)、科研時(shí)間、科研項(xiàng)目類(lèi)別、國(guó)家自然科學(xué)基金項(xiàng)目數(shù)量等[6]。使用MATLAB軟件對(duì)某院校2017年的科研數(shù)據(jù)進(jìn)行主成分分析得到9個(gè)主成分特征值,按特征值從大到小的順序得到貢獻(xiàn)率和累計(jì)貢獻(xiàn)率如表1所列。
表1 各主成分的貢獻(xiàn)率和累計(jì)貢獻(xiàn)率表
注:主成分1:學(xué)術(shù)論文;主成分2:科技獎(jiǎng)勵(lì);主成分3:科研成果;主成分4:專(zhuān)利授權(quán)及相關(guān)知識(shí)產(chǎn)權(quán);主成分5:學(xué)術(shù)著作;主成分6:科研經(jīng)費(fèi)與項(xiàng)目;主成分7:科研交流與活動(dòng);主成分8:人才隊(duì)伍;主成分9:科研平臺(tái)。
在進(jìn)行科研績(jī)效的評(píng)價(jià)時(shí),很多評(píng)價(jià)指標(biāo)之間具有相關(guān)性,這會(huì)使獲取的信息具有重疊的問(wèn)題。在這種情況下,我們可以使用基于主成分分析法的BP網(wǎng)絡(luò)神經(jīng)系統(tǒng)來(lái)進(jìn)行科研績(jī)效的評(píng)價(jià)。如上所述,我們利用MATLAB工具篩選出9個(gè)不相關(guān)的主成分指標(biāo),以此構(gòu)建一個(gè)新的評(píng)價(jià)體系。在該體系中,僅保留了主成分樣本數(shù)據(jù),這樣會(huì)使輸入樣本初始化工作大大減少,在此狀態(tài)下,輸入指標(biāo)將會(huì)大幅的銳減,由原來(lái)的幾十項(xiàng)減少為現(xiàn)在的九項(xiàng),這樣減少的主要目的是提高BP神經(jīng)網(wǎng)絡(luò)的收斂速度,并且提升其工作效率。
對(duì)主成分BP網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練時(shí)的步驟如下:
(1)樣本劃分。根據(jù)上述的科研績(jī)效評(píng)價(jià)數(shù)據(jù),在BP神經(jīng)網(wǎng)絡(luò)原型之下,使用MATLAB工具,將上邊篩選出來(lái)的9個(gè)指標(biāo)數(shù)據(jù)作為輸入層節(jié)點(diǎn),最終得分就是輸出層節(jié)點(diǎn)。隨機(jī)抽取某個(gè)月份的績(jī)效數(shù)據(jù),將其作為訓(xùn)練樣本,然后選取另外月份的績(jī)效數(shù)據(jù)作為驗(yàn)證樣本,同時(shí)還要選取其他月份的績(jī)效數(shù)據(jù)數(shù)據(jù)作為預(yù)測(cè)樣本。
(2)確定隱含層節(jié)點(diǎn)數(shù)。確定時(shí),一般可以根據(jù)經(jīng)驗(yàn)公式來(lái)進(jìn)行,“湊試”就是一種十分有效的的方法。在使用時(shí),首先確定一個(gè)十分小的隱含層結(jié)點(diǎn)數(shù),在確定之后對(duì)其進(jìn)行訓(xùn)練,在訓(xùn)練時(shí),如果訓(xùn)練次數(shù)已經(jīng)十分多,或者已經(jīng)達(dá)到了規(guī)定的訓(xùn)練次數(shù),但是收斂仍然沒(méi)有實(shí)現(xiàn),在這種情況下,需要停止訓(xùn)練。然后增加隱含層結(jié)點(diǎn)數(shù),再次進(jìn)行訓(xùn)練;
(3)網(wǎng)絡(luò)訓(xùn)練。在進(jìn)行網(wǎng)絡(luò)訓(xùn)練時(shí),先將訓(xùn)練樣本輸入在系統(tǒng)中,然后使用MATLAB進(jìn)行樣本訓(xùn)練工作,使程序不斷的進(jìn)行學(xué)習(xí),不斷的降低誤差值,使其能夠縮小至0.001之下,當(dāng)誤差值縮小至0.001之下時(shí),結(jié)束計(jì)算,網(wǎng)絡(luò)將會(huì)完成收斂。
本文主要闡述了基于主成分BP神經(jīng)網(wǎng)絡(luò)在科研績(jī)效評(píng)價(jià)中的建模方法,力爭(zhēng)縮小評(píng)價(jià)的主觀性,提升客觀性和科學(xué)性,在后續(xù)功能完善后將可以直接應(yīng)用解決類(lèi)似問(wèn)題。因此我們可以大膽的設(shè)想,在科研績(jī)效評(píng)價(jià)體系中,基于主成分的BP神經(jīng)網(wǎng)絡(luò)將會(huì)具有良好應(yīng)用前景和應(yīng)用價(jià)值。