薛培軍,潘 宋
(鄭州職業(yè)技術(shù)學(xué)院,河南 鄭州 450121)
當(dāng)前關(guān)于高校科研管理的研究主要分為以激勵(lì)手段和激勵(lì)方法為主、以科研人員(教師)為主、以科研獎(jiǎng)懲機(jī)制為主等幾個(gè)方面。以激勵(lì)手段和激勵(lì)方法為主的研究主要是從不同的視角提出科研獎(jiǎng)懲機(jī)制措施方面展開。孫桃[1]探討了內(nèi)、外兩方面激勵(lì)因素對(duì)科研人員的科研績(jī)效的影響,并指出薪酬和創(chuàng)新是影響科研績(jī)效的重要激勵(lì)因素。張和平[2]認(rèn)為高校薪酬水平及當(dāng)?shù)匦匠曩?gòu)買力對(duì)高校教師的科研生產(chǎn)力具有顯著影響。以科研人員(教師)為主的研究主要是以人為主體。張海[3]呼吁為加強(qiáng)對(duì)高??蒲腥藛T人文關(guān)懷,為高??蒲腥藛T創(chuàng)造良好的科研環(huán)境、科研數(shù)據(jù)規(guī)范化和標(biāo)準(zhǔn)化。熊立[4]通過調(diào)研大量高??蒲腥藛T的各方面信息,得出科研人員的科研績(jī)效受到工作沉浸感的顯著影響。劉宇文[5]認(rèn)為目前高校科研外部獎(jiǎng)懲機(jī)制缺乏創(chuàng)新是高校教師缺乏科研激情的主要原因之一。史冬波[6]以多起學(xué)術(shù)不端事件為案例進(jìn)行分析,得出了科研不端行為很大程度上受到激勵(lì)誘惑與獎(jiǎng)懲機(jī)制不對(duì)稱的影響。
現(xiàn)有研究對(duì)當(dāng)前高校科研管理的發(fā)展和趨勢(shì)涉及較少,本文從主題模型的角度出發(fā),研究高??蒲泄芾淼陌l(fā)展主題,從總體上把握高??蒲泄芾淼难芯棵}絡(luò)和發(fā)展動(dòng)向。
主題是由具有某領(lǐng)域特性的一系列專業(yè)術(shù)語(yǔ)組成,這些術(shù)語(yǔ)的組合能夠表征一個(gè)領(lǐng)域的研究?jī)?nèi)容及研究方向。從學(xué)術(shù)期刊的角度來看,科研管理在其發(fā)展過程中的研究?jī)?nèi)容變化,表現(xiàn)為其研究主題的變化。LDA(Latent Dirichlet Allocation,LDA)模型[7]是一種主題(topic)生成模型,是以文本—主題—詞語(yǔ)的三層貝葉斯結(jié)構(gòu)來實(shí)現(xiàn)文檔中主題及詞匯生成,能夠挖掘出龐大語(yǔ)料庫(kù)中隱含的主題信息[8]。LDA模型認(rèn)為文檔由若干個(gè)主題以不同的概率組合而成,而主題是由若干個(gè)詞語(yǔ)以不同的概率組合而成。從主題模型的角度來講,每一篇文檔都是詞匯構(gòu)成,而詞匯由主題概率分布和詞匯概率分部聯(lián)合采樣得到,其數(shù)學(xué)描述為:
1.對(duì)于語(yǔ)料庫(kù)D中的每一篇文檔d,依據(jù)服從于Dirichlet分布原則采樣獲取文檔d中的主題分布θd,即θd~Dir(α);
2.對(duì)于在每一個(gè)主題,依據(jù)服從于Dirichlet分布原則采樣獲取主題z中的詞匯分布φz,即φz~Dir(β)。
3.根據(jù)主題分布θd獲得主題zd,j,再依據(jù)詞匯分布φz獲取詞匯wd,j
重復(fù)上述過程,即可獲得一篇文檔中的所有詞匯。其中,D代表原始語(yǔ)料庫(kù),d代表第d篇文檔,θd是文檔-主題概率分布,φz是主題-詞匯概率分布,Dir(α)和Dir(β)代表先驗(yàn)分布狄利克雷分布,α和β代表模型的超參數(shù),是手動(dòng)設(shè)置的常數(shù),zi代表第d篇文檔的第j個(gè)主題,wd,j代表第d篇文檔的第j個(gè)詞匯。在整個(gè)過程中,θd和φz是隱含的參數(shù),一般采用吉布斯(Gibbs)采樣方法進(jìn)行參數(shù)估算。Gibbs利用詞匯和主題之間的后驗(yàn)概率,間接估算參數(shù)φ和θ的值。參數(shù)估算步驟如下:
1.將主題zi初始化為1到K之間的隨機(jī)整數(shù)。i從1遍歷到詞匯總數(shù)N。
2.迭代循環(huán)。i從1遍歷到N,并給詞匯賦予新的主題。
3.估算φ和θ值。分布收斂后,保存樣本,將zi的值作為訓(xùn)練成熟的數(shù)據(jù)。w表示詞匯迭代一次的樣本,據(jù)此間接推斷φ和θ的值,公式如下:
(1)
(2)
本文以來自中國(guó)知網(wǎng)的關(guān)于高??蒲泄芾淼钠诳撐臄?shù)據(jù)作為L(zhǎng)DA模型的原始語(yǔ)料庫(kù),進(jìn)而挖掘出潛藏在學(xué)術(shù)期刊中的研究主題。根據(jù)LDA模型的輸出結(jié)果,對(duì)比分析不同年份的主題強(qiáng)度及主題內(nèi)容的變化,從而梳理出高??蒲泄芾淼难芯棵}絡(luò)和趨勢(shì)。
以“高??蒲泄芾怼睘闄z索詞,收集中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)的期刊論文數(shù)據(jù),時(shí)間跨度設(shè)置為2011—2020,在對(duì)檢索結(jié)果進(jìn)行精煉和篩選后得到期刊論文2622篇。鑒于期刊論文的結(jié)構(gòu)性及文本內(nèi)容的復(fù)雜性,本文僅以對(duì)論文研究?jī)?nèi)容具有強(qiáng)表征性的標(biāo)題、摘要和關(guān)鍵詞作為原始數(shù)據(jù),并進(jìn)行數(shù)據(jù)清洗。接著使用由Python編程的Jieba中文分詞工具對(duì)每一篇文檔進(jìn)行分詞。以一年為一個(gè)時(shí)間窗口,將數(shù)據(jù)以文本文檔的形式分布到對(duì)應(yīng)的時(shí)間窗中,文本中每一行詞語(yǔ)序列代表一篇論文的分詞結(jié)果。2011—2020年,我國(guó)高校科研管理研究文獻(xiàn)呈倒“U”形趨勢(shì),自2015年峰值后下降明顯,研究力量有所減弱。各時(shí)間窗口的文檔數(shù)及詞匯數(shù)見表1。
表1 各時(shí)間窗口中文本集數(shù)據(jù)情況
在進(jìn)行主題挖掘之前,需對(duì)LDA主題模型的參數(shù)進(jìn)行設(shè)置。根據(jù)LDA模型應(yīng)用中常用的設(shè)置,這里設(shè)置參數(shù)α=0.5,β=0.1,迭代次數(shù)item=1000。根據(jù)困惑度(Perplexity)評(píng)價(jià)函數(shù)確定了總文本集的最優(yōu)主題數(shù)為19。LDA模型腳本以Python語(yǔ)言編程,將處理后的期刊論文數(shù)據(jù)輸入到腳本中,得到2622篇期刊論文的文檔-主題概率分布矩陣和19個(gè)主題的主題-詞匯概率分布矩陣。通過對(duì)主題挖掘結(jié)果的分析與觀察,篩選掉6個(gè)無效主題。參照已有文獻(xiàn)[9]的主題命名方法,將保留的13個(gè)主題以其特征詞匯的含義歸納命名,并劃分為“管理主體”“科研主體”“科研載體”三大類,見表2。其中,“管理主體”類的主題內(nèi)容是關(guān)于高校的研究,包含高校、創(chuàng)新、制度、改革四個(gè)主題;“科研主體”類的主題內(nèi)容是關(guān)于科研人員的研究,主要包含績(jī)效、研究人員、激勵(lì)三個(gè)主題;“科研載體”類的主題內(nèi)容是關(guān)于科研的對(duì)象的研究,包含學(xué)術(shù)、系統(tǒng)、經(jīng)費(fèi)、信息化、成果轉(zhuǎn)化、科研項(xiàng)目等主題。
表2 主題挖掘結(jié)果
主題強(qiáng)度演化展示了相關(guān)主題在學(xué)術(shù)期刊中的研究熱度,主題強(qiáng)度越大,則表明在當(dāng)前時(shí)間段內(nèi)該主題的研究熱度越高。通過分析對(duì)比同一主題在時(shí)間軸上的主題強(qiáng)度變化,能夠動(dòng)態(tài)把握該主題的研究情況,對(duì)分析主題的演化具有重要意義。主題挖掘結(jié)果中生成的文檔-主題概率分布矩陣,給出了所有主題的概率分布情況,反映主題對(duì)文本的貢獻(xiàn)度,亦即主題強(qiáng)度。本文采用的主題強(qiáng)度的計(jì)算方法[10]:
(3)
其中Q(Zt,k)表示當(dāng)前時(shí)間片t中主題k的強(qiáng)度,θd,k表示在第d篇文檔中第k個(gè)主題的概率,Dt表示時(shí)間片t上的文檔數(shù)量。
結(jié)合表1中各年份的文檔數(shù)量及主題強(qiáng)度計(jì)算公式,可以計(jì)算出總文本集中的主題在各個(gè)時(shí)間片上的主題強(qiáng)度。三類主題在時(shí)間軸上的主題強(qiáng)度變化如圖1、圖2、圖3所示,研究顯示,我國(guó)高??蒲泄芾碇黝}隨高校科研發(fā)展的要求發(fā)生承接和轉(zhuǎn)化。
圖1 “管理主體”類的主題強(qiáng)度變化
圖2 “科研主體”類的主題強(qiáng)度變化
圖3 “科研項(xiàng)載體”類的主題強(qiáng)度變化
由圖1可以看出,創(chuàng)新(Topic 3)和改革(Topic 13)的主題強(qiáng)度整體呈上升趨勢(shì),說明在高??蒲泄芾眍I(lǐng)域,研究科研管理創(chuàng)新和改革的熱度持續(xù)增高;另外,受2014年“大眾創(chuàng)業(yè),萬眾創(chuàng)新”的影響,兩個(gè)主題的強(qiáng)度都于2014年明顯的大幅度上升。機(jī)制(Topic 12)主題的強(qiáng)度值保持在一個(gè)中等水平上,波動(dòng)較大且無規(guī)律,這說明管理機(jī)制一直是科研管理領(lǐng)域的研究主題,也是提高科研質(zhì)量和促進(jìn)成果轉(zhuǎn)化的重要因素?!案咝!?Topic1)的主題強(qiáng)度整體呈下降趨勢(shì),結(jié)合Topic 3和Topic 13的整體上升趨勢(shì),說明在高??蒲泄芾眍I(lǐng)域,對(duì)高校本身的研究逐漸轉(zhuǎn)移到高校的創(chuàng)新和改革領(lǐng)域。
在圖2中,績(jī)效(Topic 9)的主題強(qiáng)度呈明顯上升趨勢(shì),且強(qiáng)度值始終在保持一個(gè)較高的水平上,這說明在科研管理領(lǐng)域,對(duì)研究人員的績(jī)效評(píng)價(jià)一直是研究熱點(diǎn),且研究熱度不斷上升,這也從側(cè)面說明了科研績(jī)效評(píng)價(jià)對(duì)科研人員的重要性。激勵(lì)(Topic 7)的主題強(qiáng)度在波動(dòng)中上升,這表明學(xué)術(shù)界在不斷地探索管理學(xué)中的激勵(lì)手段和激勵(lì)機(jī)制對(duì)科研人員的積極作用,而近幾年的主題強(qiáng)度不斷上升且數(shù)值較高,說明激勵(lì)手段對(duì)提高科研人員的科研效率和成果質(zhì)量是具有正向作用的。科研人員(Topic 8)的主題強(qiáng)度波動(dòng)不大,強(qiáng)度值也不高。三個(gè)主題的強(qiáng)度變化說明在高??蒲泄芾眍I(lǐng)域,對(duì)科研人員本身的研究一直是重點(diǎn),但是研究熱度并不高,而對(duì)能夠提升科研人員水平的激勵(lì)措施和績(jī)效評(píng)價(jià)則是研究熱點(diǎn)。
在圖3中,經(jīng)費(fèi)(Topic 5)的強(qiáng)度值呈緩慢上升趨勢(shì),且強(qiáng)度值一直保持在較高水平上,這表明科研經(jīng)費(fèi)一直是研究熱點(diǎn),經(jīng)費(fèi)支持是科研活動(dòng)開展的基本支撐。成果轉(zhuǎn)化(Topic 10)的強(qiáng)度值呈現(xiàn)不斷提高的上升趨勢(shì),表明了學(xué)術(shù)界對(duì)科研成果的轉(zhuǎn)化保持著較高的熱度,而強(qiáng)度值從2014年陡增,也進(jìn)一步說明經(jīng)濟(jì)新常態(tài)下對(duì)成果轉(zhuǎn)化的高度重視和關(guān)注。Topic 2和Topic 11的強(qiáng)度值處于中間水平,且波動(dòng)較小,說明了學(xué)術(shù)活動(dòng)和項(xiàng)目是科研的根本,也始終是高??蒲泄芾淼臒狳c(diǎn)。 系統(tǒng)(Topic 4)和信息化(Topic 6)的主題強(qiáng)度變化不大且數(shù)值較低,學(xué)術(shù)界對(duì)科研項(xiàng)目的信息化和科研系統(tǒng)的關(guān)注度較低,而近年來的下降趨勢(shì)和較低的強(qiáng)度數(shù)值,再加上Topic 10強(qiáng)度值的持續(xù)走高,說明在兩方面的熱度正在逐漸冷卻,研究熱點(diǎn)轉(zhuǎn)移到了科研的成果轉(zhuǎn)化上。
主題內(nèi)容的演化必然表現(xiàn)為同一主題的特征詞匯在時(shí)間片上的變化,而相鄰時(shí)間片中具有演化關(guān)系的主題之間也必然會(huì)在內(nèi)容上表現(xiàn)出一定的相似性,因此可以通過計(jì)算相鄰時(shí)間片中主題內(nèi)容的相似性來確定主題之間的聯(lián)系,進(jìn)一步分析主題內(nèi)容的演化。為了更好地展現(xiàn)主體內(nèi)容的動(dòng)態(tài)變化,對(duì)表1中各個(gè)時(shí)間窗口的文本集單獨(dú)進(jìn)行主題挖掘,得到各階段的主題內(nèi)容,見表3。由于每一個(gè)主題都是由若干個(gè)主題特征詞構(gòu)成的詞向量,可以看成一篇文本,所以可以采用計(jì)算文本相似度的WE-cos方法[11]計(jì)算主題間的相似度。根據(jù)相似度計(jì)算的實(shí)際情況,設(shè)定當(dāng)主題相似度大于0.8時(shí),認(rèn)為主體間存在演化關(guān)系,反之則認(rèn)為主題間無關(guān)聯(lián)。根據(jù)演化規(guī)則繪制出主題內(nèi)容演化路徑,如圖4所示。圖中橫軸代表時(shí)間窗口變化,縱軸代表主題,各時(shí)間窗口主題間的箭頭代表主題的繼承關(guān)系。
表3 2011—2020主題挖掘結(jié)果
圖4 主題內(nèi)容演化路徑
結(jié)合圖4及各個(gè)主題的特征詞匯變化,對(duì)主題內(nèi)容的演化做出如下分析。
1.在“管理主體”類別中,研究熱點(diǎn)由對(duì)高校本身的關(guān)注逐漸轉(zhuǎn)變?yōu)閷?duì)科研政策及獎(jiǎng)懲機(jī)制的研究,又進(jìn)一步向機(jī)制的創(chuàng)新、改革方向演化。2011年主題1、主題5、主題6和主題9 都是關(guān)于管理主體類的主題。2011年的主題1逐漸演化為2012年的主題4、2013年的主題4,到2016年的主題11,最終到2020年的主題11,特征詞也經(jīng)歷了管理、系統(tǒng)化、體系、控制、完善、機(jī)制等的演變過程;2011年主題5向下演變?yōu)榱?012年的主題1、2013年的主題5,然后主題中斷,表明主題的研究熱度大幅降低,其特征詞也經(jīng)歷了高校、行政、保障等的變化過程。
2.在“科研主體”的類別中,對(duì)科研人員的研究由評(píng)級(jí)指標(biāo)、科研服務(wù)逐漸變?yōu)殛P(guān)注科研人員的情感思想、科研團(tuán)隊(duì)的協(xié)同效應(yīng),又進(jìn)一步演化為對(duì)科研人員的激勵(lì)和績(jī)效評(píng)價(jià)。2011年的主題8是關(guān)于考核指標(biāo)內(nèi)容的主題,隨著時(shí)間推移,逐漸演化為2012年的主題2、2013年的主題7,到2015年的主8和主題9,最終到2020年的主題7,主題特征詞匯也經(jīng)歷了指標(biāo)、控制、思想、績(jī)效等內(nèi)容的演變。
3.在“科研載體”類別中,對(duì)科研項(xiàng)目的研究重點(diǎn)由經(jīng)費(fèi)預(yù)算和科研數(shù)據(jù)逐漸轉(zhuǎn)移到項(xiàng)目經(jīng)費(fèi)使用機(jī)制、項(xiàng)目科技含量,又進(jìn)一步的演化為科研項(xiàng)目的創(chuàng)新、科研成果轉(zhuǎn)化等方面。2011年的主題4逐漸轉(zhuǎn)變?yōu)?012年的主題5,2013年的主題3,到2016年的主題10,最終到2020年的主題3,主題詞也經(jīng)歷了數(shù)據(jù)、科技、設(shè)計(jì)、探索、創(chuàng)新等的演變。2013年的主題1是關(guān)于科研項(xiàng)目的內(nèi)容,隨著時(shí)間推移逐漸轉(zhuǎn)變?yōu)?014年的主題2,2015年的主題10,一直到2020年的主題6和主題8,主題特征詞匯也經(jīng)歷了申報(bào)、科學(xué)、成果、創(chuàng)新、轉(zhuǎn)化等的演變。
在管理主體方面,當(dāng)前對(duì)高校的研究已經(jīng)有對(duì)高校本身的關(guān)注逐漸轉(zhuǎn)變?yōu)檠芯扛咝?蒲泄芾頇C(jī)制的創(chuàng)新和改革;在科研主體方面,由評(píng)級(jí)指標(biāo)、科研服務(wù)過渡為關(guān)注科研人員的情感思想、科研團(tuán)隊(duì)的協(xié)同效應(yīng),當(dāng)前對(duì)科研人員的激勵(lì)和績(jī)效評(píng)價(jià)則變?yōu)闊狳c(diǎn);在科研載體方面,學(xué)術(shù)和科研項(xiàng)目一直是科研活動(dòng)的根本,科研經(jīng)費(fèi)也始終貫穿著科研活動(dòng)的全過程,而科研成果轉(zhuǎn)化則成為當(dāng)前研究的大熱點(diǎn)。
在高??蒲泄芾碇?,應(yīng)注重高校、科研人員和科研載體的綜合管理。在機(jī)制上注重創(chuàng)新性改革,提高成果轉(zhuǎn)化率在績(jī)效考核和激勵(lì)機(jī)制中的權(quán)重,要尊重科研人員的情感和實(shí)際情況,采取更加科學(xué)的績(jī)效考核,以及有針對(duì)性的激勵(lì)手段和措施,注重科研經(jīng)費(fèi)的精細(xì)化管控,建立起綜合的、多主體的科研管理新機(jī)制,以更好地提高高??蒲械馁|(zhì)量和水平。