邱均平,孟炎镕,b(杭州電子科技大學.中國科教評價研究院,b.管理學院)
在“雙一流”建設的大背景下,提升科研實力、提供具有理論和實際價值的科研成果是高校發(fā)展的一個重要方向。高??蒲挟a(chǎn)出的數(shù)量能在一定程度上反映其科研能力,但數(shù)量不是目的,科研質(zhì)量或價值才是最終追求??茖W研究成果質(zhì)量以科研論文、學術著作、報刊文章等進行表達,具有創(chuàng)新性、科學性、實踐性等特性[1]。雖然我國科研生產(chǎn)力不斷提升,但科研影響力相對較弱[2]。進行高校科研成果質(zhì)量研究,既可為“雙一流”高??蒲械陌l(fā)展提供指揮棒和風向標,也可對具有探索性和復雜性的科研活動進行定量分析。同時,分析科研資源投入有效性是深入挖掘高校發(fā)展內(nèi)在動力、提高科學管理水平的前提。
在已有的關于高??蒲谐晒|(zhì)量的研究中,譚春林等提出應注重質(zhì)量創(chuàng)新,科研產(chǎn)出質(zhì)量評價依據(jù)應體現(xiàn)于學術價值和社會貢獻,并明確了科研成果質(zhì)量的評價方向和側重點[3]。潘健等基于全球視角,發(fā)現(xiàn)科研論文產(chǎn)出數(shù)量與質(zhì)量并非完全對立,兩者的對立和同一蘊含在質(zhì)量互變之中[4]。因此,對于科研成果質(zhì)量的研究,不僅僅要依靠體現(xiàn)質(zhì)的指標,還應重視量的指標。大部分學者通過構建指標體系對科研產(chǎn)出成果進行評價研究,缺乏統(tǒng)一的成果產(chǎn)出指標,且對具有代表性科研成果權重的主觀選擇具有很大的爭議性[5]。因此,不考慮成果指標權重的大小,根據(jù)指標的特性對高校質(zhì)量進行分類研究具有一定的優(yōu)勢。
大部分學者選取了論文數(shù)量、被引量、科研獲獎等作為科研成果的代表性指標。Abramo等[6]運用引文數(shù)作為科研產(chǎn)出的指標,計算了意大利大學的研究生產(chǎn)率;Li Jing等從發(fā)表論文數(shù)量、引文量、出版物等方面探討中國高校與世界一流大學在科研產(chǎn)出能力方面的差距[7]。對于科研資源投入有效性的研究,部分學者考慮的投入因素指標較少。張寶生等[8]運用門檻回歸方法研究了政府科技經(jīng)費投入和研發(fā)人員的規(guī)模對科研產(chǎn)出的影響;蘇皚等[9]研究了科研經(jīng)費投入、課題數(shù)量和師資隊伍投入與科研創(chuàng)新產(chǎn)出的影響關系。
Logistic回歸模型可以分析多因素投入的有效性,且能夠較好地解決各分類數(shù)據(jù)相關性檢驗與貢獻水平的問題[10]。為此,本研究不構建指標體系,而是基于突出學術影響力和貢獻指標變量,對我國114所“雙一流”高校進行自然分類,同時考慮科研資源投入因素,將杰出人才培養(yǎng)、基礎設施投入、科研隊伍建設、團隊合作能力和地區(qū)經(jīng)濟實力作為自變量,將高校科研成果質(zhì)量水平作為因變量,構建無序多分類Logistic回歸模型進行投入有效性分析,探究科研資源投入與產(chǎn)出之間的非線性關系。
全國“雙一流”大學名單為137所,考慮其中23所高校的性質(zhì)及其在選取的科研指標中的表現(xiàn)很低,因此為了確保研究結果的說服性和準確性,剔除較為特殊的藝術語言類高校,如中央美術學院、中央音樂學院等。本研究從靜態(tài)的角度選擇114所“雙一流”高校,對其2020年的科研成果質(zhì)量水平以及投入有效性展開研究,高??蒲匈Y源投入與成果產(chǎn)出的數(shù)據(jù)主要采集于教育部官方網(wǎng)站文件、自然科學基金網(wǎng)、各高校官方網(wǎng)站以及Web of Science學術發(fā)表與專利信息公共服務檢索平臺。
2.2.1 K-Means聚類
聚類面對的是沒有分類標簽的數(shù)據(jù)對象,它從給定的數(shù)據(jù)集中搜索數(shù)據(jù)對象之間存在的有價值的數(shù)據(jù)分布模式[11]。K-Means聚類是一種基于質(zhì)心或距離的算法,筆者先取一個K值,再將數(shù)據(jù)劃分為K個類別,這樣同一類別內(nèi)的數(shù)據(jù)相似度較高,便于區(qū)分[12]。
本研究主要應用SPSS Statistics 25.0軟件,基于歐幾里得距離確定聚類中心點,對114所高校的科研質(zhì)量水平進行聚類,將科研質(zhì)量水平相同的歸為一類。傳統(tǒng)的用簡單計數(shù)累加的評價辦法忽略了代表性成果的重要性,導致成果數(shù)量激增但影響力不足,自然聚類可以很好地避免這些問題。同時,聚類的結果比傳統(tǒng)的分類方法更加全面、合理,而且它可以有效地消除由于數(shù)據(jù)的微小差異而導致的區(qū)別,避免了直接排名的限制[13]。
2.2.2 無序多分類Logistic回歸
Logistic回歸是一種廣義的線性回歸分析模型。邏輯回歸理論揭示了一個因變量與多個互不相關的自變量之間的多元回歸關系[14]。本研究在高??蒲匈|(zhì)量的聚類基礎上,識別不同類高校的科研質(zhì)量水平與選取自變量因素之間的關系,探究科研投入因素的有效性程度。不同的科研質(zhì)量水平為因變量,由聚類結果得出為無序多分類變量。選取的自變量均為二元或多元分類變量,因此,本研究構建無序多分類Logistic模型。
假設有n個自變量,對應k個分類的因變量。從k個因變量中選一類作為對照組,且每個分類都可以作為對照組。對照組與剩余的k-1個分類分別進行回歸方程的構建。則因變量第j個分類的Logistics回歸模型為[15]:
式(1)中,j∈[1,k-1],i∈[1,n],βji為回歸系數(shù),xi為第i個影響科研成果質(zhì)量的自變量,Pj為因變量為第j類別的概率。
參考已有研究,選取的聚類變量要具有代表性,本研究在選取變量指標時,注重成果的實際價值和創(chuàng)新性[16]。高校科研質(zhì)量水平由科研產(chǎn)出,即科研影響力和實際貢獻所決定。本研究將高??蒲匈|(zhì)量聚類指標變量設置為7種,為聚類過程的輸入變量,這些指標均可定量計算(見表1)。
表1 聚類變量指標表
高校的科研產(chǎn)出主要為學術論文。三大刊(Science、Nature、Cell)具有較高的影響力,其科研成果重大且新穎,因此發(fā)表在三大刊的論文數(shù)量體現(xiàn)了高校的科研產(chǎn)出力。發(fā)明專利體現(xiàn)的是先進的技術或方法,專利數(shù)量可以表現(xiàn)出科研機構的科研創(chuàng)新力[17]。因此,三大刊發(fā)文數(shù)和發(fā)明專利數(shù)量雖然是代表量的指標,但也能在一定程度上能反映科研質(zhì)量。
對于代表質(zhì)的成果指標,具有高被引量的論文往往代表著其具有較高的學術水平和學術影響力。三大刊被引量,代表論文具有較高的學術影響力;ESI高被引論文指某一篇SCI/SSCI論文近10年總被引次數(shù)位于某ESI學科所有相同出版年論文的前1%[18];SCI、SSCI和A&HCI被引量指標越高越能說明高??蒲挟a(chǎn)出質(zhì)量高,且相比于數(shù)量更注重內(nèi)涵;科研獲獎代表科研機構的科研實力,具有一定的創(chuàng)造性和新穎性;會議報告數(shù)代表了高校較高的科研合作和交流能力,體現(xiàn)了某一學科的最新研究成果,能夠反映科研機構的學科影響力和創(chuàng)新性。
自然聚類可以自動區(qū)分不同的高校類型,能更好地反映“雙一流”高校的整體科研水平情況。本研究運用K-Means快速聚類算法對114所高校的科研成果質(zhì)量水平進行聚類分析,根據(jù)實際的科研情況,選擇3個聚類中心點,得到了3個類群的中心點對應的科研成果質(zhì)量情況。
經(jīng)過計算,本研究選取的7個指標變量在3個類群中的差異是顯著的,即具有統(tǒng)計學意義。由最終的聚類中心可知(見表2),聚類中心點分別為(1796,5,883,561,247,44010,139)、(459,0,78,74,7,6402,23)、(1021,1,363,246,79,22397,48)。第一類各指標數(shù)是最高的,表明科研質(zhì)量最優(yōu),第三類次之,第二類指標最低,即科研質(zhì)量水平最不理想。每一類高校都有一個中心點,接近于中心點的高校各項指標處在同一質(zhì)量水平上。各層次中心點指標之間具有明顯的層次性,其中ESI高被引論文數(shù)、三大刊被引量和科研獲獎這3個指標差異最大。
表2 最終聚類中心
各個類群的高校數(shù)量情況:第一類有18所高校,包括清華大學、北京大學、浙江大學等。第二類有68所高校,包括南京大學、蘇州大學、同濟大學等。第三類有28所高校,包括華東師范大學、第二軍醫(yī)大學、南京農(nóng)業(yè)大學等。聚類結果顯示,“雙一流”高校整體的科研質(zhì)量水平呈金字塔形結構。第一類高校數(shù)量最少,這類高校在各個科研產(chǎn)出指標情況最優(yōu),而各類指標較低的高校數(shù)量則較多。基于分析結果,將三類不同質(zhì)量水平的高校劃分為優(yōu)秀類、良好類和一般類,對于科研質(zhì)量一般類和良好類高校來說,應有針對性地提高其科研質(zhì)量。
已有相關研究大多考慮課題數(shù)量、師資隊伍投入、研發(fā)人員規(guī)模和科研經(jīng)費投入等因素,其中科研經(jīng)費投入僅對科研成果數(shù)量具有正向影響,對成果質(zhì)量影響不顯著[19]。本研究將科研經(jīng)費投入進行剔除,考慮基礎設施投入、杰出人才培養(yǎng)、科研隊伍建設、團隊合作能力和地區(qū)經(jīng)濟實力因素可能會對科研產(chǎn)出產(chǎn)生影響,即投入因素是否具有有效性,選取了10個具體指標作為回歸模型自變量xi,i=(1,2,…,10)(見表3)。
表3 科研資源投入指標
(1)科研基礎設施投入。①科研基地不僅是學科建設的載體,也是培養(yǎng)創(chuàng)新型科研人才和促進科技成果創(chuàng)新的重要載體,其作為物力資本主要是財力投入長期積累而成,屬于存量概念,短期內(nèi)相對較為穩(wěn)定[20]。②科研項目為實踐教學和培養(yǎng)創(chuàng)新能力的良好平臺,高校申請的科研項目數(shù)在一定程度上反映了高校的科技創(chuàng)新力和產(chǎn)出力[21]。
(2)杰出人才是高校重要的科研資源,具有引領性作用。本研究選取中科院院士與工程院院士人數(shù)、國務院學科評議組成員人數(shù)、長江學者特聘教授人數(shù)和“杰出青年”人數(shù)指標代表高校的人才資源,在本研究調(diào)研的114所高校中有29所無中科院院士與工程院院士。國務院學科評議組成員人數(shù)不僅代表了高校的人才資源,而且展現(xiàn)了高校的學科發(fā)展力,在不同類高校中具有明顯差異。長江學者特聘教授人數(shù)、“杰出青年”人數(shù)體現(xiàn)了高校的人才科研能力,本研究調(diào)研的114所高校中有41所無長江學者特聘教授、47所無杰出青年。
(3)科研隊伍是科研的主力軍,會直接影響人力資源的質(zhì)量,進而影響科研成果的數(shù)量和質(zhì)量,因此,選取科研隊伍建設投入作為研究投入有效性的指標是合理的。本研究選取博士研究生導師和碩士研究生導師數(shù)量作為高校科研的人力投入,其代表著高校的科研產(chǎn)出力和人才培養(yǎng)能力。
(4)團隊合作能力因素中的創(chuàng)新團隊指標是指教育部“創(chuàng)新團隊發(fā)展計劃”入選團隊,創(chuàng)新團隊能反映高校的科研合作力和創(chuàng)新力??茖W研究要兼顧科研的創(chuàng)新性和可操作性,科研團隊建設是科研發(fā)展的關鍵所在[22]。
(5)廖帥[23]等認為,人均GDP發(fā)達的地區(qū)投入的科技資源普遍較高,也能獲得較好的科研產(chǎn)出。本研究考慮到地區(qū)經(jīng)濟實力因素,運用數(shù)據(jù)可視化呈現(xiàn)了114所“雙一流”高校在我國不同地區(qū)的分布情況(見圖1)??梢?,經(jīng)濟發(fā)展水平較高的東部地區(qū),可能更有利于科研成果產(chǎn)出和“雙一流”高校的建設。筆者將科研質(zhì)量作為因變量,一般、良好和優(yōu)秀分別取值為1、2、3,將上述科研資源投入變量按數(shù)據(jù)特征進行劃分(見表4)。
表4 自變量劃分類型
圖1 不同高校類型的地區(qū)分布
4.2.1 初始結果
本研究運用無序多分類Logistic回歸模型將10個科研資源投入指標作為自變量,科研質(zhì)量作為響應變量,進行科研資源投入有效性分析。由于自變量指標較少,可以采用Enter法,使所有自變量參與建模。以k(k=1,2,3)為參考類型,高校為其他類型的概率與為k類型的概率比值為[24]。本研究分別以良好和優(yōu)秀為參照類別,建立以下4個Logistic模型,P1、P2和P3分別表示高??蒲匈|(zhì)量一般、良好、優(yōu)秀的概率,βji為回歸系數(shù)。見公式(2)—(5)。
從表5初始模型擬合信息可知,該模型的-2倍對數(shù)似然值為79.647,P值小于0.05,即該模型總體上通過檢驗,說明Logistic模型能夠用于分析與釋解科研資源投入與科研質(zhì)量水平的關系。此外,Cox&Snell R2為0.691,說明自變量可以解釋不同科研成果質(zhì)量69.1%的形成原因,該模型擬合效果較佳。
表5 初始模型擬合信息
通過表6初始模型似然比檢驗可知,科研項目、中科院院士和工程院院士數(shù)、碩士研究生導師數(shù)和創(chuàng)新團隊數(shù)4個自變量的P值小于0.05,顯著影響科研質(zhì)量水平。P值大于0.05的自變量對科研成果質(zhì)量無顯著影響,應進行剔除,以優(yōu)化初始模型。
表6 初始模型似然比檢驗
4.2.2 最終擬合模型
為形成最終的擬合結果,本研究采用偏似然估計法將國務院學科評議組成員數(shù)、長江學者特聘教授人數(shù)、科研基地、博士研究生導師數(shù)、地區(qū)分布和“杰出青年”人數(shù)變量從初始模型中進行逐一剔除。剩余變量與科研成果質(zhì)量具有顯著相關性,最終模型中的中科院院士與工程院院士數(shù)、碩士研究生導師數(shù)、科研項目數(shù)和創(chuàng)新團隊數(shù)變量的相關性檢驗見表7。
表7 最終模型似然比檢驗
最終的回歸結果包括4個模型(見表8)。模型一和模型二以良好類高校為對照組,模型三和模型四以優(yōu)秀類高校為對照組。選取不同的對照組,回歸分析結果也會有一定的差別。當exp(B)值小于1時,說明變量對此模型具有反向作用;當exp(B)值大于1時,說明變量對此模型具有正向作用。
表8 無序多分類結果分析
(1)模型一和模型二中,科研成果質(zhì)量與科研隊伍建設的碩士研究生導師數(shù)量顯著相關,與杰出人才培養(yǎng)中的院士數(shù)顯著相關。從exp(B)值可以看出,模型一中碩士研究生導師數(shù)和院士數(shù)變量的exp(B)值小于1,而模型二中的exp(B)值大于1,即科研隊伍建設和杰出人才的培養(yǎng)對提高科研成果質(zhì)量效果顯著,具有有效性。模型一中,科研基礎投入中的科研項目的P值大于0.05,無顯著作用;模型二中,其P值小于0.05,具有明顯的正向顯著作用。簡而言之,科研基礎設施投入可以提高良好類高校的科研成果質(zhì)量,而在一般類高校中的促進作用較弱。從體現(xiàn)科研合作能力的創(chuàng)新團隊數(shù)來看,科研合作能力較強的高校達到優(yōu)秀科研質(zhì)量成果的概率是科研合作能力較弱高校的exp(3.48)倍,即32.66倍,可見創(chuàng)新能力和合作能力對于提升高校成果質(zhì)量具有正向的顯著作用。
(2)在模型三和模型四中,基礎設施的投入、杰出人才的培養(yǎng)和科研合作能力均與科研成果質(zhì)量有顯著的關系。對于模型三,科研隊伍的建設對一般類高校的科研成果質(zhì)量無顯著影響,可以理解為,相比于優(yōu)秀類高校,一般類高??蒲嘘犖槭沁h遠不夠的,還應該注重對其他投入因素的管理。在模型四中,碩士研究生導師數(shù)變量的P值小于0.05,意味著科研隊伍規(guī)模越大,人才資源培養(yǎng)能力越高,“一流師資”是“雙一流”建設的核心要素[25]。加強科研隊伍建設有利于科研成果質(zhì)量的提升。模型三和模型四的科研項目變量和院士數(shù)變量的P值均小于0.05,即科研項目對提高科研成果質(zhì)量效果顯著??梢越忉尀?,科研項目的申報可以鍛煉科研人員的創(chuàng)新力和生產(chǎn)能力,進一步提高其科研產(chǎn)出的質(zhì)量。
從以上分析中發(fā)現(xiàn),杰出人才培養(yǎng)對各類高校提高科研成果質(zhì)量的顯著作用最大??蒲嘘犖榻ㄔO、科研合作能力和基礎設施的投入可以提升良好類和優(yōu)秀類高??蒲谐晒|(zhì)量,但對一般類高校的科研成果質(zhì)量的促進作用相對較弱。
本研究收集“雙一流”高校的科研成果產(chǎn)出和資源投入的各指標,對高??蒲谐晒|(zhì)量和科研資源投入的有效性進行研究。結果顯示,不同科研水平的高校數(shù)量呈金字塔形結構,高校整體科研質(zhì)量水平出現(xiàn)明顯的斷層,提高一般類高校的科研質(zhì)量對“雙一流”高校建設和提高其整體實力至關重要。杰出人才培養(yǎng)、科研隊伍建設、科研合作能力和基礎設施的投入可促進不同類型的高校提升科研成果質(zhì)量,地區(qū)經(jīng)濟實力對科研成果質(zhì)量無顯著影響。
杰出人才的能量持續(xù)疊加效應對于高校提高科研成果質(zhì)量至關重要。高校應在科研管理體系中將科學研究成果數(shù)量與質(zhì)量并重,對取得高質(zhì)量成果的人才予以重點扶持,引導科研工作者撰寫高水平的論文,可以加大對人才的引進。對于處在不同科研質(zhì)量水平的高校來說,應加強合作意識,協(xié)作開展科研項目。高校應看重科研工作者的合作創(chuàng)新思維和能力,鼓勵科研團隊的建設,激發(fā)團隊創(chuàng)造力。此外,高校應加強鍛煉科研工作者的科研能力,進一步挖掘科研團隊的潛力,促使其產(chǎn)生更具實際應用意義的科研成果。