陳平華,吳亞迪,羅淏元,申建芳
(廣東工業(yè)大學計算機學院,廣東廣州 510006)
中共十八大以來,我國研究生教育發(fā)展迅速,研究生規(guī)模持續(xù)增長,培養(yǎng)體系逐步完善,為國家戰(zhàn)略和地方經濟社會發(fā)展服務的能力明顯增強。中國如今已成為研究生教育大國,但與辦好人民滿意的研究生教育、建設研究生教育強國的目標相比,我國研究生教育仍存在一些亟待解決的問題,如部分培養(yǎng)單位培養(yǎng)條件滯后、管理制度和規(guī)范不健全、制度和規(guī)范執(zhí)行不嚴格、沒有形成完整的研究生培養(yǎng)質量保證體系等。為加強研究生培養(yǎng)單位的質量意識,促進研究生培養(yǎng)的規(guī)范化管理,國務院學位委員會與教育部等部門聯(lián)合印發(fā)了《關于加強學位和研究生教育質量保障和監(jiān)督體系建設的意見》《關于加快發(fā)展新時期研究生教育改革的意見》《學位授予單位研究生教育質量保障體系建設基本規(guī)范》等系列文件。2020 年9 月25日,國務院學位委員會、教育部再次印發(fā)《關于進一步嚴格規(guī)范學位與研究生教育質量管理的若干意見》(學位〔2020〕19 號),進一步強調落實主體責任、加強培養(yǎng)過程監(jiān)控,以保證研究生培養(yǎng)質量。
國外對研究生培養(yǎng)質量影響因素的研究起步較早,而國內起步相對較晚,絕大部分研究出現在2000 年以后。多數采取定性分析法或問卷調查法,從機制、手段(督導和評價)、培養(yǎng)質量保證體系構建等管理層面進行研究,而很少從應用技術促進管理的層面進行定量研究。隨著計算機學科的迅速發(fā)展,計算機類碩士研究生的招生規(guī)模越來越大,物聯(lián)網、大數據、云計算與人工智能新技術的出現,使得計算機學科研究生培養(yǎng)質量影響因素分析對現有計算機學科碩士研究生培養(yǎng)模式的完善具有重要意義。
計算機學科碩士可分為學術型碩士和專業(yè)型碩士,培養(yǎng)學術型碩士的目的是進行更深層次的學術研究,如攻讀博士學位,或者進入技術研發(fā)領域,引領行業(yè)發(fā)展;培養(yǎng)工程型碩士的目的是培養(yǎng)具有工程實踐能力和創(chuàng)新精神的人才,為進入企業(yè)進行實際應用打下基礎。然而,我國計算機類研究生的學術能力和實踐能力尚有待提高。解決研究生培養(yǎng)過程中存在的問題,需要探究研究生培養(yǎng)質量影響因素,不斷改革和創(chuàng)新培養(yǎng)模式,以適應時代變化與新技術發(fā)展,緊跟社會需求。
本文以碩士研究生發(fā)展為中心,從廣東某高校計算機學科碩士研究生培養(yǎng)實際情況入手,針對多年來收集的研究生實際培養(yǎng)過程數據,利用數據挖掘技術對影響研究生培養(yǎng)質量的因素進行聚類和共性關聯(lián)分析,找到影響培養(yǎng)質量的關鍵因素,以期為提高研究生培養(yǎng)質量提供決策支撐。
已有研究顯示,影響碩士研究生培養(yǎng)質量的因素包括生源因素、導師因素、教學資源和培養(yǎng)過程、自身表現、課程設置等。從已收集到的基礎數據特征考慮,本文選擇生源因素、導師因素、自身表現作為影響因素指標,同時使用學位論文質量和就業(yè)質量作為研究生培養(yǎng)質量指標。研究生培養(yǎng)質量及其影響因素指標設置如表1所示。
(1)生源因素。生源因素即生源質量因素,指研究生入學時的專業(yè)基礎情況,包括入學成績、本科學校層次、本科專業(yè)契合度3個二級指標。
(2)導師因素。在研究生培養(yǎng)過程中,導師起著重要的指導作用。為對導師影響因素作全面分析,本文設置了6 個二級指標:導師職素、導師年齡、導師成果、導師在研項目、導師指導的研究生學位論文平均分和導師指導情況。
(3)自身表現因素。在研究生培養(yǎng)過程中,研究生自身的努力和個人表現也很重要。在自身表現因素方面,本文設置了課程成績、獲獎情況2個二級指標。
Table 1 Quality of postgraduate training and its influencing factors index setting表1 研究生培養(yǎng)質量及其影響因素指標設置
(4)論文質量。學位論文是研究生科研能力和水平的綜合體現,也是研究生培養(yǎng)質量的重要衡量指標。本文以學位論文成績作為衡量研究生學位論文質量的標準。
(5)就業(yè)質量。就業(yè)質量是研究生培養(yǎng)質量的社會評價形式,也是研究生培養(yǎng)質量的重要衡量指標。本文設置了3 個二級指標:薪酬水平、工作崗位與專業(yè)契合度、就業(yè)單位評級。
本文選擇廣東某高校計算機學科(包括計算機科學與技術、軟件工程學碩,計算機技術、軟件工程專碩)2016 級和2017 級共342 名碩士研究生培養(yǎng)過程數據作為研究生基礎數據,導師數據來源于該學科兩個年級的全部碩士生導師,數據具有普遍性。
(1)生源因素。①入學成績:數值型,取值為全國碩士研究生統(tǒng)一招生考試初試與復試加權總成績;②本科學校層次:字符串型,取值為985、211、一本、二本等;③本科專業(yè)契合程度:字符型,按照與計算機學科契合程度,取值為A、B、C、D、E 5個等級,如表2所示。
(2)導師因素。①導師職素:字符串型,取值為國家杰青、省杰青、特聘教授、博導、教授、副教授、碩導,當存在多個職素時,按最高職素取值;②導師年齡:數值型,取值為導師年齡;③導師成果:數值型,對不同層次成果(TOP 級、SCI-Ⅰ區(qū)、SCI-Ⅱ區(qū)、國際授權專利…)賦予不同分值,取值為導師近5 年所有成果分數之和;④導師在研項目:數值型,對不同級別項目(國家級、省級…)賦予不同分值,取值為導師在研項目分數之和;⑤導師指導的研究生學位論文平均分:數值型,取值為各導師2016、2017 級研究生的學位論文平均分;⑥導師指導情況:數值型,通過對在校研究生發(fā)放問卷,從各個維度衡量導師指導情況,并咨詢學院多個專家意見,針對各維度取權重,取值為導師各維度加權求和后的分數。
Table 2 Fitting degree of undergraduate major表2 本科專業(yè)契合程度
(3)自身表現因素。①課程成績:數值型,取值為研究生課程加權平均分;②獲獎情況:數值型,對國家獎學金、學校每學年學業(yè)一、二、三等獎學金分別賦予100、80、60、40 分,取值為各學生獲獎總分,如某學生在校期間獲得一次國家獎學金、兩次一等獎學金,則其獲獎總分S
core=100+80*2=260分。(4)論文質量。學位論文成績:數值型,取值為學位論文答辯分數與兩個送審分數的平均分。
(5)就業(yè)質量。①薪酬水平:數值型,取值為學生工作薪酬;②專業(yè)契合度:數值型,按照就業(yè)崗位與計算機學科契合程度,劃分為100、75、50、25、0 共5 個等級(見表3);③單位評級:數值型,按照學院專家意見及相關數據,劃分為100、75、50、25共4個等級。
Table 3 Fitting degree of employment position表3 就業(yè)崗位契合程度
在已收集的研究生培養(yǎng)過程實際數據及設計好的評估指標體系基礎上,本文對研究生培養(yǎng)質量影響因素進行分析,總體分析流程如圖1所示。
Fig.1 General analysis flow圖1 總體分析流程
總體分析流程共分為3步:
(1)研究生培養(yǎng)質量聚類。在指標體系中,研究生培養(yǎng)質量包括論文質量與就業(yè)質量兩個指標。采用Kmeans聚類方法對研究生培養(yǎng)質量進行聚類。
(2)研究生培養(yǎng)質量影響因素頻率分析。在第一步生成的3 個聚類中,篩選研究生培養(yǎng)質量較高的聚類,計算各個影響因素頻率,分析優(yōu)秀研究生培養(yǎng)過程的共性因素。
(3)影響因素與培養(yǎng)質量相關性分析。計算皮爾遜相關系數,度量影響因素中各指標與培養(yǎng)質量的相關程度,結合第二步的分析結果,進一步挖掘對優(yōu)秀研究生培養(yǎng)影響程度較高的因素。
研究生培養(yǎng)質量一定程度上可通過學位論文質量和就業(yè)質量來反映。為尋找研究生培養(yǎng)質量的共同特點,本節(jié)應用K-means 聚類算法,從學位論文成績、薪酬水平、專業(yè)契合度、就業(yè)單位評級等維度對研究生基礎數據進行聚類。
聚類是對某些方面相似的數據成員進行分類與組織的過程。K-means 算法是機器學習中一種簡單、有效、使用非常廣泛的聚類算法。K-means 的時間復雜度接近于線性,尤其適合大數據集。
x
={x
,x
,x
,x
}。其中,x
、x
、x
、x
分別表示學位論文成績、薪酬水平、就業(yè)崗位與專業(yè)契合度、就業(yè)單位評級。K-means 聚類算法如下:K-means 聚類結果比較理想,所有研究生被聚類為3類。應用PCA 降維,將聚類結果映射到3 維圖中,如圖2 所示(彩圖掃OSID碼可見)。
Fig.2 K-means clustering result圖2 K-means聚類結果
3個聚類中心指標均值如表4所示。
Table 4 Final cluster center表4 最終聚類中心
由表4 可知,第一類研究生各方面均處于中等水平,第二類研究生在4 個方面的表現均優(yōu)于其他兩類研究生,第三類研究生的就業(yè)質量較差。其中,第一類和第三類研究生的學位論文成績均值這一指標差異不大,論文成績多集中在70-80 分區(qū)間。結合實際分析發(fā)現,主要原因是高校畢業(yè)要求學位論文成績一般不能低于70分。
接下來將對第二類研究生(即培養(yǎng)質量最高的一類)各方面數據進行共性分析,分析各影響因素與培養(yǎng)質量之間的相關性。
為挖掘優(yōu)秀畢業(yè)研究生培養(yǎng)過程中的共同特點,為高校培養(yǎng)高質量畢業(yè)生提供依據,本節(jié)對聚類得到的第二類優(yōu)秀畢業(yè)生的各類指標進行頻率分析。
4.1.1 生源因素分析
生源因素分析結果如圖3 所示。由圖3 可知,優(yōu)秀研究生入學成績分布較均勻,且90 分以上學生占比較少,說明入學成績對于優(yōu)秀畢業(yè)生的影響較?。ㄒ妶D3(a));本科學校主要集中在“一本”這一層次,說明本科學校層次會影響研究生畢業(yè)質量(見圖3(b));本科專業(yè)契合度分布較為均勻,但各類專業(yè)人數占第二類優(yōu)秀畢業(yè)生人數的比重與契合度基本呈正相關(除優(yōu)秀畢業(yè)生中沒有的D 級專業(yè)),說明本科專業(yè)契合度會在很大程度上影響研究生畢業(yè)質量(見圖3(c))。
Fig.3 Student source factors圖3 生源因素
4.1.2 導師因素分析
由圖4 可知,優(yōu)秀畢業(yè)研究生的導師多數為博士生導師、特聘教授(見圖4(a)),導師年齡集中在40-59 歲(見圖4(b)),大部分導師的成果水平較高、在研項目較多(見圖4(c)、(d)),畢業(yè)生的學位論文平均分大多在80 分以上(見圖4(e)),并且導師對學生研究過程中的指導都較積極、嚴格(見圖4(f))。顯然,導師因素的6 方面指標對研究生培養(yǎng)過程都有著較大影響。
4.1.3 自身表現因素分析
Fig.4 Tutor factors圖4 導師因素
由圖5 可知,優(yōu)秀畢業(yè)生的課程成績都在70 分以上,雖然80-90 分數段占比較多,但是各分數段占比基本持平,說明課程成績比較重要,但對于畢業(yè)質量的影響較小(見圖5(a))。因研究生獎學金的獲得與成果有直接關系,故獲獎情況一定程度上反映了研究生的努力程度與科研能力,可以看到優(yōu)秀畢業(yè)生都多次獲得國家獎學金與一、二等獎學金,說明研究生自身努力程度與科研能力對于畢業(yè)質量影響較大(見圖5(b))。
r
定義為兩個變量之間協(xié)方差與標準差的商,如式(1)所示。Fig.5 Self performance factors圖5 自身表現因素
r
=0.859,為高度正向相關關系。其中,導師年齡的相關性不強,導師指導情況與培養(yǎng)質量之間具有強相關性,相關系數高達0.964,說明導師對研究生的指導非常重要。自身表現因素與研究生培養(yǎng)質量之間具有中度正向相關關系,而生源因素與研究生培養(yǎng)質量相關性較弱。以上分析顯示,相關性分析結果與共性分析結果較為一致,本文的分析結論與建議如下:
總體上看,導師因素對培養(yǎng)質量影響最大,其次為自身表現因素,而生源因素對其影響較小。說明提高研究生培養(yǎng)質量的首要前提是提高導師指導學生的積極性,導師在提升自身水平的同時,也要注重對學生科研能力的培養(yǎng)。同時,研究生自身表現因素在研究生培養(yǎng)過程中起到的作用也不容忽視,培養(yǎng)單位應設計多種研究生激勵機制。當然,還需注重吸收優(yōu)質生源。3 個方面相輔相成,從整體上提升碩士研究生培養(yǎng)質量。
導師因素對培養(yǎng)質量影響最大,導師對學生的影響是潛移默化的。對研究生個人而言,適當的指導和良好的師生關系可以使其更順利地獲得學位,對未來職業(yè)生涯有深遠影響。其中,6 個二級指標都一定程度上反映了導師對于學生的重要性,說明導師需要給予研究生合適、有效的指導,才能取得很好的結果。從高校層面上看,應通過多渠道引進高水平科研人才,充實研究生導師隊伍。
Table 5 Correlation analysis results表5 相關性分析結果
其次為自身表現因素。內因是事物變化發(fā)展的根本原因,其中,獲獎情況即研究生科研能力這一指標對研究生培養(yǎng)質量影響較大。因此,研究生應端正對科研的態(tài)度,克服存在的懶惰和功利心態(tài),踏踏實實、勤勤懇懇地作研究。高校為激勵研究生從事科學研究,可設計一些激勵機制,從提升課題組學習氛圍入手,在潛移默化中讓研究生自覺地提高學習興趣,調整學習狀態(tài)。
最后為生源因素。生源質量是指研究生入學前的素質水平,優(yōu)質的生源質量對提升培養(yǎng)質量具有一定的作用,分析顯示本科學校層次對于培養(yǎng)質量的影響最為顯著。因此,在以后的招生工作中,要吸引優(yōu)質生源,從而提高研究生培養(yǎng)水平。
本文在已收集研究生培養(yǎng)過程實際數據的基礎上,首先構建了研究生培養(yǎng)過程指標體系,該指標體系主要包括生源因素、導師因素、自身表現因素、論文質量和就業(yè)質量5 個一級指標,并建立了15 個二級指標,指標體系結構比較合理,內容較為豐富和全面;其次應用聚類算法,分析優(yōu)秀畢業(yè)生培養(yǎng)過程中的共同點;最后通過頻率分析和皮爾遜相關系數計算,挖掘出研究生畢業(yè)質量影響因素,發(fā)現導師和研究生自身努力是影響研究生培養(yǎng)質量的兩個重要因素。
碩士研究生培養(yǎng)質量影響因素分析是高素質人才培養(yǎng)質量體系建立的前提與基礎。本文以保障研究生培養(yǎng)質量為出發(fā)點,挖掘培養(yǎng)過程中各影響因素對研究生培養(yǎng)質量的影響程度,可為今后高校提高碩士研究生培養(yǎng)質量提供參考。
本文對于優(yōu)秀畢業(yè)生的共性分析貼合實際,但在導師指導情況分析上尚需作進一步研究,目前的研究方法雖能較好地分析出各影響因素的權重,但應考慮指標增多時可能出現的過擬合現象;其次,本文選取廣東某高校計算機學科2017、2018 級的研究生數據進行分析,但應考慮各地區(qū)、各高校對于計算機學科研究生培養(yǎng)模式、培養(yǎng)目標的差異性。因此,未來的研究將嘗試泛化能力更強的方法,選取盡可能廣泛的研究生培養(yǎng)數據,從而使研究更加合理、有效。