姜 云 飛
(福州大學(xué) 研究生院, 福建 福州 350116)
隨著我國經(jīng)濟(jì)由高速增長階段向高質(zhì)量發(fā)展階段轉(zhuǎn)變,創(chuàng)新成為第一動力, 而人才是創(chuàng)新的第一資源,作為學(xué)位與研究生教育最高學(xué)歷層級的博士研究生教育,應(yīng)真正肩負(fù)起培養(yǎng)高層次人才的使命, 培養(yǎng)出高質(zhì)量拔尖創(chuàng)新人才。 2017年1月,教育部、國務(wù)院學(xué)位委員會印發(fā)的《學(xué)位與研究生教育發(fā)展“十三五”規(guī)劃》再次強(qiáng)調(diào), 我國學(xué)位與研究生教育改革發(fā)展要以“服務(wù)需求、提高質(zhì)量”為主線。 博士研究生教育不能單純追求規(guī)模發(fā)展, 更應(yīng)注重質(zhì)量提升, 這是社會經(jīng)濟(jì)發(fā)展之需。
研究生教育分為招生、培養(yǎng)、學(xué)位三個主要環(huán)節(jié),各環(huán)節(jié)相互影響,相互作用,其中招生是基礎(chǔ),是提升研究生教育質(zhì)量的首要環(huán)節(jié)。博士研究生招生環(huán)節(jié)的選拔方式、考生來源、指標(biāo)分配等都更為復(fù)雜,如何科學(xué)合理地優(yōu)化選拔方式、提升生源質(zhì)量,是博士研究生招生工作研究的重點(diǎn),也是提升博士研究生教育質(zhì)量的關(guān)鍵。
近年來,我國不斷深化博士研究生招生制度改革,賦予招生單位相對更大的自主權(quán),在傳統(tǒng)的普通招考、碩博連讀、直接攻博三種方式的基礎(chǔ)上,積極推進(jìn)完善“申請-考核”制招生選拔機(jī)制,四種方式具體的招收對象和選拔方法見表1。
根據(jù)招生方式的不同,招收對象和選拔方式也有所不同。招生方式、專業(yè)、對象和選拔方法,會直接影響招生單位招生的結(jié)構(gòu)質(zhì)量、生源質(zhì)量和選拔質(zhì)量,從而影響到宏觀的研究生招生質(zhì)量。如果通過分析研究生招生的歷年數(shù)據(jù),能夠發(fā)現(xiàn)優(yōu)質(zhì)生源的特征,找到研究生招生的結(jié)構(gòu)質(zhì)量、生源質(zhì)量和選拔質(zhì)量的影響因素,就可以在研究生招生環(huán)節(jié)采取有效措施,科學(xué)優(yōu)化各種招生選拔方式方法,從而有效地提升研究生招生質(zhì)量。
表1 博士研究生招生方式情況表
K-means聚類技術(shù)是一種經(jīng)典的聚類算法,它將數(shù)據(jù)對象分成類或簇,最終使同一個簇中的對象之間具有很高的相似度,而不同簇中的對象高度相異[1]。K-means聚類過程具體概括為:從數(shù)據(jù)集D中任意選擇k個對象作為初始簇中心;重復(fù)上述過程;根據(jù)簇中對象的均值,將每個對象(再)指派到最相似的簇;更新簇均值,直到均值不再發(fā)生變化。
博士研究生招生是一項(xiàng)周期性工作,招生階段會產(chǎn)生大量的數(shù)據(jù),借助K-means聚類技術(shù),發(fā)掘數(shù)據(jù)背后蘊(yùn)藏的規(guī)律,可以有效輔助招生工作。
各招生單位博士研究生招生的各個環(huán)節(jié),都必須采用教育部統(tǒng)一制定的全國博士研究生招生標(biāo)準(zhǔn)信息庫,統(tǒng)一的標(biāo)準(zhǔn)數(shù)據(jù)結(jié)構(gòu)為有效地進(jìn)行數(shù)據(jù)聚類分析提供了必要條件。全國標(biāo)準(zhǔn)信息庫結(jié)構(gòu)是多維的,涉及67個字段,但并不是每個字段都是直接有效數(shù)據(jù)。通過查閱文獻(xiàn)[2]、反復(fù)實(shí)驗(yàn)和借鑒以往工作經(jīng)驗(yàn),更考慮到博士生畢業(yè)成績等相關(guān)數(shù)據(jù)的可得性,本實(shí)驗(yàn)采用2012—2014年某高校博士研究生錄取數(shù)據(jù)庫數(shù)據(jù),以便考察博士生在學(xué)期間的全部學(xué)習(xí)、科研等指標(biāo),以及畢業(yè)時的成績狀況,更有效地評價考生的整體素質(zhì),進(jìn)而證明實(shí)驗(yàn)的有效性。
實(shí)驗(yàn)篩選了年齡、性別、學(xué)科、錄取信息、學(xué)歷信息、考試成績、考試方式、考生來源、就讀學(xué)校、就讀專業(yè)與錄取專業(yè)相近度等35個字段。具體實(shí)驗(yàn)過程包括:數(shù)據(jù)預(yù)處理、通過測試確定K-means算法的K值、使用K-means算法聚類和聚合類簇的有效性分析等步驟。
聚類結(jié)果的評估指標(biāo)主要有聚類準(zhǔn)確率、同質(zhì)度、分離度等[3],針對算法應(yīng)用層面,博士研究生招生數(shù)據(jù)類別具有模糊性,無法用準(zhǔn)確率指標(biāo)判斷實(shí)驗(yàn)有效性,只能采用同質(zhì)度、分離度指標(biāo)分析聚類結(jié)果。同質(zhì)度通過計算屬于同一特征類中的各點(diǎn)與中心點(diǎn)的平均距離,反映同一類數(shù)據(jù)之間的緊密程度;分離度通過計算各個特征類的中心點(diǎn)之間的平均加權(quán)距離,反映不同特征類之間的分離程度。同質(zhì)度越小,分離度越大,數(shù)據(jù)聚類的質(zhì)量就越好。
實(shí)驗(yàn)進(jìn)行了29次迭代,最終聚合形成4個類簇,每個類簇的同質(zhì)度、分離度都達(dá)到了穩(wěn)態(tài),具體情況見表2。其中,類簇內(nèi)部對象分布相對緊湊,如圖1所示。最小同質(zhì)度為5.903,最大同質(zhì)度為27.880,大部分同質(zhì)度都分布在0~30之間,分布相對集中;類簇間的類中心相距較遠(yuǎn),最小分離度為114.586 4,最大分離度為246.715 5,分布相對疏遠(yuǎn)。每個類簇的分離度都遠(yuǎn)大于同質(zhì)度,分離度與同質(zhì)度的最小差值為90.259 4,最大差值為240.812 5。同質(zhì)度相對較小,分離度相對較大,實(shí)驗(yàn)的聚類結(jié)果質(zhì)量良好。
圖1 類內(nèi)平均距離分布圖
從研究生招生的時間順序來看,研究生招生質(zhì)量可解構(gòu)為結(jié)構(gòu)質(zhì)量、生源質(zhì)量、選拔質(zhì)量三種重要的質(zhì)量內(nèi)涵[4]。K-means聚類算法應(yīng)用于博士研究生招生質(zhì)量分析,除了聚合的實(shí)驗(yàn)結(jié)果有效之外,實(shí)驗(yàn)結(jié)果必須是可解釋的、可理解的和可應(yīng)用的。根據(jù)研究生招生質(zhì)量內(nèi)涵,解讀聚合形成的類簇質(zhì)量情況如下。
(1) 結(jié)構(gòu)質(zhì)量。研究生教育結(jié)構(gòu)是包含學(xué)位層次、學(xué)位類型、學(xué)科門類等在內(nèi)的復(fù)雜多維結(jié)構(gòu)模型,而招生專業(yè)目錄是開展招生工作的基礎(chǔ),學(xué)科、專業(yè)、導(dǎo)師等關(guān)鍵要素是保障研究生結(jié)構(gòu)質(zhì)量的關(guān)鍵環(huán)節(jié)。在實(shí)驗(yàn)形成的最終類簇中,如果某個類簇涵蓋的優(yōu)勢學(xué)科、強(qiáng)勢專業(yè)和高層次導(dǎo)師比例高,則體現(xiàn)了良好的結(jié)構(gòu)質(zhì)量。教育部發(fā)布的“一流學(xué)科”代表了各招生單位的強(qiáng)勢學(xué)科和發(fā)展方向。全國第四輪學(xué)科評估結(jié)果為B+以上學(xué)科也是各招生單位的優(yōu)勢學(xué)科,院士、長江學(xué)者、國家杰出青年科學(xué)基金獲得者等高層次人才是各招生單位的學(xué)科帶頭人。實(shí)驗(yàn)結(jié)果從此三個指標(biāo)分析招生的結(jié)構(gòu)質(zhì)量,具體見表3。類1在雙一流學(xué)科、學(xué)科評估B+以上學(xué)科、高層次學(xué)科帶頭人方面都表現(xiàn)最優(yōu)秀,其研究生結(jié)構(gòu)質(zhì)量優(yōu)異;類4在學(xué)科評估B+以上學(xué)科方面表現(xiàn)突出;類2和類3在三個指標(biāo)方面都相對落后。
(2) 生源質(zhì)量。研究生教育歸根結(jié)底是人的教育,衡量生源質(zhì)量好壞也是評價人的綜合素質(zhì)。權(quán)衡人才綜合素質(zhì)的指標(biāo)與博士研究生招生數(shù)據(jù)相結(jié)合,主要包括考生學(xué)歷背景、成績情況、考生性質(zhì)、畢業(yè)時間、年齡等指標(biāo),具體見表4所示。類1的考生以碩博連讀為主體,均為在讀碩士研究生,且所學(xué)專業(yè)與錄取專業(yè)一致,學(xué)歷背景多畢業(yè)于“211”工程以上院校,平均年齡較小,從研究生培養(yǎng)經(jīng)驗(yàn)而言,該類生源最受歡迎,生源質(zhì)量評價優(yōu)異;同為普通招考的類2和類4中,類4中成績、學(xué)歷背景、應(yīng)屆生所占比例、在職考生生源情況、平均畢業(yè)時間、平均年齡均優(yōu)于類2;類3為同等學(xué)力考生,所占比例較小。
表3 聚類結(jié)果結(jié)構(gòu)質(zhì)量情況表
表4 聚類結(jié)果生源質(zhì)量情況表
(3) 選拔質(zhì)量。選拔質(zhì)量指選拔結(jié)果的合格程度和選拔方式的合理程度。選拔錄取后學(xué)生的學(xué)習(xí)成績、科研情況、獲獎情況、畢業(yè)論文、按時畢業(yè)等指標(biāo)是評估選拔質(zhì)量高低的最佳指標(biāo)。本實(shí)驗(yàn)選擇2012—2014年間數(shù)據(jù),也是為了更好地評估選拔質(zhì)量,具體情況見表5。類1的考生發(fā)表論文、獲獎、論文送審、答辯成績、按學(xué)制準(zhǔn)時畢業(yè)率等指標(biāo)表現(xiàn)最為突出,選拔質(zhì)量優(yōu)秀;普通招考為主的類2與4類形成對比,類4在學(xué)習(xí)成績方面最為突出,發(fā)表論文、論文送審、答辯情況、按學(xué)制準(zhǔn)時畢業(yè)率也占優(yōu)勢,類4的選拔質(zhì)量好于類2;類3的指標(biāo)表現(xiàn)較差。
表5 各類考生攻博期間情況表
綜合考量結(jié)構(gòu)質(zhì)量、生源質(zhì)量和選拔質(zhì)量的情況,以碩博連讀生為主的類1招生質(zhì)量最為優(yōu)異。以普通招考為主的類2、3、4中,類4的招生質(zhì)量較好,其結(jié)構(gòu)質(zhì)量、生源質(zhì)量、選拔質(zhì)量均優(yōu)于類2、3。類3以同等學(xué)力考生為主,招生質(zhì)量表現(xiàn)最差。
利用K-means聚類算法最終的實(shí)驗(yàn)結(jié)果,結(jié)合我國博士研究生招生的四種選拔方法,針對博士研究生招生質(zhì)量提出建議。
根據(jù)聚類結(jié)果分析,類1的碩博連讀生招生質(zhì)量最為優(yōu)異,結(jié)構(gòu)質(zhì)量、生源質(zhì)量和選拔質(zhì)量,均表現(xiàn)最佳。該類考生入學(xué)后培養(yǎng)階段,在學(xué)習(xí)成績、論文情況、獲獎情況等均表現(xiàn)最為優(yōu)異,73.01%的碩博連讀生均可按時畢業(yè)。因此,在招生政策制定、資源分配過程中,應(yīng)適當(dāng)擴(kuò)大碩博連讀生的招生比例。擴(kuò)大的方向既應(yīng)該考慮到以“一流學(xué)科”等為主的強(qiáng)勢學(xué)科的需求,又應(yīng)該考慮到導(dǎo)師群體的實(shí)際需要,充分發(fā)揮導(dǎo)師發(fā)掘人才的主觀能動性。
近年來,隨著博士招生制度改革的不斷深化,以初試筆試為主的普通招考選拔考生的數(shù)量逐步降低,部分“雙一流”招生單位甚至取消傳統(tǒng)的筆試考試方式。但是,我國研究生招生單位眾多,各招生單位均有自身的校情,導(dǎo)師、學(xué)科等結(jié)構(gòu)質(zhì)量不同,生源質(zhì)量不同,選拔方式也應(yīng)該不同。從聚類結(jié)果來看,普通招考類選拔方式能招收到生源質(zhì)量優(yōu)異的考生,但也存在著相當(dāng)比例的無法按時畢業(yè)等不良考生,因此,各個招生單位應(yīng)該逐步控制考試類考生比例。
科學(xué)合理地降低考試類考生的數(shù)量是各個招生單位待解的難題。近年來數(shù)據(jù)挖掘、大數(shù)據(jù)等技術(shù)手段發(fā)展迅速,各個招生單位可以根據(jù)多年的數(shù)據(jù)積累,篩選出適合普通招考類的優(yōu)質(zhì)生源。例如,學(xué)歷背景好、專業(yè)相關(guān)性強(qiáng)、畢業(yè)時間短、平均年齡小等特征,在本次實(shí)驗(yàn)中被驗(yàn)證為優(yōu)質(zhì)生源的重要指標(biāo),而同等學(xué)力考生、在職考生等出現(xiàn)不良考生的概率較大。因此,借助先進(jìn)的數(shù)據(jù)分析技術(shù),探索優(yōu)質(zhì)生源的內(nèi)在特征,可以科學(xué)合理地設(shè)定普通招考類考生的招生范圍,既降低了普通招考類考生的招生比例,又提升了該類考生的生源質(zhì)量。
傳統(tǒng)的筆試選拔方式仍是目前我國博士招生的主流,但其擁有自身的局限性[5],需要建立多層次的博士招生選拔體系?!吧暾?考核”制是招生選拔考試發(fā)展的主要方向。清華大學(xué)、天津大學(xué)等世界一流學(xué)校逐步全面實(shí)施“申請-考核”制招生方式,其他更多的招生單位也開始探索。從聚類實(shí)驗(yàn)結(jié)果分析,免筆試的碩博連讀選拔類別的類1,具有良好的招生質(zhì)量,代表著該招生單位已經(jīng)具備了開展“申請-考核”制招生的基本條件。招生單位的哪些專業(yè)、哪些導(dǎo)師、哪些考生適合“申請-考核”制選拔方式,是“申請-考核”制招生的一大難題,也是進(jìn)一步實(shí)踐與研究的方向。