羅富智
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
教育興則國(guó)家興,教育強(qiáng)則國(guó)家強(qiáng)。高等教育是一個(gè)國(guó)家發(fā)展水平和發(fā)展?jié)摿Φ闹匾獦?biāo)志。高等院校是立德樹(shù)人、培養(yǎng)人才的場(chǎng)所,而學(xué)科是大學(xué)教書(shū)育人、科學(xué)研究與社會(huì)服務(wù)的基礎(chǔ)。教育部為提高我國(guó)大學(xué)的辦學(xué)水平和國(guó)際競(jìng)爭(zhēng)力,不僅設(shè)置了雙一流背景下的一流大學(xué)和一流學(xué)科建設(shè)計(jì)劃,近乎同時(shí)對(duì)全國(guó)高校學(xué)科開(kāi)展了評(píng)估工作[1]。學(xué)科評(píng)估量化了該學(xué)科目前的發(fā)展實(shí)力和競(jìng)爭(zhēng)力,學(xué)科建設(shè)計(jì)劃則指引了高校未來(lái)發(fā)展的方向。高等教育作為我國(guó)人才的搖籃,該兩項(xiàng)相關(guān)工作引發(fā)社會(huì)各界的關(guān)注。
部分即將畢業(yè)的本科生做出了國(guó)內(nèi)繼續(xù)讀研深造的選擇。該類(lèi)人群已經(jīng)隸屬于某個(gè)專(zhuān)業(yè)門(mén)類(lèi),大部分同學(xué)會(huì)直接報(bào)考對(duì)口或相近的研究生專(zhuān)業(yè)。相比于本科的通識(shí)教育,院校學(xué)科實(shí)力對(duì)研究生的學(xué)習(xí)科研更為重要。然而,面向?qū)嵙Ω饔兴L(zhǎng)的眾多高校,高年級(jí)本科生們雖然初步了解自身專(zhuān)業(yè)的內(nèi)容,卻對(duì)學(xué)科建設(shè)和評(píng)估難以有系統(tǒng)性的認(rèn)識(shí),也容易忽略一個(gè)學(xué)科群內(nèi)學(xué)科間的相互帶動(dòng)作用,更無(wú)法將自身對(duì)學(xué)校城市的偏好與之對(duì)比,因而在報(bào)考時(shí)過(guò)于盲目。
因此,本文綜合一流高校建設(shè)名單、一流學(xué)科建設(shè)名單、第四次學(xué)科評(píng)估結(jié)果,對(duì)城市、學(xué)科實(shí)力、發(fā)展前景等進(jìn)行量化評(píng)估[2],設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)完整的可視分析系統(tǒng)。該系統(tǒng)能夠基于學(xué)科建設(shè)評(píng)估指標(biāo),主要為面臨擇校的高中、本科畢業(yè)生提供含有用戶(hù)偏好的院校對(duì)比排名,使之擇校決策有專(zhuān)業(yè)依據(jù)可遵循?;赪eb端的系統(tǒng)可提供交互手段供用戶(hù)調(diào)整指標(biāo)權(quán)重,從而生成具有用戶(hù)偏好的排名。系統(tǒng)以計(jì)算機(jī)新興工程科學(xué)群為例進(jìn)行分析,使對(duì)比結(jié)果更客觀,用戶(hù)決策更合理。
本文使用的數(shù)據(jù)來(lái)自于所寫(xiě)爬蟲(chóng)從中國(guó)教育在線(xiàn)網(wǎng)站、中國(guó)學(xué)位與研究生教育信息網(wǎng)上獲取。包含高校概況、高校學(xué)科群實(shí)力評(píng)分及高校學(xué)科大類(lèi)概況三個(gè)部分。
用于描述一所高校的基本信息,包含學(xué)校編號(hào)、學(xué)校名稱(chēng)、學(xué)校各評(píng)級(jí)學(xué)科數(shù)量、省市、經(jīng)緯度等。學(xué)校編號(hào)(招生代碼)用于唯一標(biāo)識(shí)一所大學(xué),如四川大學(xué)的高校代碼為10610。學(xué)校學(xué)科評(píng)級(jí)包括A+~C-,反映學(xué)校的學(xué)科建設(shè)情況。
用于評(píng)價(jià)一所高校的實(shí)力,包含城市評(píng)分、知名度評(píng)分、雙一流評(píng)分、第四次學(xué)科評(píng)分。城市評(píng)分來(lái)自于上文獲取的城市排名數(shù)據(jù)。知名度評(píng)分參考“2019中國(guó)最好大學(xué)排名”。雙一流評(píng)分表征高校在一流學(xué)科建設(shè)中是否存在“電子科學(xué)與技術(shù)、信息與通信工程、控制科學(xué)與工程、計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程”,如果存在則代表二十分值。第四次學(xué)科評(píng)分:將電子科學(xué)與技術(shù)、信息與通信工程、控制科學(xué)與工程、計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程五個(gè)學(xué)科的學(xué)科評(píng)估等級(jí)映射為分?jǐn)?shù)進(jìn)行加和,表示該校學(xué)科群的發(fā)展實(shí)力。
用于描述高校的學(xué)科完整度,包含學(xué)校簡(jiǎn)介、各學(xué)科門(mén)類(lèi)名單等信息。學(xué)校簡(jiǎn)介為該校的主要標(biāo)簽,學(xué)科包含文史、理工、經(jīng)管、醫(yī)學(xué)、農(nóng)學(xué)、藝術(shù)等大類(lèi)與哲學(xué)、理學(xué)的、工學(xué)等一級(jí)學(xué)科。
基于章節(jié)1中的數(shù)據(jù)描述,本文綜合一流高校建設(shè)名單、一流學(xué)科建設(shè)名單、第四次學(xué)科評(píng)估結(jié)果,對(duì)城市、學(xué)科實(shí)力、發(fā)展前景等進(jìn)行量化評(píng)估,提出了三點(diǎn)可視分析任務(wù)[3],使用戶(hù)能夠基于Web系統(tǒng)對(duì)感興趣的院校進(jìn)行對(duì)比分析,從中加入自己的情感偏好。具體的可視化任務(wù)定義如下:
任務(wù)一:不同地理粒度的高校分布:
(1)按省份劃分的高校數(shù)量;
(2)高校地理空間分布;
(3)篩選院校范圍;
(4)基于學(xué)科評(píng)估的學(xué)校發(fā)展現(xiàn)狀。
任務(wù)二:基于學(xué)科群的競(jìng)爭(zhēng)力排名:
(1)學(xué)校的整體競(jìng)爭(zhēng)力排名;
(2)學(xué)校的固有屬性、學(xué)科群實(shí)力與前景;
(3)定義排名屬性權(quán)重。
任務(wù)三:學(xué)校學(xué)科門(mén)類(lèi)競(jìng)爭(zhēng)力:
(1)學(xué)科門(mén)類(lèi)實(shí)力和前景;
(2)相似發(fā)展模式院校的探索。
基于以上可視化任務(wù),本文完成了可視化視圖設(shè)計(jì)與系統(tǒng)實(shí)現(xiàn)。
根據(jù)本文獲取的數(shù)據(jù)和本文所定義的可視化任務(wù)來(lái)設(shè)計(jì)可視化系統(tǒng)方案,本文基React[4]、Echarts[5]、Pandas[6]等技術(shù)進(jìn)行方案實(shí)現(xiàn)。本文設(shè)計(jì)的可視化能夠清晰地解決定義的三個(gè)可視化任務(wù),幫助用戶(hù)完成高校的對(duì)比與選擇。
高校本身的地理位置屬性是重要的分析因素,基于地理分布的分析能夠幫助我們發(fā)現(xiàn)全國(guó)的高校分布,從而發(fā)現(xiàn)學(xué)科建設(shè)較為完善的省份。如圖1所示,顯示了學(xué)校在全國(guó)15個(gè)省級(jí)行政區(qū)的數(shù)量分布情況。
圖1 高校分布統(tǒng)計(jì)
進(jìn)一步地,采用地圖與玫瑰圖疊加的方式可以對(duì)大學(xué)的地理信息進(jìn)行展示,如圖2所示。通過(guò)地圖上疊加的南丁格爾玫瑰圖的半徑編碼某高校從“A+”到“C-”九個(gè)學(xué)科評(píng)級(jí)上的學(xué)科數(shù)量,并用顏色區(qū)分不同的級(jí)別。在控制面板中對(duì)學(xué)校進(jìn)行篩選后,可觀察到某省符合條件學(xué)校的地點(diǎn)信息。通過(guò)對(duì)學(xué)校間學(xué)科評(píng)估的分布情況進(jìn)行分析,可以實(shí)現(xiàn)學(xué)校間的比較。在圖2中可以發(fā)現(xiàn),四川大學(xué)和電子科技大學(xué)在第四輪學(xué)科評(píng)估中差異明顯。同時(shí)用戶(hù)可以通過(guò)對(duì)拖拽、縮放、單擊雙擊等操作于其他視圖聯(lián)動(dòng)進(jìn)行進(jìn)一步分析。
圖2 地圖視圖:高校學(xué)科評(píng)估
本文要分析的高校信息是多維度信息,包括“城市”,“知名度”,“雙一流評(píng)分”以及個(gè)學(xué)科實(shí)力等緯度。為了支持同時(shí)對(duì)多維度信息的可視化分析,采用雷達(dá)圖[7]與熱力圖矩陣[8]相結(jié)合的方式。如圖3和圖4所示,熱力圖矩陣詳細(xì)展示了學(xué)校之間的排名情況。其中,行代表對(duì)應(yīng)高校,列代表高校的某個(gè)屬性,通過(guò)顏色深淺編碼對(duì)應(yīng)行高校在對(duì)應(yīng)列屬性上的表現(xiàn)的優(yōu)劣。雷達(dá)圖中,用五個(gè)坐標(biāo)軸展示高校在五個(gè)緯度的歸一化表示的優(yōu)劣信息,離中心點(diǎn)距離越遠(yuǎn)代表在對(duì)應(yīng)屬性上表現(xiàn)越好。雷達(dá)圖可以同時(shí)展示多個(gè)高校,不同高校用不同色相區(qū)分。
圖3 雷達(dá)圖
圖4 熱力圖矩陣
在圖4中,可以發(fā)現(xiàn)南開(kāi)大學(xué)和四川大學(xué)排名很接近,同時(shí)各項(xiàng)分布得分也基本一致。通過(guò)在控制面板對(duì)第四次學(xué)科評(píng)估權(quán)重進(jìn)行調(diào)整,會(huì)發(fā)現(xiàn)四川大學(xué)的排名有所上升。
如圖5所示,在學(xué)科門(mén)類(lèi)建設(shè)和評(píng)估視圖中,通過(guò)雙向橫向柱狀圖展示高校在“理工”、“文史”等六類(lèi)學(xué)科分別在學(xué)科評(píng)估和一流學(xué)科建設(shè)方面的實(shí)力,柱狀圖的高低編碼對(duì)應(yīng)屬性強(qiáng)弱,從而對(duì)所選學(xué)校的學(xué)科評(píng)估分?jǐn)?shù)和學(xué)科建設(shè)數(shù)量進(jìn)行展示。在圖5中可以發(fā)現(xiàn),四川大學(xué)在理工和醫(yī)學(xué)領(lǐng)域?qū)W科評(píng)估分?jǐn)?shù)較高,同時(shí)所入選的學(xué)科建設(shè)數(shù)量也十分眾多。
圖5 學(xué)科門(mén)類(lèi)建設(shè)和評(píng)估視圖
在學(xué)科評(píng)估基礎(chǔ)上,采用散點(diǎn)圖的方式展示學(xué)校之間的相似性,如圖6所示。將學(xué)校屬性降維映射到二維坐標(biāo)中,每個(gè)散點(diǎn)代表一個(gè)學(xué)校,散點(diǎn)相近代表這兩所學(xué)校的發(fā)展模式相類(lèi)似,如發(fā)展程度相當(dāng)?shù)木C合性大學(xué)。通過(guò)對(duì)圖6的探索,我們發(fā)現(xiàn)投影的結(jié)果符合人們對(duì)于學(xué)校的基本認(rèn)知。強(qiáng)工科學(xué)校如合肥工業(yè)大學(xué)、北京交通大學(xué)、華南理工大學(xué)、西安電子科技大學(xué)等聚成了一簇。
圖6 高校投影視圖
結(jié)合以上三小節(jié)中的可視化視圖設(shè)計(jì),最終形成的系統(tǒng)界面圖如圖7所示。用戶(hù)通過(guò)在地圖上點(diǎn)選自己感興趣的學(xué)校,可以在學(xué)校屬性視圖和學(xué)科門(mén)類(lèi)建設(shè)和評(píng)估中對(duì)學(xué)校的詳細(xì)信息進(jìn)行查看。同時(shí),用戶(hù)通過(guò)鼠標(biāo)懸浮操作,可以查看該校的一流學(xué)科建設(shè)名單。在高校對(duì)比視圖,用戶(hù)通過(guò)鼠標(biāo)點(diǎn)擊刪除自己不感興趣的學(xué)校,也可以通過(guò)鼠標(biāo)懸浮查看各個(gè)學(xué)校在不同維度的評(píng)分情況。
圖7 系統(tǒng)界面圖
本文從高校一流學(xué)科建設(shè)與學(xué)科評(píng)估的角度出發(fā),提出了高校學(xué)科分析中應(yīng)關(guān)注的三大可視分析任務(wù),并且從這三個(gè)任務(wù)層次(地理分布、學(xué)科群排名、學(xué)科競(jìng)爭(zhēng)力)出發(fā)進(jìn)行不同維度的解析。通過(guò)交互聯(lián)動(dòng)的方式,使視圖之間進(jìn)行交互探索,從對(duì)高校學(xué)科信息提供了全方位、多角度的理解。基于本文實(shí)現(xiàn)的系統(tǒng),用戶(hù)能夠從自身需求出發(fā)完成院校對(duì)比、專(zhuān)業(yè)選擇等任務(wù)。此外,系統(tǒng)也可面向高校工作人員,鮮明呈現(xiàn)校內(nèi)外學(xué)科建設(shè)的差異,為學(xué)科群發(fā)展政策提供建議。