楊志飛,閆光輝,羅 浩,常文文
(蘭州交通大學 電子與信息工程學院,蘭州 730070)
隨著研究生的不斷擴招,研究生規(guī)模不斷擴大,研究生管理數(shù)據(jù)也日趨龐大,這些數(shù)據(jù)看似毫無關(guān)聯(lián).在大數(shù)據(jù)時代,找到它們之間有效的關(guān)聯(lián),分析其關(guān)聯(lián)關(guān)系,有利于發(fā)現(xiàn)其相互作用[1].同時隨著智能產(chǎn)業(yè)的興起,導致了工程系統(tǒng)社會化、社會系統(tǒng)工程化、簡單系統(tǒng)復雜化的新趨勢,研究生教育也得到了很好地發(fā)展[2].目前,我國的研究生教育已經(jīng)成為培養(yǎng)高層次人才、支撐自主創(chuàng)新的戰(zhàn)略性力量,也是推進創(chuàng)新型國家的構(gòu)建和“中國夢”實現(xiàn)的主導力量[3],因而需要優(yōu)化課程教學管理,不斷推動教學改革與創(chuàng)新[4].研究生教學管理主要為學術(shù)型研究生和專業(yè)型研究生[5].課程體系是專業(yè)培養(yǎng)的重要內(nèi)容,是實現(xiàn)人才培養(yǎng)的最主要途徑和最重要的基礎(chǔ),是實現(xiàn)人才培養(yǎng)方案的依托.2019年3月,教育部發(fā)布教研廳[2019]1號文件《教育部辦公廳關(guān)于進一步規(guī)范和加強研究生培養(yǎng)管理的通知》明確要求,要堅持“服務(wù)需求,提高質(zhì)量”的研究生教育發(fā)展主線,優(yōu)化和完善方案設(shè)置.構(gòu)建多元化的研究生課程體系勢在必行[2],分析課程間的關(guān)系有利于構(gòu)建優(yōu)質(zhì)的課程體系,有利于解決研究生學習的多樣性問題.復雜網(wǎng)絡(luò)是根據(jù)數(shù)學方法、圖論等發(fā)展起來的定量分析方法,是研究復雜系統(tǒng)的新視角.復雜網(wǎng)絡(luò)目前已經(jīng)應(yīng)用在自然科學與社會科學研究的各個方面,比如疾病傳播、氣象動力學、歷史演化等.在教育方面,復雜網(wǎng)絡(luò)也有了一定的應(yīng)用,通過分數(shù)將課程關(guān)聯(lián),分析本科專業(yè)核心課程[6];挖掘課程內(nèi)知識點,構(gòu)建網(wǎng)絡(luò)模型,優(yōu)化教學過程[7-8].本文將復雜網(wǎng)絡(luò)作為研究生課程群體系的建模原理,以研究生培養(yǎng)計劃為基礎(chǔ),將其定義為選課關(guān)系,對研究生課程進行建模和分析,探索研究生課程間的關(guān)聯(lián)關(guān)系,同時借助網(wǎng)絡(luò)分析可視化工具,直觀地展示各專業(yè)培養(yǎng)方案中課程之間的結(jié)構(gòu)以及關(guān)聯(lián)關(guān)系.最后,以蘭州交通大學電子與信息工程學院研究生培養(yǎng)方案中的課程為例,并將課程作為一個向量,通過每門課程中的學生集合建立課程之間的關(guān)聯(lián),計算其相關(guān)關(guān)系,將課程間的復雜關(guān)系通過網(wǎng)絡(luò)圖的方式呈現(xiàn);將學生集合作為課程的重要屬性之一并融合兩種網(wǎng)絡(luò)結(jié)構(gòu)分析課程重要性.
采用復雜網(wǎng)絡(luò)技術(shù)對研究生選課關(guān)系的課程群建模,從而可以利用復雜網(wǎng)絡(luò)中的社團劃分、重要節(jié)點排序?qū)φn程群進行分析,同時將復雜網(wǎng)絡(luò)技術(shù)應(yīng)用于研究生課程群的建設(shè),其建模過程可以定義為Stu-Course-CN,其建模流程如下:
1)根據(jù)研究生培養(yǎng)方案建立每學期的課程群ΩC={c1,…,ci,…,cM},其中的ci表示第i門課程.
2)根據(jù)研究生的培養(yǎng)計劃建立每門課的選課學生集合ΩSi={fi(ci)},其中:ΩS={s1,s2,…,sN}為選課的學生集合;{fi(ci)}為第i門課程的學生集合.
3)剔除學生集為空的課程,將非空學生集的課程定義為選課課程群=ΩC\{ci|ΩSi=?};然后,計算選課課程群中課程之間的學生集的交集,Numij=|ΩSi∩ΩSj|為第i,j 2門課程之間的共有學生數(shù).
4)根據(jù)復雜網(wǎng)絡(luò)鄰接矩陣原理,建立基于Numij的網(wǎng)絡(luò)關(guān)系,其鄰接矩陣為
定義該網(wǎng)絡(luò)為選課課程群網(wǎng)絡(luò).
為了分析選課課程群的內(nèi)在關(guān)系,對課程群網(wǎng)絡(luò)結(jié)構(gòu)進行社團分析.課程群網(wǎng)絡(luò)結(jié)構(gòu)的社團研究可以揭示錯綜復雜的課程群網(wǎng)絡(luò)如何由相對獨立又相互交錯的社團構(gòu)成.根據(jù)社團內(nèi)的節(jié)點之間連接非常緊密而社團間的連接卻相對稀疏的現(xiàn)象,分析課程群的社團結(jié)構(gòu),對了解課程群網(wǎng)絡(luò)結(jié)構(gòu)和分析網(wǎng)絡(luò)特性具有極為重要的意義,并且可以進一步幫助發(fā)現(xiàn)課程之間的聚類關(guān)系,為課程群建設(shè)、排課安排等提供一定的應(yīng)用價值.
課程群網(wǎng)絡(luò)的社團分析算法分為3個階段,這3個階段重復迭代,定義為stepA算法[9-10].假設(shè)課程群網(wǎng)絡(luò)為由N門課程組成的N個節(jié)點的加權(quán)網(wǎng)絡(luò),同時采用網(wǎng)絡(luò)模塊度的度量準則模塊度增益ΔQ.定義社團B的模塊化增益為
第1階段,完成初步社團劃分,計算步驟如下:
1)為每個節(jié)點分配一個社團,此時社團數(shù)等于節(jié)點數(shù).
2)對每個節(jié)點i,考慮其鄰居節(jié)點j,將節(jié)點i從其社團移除,并將其放置在j的社團中.
3)計算每個社團的模塊化增益ΔQ.若ΔQ≥0,則保留i在j社團中,完成一次社團節(jié)點的移動;若ΔQ<0,則i恢復到原來的社團中,節(jié)點社團移動失敗.
4)遍歷所有的節(jié)點.
5)當模塊化增益不再有正值時,第1階段完成.
第2階段,完成新網(wǎng)絡(luò)構(gòu)建,計算步驟如下:
1)將第1階段形成的社團視為節(jié)點;
3)生成新網(wǎng)絡(luò);
4)對新網(wǎng)絡(luò)采用第1階段步驟對其進行迭代計算.
第3階段,判斷模塊化增益是否為最大值,若不是最大值繼續(xù)第1階段和第2階段,否則結(jié)束社團劃分.
stepA算法計算示意圖如圖1所示.首先,通過計算模塊度增益及對其的優(yōu)化過程形成新社團;其次,根據(jù)社團劃分建立新網(wǎng)絡(luò).重復這2個階段直到模塊化增益達到最大值.
圖1 選課網(wǎng)絡(luò)社團分析步驟Fig.1 Analysis steps of course selection network community
在選課課程群網(wǎng)絡(luò)中,有必要對該網(wǎng)絡(luò)中的課程進行重要性分析,發(fā)現(xiàn)和挖掘選課關(guān)系下課程的重要性,為下一步的課程建設(shè)做支持.在復雜網(wǎng)絡(luò)中,刻畫節(jié)點重要程度的一個指標就是節(jié)點中心化,用于定量表示網(wǎng)絡(luò)中一些節(jié)點比其他節(jié)點更重要或處于更中心的位置,該指標用于確定網(wǎng)絡(luò)中個體所處位置與其在群體中的影響之間的關(guān)系,已廣泛應(yīng)用于保障體系[11]、燃氣管網(wǎng)[12]、傳輸效率[13]和個人績效[14]等方面.節(jié)點重要性的度量方法主要有節(jié)點度、特征向量和接近度等,但這些指標僅考慮網(wǎng)絡(luò)中節(jié)點的結(jié)構(gòu)關(guān)系.在選課關(guān)系網(wǎng)絡(luò)中,在兼顧課程群網(wǎng)絡(luò)節(jié)點的結(jié)構(gòu)關(guān)系的同時引入課程屬性(尤其是課程的選課人數(shù)),以便對課程重要性進行多屬性[15-16]分析.
1)網(wǎng)絡(luò)結(jié)構(gòu)的局部信息處理.在基于選課關(guān)系的課程群網(wǎng)絡(luò)結(jié)構(gòu)中,雖然度指標能直接反映一個節(jié)點對網(wǎng)絡(luò)中其他節(jié)點的直接影響力,但擁有大量連接的鄰居節(jié)點可能有更大的影響力,也就是在選課課程群網(wǎng)絡(luò)結(jié)構(gòu)中節(jié)點的重要性不僅與自身的信息有關(guān),而且與該節(jié)點的鄰居節(jié)點的度也存在一定關(guān)聯(lián),即該節(jié)點的度及其鄰居節(jié)點的度越大,節(jié)點越重要,可以采用一個多級鄰居信息指標以及其鄰居之間的緊密程度對網(wǎng)絡(luò)中的節(jié)點重要性進行度量,將其定義為基于鄰居信息與集聚系數(shù)的節(jié)點重要性評價方法(P(i))[17].
其中:fi為節(jié)點vi自身的度與其所有鄰居vu度之和,即fi=k(i)+k(u),k(u)表示節(jié)點vu的度,Γ(i)表示當前節(jié)點vi的鄰居節(jié)點集合;cci為節(jié)點vi的集聚系數(shù);G為整個網(wǎng)絡(luò)節(jié)點集.
2)網(wǎng)絡(luò)結(jié)構(gòu)的全局信息處理.基于網(wǎng)絡(luò)全局屬性的節(jié)點重要性度量主要考慮網(wǎng)絡(luò)全局信息,特征向量指標不僅考慮全局網(wǎng)絡(luò)信息,同時考慮了鄰居節(jié)點的重要性程度.特征向量指標強調(diào)節(jié)點之間的相互影響,節(jié)點的重要性不僅與其連接的邊數(shù)有關(guān),而且和連接節(jié)點的重要性成線性關(guān)系,設(shè)網(wǎng)絡(luò)具有N個節(jié)點,A表示網(wǎng)絡(luò)的鄰接矩陣,λ1,λ2,…,λN表示A的N個特征值.設(shè)λ為矩陣A的最大特征值,有
其中:aij為A中元素;ei為節(jié)點i的重要性度量值;ej為節(jié)點i鄰居節(jié)點的重要性度量值.則節(jié)點i的特征向量指標可以定義為
3)網(wǎng)絡(luò)節(jié)點選課人數(shù)屬性處理.根據(jù)Stu-Course-CN建模流程,計算每門課的學生人數(shù)si,形成課程人數(shù)集合s={s1,…,si,…,sN}.人數(shù)是選課的最重要的屬性,對其歸一化處理,歸一化公式為
因選課中最大人數(shù)不等于最小人數(shù),所以s′i∈(0,1).
在選課的課程網(wǎng)絡(luò)中,需要充分考慮網(wǎng)絡(luò)的局部信息和全局信息,同時融合選課人數(shù)信息,為此定義課程重要性指標為
采用蘭州交通大學電信學院研究生連續(xù)3年的選課情況作為分析對象.本文以2018年第2學期研究生的選課情況為例,實際開課共33門,研究生182名,3個專業(yè)方向(信息與通信工程、計算機科學與技術(shù)、電子科學工程).為了便于分析,對課程進行編號處理,定義如下:1代表功率電子學;2代表大規(guī)模集成電路CAD;3代表可信計算與信息安全;4代表基于FPGA的數(shù)字系統(tǒng)設(shè)計;5代表現(xiàn)代半導體物理與器件;6代表應(yīng)用統(tǒng)計學;7代表機器學習;8代表模糊數(shù)學及應(yīng)用;9代表深度學習;10代表最優(yōu)化方法及應(yīng)用;11代表DSP技術(shù)及開發(fā);12代表通信網(wǎng)協(xié)議分析與管理;13代表通信系統(tǒng)仿真技術(shù);14代表軟件無線電技術(shù);15代表數(shù)字圖像處理;16代表語音信號處理;17代表信號檢測與估值;18代表應(yīng)用密碼學;19代表無線通信技術(shù)與應(yīng)用;20代表軌道交通通信技術(shù);21代表無線通信網(wǎng)絡(luò)規(guī)劃與優(yōu)化;22代表軟件體系結(jié)構(gòu);23代表智能計算;24代表數(shù)據(jù)挖掘;25代表現(xiàn)代數(shù)據(jù)庫技術(shù);26代表網(wǎng)絡(luò)安全技術(shù);27代表神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用;28代表統(tǒng)計決策與模式識別;29代表分布式系統(tǒng);30代表高級計算機圖形學;31代表智能鐵路運輸系統(tǒng)(ITS-R);32代表科技英語寫作(信息類);33代表虛擬現(xiàn)實技術(shù)及應(yīng)用.根據(jù)式(1)獲得課程之間的鄰接矩陣(見表1),采用Stu-Course-CN構(gòu)建學生培養(yǎng)計劃下的課程之間的復雜網(wǎng)絡(luò),網(wǎng)絡(luò)如圖2所示,該網(wǎng)絡(luò)共33個節(jié)點,468條邊.從圖2的選課關(guān)系網(wǎng)絡(luò)中可以發(fā)現(xiàn):該網(wǎng)絡(luò)為稠密網(wǎng)絡(luò),大部分課程之間具有較為稠密的連接,僅個別課程連接比較稀疏.從該網(wǎng)絡(luò)中無法直接獲得課程的專業(yè)方向以及課程的重要性,為此需要對該網(wǎng)絡(luò)進行社團和重要性分析.
圖2 選課關(guān)系的課程復雜網(wǎng)絡(luò)Fig.2 Course complex network of course selection relationship
為了挖掘網(wǎng)絡(luò)結(jié)構(gòu)中隱藏的信息,對該33門課的選課關(guān)系課程群網(wǎng)絡(luò)采用stepA算法進行社團分析,結(jié)果如圖3所示,最終模塊度ΔQ收斂于0.171,社團劃分為三類,分別為:電子科學方向,包括1,2,4,5,15,25等6個節(jié)點;計算機方向,包括3,6,7,10,18,22,23,24,26,29,32等11個節(jié)點;信息與通信方向,包括8,9,11,12,13,14,16,17,19,20,21,27,28,30,31,33等16個節(jié)點.與培養(yǎng)方案進行比較,社團劃分與培養(yǎng)方案課程劃分一致.圖4為培養(yǎng)方案的課程關(guān)系,在培養(yǎng)方案中,15(數(shù)字圖像處理)、25(現(xiàn)代數(shù)據(jù)庫技術(shù))和32(科技英語寫作(信息類))3門課為3個培養(yǎng)方向的共有課程,但15(數(shù)字圖像處理)內(nèi)容偏重信息與通信方向,25(現(xiàn)代數(shù)據(jù)庫技術(shù))內(nèi)容偏重計算機方向;18(應(yīng)用密碼學)、24(數(shù)據(jù)挖掘)、26(網(wǎng)絡(luò)安全技術(shù))、27(神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用)和30(高級計算機圖形學)是計算機方向和信息與通信方向的共有課程,但18(應(yīng)用密碼學)內(nèi)容偏重于信息與通信方向,24(數(shù)據(jù)挖掘)、26(網(wǎng)絡(luò)安全技術(shù))、27(神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用)和30(高級計算機圖形學)4門課程內(nèi)容偏重于計算機方向.從圖3的選課網(wǎng)絡(luò)社團劃分可以看出:15(數(shù)字圖像處理)、25(現(xiàn)代數(shù)據(jù)庫技術(shù))在分類中屬于電子科學方向,說明這兩門課程主要選擇的學生為電子科學方向?qū)W生,可能同這學期電子科學方向開課的課程數(shù)少有一定的關(guān)系;30(高級計算機圖形學)屬于信息與通信方向分類,說明該課程主要由信息與通信方向的學生進行選課.從上述分析中可以得出:基于學生選課關(guān)系網(wǎng)絡(luò)的社團劃分和培養(yǎng)方案是一致的,說明該方法在選課網(wǎng)絡(luò)中是可行的.同時從社團劃分中也可以看出個別課程的主要選課學生的學科方向,對后期的培養(yǎng)方案修訂具有一定的意義.
圖3 課程群的社團劃分Fig.3 Community division of curriculum group
圖4 培養(yǎng)方案課程關(guān)系Fig.4 Relationship between training program
為了進一步挖掘課程的有效信息,采用式(7)對選課關(guān)系課程群的課程重要性進行分析,其結(jié)果如圖5所示,圖中列出了選課人數(shù)屬性下的課程重要性分析、網(wǎng)絡(luò)結(jié)構(gòu)特征的課程重要性分析以及二者融合的重要性分析.從圖5中可以看出:絕大多數(shù)的課程在這3種分析下重要性具有一致性,但機器學習、數(shù)字圖像處理、軌道交通通信技術(shù)、數(shù)據(jù)挖掘、現(xiàn)代數(shù)據(jù)庫技術(shù)、分布式系統(tǒng)以及科技英語寫作(信息類)等7門課程值得注意,從這7門課程可以看出,這7門選課人數(shù)都很多,在網(wǎng)絡(luò)結(jié)構(gòu)影響下其重要性雖沒有變化,但對其重要性幅值帶來了一定的約束,重要性值更加合理;同時有個別課程二者的重要性不同,如模糊數(shù)學與應(yīng)用,雖然其選課人數(shù)少于應(yīng)用統(tǒng)計學,但其融合后的重要性大于應(yīng)用統(tǒng)計學,說明網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系提升了其重要性;另外,還有分布式系統(tǒng)、應(yīng)用密碼學和現(xiàn)代數(shù)據(jù)庫技術(shù),這些課程的網(wǎng)絡(luò)結(jié)構(gòu)直接影響了融合后的重要性分析,使得選課人數(shù)多的分布式系統(tǒng)的重要性低于應(yīng)用密碼學和現(xiàn)代數(shù)據(jù)庫技術(shù).從整體上而言,基于選課關(guān)系網(wǎng)絡(luò)課程的重要性能夠反應(yīng)學生的喜好,通過網(wǎng)絡(luò)關(guān)系可以反應(yīng)選課關(guān)系對課程重要性的影響.
圖5 課程重要性分析Fig.5 Curriculum importance analysis
本文首先對研究生課程群的選課關(guān)系進行了分析,建立了選課關(guān)系下的課程群復雜網(wǎng)絡(luò)模型,隨后分析了在選課關(guān)系下的課程群社團結(jié)構(gòu),并和培養(yǎng)方案進行了比較,結(jié)果表明:該社團結(jié)構(gòu)同培養(yǎng)方案是一致的,同時也挖掘出個別課程主要為某一個學科方向的學生選擇,為培養(yǎng)方案的修訂提供了一定的依據(jù).接著,采用網(wǎng)絡(luò)結(jié)構(gòu)指標、選課人數(shù)屬性以及二則的融合對選課關(guān)系下的課程重要性進行了分析,從分析結(jié)果可以看出學生選課的興趣傾向于該門課程在學生中的影響力,這對課程評價有一定的參照價值,同時也有利于研究課程的合理性安排.總之,通過復雜網(wǎng)絡(luò)對研究生課程進行建模不僅能分析課程在課程體系中的重要性,同時為后續(xù)的課程管理與學生興趣相結(jié)合提供依據(jù).