李思,魯澄宇
(廣東醫(yī)科大學(xué),廣東湛江 523808)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,簡(jiǎn)寫(xiě)為ANNs)是20世紀(jì)80年代以來(lái)人工智能領(lǐng)域興起的研究熱點(diǎn)。人工神經(jīng)網(wǎng)絡(luò)從信息處理角度對(duì)人腦神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象,建立某種簡(jiǎn)單模型,按不同的連接方式組成不同的網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。人工神經(jīng)網(wǎng)絡(luò)模型能使用單元節(jié)點(diǎn)模擬神經(jīng)元,通過(guò)調(diào)整內(nèi)部大量節(jié)點(diǎn)(神經(jīng)元)之間相互連接的關(guān)系,從而達(dá)到處理信息的目的[1-3]。
數(shù)據(jù)挖掘(Data Mining)能采用數(shù)學(xué)、統(tǒng)計(jì)、人工智能和人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的科學(xué)方法,如記憶推理、聚類(lèi)分析、關(guān)聯(lián)分析、決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、基因算法等技術(shù),從大量數(shù)據(jù)中挖掘出隱含的、先前未知的、對(duì)決策具有潛在價(jià)值的關(guān)系、模式和趨勢(shì),并用這些知識(shí)和規(guī)則建立用于決策支持的模型,提供預(yù)測(cè)性決策支持的方法、工具和過(guò)程[4-5]。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),數(shù)據(jù)挖掘主要有數(shù)據(jù)準(zhǔn)備、規(guī)律尋找和規(guī)律表示三個(gè)步驟。數(shù)據(jù)準(zhǔn)備是從相關(guān)的數(shù)據(jù)源中選取所需的數(shù)據(jù)并整合成用于數(shù)據(jù)挖掘的數(shù)據(jù)集;規(guī)律尋找是用某種方法將數(shù)據(jù)集所含的規(guī)律找出來(lái);規(guī)律表示是盡可能以用戶(hù)可理解的方式(如可視化)將找出的規(guī)律表示出來(lái)。
隨著信息技術(shù)的發(fā)展,探索新的學(xué)習(xí)方式、教學(xué)方法以及建設(shè)數(shù)字化校園成為當(dāng)代教學(xué)工作的重點(diǎn)。隨著無(wú)紙化辦公的深入,越來(lái)越多的數(shù)據(jù)信息存儲(chǔ)在服務(wù)器內(nèi),如何合理、恰當(dāng)、有效地運(yùn)用信息技術(shù),從海量的數(shù)據(jù)中提取并發(fā)現(xiàn)有用的信息,為教育教學(xué)提供參考依據(jù),成為當(dāng)前急需解決的新問(wèn)題[6]。
考試成績(jī)是對(duì)學(xué)生學(xué)習(xí)情況的檢查和評(píng)定,它從一個(gè)側(cè)面反映了學(xué)校教育的成功與否。近年來(lái),隨著高校學(xué)生考研需求的逐年增長(zhǎng),學(xué)生考研成績(jī)?cè)u(píng)估成為評(píng)價(jià)教學(xué)質(zhì)量的一個(gè)重要依據(jù)。運(yùn)用人工神經(jīng)網(wǎng)絡(luò)技術(shù)能構(gòu)建學(xué)生考研成績(jī)數(shù)據(jù)庫(kù),分析學(xué)生的考研成績(jī),找出對(duì)成績(jī)影響較大的因素,對(duì)學(xué)生的考研成績(jī)作出一定的預(yù)測(cè),為學(xué)生填報(bào)志愿提供指導(dǎo),提高考研錄取率,這將對(duì)改進(jìn)學(xué)生的培養(yǎng)方式和提高教學(xué)質(zhì)量帶來(lái)很大的幫助。
本文基于數(shù)據(jù)挖掘思想構(gòu)建學(xué)生的考研成績(jī)數(shù)據(jù)庫(kù),通過(guò)人工神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)進(jìn)行研究分析,探究學(xué)生的學(xué)習(xí)成績(jī)蘊(yùn)藏的規(guī)律。
本文的實(shí)驗(yàn)數(shù)據(jù)收集了廣東醫(yī)科大學(xué)藥學(xué)院2015、2016、2017級(jí)藥學(xué)專(zhuān)業(yè)學(xué)生的考研成績(jī)及相關(guān)主干課程的成績(jī)??佳谐煽?jī)?yōu)榭偡?。依?jù)藥學(xué)專(zhuān)業(yè)人才培養(yǎng)方案中的課程設(shè)置,筆者參照選取了相關(guān)主干課程成績(jī):藥理學(xué)、藥物化學(xué)、藥劑學(xué)、藥物分析、天然藥物化學(xué)、藥用植物學(xué)與生藥學(xué)、生物藥劑學(xué)與藥代動(dòng)力學(xué)專(zhuān)業(yè)課成績(jī)和有機(jī)化學(xué)、分析化學(xué)專(zhuān)業(yè)基礎(chǔ)課成績(jī)(建立模型時(shí)統(tǒng)稱(chēng)為專(zhuān)業(yè)基礎(chǔ))。本研究建立了藥學(xué)專(zhuān)業(yè)學(xué)生的考研成績(jī)數(shù)據(jù)庫(kù)和分析數(shù)據(jù)庫(kù),通過(guò)人工神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)學(xué)生的成績(jī)進(jìn)行分析。
一個(gè)典型的人工神經(jīng)網(wǎng)絡(luò)由一個(gè)輸入層(input layer)、多個(gè)隱藏層(hidden layer)和一個(gè)輸出層(output layer)構(gòu)成。神經(jīng)網(wǎng)絡(luò)的第一層稱(chēng)為輸入層,被設(shè)計(jì)來(lái)從外部接收各種輸入;神經(jīng)網(wǎng)絡(luò)的最后一層稱(chēng)為輸出層,輸出處理結(jié)果;位于輸入層和輸出層之間有一到多個(gè)層稱(chēng)為隱藏層,神經(jīng)網(wǎng)絡(luò)大部分由隱藏層構(gòu)成。
根據(jù)藥學(xué)專(zhuān)業(yè)主干課程的設(shè)置,模型選取了藥理學(xué)、藥物化學(xué)、藥劑學(xué)、藥物分析、生物藥劑學(xué)與藥代動(dòng)力學(xué)、無(wú)機(jī)化學(xué)、有機(jī)化學(xué)、分析化學(xué)8門(mén)課程的成績(jī)作為輸入,以考研總分和專(zhuān)業(yè)基礎(chǔ)課成績(jī)作為輸出,從159名學(xué)生樣本中隨機(jī)抽取109名為訓(xùn)練集,50名為驗(yàn)證集,從而建立人工神經(jīng)網(wǎng)絡(luò)模型,如圖1所示。模型包括輸入層(8個(gè)神經(jīng)元)、隱藏層(6個(gè)神經(jīng)元)和輸出層(2個(gè)神經(jīng)元)。8門(mén)主干課程的成績(jī)通過(guò)輸入節(jié)點(diǎn)輸入之后,再經(jīng)過(guò)隱藏層的數(shù)據(jù)處理,最后在輸出層節(jié)點(diǎn)得出輸出值。
圖1 基于人工神經(jīng)網(wǎng)絡(luò)的考研成績(jī)預(yù)測(cè)模型
藥學(xué)專(zhuān)業(yè)學(xué)生的專(zhuān)業(yè)基礎(chǔ)課程成績(jī)和考研總分成績(jī)預(yù)測(cè)結(jié)果如圖2所示。通過(guò)圖2可以看出,預(yù)測(cè)值與實(shí)際值之間的差異大小可以通過(guò)觀察預(yù)測(cè)值與實(shí)際值之間的差異來(lái)評(píng)價(jià)模型。由圖2可以看出,模型的預(yù)測(cè)性能能較好地通過(guò)檢驗(yàn)。
圖2 預(yù)測(cè)-實(shí)測(cè)圖(專(zhuān)業(yè)基礎(chǔ))
圖3 預(yù)測(cè)-實(shí)測(cè)圖(總分)
對(duì)輸入數(shù)據(jù)正態(tài)化可以保證神經(jīng)網(wǎng)絡(luò)的輸出對(duì)各參數(shù)的梯度(導(dǎo)數(shù))間不會(huì)相差過(guò)大,使我們僅用一個(gè)學(xué)習(xí)率的改變就可以滿(mǎn)足各參數(shù)的更新,達(dá)到模型的穩(wěn)定。正態(tài)化是改進(jìn)模型收斂性的工具。根據(jù)自變量重要性(見(jiàn)圖4)和正態(tài)化重要性(見(jiàn)圖5)的分析結(jié)果可以看出,模型選取的藥物化學(xué)等8門(mén)課程的正態(tài)化重要性較好,基本能保證預(yù)測(cè)模型的可操性和穩(wěn)定性。
圖4 自變量重要性
圖5 正態(tài)化重要性
綜上所述,人工神經(jīng)網(wǎng)絡(luò)模型對(duì)考研成績(jī)的預(yù)測(cè)具有較高的準(zhǔn)確性,說(shuō)明本研究整體的技術(shù)路線(xiàn)可行。人工神經(jīng)網(wǎng)絡(luò)模型能通過(guò)藥學(xué)專(zhuān)業(yè)藥物化學(xué)、藥物分析、藥劑學(xué)、生物藥劑學(xué)與藥代動(dòng)力學(xué)、有機(jī)化學(xué)、藥理學(xué)、分析化學(xué)、無(wú)機(jī)化學(xué)等主干課程的成績(jī)?nèi)ヮA(yù)測(cè)考研成績(jī)。人工神經(jīng)網(wǎng)絡(luò)模型能找出對(duì)學(xué)生成績(jī)影響最大的因素,學(xué)生可以根據(jù)自己主干課程的成績(jī)?nèi)ヮA(yù)測(cè)自己的考研成績(jī),從而判斷自己的考研策略[7]。教師要進(jìn)一步了解學(xué)生的學(xué)習(xí)情況,及時(shí)對(duì)主干課程進(jìn)行調(diào)整,對(duì)課程教學(xué)內(nèi)容進(jìn)行優(yōu)化,對(duì)教學(xué)方法進(jìn)行改革,不斷提高教學(xué)質(zhì)量,從而滿(mǎn)足學(xué)生的學(xué)習(xí)需求和發(fā)展需要。教師要對(duì)學(xué)生的考研成績(jī)作出正確的預(yù)測(cè),給學(xué)生填報(bào)志愿提供指導(dǎo)策略,提高考研錄取率。人工神經(jīng)網(wǎng)絡(luò)模型能為高校教師管理各項(xiàng)教學(xué)工作、指導(dǎo)教育教學(xué)實(shí)踐、更客觀地評(píng)價(jià)教學(xué)質(zhì)量的效果提供依據(jù),也能為職能部門(mén)的正確決策提供科學(xué)的理論依據(jù)。