王 炳 堃
(閩南理工學(xué)院 招生就業(yè)處,福建 石獅 362700)
隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展,大數(shù)據(jù)技術(shù)、數(shù)據(jù)倉(cāng)庫(kù)等也得到突飛猛進(jìn)的發(fā)展。且大部分民辦高校招生數(shù)據(jù)管理系統(tǒng)僅僅滿足簡(jiǎn)單的事務(wù)管理,如錄取庫(kù)信息的導(dǎo)入、錄取學(xué)生信息的查看、學(xué)生信息的更改、錄取通知書(shū)的打印等操作,對(duì)招生決策也是處于表面層面上。因此,如何把數(shù)據(jù)挖掘技術(shù)更好地應(yīng)用到民辦高校招生工作,這是目前民辦高校遇到的新的機(jī)遇和挑戰(zhàn)。挖掘數(shù)據(jù)中的潛在信息,為高校招生工作的管理、決策提供有力支持,提高高校招生工作的效率和決策水平[1]。各高校每年都有考生因?yàn)楦髯栽蚍艞壢雽W(xué)資格,不但影響了高校報(bào)到率,還對(duì)教育資源造成極大浪費(fèi)。文章以閩南理工學(xué)院為例,根據(jù)自身特點(diǎn),結(jié)合學(xué)校的需要設(shè)計(jì)出一套行之有效的系統(tǒng)和工具,從學(xué)校的招生錄取庫(kù)中提取有效的數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù),應(yīng)用數(shù)據(jù)挖掘技術(shù)中的多維數(shù)據(jù)分析預(yù)測(cè)閩南理工學(xué)院招生報(bào)到情況,為學(xué)校決策者提供參考,有助于學(xué)校得出更加合理、有效的預(yù)測(cè),有利于學(xué)校在開(kāi)學(xué)前開(kāi)展一些準(zhǔn)備工作,統(tǒng)籌安排,為提高新生報(bào)到率指引方向。
閩南理工學(xué)院創(chuàng)辦于1998年,經(jīng)教育部批準(zhǔn)于2008年升格為普通本科高等學(xué)校。由于學(xué)校的性質(zhì)、專業(yè)、錄取分?jǐn)?shù)和所在地區(qū)等原因?qū)е聦W(xué)校每年的新生報(bào)到率不高。文章利用數(shù)據(jù)倉(cāng)庫(kù)和OLAP等技術(shù)對(duì)新生錄取報(bào)到率進(jìn)行多維分析,分析學(xué)校2014-2018近5年的新生報(bào)到率情況,為學(xué)校當(dāng)年的錄取工作提供數(shù)據(jù)支撐,為來(lái)年的招生工作做指導(dǎo)。
新生錄取報(bào)到率可以從三個(gè)方向進(jìn)行探索,分別是各專業(yè)錄取報(bào)到率、各專業(yè)報(bào)到人數(shù)情況和各省份錄取報(bào)到率。利用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘等技術(shù)對(duì)新生錄取報(bào)到率進(jìn)行分析,了解未報(bào)到人數(shù)情況,確認(rèn)閩南理工學(xué)院各專業(yè)、各省份生源流失的情況,為招生數(shù)據(jù)分析和招生宣傳提供服務(wù)。錄取報(bào)到率分析主題的功能需求維度分析見(jiàn)表1。
表1 錄取報(bào)到率分析主題的功能需求維度分析
文章采用B/S結(jié)構(gòu)對(duì)招生數(shù)據(jù)智能分析系統(tǒng)進(jìn)行設(shè)計(jì),該系統(tǒng)主要由三部分構(gòu)成,分別是:客戶端、服務(wù)器端和數(shù)據(jù)倉(cāng)庫(kù)。具體的招生數(shù)據(jù)智能分析系統(tǒng)結(jié)構(gòu)如圖1。
圖1 招生數(shù)據(jù)智能分析系統(tǒng)架構(gòu)圖
數(shù)據(jù)倉(cāng)庫(kù)里存儲(chǔ)著最新的2015-2019年5年的錄取數(shù)據(jù)和報(bào)到數(shù)據(jù),用到的新生報(bào)到數(shù)據(jù)和錄取數(shù)據(jù)主要來(lái)源于“全國(guó)普通高校招生網(wǎng)上錄取系統(tǒng)”。該系統(tǒng)導(dǎo)出的各省份(除了廣東省使用廣東版錄取系統(tǒng)和實(shí)行新高考浙江、上海兩省、市外)錄取數(shù)據(jù)文件類型統(tǒng)一,都是dbf格式,文件數(shù)量一致,內(nèi)容比較規(guī)范。根據(jù)各管理員傳來(lái)的需求指令,執(zhí)行SOL語(yǔ)句,將處理結(jié)果傳遞到應(yīng)用服務(wù)器。數(shù)據(jù)的導(dǎo)入可以分成自動(dòng)識(shí)別導(dǎo)入和手動(dòng)導(dǎo)入。
服務(wù)器端由Web服務(wù)器和應(yīng)用服務(wù)器組成。應(yīng)用服務(wù)器中包含查詢工具、OLAP工具、數(shù)據(jù)管理工具和ETL工具等。Web服務(wù)器工作原理一般包括四個(gè)步驟:連接過(guò)程、請(qǐng)求過(guò)程、應(yīng)答過(guò)程和關(guān)閉連接[2]。
系統(tǒng)管理員和其他管理員等用戶通過(guò)瀏覽器向服務(wù)器發(fā)出請(qǐng)求指令,再把指令傳輸?shù)絎EB服務(wù)器、應(yīng)用服務(wù)器,存放數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)數(shù)據(jù)庫(kù)將管理員請(qǐng)求處理后,把處理結(jié)果傳輸?shù)綖g覽器,通過(guò)圖、表等多種直觀方式顯示給用戶,該系統(tǒng)操作簡(jiǎn)便、準(zhǔn)確、直觀明了,非常適合非計(jì)算機(jī)專業(yè)教師的使用。
通過(guò)數(shù)據(jù)挖掘模型建立維度時(shí),通常的流程主要是創(chuàng)建空維、級(jí)別、層次、進(jìn)行映射、維護(hù)。在維的映射中,ID映射為成員屬性[3]。維護(hù)維,就是裝載、計(jì)算匯總數(shù)據(jù)的過(guò)程。文章在數(shù)據(jù)庫(kù)服務(wù)器中構(gòu)建11個(gè)維度表,分別是:招生年份維、招生省份維、性別維、民族維、考生類別維、學(xué)生成績(jī)維、年齡段維、志愿批次維、專業(yè)志愿情況維、錄取專業(yè)維和二級(jí)學(xué)院系別維度。
立方是多維數(shù)據(jù)的邏輯展現(xiàn),建立立方的主要過(guò)程為:創(chuàng)建、選擇、定義、度量、映射及維護(hù)[4]。文章對(duì)維度進(jìn)行了組合后創(chuàng)建多個(gè)三維立方,以新生錄取報(bào)到率分析主題為例,數(shù)據(jù)立方體的構(gòu)建表如表2。
表2 數(shù)據(jù)立方體的構(gòu)建表
客戶端結(jié)果展示是通過(guò)對(duì)數(shù)據(jù)倉(cāng)庫(kù)中保存的海量歷史數(shù)據(jù)進(jìn)行分析和展示。數(shù)據(jù)挖掘結(jié)果的展現(xiàn)常用方法是采用多維報(bào)表的形式[5]。在對(duì)二維、三維及多維數(shù)據(jù)進(jìn)行展示時(shí),利用餅圖、柱狀圖和立方圖等形式,簡(jiǎn)單、準(zhǔn)確地展示出數(shù)據(jù)的變化趨勢(shì),了解不同因素對(duì)結(jié)果的影響程度,方便學(xué)校統(tǒng)籌安排,為提高新生報(bào)到率做好數(shù)據(jù)支撐。
閩南理工學(xué)院招生數(shù)據(jù)智能分析系統(tǒng)的招生錄取報(bào)到率可以更直觀、更清晰地查看出某年份各個(gè)專業(yè)的報(bào)到率情況,以供招生部門(mén)工作人員方便、快捷地了解到學(xué)校各專業(yè)報(bào)到情況。以2018年招生數(shù)據(jù)為例,選取招生年份:2018,度量方式“錄取報(bào)到率”,維度“專業(yè)”,顯示結(jié)果如圖2。
圖2 2018年各專業(yè)報(bào)到率顯示界面
從圖2可以看出學(xué)校各個(gè)專業(yè)報(bào)到率基本都在90%左右。其中,資產(chǎn)評(píng)估、審計(jì)學(xué)、給排水科學(xué)與技術(shù)等幾個(gè)專業(yè)報(bào)到率比較靠前。測(cè)控技術(shù)與儀器、材料成型及控制工程、光電信息科學(xué)與工程、國(guó)際經(jīng)濟(jì)與貿(mào)易和經(jīng)濟(jì)學(xué)等專業(yè)報(bào)到率較低。報(bào)到率較低的原因分析:測(cè)控技術(shù)與儀器、材料成型及控制工程、光電信息科學(xué)與工程等專業(yè)屬于工科專業(yè),考生對(duì)這幾個(gè)專業(yè)比較陌生,直接填報(bào)這幾個(gè)專業(yè)的考生較少,大部分生源是通過(guò)專業(yè)志愿調(diào)劑才完成招生計(jì)劃,影響了這幾個(gè)專業(yè)的報(bào)到率。國(guó)際經(jīng)濟(jì)與貿(mào)易、經(jīng)濟(jì)學(xué)兩專業(yè)面向外省計(jì)劃較多,外省由于學(xué)校宣傳力度、學(xué)費(fèi)、路途遙遠(yuǎn)、學(xué)生復(fù)讀等原因,導(dǎo)致國(guó)際經(jīng)濟(jì)與貿(mào)易、經(jīng)濟(jì)學(xué)這兩個(gè)經(jīng)濟(jì)類專業(yè)報(bào)到率偏低。
利用閩南理工學(xué)院招生數(shù)據(jù)智能分析系統(tǒng)的錄取報(bào)到人數(shù)能夠看到各專業(yè)的生源報(bào)到情況和未報(bào)到情況,查看某年份各個(gè)專業(yè)生源流失情況。以2018年招生數(shù)據(jù)為例,選取招生年份:2018,度量方式“錄取報(bào)到人數(shù)”,維度“專業(yè)”,顯示結(jié)果如圖3。
從圖3可以看出,學(xué)校在經(jīng)濟(jì)學(xué)、土木工程、財(cái)務(wù)管理等專業(yè)未報(bào)到的人數(shù)較多。結(jié)合各專業(yè)報(bào)到率的分析結(jié)果,學(xué)校在經(jīng)濟(jì)學(xué)專業(yè)的生源流失情況較為嚴(yán)重。學(xué)校可依據(jù)此分析結(jié)果,適當(dāng)調(diào)減經(jīng)濟(jì)學(xué)專業(yè)的招生計(jì)劃,并提高該專業(yè)招生地區(qū)的宣傳工作。
圖3 2018年錄取報(bào)到人數(shù)顯示界面
通過(guò)閩南理工學(xué)院招生數(shù)據(jù)智能分析系統(tǒng)的招生省份報(bào)到率可以很容易看出某年某省份的報(bào)到率情況,以便招生部門(mén)工作人員簡(jiǎn)單、直觀地看出學(xué)校在各省份的報(bào)到率情況。以2018年招生數(shù)據(jù)為例,選取招生年份:2018,度量方式“錄取報(bào)到率”,維度“省份”,顯示結(jié)果如圖4。
圖4 2018年各省份錄取報(bào)到率顯示界面
從圖4可以看出,遼寧、浙江、海南和內(nèi)蒙古4個(gè)省份不是協(xié)作省份,報(bào)到率達(dá)100%,但招生計(jì)劃較少,來(lái)年可以適當(dāng)增加計(jì)劃數(shù)。安徽、河南2個(gè)省份是協(xié)作省份,兩省考生人數(shù)多,報(bào)到率在90%左右,招生計(jì)劃數(shù)較多,來(lái)年可以保持或適當(dāng)增加計(jì)劃數(shù)。云南、甘肅和山西3省為協(xié)作省份,招生計(jì)劃數(shù)較多,報(bào)到率一般,來(lái)年可保持計(jì)劃數(shù)。貴州、廣西兩省為協(xié)作省份,報(bào)到率較低。分析原因可知:這兩省考生因?yàn)閷W(xué)校性質(zhì)、路途遙遠(yuǎn)、學(xué)費(fèi)等原因選擇復(fù)讀人數(shù)較多,來(lái)年可加大貴州、廣西兩省的招生宣傳力度,在條件允許的情況下適當(dāng)減少招生計(jì)劃。學(xué)校2018年首次在江西省招生,考生對(duì)學(xué)校情況了解不多,報(bào)到率較低,來(lái)年可加大對(duì)江西省的招生宣傳力度。
文章結(jié)合當(dāng)前階段招生數(shù)據(jù)分析系統(tǒng)存在的不足,以閩南理工學(xué)院為例,設(shè)計(jì)了一套招生數(shù)據(jù)智能分析管理系統(tǒng)。以招生錄取報(bào)到率為分析主題詳細(xì)介紹系統(tǒng)功能的開(kāi)發(fā),實(shí)現(xiàn)了以圖、表等表現(xiàn)形式簡(jiǎn)單、準(zhǔn)確、直觀地展現(xiàn)多維數(shù)據(jù)集,從而較好地分析預(yù)測(cè)出學(xué)校招生報(bào)到情況,為學(xué)校招生工作提供參考,精準(zhǔn)發(fā)力,使招生宣傳更加有目的性,使學(xué)校做出更加合理、有效的決策,樹(shù)立學(xué)校品牌。