◆房 坤
(青島港灣職業(yè)技術學院 山東 266404)
數據挖掘技術在高職院校招生工作中的應用研究
◆房 坤
(青島港灣職業(yè)技術學院 山東 266404)
當前信息爆炸式增長,我們開始利用數據挖掘技術來獲取到我們所需要的相關信息。對于高職院校而言,招生工作十分重要,因此建立起以數據挖掘技術為基礎的高校招生信息管理系統(tǒng)勢在必行。本文以青島港灣職業(yè)技術學院為例,分析數據挖掘技術在高職院校招生工作中的具體應用。
數據挖掘技術;高職院校;招生工作
高等職業(yè)教育自身具備了十分明顯的職業(yè)針對性,所培養(yǎng)的人才都是高級技能型的。但是我國現在的高考觀念依然把高等職業(yè)院??闯墒恰安钌逃?,這種不正確的觀念使高職院校的招生工作變得更加困難了[1]。為了改善青島港灣職業(yè)技術學院的招生現狀,可以建立起專門的高職院校招生信息管理系統(tǒng),為招生工作的順利開展提供決策支持。
1.1 高職院校招生信息管理系統(tǒng)的內容
當前高校的招生系統(tǒng)主要包含了兩個方面的內容,分別是電腦化和自動化[2]。構建模型的主要目的就是要為相關人員提供及時有效的信息,以此來實現信息的共享。對于遠程錄取來說,能夠及時的把報考考生的信息提供給錄取工作人員,幫助錄取人員對考生進行閱檔和分檔。錄取對計劃管理來說可以提供各個專業(yè)的計劃信息、事業(yè)信息和來源信息等,對全校各個專業(yè)的計劃進行系統(tǒng)化管理,對整個錄取過程進行約束。高職院校的招生系統(tǒng)主要是根據高等職業(yè)院校的招生管理工作模式所開發(fā)的管理軟件,這個系統(tǒng)對考生的信息進行導入、計劃管理、考生圖片信息導入、考生信息的管理、審核、考生信息查詢、打印新生通知書以及招生信息的分析統(tǒng)計功能。通過高職院校的招生信息管理系統(tǒng),招生工作人員可以及時的掌握招生的工作過程中所涉及到的考試信息以及招生統(tǒng)計信息。
1.2 高職院校招生信息管理系統(tǒng)的設計和實現
當前各大高校都面臨著市場運行機制的挑戰(zhàn),各個學校之間的競爭比較大,對于高職院校來說由于傳統(tǒng)高考觀念的存在,對其還有一些偏見,因此其面臨的招生壓力更大,招生錄取工作幾乎是其生存和發(fā)展的生命線。以青島港灣職業(yè)技術學院為例,可以對其歷史的招生數據進行分析和處理,為今后的招生決策提供支持和借鑒。學院的招生決策支持系統(tǒng)工作流程圖主要如圖1所示:
圖1 招生決策支持系統(tǒng)工作流程圖
圖1 中的招生決策支持系統(tǒng)是由四個部分組成的,從上到下依次是:數據分析和展現、多維數據集、數據倉庫和數據集成。
2.1 數據挖掘技術和傳統(tǒng)數據分析技術相比的優(yōu)越性
傳統(tǒng)的數據分析技術有查詢、報表和網絡聯(lián)機等,數據挖掘技術與其相比最根本的區(qū)別就是數據挖掘技術是在沒有明確的假設條件下進行的數據潛在信息、知識的挖掘和發(fā)現。另外數據挖掘所得到的信息具有先驗性、有效性和實用性。數據挖掘技術能夠發(fā)現那些違背直覺的潛在信息,預測根據以往的信息對未來的事情進行預測。所以數據挖掘通常會發(fā)覺一些出乎意料的并且有的信息,與之相比,傳統(tǒng)的數據分析技術則只能夠對已有的數據進行分析和歸納,借助于統(tǒng)計學的知識來對數據進行一些令人容易理解的描述和呈現。但是數據規(guī)模不斷擴大,數據的類型也更加復雜,傳統(tǒng)的數據分析技術無法符合人們越來越高的期望。
由于分析數據的需要,數據倉庫中所蘊含的數據都是反映了客觀世界的歷史真實性,通常是一起進行載入和訪問的,只能進行查詢。數據挖掘技術需要根據數據倉庫中的數據信息選擇合適的分析工具,進而得出有用的分析信息。數據挖掘過程是一個反復循環(huán)的過程,每一個步驟如果沒有達到預期的目標,都要回到前面的步驟,重新調整并執(zhí)行,大大提高了數據挖掘和分析的安全性能。
2.2 高職院校招生信息數據挖掘系統(tǒng)內容
數據倉庫最主要的目標是主題,而主題中涵蓋了全面的信息[3]。之前所使用的數據庫對于考生的信息一般只是側重于某個方面。比如在招生信息的數據挖掘系統(tǒng)中,我們所涉及的“招生”主題,就需要綜合多方面的內容,比如:考生的高考成績、招生的年度信息、單招成績、專業(yè)計劃和專業(yè)的基本情況等。以數據倉庫為基礎的數據高職院校招生信息數據挖掘系統(tǒng)如圖2所示:
圖2 基于數據倉庫的高職院校招生信息數據挖掘系統(tǒng)
如圖2所示,高職院校的招生信息數據挖掘系統(tǒng),主要是建立在方法庫、知識庫和數據倉庫的基礎上的,還需要充分的利用數據挖掘技術、聯(lián)機分析處理和可視化的工具來對考生的相關信息進行分析。而內部和外部的數據源所包含的是對招生前景和招生狀況的信息,形成了可視化的數據視圖,從而為高職院校進行合理的招生提供重要的決策支持。聯(lián)機則可以把在數據挖掘中所獲取到的新知識進行處理。決策者對數據挖掘技術的實際操作和應用可以提煉出不少有用的信息,然后在招生決策提供服務,使得招生的可靠性和準確性大大的提升。通俗來說,這個數據挖掘就是要在眾多的數據中尋找有用的隱藏信息,進而得到之前關心卻沒有得到的信息,并且把這些信息歸納成結構模式,來為招生管理提供實際的支持。
2.3 高職院校招生工作中對數據挖掘技術的具體應用
影響考生來校報考的因素有很多,為了更加科學的預測報考的人數,通過數據挖掘技術,采用ID3的決策樹改進方法,對高職院校招生數據倉庫中的數據實施了數據挖掘技術。因此用決策樹分類算法來建立學生報到的分類模型,在今后的決策中按照分類模型對學校的報考比例進行分析,以便對未來的招生工作做好準備,該步驟為:
(1)確定業(yè)務對象 針對高職學生的報考情況,本文采用決策樹方法。決策樹分類模型的規(guī)則集生成是以報考率為基礎的,以此對新生報報考率進行預測,這樣很可能會得到報考的人數。
(2)對數據進行預處理 2016年青島港灣職業(yè)技術學院一志愿報考的數據,是以Excel表格的形式存在的。
(3)數據挖掘 招生數據挖掘利用SPSS開發(fā)的商業(yè)版Clementine 8.1 中的C5.0算法,生成分析預測模型。
(4)模式評價 對本校學生的報到率分析和預測使用的分類模型,結果被解釋為分類模式,這種模式可以使用以下的規(guī)則來進行描述:
表1 2016年青島港灣職業(yè)技術學院學生一志愿報考率
(5)輔助決策 根據發(fā)現的模式,再結合我校的實際情況,和相關的專家進行了深入的溝通和交流,而且也聽取了一部分學生的意見反饋,進行深入的分析,所得出的結論是:
首先,2016年我校一志愿的整體報考率達到了96.7%,在同等高職院校中,報考率比較高。這說明,我校從總體上和其他院校相比,具有比較強的競爭力和吸引力,也表明招生前期的宣傳準備工作比較到位。
其次,報考率最高的是山東省夏季單招,已經達到137.0%。報考率最低的為省外普通高考,具體數值為76.8%,因此下一年需要適當的調整招生計劃,擴大山東省夏季單招的計劃招生人數,減少省外普通高考的計劃招生人數。另外需要擴大省外的招生宣傳投放力度,提高我校在省外的競爭力。
最后,根據報考率,可以對專業(yè)設置進行調整,以汽車營銷與服務專業(yè)為例,本專業(yè)在五種高考類型中報考率都比較低;因此以后對本專業(yè)就可以進行適當調整。通過數據挖掘得到相關的數據,以數據為基礎,對專業(yè)重新進行調整和設置,使我校的專業(yè)設置更加合理,從而為招生錄取工作提供更加科學的支撐,使招生工作更加規(guī)范。
對高職院校的考生報到率進行統(tǒng)計和分析,可以做出科學的評價和預測,有利于學校及時發(fā)現招生工作和學院管理中所存在的問題,而且還可以針對具體的問題制定出相應的整改措施,對進一步提高一志愿報考率、報到率,穩(wěn)定辦學規(guī)模有重要的意義。
高職院校面臨著巨大的生源競爭壓力,想要實現招生效益的最大化,需要充分利用數據庫的原理和數據倉儲概念,結合高職院校所有的特點,設計高職院校招生信息管理系統(tǒng)數據倉庫的中體框架,為以后的招生工作提供決策分析的數據基礎。
[1]羅孟華.基于數據挖掘技術的高職院校招生決策研究[D].華東師范大學,2009.
[2]黃榮堅.數據挖掘在高職院校招生中的應用研究[D].中山大學,2014.
[3]張汝平.數據挖掘技術在招生報到系統(tǒng)中的應用[D].天津大學,2014.
圖4 管理員管理平臺
本文主要根據對校園網站的應用研究及具體實現方案進行了探討。在應用研究方面,主要從校園網站信息化的目標出發(fā),進行了系統(tǒng)的調研和分析、可行性分析,初步對系統(tǒng)結構進行研究,結合實際需要設計出便于管理操作的校園網站系統(tǒng)平臺構架。
參考文獻:
[1]沙巨山.基于B/S結構的高??蒲泄芾硐到y(tǒng)設計以及實現[D].華東理工大學,2013.
[2]熊錦輝.基于B/S結構的學生信息管理系統(tǒng)的設計與實現[D].北京郵電大學,2013.
[3]馮興利,鎖志海,徐墨.基于PHP+MySQL的Web系統(tǒng)安全防范及全站靜態(tài)化[J].現代電子技術,2012.
[4]李鑫.Web服務器性能優(yōu)化研究與實現[D].哈爾濱工程大學,2011.
[5]劉進軍.論PHP在網站系統(tǒng)建設中的應用[J].電腦知識與技術,2012.