趙祖應(yīng),丁 勇,潘明波
(云南工商學(xué)院,云南 昆明 651701)
招生工作一直是民辦學(xué)校最重要的工作,民辦學(xué)校在招生上的投入占一年總支出的很大部份,采用的招生方式也在不斷的更新,使用新方法,新模式。但同時也會發(fā)現(xiàn),有些方式方法并不能解決招生問題,浪費了有限的資源,得不償失,主要表現(xiàn)在招生成本高、沒有嚴(yán)格的招生機制,宣傳模式單一等。歸根原因是沒有找到適合本校的招生方法與模式,而要能做到這一點,必須要對招生工作做一個詳細的研究,根據(jù)以住招生的情況,總結(jié)分析,找出問題所在點和發(fā)光點,為招生工作更好的方式提供有力的依據(jù)。
步驟1:發(fā)現(xiàn)所有的頻繁集。項集的頻度至少應(yīng)等于(預(yù)先設(shè)置的)最小支持度。關(guān)聯(lián)規(guī)則的整個性能主要取決于這一步。
步驟2:根據(jù)所獲得的頻繁項集,產(chǎn)生相應(yīng)的強關(guān)聯(lián)規(guī)則。這些規(guī)則必須滿足最小置信度閾值。
Apriori算法是挖掘產(chǎn)生關(guān)聯(lián)規(guī)則所需要的頻繁項集的基本算法,是數(shù)據(jù)挖掘領(lǐng)域里面常用的一種關(guān)聯(lián)規(guī)則挖掘算法。該算法利用一個層次順序搜索的循環(huán)方法來完成頻繁集的挖掘工作。這一循環(huán)方法就是利用(k-1)-項集來產(chǎn)生k-項集,具體的做法是首先找出頻繁集I-項集,記為L1;然后利用 L1來挖掘產(chǎn)生 L2,即頻繁 2-項集,如此循環(huán)往返,直到無法發(fā)現(xiàn)更多的頻繁k-項集為止。在每一層挖掘產(chǎn)生Lk時,都需要對整個數(shù)據(jù)庫掃描一遍。Apriori算法利用Lk-1來生成Lk。
該算法實現(xiàn)過程包括兩個步驟,即連接和剪枝,具體實現(xiàn)過程如下。
連接步驟:設(shè)l1和l2為 Lk-1中的的兩個項集,符號Lij表示 Li中的第j項,如 Li,k-2就表示 li中的倒數(shù)第二項。 若 Lk-1的連接操作記為 Lk-1⊕Lk-1,它表示若l1和l2中的前(k-2)項是相同的,即若有下面關(guān)系。
則Lk-1中的l1和l2的內(nèi)容就可以連接到一起。
剪枝步驟:Ck是Lk的一個超集,其中由項集組成的各元素不一定都是頻繁項集,但是所有的頻繁k-項集一定都在里面,即有L?Ck。對數(shù)據(jù)庫進行掃描就可以確定Ck中各候選項集的支持頻度,并由此獲得Lk中的各個元素,即頻度k-項集。所有頻度不小于最小支持頻度的候選集就是Lk的頻繁集。
從某高校招生的收集數(shù)據(jù)中抽出1 000條數(shù)據(jù)進行數(shù)據(jù)預(yù)處理,并對其進行數(shù)據(jù)篩選,處理結(jié)果如表1和表2所示。
表1 2012年招生數(shù)據(jù)預(yù)處理
表2 2013年招生數(shù)據(jù)預(yù)處理
利用spss Clemention工具建立模型,本例用2012年入學(xué)數(shù)據(jù)與2013年入學(xué)數(shù)據(jù)進行比較,得出兩年的地區(qū)與是否報到的關(guān)聯(lián)性分析,建模如圖3所示。
在2012年的數(shù)據(jù)中,設(shè)置最低條件支持度為8.0,最小規(guī)則置信度60.0%,最大前項數(shù)為5,得到的數(shù)據(jù)分析結(jié)果如圖4所示。
如果把2013的規(guī)則支持度和置信度設(shè)置和2012相同,結(jié)果如圖5所示。
圖4 2012年執(zhí)行結(jié)果
圖5 2013年執(zhí)行結(jié)果
根據(jù)圖 4和圖 5進行比較,B(云南大理)和 D(云南昭通)地區(qū)的學(xué)生報到是趨于正常的發(fā)展,在2013年招生中,A(云南昆明)、C(云南曲靖)和 E(云南麗江)加大了招生宣傳,取得了非常明顯的效果,那么在2014年的招生宣傳中,還需要在A、C、E地區(qū)保持一定的宣傳投入,在B和D地區(qū)可以適當(dāng)減少招生投入。
一個學(xué)校生源的多少決定了它規(guī)模及發(fā)展。特別是在民辦高校,“招生就是一切”,招生中不僅要數(shù)量、質(zhì)量也是發(fā)展的關(guān)鍵。民辦院校在不同的發(fā)展時期會有不同的發(fā)展策略,在不同的歷史時期院校也就有不同的招生策略及隊伍建設(shè)適應(yīng)發(fā)展的需求。因此,只有在清楚制定了院校發(fā)展戰(zhàn)略規(guī)劃后,才能順理成章地制定出院校人力資源需求、發(fā)展、策略、培訓(xùn)、擴建和儲備計劃。充分把數(shù)據(jù)挖掘技術(shù)利用在招生工作中,將對個高校的招生工作提供決策支持,對高校的招生成本的整合具有深遠的意義。
[1]趙祖應(yīng),丁勇.基于Apriori算法的購物籃關(guān)聯(lián)規(guī)則分析[J].江西科學(xué),2012(1).
[2]王嵩巖.基于數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則研究[J].吉林省經(jīng)濟管理干部學(xué)院學(xué)報,2008,22(1):80-82.
[3]朱建平,謝邦昌.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的提升及其應(yīng)用[J].統(tǒng)計研究,2004(12):34-39.
[4] 姚俊.淺談關(guān)聯(lián)規(guī)則挖掘[J].信息技術(shù),2005(6).
[5]劉柱文,李麗琳.關(guān)聯(lián)規(guī)則技術(shù)在數(shù)據(jù)挖掘中的應(yīng)用[J].科學(xué)技術(shù)與工程,2008(6).
[6]譚建豪,章兢.數(shù)據(jù)挖掘技術(shù)[M].北京:中國水利水電出版社,2009.
[7]劉世平.數(shù)據(jù)挖掘技術(shù)與應(yīng)用[M].北京:高等教育出版社,2010.