宋麗萍,韋建國(guó)
(阜陽(yáng)職業(yè)技術(shù)學(xué)院工程科技學(xué)院,安徽 阜陽(yáng) 236000)
基于關(guān)聯(lián)規(guī)則挖掘技術(shù)的學(xué)生數(shù)據(jù)分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
宋麗萍,韋建國(guó)
(阜陽(yáng)職業(yè)技術(shù)學(xué)院工程科技學(xué)院,安徽 阜陽(yáng) 236000)
數(shù)據(jù)挖掘技術(shù)的發(fā)展,使高校積累的大規(guī)模的數(shù)據(jù)得到了很好的利用.數(shù)據(jù)挖掘有很多研究方向,關(guān)聯(lián)規(guī)則挖掘就是其中之一.對(duì)關(guān)聯(lián)規(guī)則挖掘算法Apriori算法進(jìn)行了分析和優(yōu)化,對(duì)比了優(yōu)化Apriori算法與原算法的性能,結(jié)果表明,優(yōu)化后算法效率顯著提高.基于Web技術(shù)和SQL Server2005,并采用優(yōu)化的Apriori算法,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)學(xué)生數(shù)據(jù)分析系統(tǒng);系統(tǒng)具有數(shù)據(jù)導(dǎo)入、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘等功能.
數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法;系統(tǒng)
近年來(lái)隨著高等學(xué)校擴(kuò)招規(guī)模的進(jìn)一步加大,國(guó)內(nèi)各高校在校生人數(shù)不斷上升,這無(wú)疑給高校的教學(xué)和管理工作帶來(lái)新的挑戰(zhàn),如同其他領(lǐng)域一樣,高校的教學(xué)和管理積累了大量的數(shù)據(jù)資源,比如教學(xué)、圖書(shū)檔案、招生就業(yè)、教學(xué)科研等.若能從這些累積的數(shù)據(jù)中挖掘出一些具有參考意義的信息,將有助于高校的教學(xué)和管理.本文以我校積累的大量學(xué)生數(shù)據(jù)為研究對(duì)象,對(duì)關(guān)聯(lián)規(guī)則算法Apriori算法進(jìn)行優(yōu)化,并利用優(yōu)化的算法設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)關(guān)聯(lián)規(guī)則挖掘系統(tǒng).
數(shù)據(jù)挖掘是對(duì)有用的信息內(nèi)容進(jìn)行深層次的分析與挖掘,而關(guān)聯(lián)規(guī)則挖掘是非常重要的挖掘技術(shù)之一.關(guān)聯(lián)規(guī)則反映的是一個(gè)事物與其他事物之間的相互關(guān)聯(lián)性,如果事物之間存在有關(guān)聯(lián)規(guī)則,那么通過(guò)其他事物就能夠預(yù)測(cè)到其中一個(gè)事物[1].
(1)設(shè)定最小支持度,在數(shù)據(jù)庫(kù)D中求出出現(xiàn)頻率高的頻繁項(xiàng)集;
(2)設(shè)定最小置信度,頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,產(chǎn)生的規(guī)則要滿(mǎn)足最小支持度和最小置信度[2].
關(guān)聯(lián)規(guī)則挖掘的第一步是求頻繁項(xiàng)集,也是關(guān)鍵的一步,要提高挖掘算法的總體性能,就要從提高頻繁項(xiàng)集的效率入手.Apriori算法是眾多關(guān)聯(lián)規(guī)則挖掘算法中最經(jīng)典且最具影響力的算法,該算法使用寬度優(yōu)先的查找策略,基于候選項(xiàng)集來(lái)產(chǎn)生頻繁項(xiàng)集,由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則[3].
① 設(shè)初始候選集C1,k=1;
②在Lk中計(jì)算出每一個(gè)項(xiàng)集的支持度,并篩選出支持度大于Smin的項(xiàng)集,形成頻繁項(xiàng)集Lk;
③ 如果Ck=θ,置L1={L1,L2,…,Lk}后終止,否則,對(duì)Lk的頻繁項(xiàng)集進(jìn)行自然連接運(yùn)算Lk??Lk,得項(xiàng)為k+l的候選集Ck+l;
④ 置k=k+1,轉(zhuǎn)步②.
而在其中有兩個(gè)重要步驟是最關(guān)鍵的,即為連接步和剪枝步.設(shè)k-1次掃描數(shù)據(jù)庫(kù)D產(chǎn)生大小為k-1的頻繁項(xiàng)集為L(zhǎng)k-1,從頻繁項(xiàng)集Lk-l產(chǎn)生所有項(xiàng)為k的候選項(xiàng)集.
連接步:通過(guò)Lk-l與自身連接得到一個(gè)項(xiàng)為k的候選項(xiàng)集集合Ck.連接的規(guī)則為:如果
{il1,il2,…,ilk-2,is}∈Lk-1,
{il1,il2,…,ilk-2,it}∈Lk-1,
則
{il1,il2,…ilk-2,is}??{il1,il2,…ilk-2,it}=
{il1,il2,…ilk-2,is,it}∈Lk,
項(xiàng)為k的候選集就是Ck=Lk-1??Lk-1.
剪枝步.剪枝步是從連接得到的候選集中剪去不會(huì)產(chǎn)生頻繁項(xiàng)集的候選項(xiàng),形成新的候選集.設(shè)c∈Ck是k項(xiàng)集,若c的k-1個(gè)元素組成子集Ck-1,Ck-1不屬于Lk-1,則從Ck中將c剪除.
在Apriori算法中,執(zhí)行過(guò)程是基于多次掃描事務(wù)數(shù)據(jù)庫(kù)來(lái)實(shí)現(xiàn)的,根據(jù)Apriori性質(zhì)我們知道,頻繁項(xiàng)集的所有子集必須都是頻繁的.一旦從事務(wù)數(shù)據(jù)庫(kù)D中求出頻繁項(xiàng)集,由此產(chǎn)生的強(qiáng)關(guān)聯(lián)規(guī)則是直截了當(dāng)?shù)模瑢?duì)于置信度計(jì)算如下:其中條件概率用項(xiàng)集支持度計(jì)數(shù)表示:
Confidence(A→B)=P(A|B)=support-count(A∪B)/support-count(A)
其中:項(xiàng)集A∪B的事務(wù)數(shù)用support-count(A∪B)表示,項(xiàng)集A的事務(wù)數(shù)用support-count(A)表示.
Apriori算法雖然操作簡(jiǎn)單但還存在一些缺點(diǎn),因?yàn)槊看萎a(chǎn)生候選項(xiàng)集都要掃描一遍事務(wù)數(shù)據(jù)庫(kù)D,因此數(shù)據(jù)量比較大時(shí),產(chǎn)生的候選項(xiàng)集是比較龐大的,對(duì)于計(jì)算機(jī)的運(yùn)行時(shí)間和空間是一種大的挑戰(zhàn),另外每次尋找k頻繁項(xiàng)集,都需要掃描一遍數(shù)據(jù)庫(kù),會(huì)產(chǎn)生很大的I/O負(fù)載.
在從候選項(xiàng)集產(chǎn)生頻繁項(xiàng)集的過(guò)程中,有這樣一個(gè)性質(zhì):一個(gè)項(xiàng)集如果是頻繁項(xiàng)集當(dāng)且僅當(dāng)它的所有的子集都是頻繁的.如果Ck中某個(gè)候選項(xiàng)集中有一個(gè)(k-1)-子集不屬于Lk-1,那么這個(gè)項(xiàng)集可以被修剪掉而不再被考慮,利用這種修剪策略來(lái)減小候選項(xiàng)集Ck的大小,可以顯著地改進(jìn)生成所有頻繁項(xiàng)集算法的性能[4].
為了比較算法優(yōu)化前與優(yōu)化后的性能,進(jìn)行了數(shù)值實(shí)驗(yàn),首先給出一個(gè)進(jìn)行實(shí)驗(yàn)評(píng)估的數(shù)據(jù)庫(kù):測(cè)試所用的數(shù)據(jù)來(lái)源于UCI數(shù)據(jù)集中的ThyroidDisease(甲狀腺疾病)數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)有7200條記錄.實(shí)驗(yàn)使用MATLAB7.0軟件,在CPU為2.4GMHz,內(nèi)存為2G的計(jì)算機(jī)上完成的.
首先比較在最小支持度相同的情況下,規(guī)模不同的數(shù)據(jù)集挖掘的時(shí)間性能.此處將最小支持度設(shè)為10%,數(shù)據(jù)選取數(shù)據(jù)集中的前500條、1500條、4500條、7000條記錄,利用這些數(shù)據(jù)比較Apriori算法在優(yōu)化前與優(yōu)化后生成所有頻繁項(xiàng)集所用的時(shí)間.其比較結(jié)果如圖1所示:
圖1 相同最小支持度下的運(yùn)算時(shí)間圖
從圖1可以看出,在不同規(guī)模的事務(wù)數(shù)據(jù)集下,優(yōu)化后的Apriori算法所使用的運(yùn)算時(shí)間均低于優(yōu)化前的算法,這說(shuō)明提高了運(yùn)行效率,同時(shí)對(duì)于數(shù)據(jù)量比較小的數(shù)據(jù)庫(kù),優(yōu)化前與優(yōu)化后的算法運(yùn)算時(shí)間差距不是很明顯;但隨著數(shù)據(jù)量的增加,兩種算法的運(yùn)算時(shí)間的差距越來(lái)越明顯.
再次比較在不同的最小支持度下生成頻繁項(xiàng)集的時(shí)間性能.數(shù)據(jù)采用數(shù)據(jù)集中全部的7200條記錄,設(shè)定最小支持度分別為1%,5%,10%,15%,20%.其比較結(jié)果如圖2所示.
圖2 不同最小支持度下的運(yùn)算時(shí)間圖
圖2說(shuō)明了在相同的數(shù)據(jù)規(guī)模和不同的最小支持度下優(yōu)化的Apriori算法的執(zhí)行時(shí)間都比原算法的時(shí)間短,優(yōu)化的Apriori算法運(yùn)行效率高于原Apriori算法.當(dāng)最小支持度比較大時(shí),優(yōu)化前與優(yōu)化后沒(méi)有明顯的區(qū)別,但當(dāng)最小支持度較小時(shí),優(yōu)化的Apriori算法效率有明顯提高[5].
(1)系統(tǒng)的設(shè)計(jì)
本系統(tǒng)的設(shè)計(jì)目的主要有以下兩點(diǎn):一是為高職學(xué)校的學(xué)生管理工作提供幫助,二是為高職學(xué)校學(xué)生的就業(yè)提供參考.本系統(tǒng)的設(shè)計(jì)是為了適應(yīng)當(dāng)前高職教育的發(fā)展以及就業(yè)發(fā)展而設(shè)計(jì)的分析系統(tǒng)模型[6].
在進(jìn)行數(shù)據(jù)挖掘之前,我們需要建立一個(gè)行之有效的數(shù)據(jù)挖掘過(guò)程模型,而數(shù)據(jù)挖掘過(guò)程模型主要有兩種,一是Fayyad數(shù)據(jù)挖掘過(guò)程模型,二是CRISP-DM數(shù)據(jù)挖掘過(guò)程模型[7].本系統(tǒng)采用的是Fayyad數(shù)據(jù)挖掘過(guò)程模型,如圖3所示:
圖3 Fayyad數(shù)據(jù)挖掘過(guò)程
(2)系統(tǒng)的實(shí)現(xiàn)
系統(tǒng)挖掘所利用的學(xué)生數(shù)據(jù)信息來(lái)自多個(gè)部門(mén),本系統(tǒng)主要是由DTS(DataTransformationServices)抽取出同構(gòu)的或異構(gòu)的學(xué)生數(shù)據(jù)信息,對(duì)于采集到的這些數(shù)據(jù)信息,利用DTS完成數(shù)據(jù)選擇,刪除無(wú)用的數(shù)據(jù)[8].
根據(jù)高職院校學(xué)生的特點(diǎn),使用優(yōu)化的Apriori算法,通過(guò)對(duì)最小支持度和最小置信度進(jìn)行選擇后得到關(guān)聯(lián)規(guī)則結(jié)果.
系統(tǒng)基于Web技術(shù)和SQLServer2005開(kāi)發(fā)完成的可視化的交互式程序界面,較容易集成,確保用戶(hù)在操作方面的簡(jiǎn)單方便.
圖4 系統(tǒng)首頁(yè)
圖5 登錄系統(tǒng)后截圖
以下是本系統(tǒng)設(shè)計(jì)的主要功能模塊的功能介紹:
系統(tǒng)管理模塊.利用本模塊,用戶(hù)可以對(duì)設(shè)計(jì)的系統(tǒng)進(jìn)行必要的管理操作.
學(xué)生信息管理模塊.利用此模塊,用戶(hù)能夠?qū)W(xué)生的基本信息、學(xué)習(xí)成績(jī)、就業(yè)信息等進(jìn)行查詢(xún),還能進(jìn)行添加、刪除、修改等必要的數(shù)據(jù)管理操作.
數(shù)據(jù)預(yù)處理模塊.本模塊可按照用戶(hù)設(shè)定的條件來(lái)選擇合適的數(shù)據(jù)預(yù)處理的方法,將大量的學(xué)生信息進(jìn)行數(shù)據(jù)預(yù)處理的操作.比如數(shù)據(jù)信息的離散化、數(shù)據(jù)泛化等各項(xiàng)處理.
數(shù)據(jù)挖掘模塊.此功能模塊是本系統(tǒng)中最重要的一個(gè)模塊,利用本模塊可以進(jìn)行關(guān)聯(lián)規(guī)則挖掘,挖掘出與相關(guān)專(zhuān)業(yè)學(xué)生就業(yè)聯(lián)系緊密的因素.
報(bào)表打印模塊.在實(shí)現(xiàn)信息查詢(xún)結(jié)束后,使用“打印報(bào)表”模塊,用戶(hù)可以對(duì)系統(tǒng)挖掘產(chǎn)生的各項(xiàng)學(xué)生信息進(jìn)行直接打印.
(3)關(guān)聯(lián)規(guī)則挖掘?qū)嵗?/p>
系統(tǒng)針對(duì)阜陽(yáng)職業(yè)技術(shù)學(xué)院2010級(jí)護(hù)理專(zhuān)業(yè)學(xué)生數(shù)據(jù)進(jìn)行處理和分析,數(shù)據(jù)表包括學(xué)生基本信息情況表、學(xué)生成績(jī)表、技能鑒定成績(jī)表、學(xué)生就業(yè)情況表,存儲(chǔ)了采集到的學(xué)生所有的信息數(shù)據(jù),表中已經(jīng)將缺考、休學(xué)學(xué)生的數(shù)據(jù)記錄已經(jīng)去掉,形成了760條護(hù)理專(zhuān)業(yè)學(xué)生的有效記錄.進(jìn)入學(xué)生信息分析系統(tǒng)后,單擊“數(shù)據(jù)預(yù)處理”這個(gè)按鈕,系統(tǒng)會(huì)自動(dòng)進(jìn)行數(shù)據(jù)的處理,包括對(duì)數(shù)據(jù)信息的離散化、數(shù)據(jù)泛化、缺失數(shù)據(jù)的填充、刪除冗余數(shù)據(jù)和成績(jī)的綜合處理等.在對(duì)數(shù)據(jù)進(jìn)行預(yù)處理之后,就可以進(jìn)行關(guān)聯(lián)規(guī)則挖掘了.挖掘需要設(shè)定最小支持度和最小置信度,設(shè)定的最小支持度值越高,挖掘出的相關(guān)的規(guī)則就越少,挖掘過(guò)程也就越快.點(diǎn)擊“關(guān)聯(lián)規(guī)則挖掘”按鈕, 進(jìn)入“關(guān)聯(lián)規(guī)則挖掘”界面,在頁(yè)面中輸入最小支持度為20%、最小置信度為55%,經(jīng)過(guò)挖掘后,得到的結(jié)果如圖6.
圖6 護(hù)理專(zhuān)業(yè)關(guān)聯(lián)規(guī)則挖掘結(jié)果
(4)關(guān)聯(lián)規(guī)則挖掘結(jié)果的驗(yàn)證及預(yù)測(cè)
上面對(duì)護(hù)理專(zhuān)業(yè)的學(xué)生的就業(yè)數(shù)據(jù)進(jìn)行了關(guān)聯(lián)規(guī)則挖掘,現(xiàn)在利用其中的部分關(guān)聯(lián)規(guī)則對(duì)我校2013年護(hù)理專(zhuān)業(yè)的畢業(yè)生的就業(yè)情況進(jìn)行對(duì)比分析,并測(cè)驗(yàn)我們得出的關(guān)聯(lián)規(guī)則用于預(yù)測(cè)的準(zhǔn)確性.
①綜合測(cè)評(píng)分?jǐn)?shù)高的學(xué)生的就業(yè)情況
圖7 綜合測(cè)評(píng)高的就業(yè)情況示意圖
圖8 獲獎(jiǎng)學(xué)生的就業(yè)情況示意圖
在2013年畢業(yè)的760名護(hù)理專(zhuān)業(yè)的畢業(yè)生中,綜合測(cè)評(píng)成績(jī)高的有310名,其中有271名學(xué)生就業(yè)或升學(xué),所占比例為87.42%,見(jiàn)圖7.這一數(shù)據(jù)比較符合以上采用的學(xué)生數(shù)據(jù)挖掘出來(lái)的規(guī)則:綜合測(cè)評(píng) 優(yōu)良=> 就業(yè)、升學(xué) 64% 85%中的數(shù)據(jù)值85%,這一方面說(shuō)明了我們挖掘出來(lái)的關(guān)聯(lián)規(guī)則的準(zhǔn)確性,另一方面也說(shuō)明了綜合測(cè)評(píng)成績(jī)好的學(xué)生更容易就業(yè)或升學(xué).為了提高學(xué)生畢業(yè)以后就業(yè)的競(jìng)爭(zhēng)力,學(xué)校就業(yè)部門(mén)應(yīng)該針對(duì)性地多開(kāi)一些與就業(yè)相關(guān)的活動(dòng)或講座,如職業(yè)生涯規(guī)劃、面試技巧、就業(yè)指導(dǎo)課程等,也應(yīng)對(duì)其進(jìn)行相關(guān)技能的培養(yǎng),以提高他們的綜合素質(zhì).
②獲獎(jiǎng)學(xué)生的就業(yè)情況
在2013年的護(hù)理專(zhuān)業(yè)的畢業(yè)生中,人工統(tǒng)計(jì)出來(lái)的獲獎(jiǎng)的有165名,其中有152名學(xué)生就業(yè)或升學(xué),所占比例為92.12%,見(jiàn)圖8.這一數(shù)據(jù)也接近于以上采用的學(xué)生數(shù)據(jù)挖掘出來(lái)的結(jié)果:獲 獎(jiǎng) => 就業(yè)、升學(xué) 30% 91%中的數(shù)據(jù)值91%,這說(shuō)明了獲獎(jiǎng)的同學(xué)更受用人單位的歡迎,因此輔導(dǎo)員可以鼓勵(lì)更多的學(xué)生多參加一些校級(jí)、省級(jí)或國(guó)家級(jí)的信息技術(shù)大賽,多參加一些活動(dòng),讓更多的學(xué)生獲得獎(jiǎng)項(xiàng),以增強(qiáng)他們的就業(yè)能力,當(dāng)然這些需要他們努力學(xué)習(xí),掌握相應(yīng)的技能才行.
通過(guò)以上的預(yù)測(cè)結(jié)果來(lái)看,雖然這個(gè)準(zhǔn)確率并不能使人完全滿(mǎn)意,但是綜觀我國(guó)高職院校的研究現(xiàn)狀,這個(gè)準(zhǔn)確率相對(duì)來(lái)說(shuō)還是比較可靠的,這說(shuō)明預(yù)測(cè)效果具有一定的可信度,可以作為高職院校教學(xué)和就業(yè)管理工作改革的參考.
本文分析了數(shù)據(jù)挖掘之中經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法Apriori算法的優(yōu)缺點(diǎn),并對(duì)其進(jìn)行了優(yōu)化,利用實(shí)驗(yàn)驗(yàn)證了該算法優(yōu)化前與優(yōu)化后在效率上的提高,并依此建立了適用于高職院校學(xué)生就業(yè)的數(shù)據(jù)挖掘模型.利用優(yōu)化的Apriori算法實(shí)現(xiàn)了高職院校學(xué)生信息分析系統(tǒng),同時(shí)選用我校護(hù)理專(zhuān)業(yè)的畢業(yè)生信息進(jìn)行了關(guān)聯(lián)規(guī)則挖掘,并利用實(shí)際就業(yè)情況進(jìn)行了預(yù)測(cè)驗(yàn)證,說(shuō)明了預(yù)測(cè)效果具有一定的可信度.這些證明了學(xué)生信息可以被挖掘并進(jìn)行應(yīng)用,但在選擇關(guān)聯(lián)規(guī)則挖掘算法和應(yīng)用數(shù)據(jù)庫(kù)的規(guī)模方面還有待于進(jìn)一步的改善.
[1]況莉莉.關(guān)聯(lián)規(guī)則在高校圖書(shū)館讀者數(shù)據(jù)處理中的應(yīng)用研究[D].合肥:合肥工業(yè)大學(xué)碩士學(xué)位論文,2010.
[2]張婭妮.數(shù)據(jù)挖掘技術(shù)在就業(yè)指導(dǎo)中的應(yīng)用研究[J].淮海工學(xué)院學(xué)報(bào):自然科學(xué)版,2013,(2):32-34.
[3]宋麗萍.關(guān)聯(lián)規(guī)則挖掘在圖書(shū)館生態(tài)化建設(shè)中的應(yīng)用[J].阜陽(yáng)職業(yè)技術(shù)學(xué)院學(xué)報(bào),2014,(2):26-27.
[4]王偉.關(guān)聯(lián)規(guī)則中的Aprioir算法的研究與改進(jìn)[D].青島:中國(guó)海洋大學(xué)碩士學(xué)位論文,2012.
[5]麥丞程.基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)「J].電腦編程技巧與應(yīng)用,2015,(11):33-35.
[6]齊金鵬.數(shù)據(jù)挖掘模型可視化研究與其應(yīng)用實(shí)例[D].吉林:吉林大學(xué)碩士學(xué)位論文,2004.
[7]劉木林,朱慶華.基于Hadoop的關(guān)聯(lián)規(guī)則挖掘算法研究——以Apriori算法為例[J].計(jì)算機(jī)技術(shù)與發(fā)展,2016,(7):2-5.
[8]陳海宇,郭曉偉.?dāng)?shù)據(jù)挖掘在高職院校就業(yè)指導(dǎo)中的應(yīng)用研究[J].湖南工程學(xué)院學(xué)報(bào):自然科學(xué)版,2011,(2):56-59.
(責(zé)任編校:晴川)
Design and Realization of Student Data Analysis System Based on Association Rule Mining Technology
SONG Liping, WEI Jianguo
(College of Engineering Science and Technology, Fuyang Vocational and Technical College,Fuyang Anhui 236000, China)
The development of data mining technology makes good use of large-scale data accumulated in colleges and universities. There are many research directions in the field of data mining, one of which is association rule mining. This paper analyzes and optimizes the Apriori algorithm, an algorithm of association rule mining, and compares the performances of the optimized Apriori algorithm with the orginal algorithm, which proves the efficiency of optimized Apriori algorithm. Based on the web technology and SQL Server 2005, the paper designs and realizes a system of association rule mining, which adopts the optimized Apriori algorithm and can achieve the functions of data import,data pre-processing, data mining and so on.
data mining; association rule; Apriori algorithm; system
2016-12-19
安徽省高校自然科學(xué)研究重點(diǎn)項(xiàng)目“關(guān)聯(lián)規(guī)則在高職學(xué)生就業(yè)數(shù)據(jù)處理中的應(yīng)用研究”(批準(zhǔn)號(hào):KJ2016A561);安徽省高校自然科學(xué)研究重點(diǎn)項(xiàng)目“校園網(wǎng)絡(luò)安全過(guò)濾關(guān)鍵算法研究”(批準(zhǔn)號(hào):KJ2016A563);安徽省高校人文社會(huì)科學(xué)重點(diǎn)研究項(xiàng)目(批準(zhǔn)號(hào):SK2016A0688)階段性成果.
宋麗萍(1984— ),女,安徽阜陽(yáng)人,阜陽(yáng)職業(yè)技術(shù)學(xué)院工程科技學(xué)院講師,碩士.研究方向:數(shù)據(jù)挖掘.
TP391
A
1008-4681(2017)02-0058-04