姚家麟 譚召 于松楠 鞠茵茵 劉素娟
摘要:隨著互聯(lián)網(wǎng)技術(shù)在教育領(lǐng)域應(yīng)用得越來(lái)越成熟,各類(lèi)型的網(wǎng)絡(luò)教學(xué)平臺(tái)與測(cè)試系統(tǒng)層出不窮。無(wú)論是各個(gè)高校的網(wǎng)絡(luò)授課系統(tǒng),還是包含各類(lèi)行業(yè)實(shí)際案例課程的網(wǎng)課平臺(tái),都為當(dāng)代學(xué)習(xí)者與授課方提供了極大的便利。在各類(lèi)教學(xué)平臺(tái)中,均有大量的數(shù)據(jù)產(chǎn)出,對(duì)這些在線(xiàn)學(xué)習(xí)過(guò)程中產(chǎn)生的大量數(shù)據(jù)進(jìn)行挖掘,可以有效地對(duì)學(xué)習(xí)者的學(xué)習(xí)行為模式提出建議與優(yōu)化,同時(shí),可以給授課方精準(zhǔn)的授課效果分析,幫助授課方改進(jìn)授課方針。在由大量用戶(hù)組成的學(xué)習(xí)社區(qū)生態(tài)下,通過(guò)多維度數(shù)據(jù)挖掘,可以對(duì)不同用戶(hù)給出精準(zhǔn)的課業(yè)投放,大大提高用戶(hù)的學(xué)習(xí)體驗(yàn)。
關(guān)鍵詞:學(xué)習(xí)行為分析;K均值聚類(lèi);樸素貝葉斯分類(lèi)器;數(shù)據(jù)挖掘;數(shù)據(jù)可視化;在線(xiàn)學(xué)習(xí)
中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)11-0017-03
1 引言
在線(xiàn)學(xué)習(xí)與傳統(tǒng)學(xué)習(xí)方式相比,為學(xué)習(xí)者提供豐富的學(xué)習(xí)資源和書(shū)籍無(wú)法比擬的信息環(huán)境,能滿(mǎn)足學(xué)習(xí)者個(gè)性化學(xué)習(xí)的需求,為學(xué)習(xí)者提供更加自由的學(xué)習(xí)空間,學(xué)習(xí)者可以定制自己的學(xué)習(xí)方式,不斷提高學(xué)習(xí)效率,從而將被動(dòng)地接受變成主動(dòng)的學(xué)習(xí)[1-4]。
但是隨著在線(xiàn)教育的不斷發(fā)展,也面臨著巨大的挑戰(zhàn),特別是在學(xué)歷教育或者正式教育方面,主要問(wèn)題包括:
(1)教學(xué)的質(zhì)量與效果問(wèn)題;
(2)教學(xué)的個(gè)性化調(diào)整與適應(yīng)問(wèn)題;
(3)對(duì)學(xué)習(xí)的監(jiān)控、教育、評(píng)價(jià)問(wèn)題。
在大數(shù)據(jù)時(shí)代的背景下,各類(lèi)“互聯(lián)網(wǎng)+”產(chǎn)業(yè)紛紛致力于數(shù)據(jù)挖掘的研發(fā)與應(yīng)用,“云計(jì)算”與“人工智能”漸漸成為高頻詞,而“互聯(lián)網(wǎng)+”教育的相關(guān)產(chǎn)業(yè)中,針對(duì)上述三個(gè)主要問(wèn)題,數(shù)據(jù)挖掘也同樣值得探索與開(kāi)發(fā)。對(duì)于用戶(hù)在學(xué)習(xí)過(guò)程中產(chǎn)生的各類(lèi)數(shù)據(jù),通過(guò)科學(xué)的采集分析,能夠劃分學(xué)習(xí)者的類(lèi)型,學(xué)習(xí)行為模式的類(lèi)型,乃至學(xué)習(xí)效果的預(yù)測(cè),將此反饋給用戶(hù),能夠給予用戶(hù)更好的平臺(tái)使用體驗(yàn)并優(yōu)化改善學(xué)習(xí)方法,提高學(xué)習(xí)效率,同時(shí)對(duì)于授課方而言,這也是調(diào)節(jié)授課方針的雙向反饋[3-6]。
2 相關(guān)工作
2.1在線(xiàn)學(xué)習(xí)平臺(tái)研究現(xiàn)狀
當(dāng)代在線(xiàn)學(xué)習(xí)平臺(tái)以及網(wǎng)絡(luò)教學(xué)平臺(tái)層出不窮,其中MOOC(massive open online courses)慕課網(wǎng)更是業(yè)內(nèi)典范。將各行各業(yè)的各類(lèi)課程分布在不同的大類(lèi)小類(lèi)之下,以樹(shù)狀結(jié)構(gòu)的形式引導(dǎo)用戶(hù)選擇想要學(xué)習(xí)的課程。其理念與實(shí)踐得到了國(guó)內(nèi)外眾多大學(xué)的認(rèn)同,包括哈佛大學(xué)、麻省理工學(xué)院、斯坦福大學(xué)、北京大學(xué)、清華大學(xué)等,他們?cè)谀秸n網(wǎng)上免費(fèi)公開(kāi)自己的課程,供全球?qū)W習(xí)者進(jìn)行在線(xiàn)學(xué)習(xí)訪(fǎng)問(wèn),在這種網(wǎng)絡(luò)教學(xué)模式下,全球千萬(wàn)用戶(hù)得以收益[1-2]。并且,其證書(shū)體系也在平臺(tái)的發(fā)展中日益完備,對(duì)于不同課程的考核方針以及考核過(guò)程具有不同的處理策略,確保其證書(shū)的有效性與真實(shí)性。然而,對(duì)于網(wǎng)絡(luò)教學(xué)平臺(tái)而言,學(xué)習(xí)者的學(xué)習(xí)效果,更多地取決于學(xué)習(xí)者的學(xué)習(xí)動(dòng)機(jī),并且由于網(wǎng)絡(luò)教學(xué)的模式局限于對(duì)于資源的展示與訪(fǎng)問(wèn),更需要學(xué)習(xí)者極大的自主學(xué)習(xí)欲望和較為高效的學(xué)習(xí)方法,否則,面對(duì)優(yōu)質(zhì)的課程資源,可能最終的學(xué)習(xí)效果難以達(dá)到學(xué)習(xí)者的心理預(yù)期。并且,不僅僅局限于慕課網(wǎng),眾多的網(wǎng)絡(luò)教學(xué)平臺(tái)均存在著這個(gè)問(wèn)題,當(dāng)學(xué)習(xí)者的學(xué)習(xí)方法較差或?qū)W習(xí)動(dòng)機(jī)較弱,其學(xué)習(xí)效果相較于傳統(tǒng)課堂教學(xué)并不盡如人意。因此,對(duì)于在線(xiàn)學(xué)習(xí)或網(wǎng)絡(luò)教學(xué)平臺(tái)而言,通過(guò)數(shù)據(jù)挖掘算法合理的定制個(gè)性化學(xué)習(xí)方案顯得尤為重要。
2.2 K-means聚類(lèi)算法
3 學(xué)習(xí)平臺(tái)設(shè)計(jì)及在線(xiàn)行為分析
3.1學(xué)習(xí)平臺(tái)搭建設(shè)計(jì)
學(xué)習(xí)平臺(tái)采取Web應(yīng)用程序的形式,以Python作為后端語(yǔ)言,包含業(yè)務(wù)邏輯處理和數(shù)據(jù)挖掘部分,使用Django框架搭建,在服務(wù)器端采用Nginx+uWSGI部署,以解決Django框架本身單線(xiàn)程的問(wèn)題。數(shù)據(jù)庫(kù)部分因是測(cè)試平臺(tái),采用MySQL數(shù)據(jù)庫(kù)進(jìn)行全部數(shù)據(jù)的存儲(chǔ)。
平臺(tái)主要業(yè)務(wù)如下:
對(duì)于大部分用戶(hù)即學(xué)習(xí)者,平臺(tái)提供:在線(xiàn)學(xué)習(xí)、在線(xiàn)練習(xí)、在線(xiàn)測(cè)試、論壇系統(tǒng)、智能反饋等業(yè)務(wù)。
對(duì)于平臺(tái)的第二類(lèi)用戶(hù)即教學(xué)者,平臺(tái)提供:開(kāi)設(shè)課程、開(kāi)設(shè)教學(xué)班、發(fā)布作業(yè)練習(xí)、發(fā)布考試、發(fā)布教學(xué)資源、導(dǎo)入題目、論壇系統(tǒng)、智能反饋等業(yè)務(wù)。
3.2 數(shù)據(jù)采集
在進(jìn)行數(shù)據(jù)挖掘之前,數(shù)據(jù)采集是不可或缺的一步,無(wú)論是從關(guān)系型數(shù)據(jù)庫(kù)中直接讀取,還是從日志數(shù)據(jù)中篩選過(guò)濾,都是為后續(xù)的數(shù)據(jù)處理做準(zhǔn)備。結(jié)合現(xiàn)有文獻(xiàn)及資料,基于測(cè)試平臺(tái)的構(gòu)建設(shè)計(jì),共收集九類(lèi)特征數(shù)據(jù)。由于全部數(shù)據(jù)使用MySQL存儲(chǔ),對(duì)于日志數(shù)據(jù)庫(kù)的設(shè)計(jì)采取分類(lèi)分表的模式,操作日志、下載日志、搜索日志、錯(cuò)誤日志分表存儲(chǔ),包含請(qǐng)求內(nèi)參數(shù)、用戶(hù)信息、瀏覽器信息、操作路徑、時(shí)間戳等常規(guī)日志字段。
當(dāng)用戶(hù)進(jìn)行相關(guān)操作時(shí),請(qǐng)求中包含的參數(shù)信息,在業(yè)務(wù)模塊成功執(zhí)行后,帶著請(qǐng)求信息、參數(shù)信息、時(shí)間戳信息共同存儲(chǔ)至對(duì)應(yīng)表,如圖1所示,囊括頁(yè)面切換、資源訪(fǎng)問(wèn)、模擬練習(xí)等用戶(hù)操作,同時(shí)資源下載、站內(nèi)搜索等模塊也會(huì)被轉(zhuǎn)儲(chǔ)。平臺(tái)共涉及九類(lèi)特征數(shù)據(jù)的采集,主要方法采用從數(shù)據(jù)庫(kù)中篩選調(diào)取后,進(jìn)行一定統(tǒng)計(jì)轉(zhuǎn)儲(chǔ)為數(shù)據(jù)模型。
3.3 數(shù)據(jù)預(yù)處理
對(duì)于以上九類(lèi)數(shù)據(jù)模型,首先對(duì)缺失值進(jìn)行分析填補(bǔ),采用均值插補(bǔ)法進(jìn)行填充,確保全部數(shù)據(jù)模型的完整性,其次采取聚類(lèi)算法將連續(xù)型數(shù)據(jù)離散化,最后將處理完畢的數(shù)據(jù)重新轉(zhuǎn)儲(chǔ)成數(shù)據(jù)模型,以供進(jìn)一步處理。
預(yù)處理方法:
1)均值插補(bǔ)[7]:
由于平臺(tái)采集數(shù)據(jù)具有可度量性,因此使用該方法對(duì)缺失數(shù)據(jù)進(jìn)行填補(bǔ),通過(guò)計(jì)算某缺失值同類(lèi)元素有效值的均值,將其填補(bǔ)進(jìn)入空缺位置。
2)聚類(lèi)算法:
算法流程:
(1)擬定K值,即總簇類(lèi)數(shù)目;
(2)通過(guò)均值隨機(jī)數(shù)*數(shù)據(jù)樣本容量來(lái)擬定K個(gè)初始質(zhì)心位置;
(3)設(shè)置最大迭代次數(shù)N;
(4)對(duì)于數(shù)據(jù)集中剩余非質(zhì)心元素,測(cè)量其到各個(gè)質(zhì)心距離,并將其歸到最近質(zhì)心的類(lèi);
(5)更新已經(jīng)得到的各個(gè)類(lèi)的質(zhì)心;
(6)迭代(4)(5)兩步直至新的質(zhì)心與原質(zhì)心相等或達(dá)到最大迭代次數(shù);
(7)返回包含簇類(lèi)劃分的數(shù)據(jù)集。
在采集到的九類(lèi)數(shù)據(jù)模型中,在線(xiàn)時(shí)長(zhǎng)信息、論壇信息、資源信息、測(cè)評(píng)信息、搜索信息、在現(xiàn)時(shí)段信息均采用K均值聚類(lèi)算法進(jìn)行類(lèi)目劃分,而基礎(chǔ)信息則直接對(duì)不同信息進(jìn)行數(shù)字化處理,劃分類(lèi)目。頁(yè)面訪(fǎng)問(wèn)信息在進(jìn)行歸一化處理后,也使用K均值聚類(lèi)算法進(jìn)行類(lèi)目劃分。
3.4 數(shù)據(jù)挖掘?qū)W習(xí)行為分析
平臺(tái)采用樸素貝葉斯算法作為數(shù)據(jù)挖掘的主要算法。通過(guò)對(duì)數(shù)據(jù)預(yù)處理后的九類(lèi)特征數(shù)據(jù)集進(jìn)行先驗(yàn)概率與條件概率的計(jì)算建模,來(lái)進(jìn)行用戶(hù)的分類(lèi)。
在經(jīng)過(guò)K均值聚類(lèi)算法離散化后,原有包含連續(xù)型數(shù)據(jù)的九類(lèi)特征數(shù)據(jù)模型,全部轉(zhuǎn)化離散型數(shù)據(jù)模型,通過(guò)計(jì)算每一類(lèi)特征中每一簇類(lèi)出現(xiàn)的次數(shù),即可獲得九類(lèi)特征數(shù)據(jù)的先驗(yàn)概率,而通過(guò)計(jì)算在指定用戶(hù)類(lèi)別下的某類(lèi)特征數(shù)據(jù)中每一簇類(lèi)的出現(xiàn)次數(shù),即可獲得該類(lèi)特征數(shù)據(jù)在指定用戶(hù)類(lèi)別下的條件概率。通過(guò)對(duì)全部特征數(shù)據(jù)集的計(jì)算,完成樸素貝葉斯模型的建立。
樸素貝葉斯分類(lèi):
(1)設(shè)X={A1,A2,A3,…,Am}為一個(gè)待分類(lèi)項(xiàng),每個(gè)A為X的一個(gè)特征;
(2)有類(lèi)別集合Y={C1,C2,C3,…,Cn};
(3)分別計(jì)算P(C1|X),P(C2|X),P(C3|X),…,P(Cn|X);
(4)若P(Ck|X)=max{P(C1|X),P(C2|X),P(C3|X),…,P(Cn|X)},則X∈Ck。
平臺(tái)將成績(jī)數(shù)據(jù)作為打標(biāo)數(shù)據(jù),通過(guò)不同成績(jī)區(qū)段,將所有用戶(hù)區(qū)分為五類(lèi)用戶(hù),對(duì)于新用戶(hù)即新個(gè)體而言,在獲得足夠的數(shù)據(jù)以進(jìn)行K均值聚類(lèi)以后,即可通過(guò)其表現(xiàn)出的九類(lèi)特征數(shù)據(jù)來(lái)進(jìn)行用戶(hù)類(lèi)別的預(yù)測(cè)評(píng)估。
樸素貝葉斯算法中,對(duì)于概率的計(jì)算存在著獨(dú)立事件假設(shè),而在現(xiàn)實(shí)生活中往往不是如此。學(xué)生的各類(lèi)學(xué)習(xí)行為之間往往存在著關(guān)聯(lián)性,同時(shí),各類(lèi)數(shù)據(jù)對(duì)于學(xué)生學(xué)習(xí)效果的影響并不相同,因此,在不對(duì)樸素貝葉斯算法進(jìn)行改良的情況下,難以做出最為準(zhǔn)確的評(píng)估,并且由于學(xué)生學(xué)習(xí)行為關(guān)聯(lián)性的存在,在數(shù)據(jù)集較小的情況下,難以計(jì)算得出最準(zhǔn)確的樸素貝葉斯模型。因此,需要在計(jì)算的過(guò)程中,對(duì)樸素貝葉斯模型進(jìn)行加權(quán)處理,對(duì)于不同影響力的特征數(shù)據(jù)賦予不同的權(quán)重值,并且需要進(jìn)行較長(zhǎng)時(shí)間的樣本訓(xùn)練,才能提高模型的準(zhǔn)確率[12-14]。初始的權(quán)重值采用現(xiàn)有學(xué)習(xí)行為分析研究中的部分結(jié)論,后在真實(shí)數(shù)據(jù)的訓(xùn)練過(guò)程中,通過(guò)用戶(hù)反饋及預(yù)測(cè)準(zhǔn)確率雙向調(diào)節(jié)各類(lèi)數(shù)據(jù)權(quán)重值,以提高模型準(zhǔn)確率[1-4]。
4 實(shí)驗(yàn)及分析
在模擬數(shù)據(jù)試驗(yàn)中,對(duì)九類(lèi)特征數(shù)據(jù),模擬生成共計(jì)7380條數(shù)據(jù),通過(guò)參考現(xiàn)有文獻(xiàn)及資料,對(duì)不同特征采取不同概率分布,見(jiàn)表1。
將模擬數(shù)據(jù)經(jīng)數(shù)據(jù)可視化處理后,見(jiàn)圖2,此為在線(xiàn)時(shí)長(zhǎng)的柱狀圖,其x軸表示在線(xiàn)時(shí)長(zhǎng),y軸表示該單位在線(xiàn)時(shí)長(zhǎng)的人數(shù),顯而易見(jiàn)其符合N(36000,21000)的概率分布。
在聚類(lèi)測(cè)試中對(duì)不同數(shù)據(jù)源采用不同k值選取,經(jīng)手肘法測(cè)試后,生成的最佳k值,見(jiàn)表2。
將模擬數(shù)據(jù)經(jīng)數(shù)據(jù)可視化處理后,見(jiàn)圖3,此為在線(xiàn)時(shí)長(zhǎng)的聚類(lèi)質(zhì)心分布圖,由于是一維數(shù)據(jù),所以其x軸與y軸均為在線(xiàn)時(shí)長(zhǎng),三個(gè)質(zhì)心分別落在19000,40000,63000左右的位置,測(cè)試用算法并未設(shè)置最大迭代次數(shù),因此此為最佳質(zhì)心位置選取,圖4,此為聚類(lèi)效果圖,x軸表示劃分類(lèi)別,分別為0,1,2三類(lèi),y軸表示在線(xiàn)時(shí)長(zhǎng),結(jié)合圖2在線(xiàn)時(shí)長(zhǎng)統(tǒng)計(jì)圖觀測(cè),其聚類(lèi)效果良好,每個(gè)類(lèi)目人數(shù)分布合理。
在成績(jī)分段上,首先將成績(jī)百分化后,低于55分為一類(lèi),55-68為一類(lèi),68-79為一類(lèi),79-88為一類(lèi),高于88為一類(lèi),共計(jì)五類(lèi)。將九類(lèi)特征模擬數(shù)據(jù)中的前80%作為訓(xùn)練樣本,剩余20%作為測(cè)試樣本,測(cè)試樸素貝葉斯分類(lèi)器準(zhǔn)確率,最終于源數(shù)據(jù)類(lèi)別相符占62%,即在模擬數(shù)據(jù)實(shí)驗(yàn)中,該分類(lèi)器能達(dá)到62%的準(zhǔn)確率。
5 結(jié)論及展望
在網(wǎng)絡(luò)教學(xué)平臺(tái)中,K均值聚類(lèi)算法和樸素貝葉斯分類(lèi)器的使用具有可行性,但由于網(wǎng)絡(luò)教學(xué)平臺(tái)中能獲取的特征具有局限性,并且當(dāng)前算法并未對(duì)特征重要性進(jìn)行加權(quán)處理,且各特征之間有著不可忽視的關(guān)聯(lián)性,因此在模擬數(shù)據(jù)下,達(dá)到了62%的準(zhǔn)確率足以體現(xiàn)該分類(lèi)器在實(shí)際應(yīng)用中的可行性。當(dāng)從真實(shí)網(wǎng)絡(luò)教學(xué)環(huán)境中獲取到大量數(shù)據(jù)后,不僅僅能夠?qū)δP瓦M(jìn)行修正,同樣可以對(duì)算法進(jìn)行改良,優(yōu)化,這是為今后探索數(shù)據(jù)挖掘算法在網(wǎng)絡(luò)教學(xué)之中的應(yīng)用做準(zhǔn)備。對(duì)于該算法在在線(xiàn)學(xué)習(xí)平臺(tái)中的進(jìn)一步開(kāi)發(fā),可以從對(duì)數(shù)據(jù)的加權(quán)處理以及對(duì)更科學(xué)的特征值選取兩方面入手。隨著越來(lái)越多的用戶(hù)群體加入,優(yōu)質(zhì)的網(wǎng)絡(luò)教學(xué)也將被更多人接受認(rèn)可,網(wǎng)絡(luò)教學(xué)的意義與價(jià)值都將被放大,成熟的數(shù)據(jù)挖掘體系也將被建立。但在發(fā)展過(guò)程中,一定會(huì)存在著諸多問(wèn)題,一步步優(yōu)化改良是作為開(kāi)發(fā)者不可或缺的素質(zhì)。對(duì)于網(wǎng)絡(luò)教學(xué)平臺(tái)中用戶(hù)行為特征值選取,建立完備的預(yù)測(cè)體系與個(gè)性化推薦體系,深入了解用戶(hù)需求是接下來(lái)要面對(duì)的問(wèn)題也是主要研究方向,同時(shí),優(yōu)化“教”與“學(xué)”之間的雙向反饋也是極為重要的研究任務(wù)。
參考文獻(xiàn):
[1]蔣卓軒,張巖,李曉明.基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測(cè)[J].計(jì)算機(jī)研究與發(fā)展,2015,52(3):614-628.
[2]李曼麗,徐舜平,孫夢(mèng)嫽.MOOC學(xué)習(xí)者課程學(xué)習(xí)行為分析——以“電路原理”課程為例[J].開(kāi)放教育研究,2015,21(2):63-69.
[3]胡藝齡,顧小清,趙春.在線(xiàn)學(xué)習(xí)行為分析建模及挖掘[J].開(kāi)放教育研究,2014,20(2):102-110.
[4]柴艷妹,雷陳芳.基于數(shù)據(jù)挖掘技術(shù)的在線(xiàn)學(xué)習(xí)行為研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2018(5).
[5]劉瓊.在線(xiàn)學(xué)習(xí)系統(tǒng)的數(shù)據(jù)挖掘研究[D].武漢理工大學(xué),2010.
[6]徐鵬,王以寧,劉艷華,等.大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國(guó)《通過(guò)教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報(bào)告解讀及啟示[J].遠(yuǎn)程教育雜志,2013(6):11-17.
[7]金勇進(jìn).缺失數(shù)據(jù)的插補(bǔ)調(diào)整[J].數(shù)理統(tǒng)計(jì)與管理,2001,20(6):47-53.
[8]袁方,周志勇,宋鑫.初始聚類(lèi)中心優(yōu)化的k-means算法[J].計(jì)算機(jī)工程,2007,33(3):65-66.
[9]楊善林,李永森,胡笑旋,等.K-means算法中的k值優(yōu)化問(wèn)題研究[J].系統(tǒng)工程理論與實(shí)踐,2006,26(2):97-101.
[10]袁方,孟增輝,于戈.對(duì)k-means聚類(lèi)算法的改進(jìn)[J].計(jì)算機(jī)工程與應(yīng)用,2004,40(36):177-178.
[11]Hartigan J A,Wong M A.Algorithm AS 136:A K-Means Clustering Algorithm[J].Journal of the Royal Statistical Society,1979,28(1):100-108.
[12]程克非,張聰.基于特征加權(quán)的樸素貝葉斯分類(lèi)器[J].計(jì)算機(jī)仿真,2006,23(10):92-94.
[13]范金金,劉鵬.樸素貝葉斯分類(lèi)器的獨(dú)立性假設(shè)研究[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(34):139-141.
[14]趙文濤,孟令軍,趙好好,等.樸素貝葉斯算法的改進(jìn)與應(yīng)用[J].測(cè)控技術(shù),2016,35(2):143-147.
[15]秦鋒,任詩(shī)流,程澤凱,等.基于屬性加權(quán)的樸素貝葉斯分類(lèi)算法[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(6):107-109.
[16]余芳,姜云飛.一種基于樸素貝葉斯分類(lèi)的特征選擇方法[J].中山大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,43(5):118-120.
【通聯(lián)編輯:王力】