繆廣寒
摘 要 關(guān)聯(lián)算法是實現(xiàn)學(xué)習(xí)系統(tǒng)的個性化、自主化的有效工具,利用Apriori算法我們可以在學(xué)習(xí)系統(tǒng)中尋找到學(xué)生的學(xué)習(xí)規(guī)律,進而實現(xiàn)個性化的學(xué)習(xí)推薦,是為個性化學(xué)習(xí)系統(tǒng)不可取少的功能模塊。
關(guān)鍵詞 Apriori算法;個性化學(xué)習(xí)系統(tǒng);AprioriTid算法;數(shù)據(jù)挖掘
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-7597(2014)05-0047-02
目前,眾多的學(xué)習(xí)系統(tǒng)大多類似,主要表現(xiàn)在:通用型較多,有專業(yè)特色的開發(fā)者少;理論類多,實踐類少;大眾類多,個性化少。而對于目前的個性化系統(tǒng)來說,由于缺乏一個可以量化的個性化的標(biāo)準(zhǔn),所以在具體實現(xiàn)上很難真正的實現(xiàn)個性化學(xué)習(xí),即在內(nèi)容上、模塊上、結(jié)構(gòu)上很難有較為系統(tǒng)、全面、高質(zhì)量的系統(tǒng)出現(xiàn)。同時,人們的網(wǎng)絡(luò)學(xué)習(xí)已經(jīng)不再滿足于傳統(tǒng)書本的電子化。交互性、自主性、個性、多元化等各種學(xué)習(xí)特征急需實現(xiàn)。因此,許多教育學(xué)者協(xié)同學(xué)習(xí)系統(tǒng)開發(fā)者們都不斷投入到個性化學(xué)習(xí)系統(tǒng)中的個性化的開發(fā)建設(shè)中去,希望能在技術(shù)層面解決個性化需求與海量學(xué)習(xí)資源之間的矛盾,實時給網(wǎng)絡(luò)學(xué)習(xí)者個性化的學(xué)習(xí)指導(dǎo),實現(xiàn)真正的因材施教。
基于上述問題的解決,本文構(gòu)建設(shè)計了一個課外體育的個性化學(xué)習(xí)系統(tǒng),并利用數(shù)據(jù)挖掘技術(shù)中Apriori算法來改進當(dāng)前的個性化學(xué)習(xí)系統(tǒng)的學(xué)習(xí)模式,對每一個網(wǎng)絡(luò)學(xué)習(xí)者提供個性化的學(xué)習(xí)進程。
1 個性化學(xué)習(xí)系統(tǒng)及其技術(shù)支持
個性化學(xué)習(xí)是指根據(jù)學(xué)習(xí)者的個性特征實施教育活動,充分發(fā)揮學(xué)習(xí)者的主動性,促進學(xué)生全面、自由、協(xié)調(diào)的發(fā)展,從而進一步發(fā)展學(xué)生的個性和潛能激發(fā)。個性化學(xué)習(xí)是一種創(chuàng)造性、實踐性和探索性的學(xué)習(xí)方式,它的根本目標(biāo)是讓每個學(xué)生獲得個性發(fā)展,實現(xiàn)個性化學(xué)習(xí)的關(guān)鍵主要是看個性化系統(tǒng)能否適應(yīng)學(xué)生的個性化差異,其中包括學(xué)生的學(xué)習(xí)能力的差異、學(xué)習(xí)興趣的差異、學(xué)習(xí)適應(yīng)性差異和學(xué)習(xí)經(jīng)驗差異。
為了滿足學(xué)習(xí)者個性化、自主式學(xué)習(xí)要求,網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)平臺也在不斷的發(fā)展改進,以各種技術(shù)支撐的學(xué)習(xí)系統(tǒng)應(yīng)運而生,如自適應(yīng)學(xué)習(xí)系統(tǒng)、課程點播系統(tǒng)系統(tǒng)、課程視頻會議等,還有以建設(shè)個性化學(xué)習(xí)環(huán)境為主的WEB2.0技術(shù),RSS聚合技術(shù)、Ajax技術(shù)、Ontology本體檢索技術(shù)、數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)庫技術(shù)等應(yīng)運而生??梢哉f從國家到學(xué)校,各種相關(guān)研究和投入已經(jīng)多有嘗試,頗具規(guī)模。
要實現(xiàn)學(xué)習(xí)系統(tǒng)個性關(guān)鍵在于從信息資源的海洋中得到關(guān)于學(xué)習(xí)者對系統(tǒng)資源使用模式的相關(guān)知識,并進一步結(jié)合這些知識根據(jù)學(xué)習(xí)者的個人興趣特征實現(xiàn)對學(xué)習(xí)者的個性化推薦,提供相應(yīng)資源。目前這些功能的實現(xiàn)主要采用數(shù)據(jù)挖掘技術(shù)來實現(xiàn)。其中,關(guān)聯(lián)規(guī)則就是數(shù)據(jù)挖掘技術(shù)中的一個重要分析模式。
1.1 關(guān)聯(lián)規(guī)則
數(shù)據(jù)關(guān)聯(lián)是指數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。如果兩個或多個變量的取值之間存在某種規(guī)律性,就可稱之為關(guān)聯(lián)。數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則實在滿足一定支持度和置信度算法的同時在事務(wù)數(shù)據(jù)庫數(shù)量龐大的關(guān)聯(lián)規(guī)則中找到強規(guī)則。Apriori算法是一個典型的關(guān)聯(lián)規(guī)則算法 ,也稱廣度優(yōu)先算法。是R Agrawal和R Srikant 于1994年提出的。
1.2 Apriori算法
Apriori算法的基本思想是:1)找出所有的頻集,這些項集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣;2)從頻繁項集發(fā)現(xiàn)強關(guān)聯(lián)規(guī)則。從一開始找到的頻繁項集的規(guī)則中找出只包含集合的項的所有規(guī)則。掃描項集,使用遞歸的方法找出所有頻繁項集,為了生成所有頻集,使用了遞歸的方法。具體算法偽代碼如下:
Input:數(shù)據(jù)庫D;最小支持度MinSuport_count。
Output:數(shù)據(jù)庫D中的頻繁項集I。
Begin
a、獲得所有支持度不小于 MinSupport的1-項目集
Im=large1-Itemsets;
b、找出數(shù)據(jù)庫D 中所有的頻繁項集I
FOR(k=2;Ik-1≠Ф;k++)DO
Ck=apriori_gen(Ik-1);
FOR 所有transactions l ∈D DO
Ct=subset(CK,t);
FOR 所有候選 c∈Ct DO
c.count++
END
END
Ik={ c ∈Ck|c.count≥MinSuport_count}
END
I=∪Ik
End
其中,apriori_gen(Ik-1)算法按照上一次迭代發(fā)現(xiàn)新的候選項集,分為鏈接和修剪兩個部分。具體描述如下:
1.2.1 鏈接
Begin
FOR 所有項目集 p∈Lk-1 DO
FOR 所有項目集 q∈Lk-1 DO
IF p.item1=q.item1,p.item2=q.item2…p.itemk-2=
q.itemk-2, p.itemk-1=q.itemk-1, THEN {
C=p∪q; //鏈接,產(chǎn)生候選集
IF has_infrequent_subset(c,Ik-1) THEN
Delete c; // 修剪。去掉無用候選項
ELSE add c to Ck}
Return Ck
End
1.2.2 修剪
在上述算法中,語句“IF has_infrequent_subset(c,Lk-1) THEN刪除”是判斷c 是否需要加入到 k-候選集中,不需要就修剪掉。endprint
Begin
FOR each (k-1)-subsets of c DO
IF S ? Ik-1 THEN
Return true;
Return False;
END
End
2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則
關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績分析上,如知識點與測試成績之間函數(shù)關(guān)系。通過對籃球課程的活動記錄與相應(yīng)的測試成績的數(shù)據(jù)分析,我們可以找到一些對今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。
2.1 整理數(shù)據(jù)
學(xué)生的學(xué)習(xí)記錄庫中記錄了學(xué)生的個人信息與基本學(xué)習(xí)過程信息。如學(xué)生姓名、學(xué)號、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時間、學(xué)習(xí)路徑、測試成績等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫。
2.2 生成事物數(shù)據(jù)庫選擇自主學(xué)習(xí)內(nèi)容,以代碼代替
2.3 生成頻繁項集
通過以上的對應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項集。
2.4 關(guān)聯(lián)規(guī)則生成
在Apriori算法中,對于每一個頻繁k-項集都要找出其中所有可能的真子集,計算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗證一個項子集都要重新掃描一遍Ik-1。在對某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運球技能與防守戰(zhàn)術(shù)同時成績優(yōu)秀,則發(fā)現(xiàn)的該生在實踐活動中的投籃技能成績也一般為優(yōu)秀。通過該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個性化學(xué)習(xí)方案。
3 多項目集的Apriori算法改進
我們發(fā)現(xiàn),由于Apriori算法對數(shù)據(jù)庫的掃描次數(shù)過多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時,系統(tǒng)I/O負(fù)載會變大,每次掃描數(shù)據(jù)庫的時間就會越長。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識節(jié)點太多而導(dǎo)致分析的頻繁項集個數(shù)太多會產(chǎn)生大量的侯選項集。這會導(dǎo)致運算時間顯著增加。所以根據(jù)不同的課程,我們可以改進Apriori算法,采用減低候選項目數(shù)量的方法,我們稱之為AprioriTid。此算法無需此次掃描數(shù)據(jù)庫,當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫之后,第二次只需要掃描前一次產(chǎn)生的項目集而不再需要完全的掃描數(shù)據(jù)庫,這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運算時間。
具體改進為在事務(wù)集TID中。當(dāng)k=1時,C1掃描數(shù)據(jù)庫D,C1=數(shù)據(jù)庫D,但當(dāng)k>1時,有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。
此外,我們還可以在AprioriTid的基礎(chǔ)上通過把項目集中一些無關(guān)的屬性先去掉以及通過把兩個元素結(jié)合在一起組成一個新屬性的辦法來減少工作量,又或者在產(chǎn)生頻繁k-項集以后去掉一些非頻繁項集來簡化掃描時間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。
4 現(xiàn)存的問題與思考
利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動態(tài),進而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點。但是在分布式計算與學(xué)習(xí)增量的情況下,我們不得不需要進一步地改進算法,以適合當(dāng)前及未來的個性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢。
參考文獻(xiàn)
[1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)研究[D].揚州:揚州大學(xué),2009.
[2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報,2005(12).
[3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(自然科學(xué)版),2005(10).
[4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.
[5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.
[6]王志強.基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint
Begin
FOR each (k-1)-subsets of c DO
IF S ? Ik-1 THEN
Return true;
Return False;
END
End
2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則
關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績分析上,如知識點與測試成績之間函數(shù)關(guān)系。通過對籃球課程的活動記錄與相應(yīng)的測試成績的數(shù)據(jù)分析,我們可以找到一些對今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。
2.1 整理數(shù)據(jù)
學(xué)生的學(xué)習(xí)記錄庫中記錄了學(xué)生的個人信息與基本學(xué)習(xí)過程信息。如學(xué)生姓名、學(xué)號、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時間、學(xué)習(xí)路徑、測試成績等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫。
2.2 生成事物數(shù)據(jù)庫選擇自主學(xué)習(xí)內(nèi)容,以代碼代替
2.3 生成頻繁項集
通過以上的對應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項集。
2.4 關(guān)聯(lián)規(guī)則生成
在Apriori算法中,對于每一個頻繁k-項集都要找出其中所有可能的真子集,計算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗證一個項子集都要重新掃描一遍Ik-1。在對某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運球技能與防守戰(zhàn)術(shù)同時成績優(yōu)秀,則發(fā)現(xiàn)的該生在實踐活動中的投籃技能成績也一般為優(yōu)秀。通過該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個性化學(xué)習(xí)方案。
3 多項目集的Apriori算法改進
我們發(fā)現(xiàn),由于Apriori算法對數(shù)據(jù)庫的掃描次數(shù)過多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時,系統(tǒng)I/O負(fù)載會變大,每次掃描數(shù)據(jù)庫的時間就會越長。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識節(jié)點太多而導(dǎo)致分析的頻繁項集個數(shù)太多會產(chǎn)生大量的侯選項集。這會導(dǎo)致運算時間顯著增加。所以根據(jù)不同的課程,我們可以改進Apriori算法,采用減低候選項目數(shù)量的方法,我們稱之為AprioriTid。此算法無需此次掃描數(shù)據(jù)庫,當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫之后,第二次只需要掃描前一次產(chǎn)生的項目集而不再需要完全的掃描數(shù)據(jù)庫,這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運算時間。
具體改進為在事務(wù)集TID中。當(dāng)k=1時,C1掃描數(shù)據(jù)庫D,C1=數(shù)據(jù)庫D,但當(dāng)k>1時,有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。
此外,我們還可以在AprioriTid的基礎(chǔ)上通過把項目集中一些無關(guān)的屬性先去掉以及通過把兩個元素結(jié)合在一起組成一個新屬性的辦法來減少工作量,又或者在產(chǎn)生頻繁k-項集以后去掉一些非頻繁項集來簡化掃描時間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。
4 現(xiàn)存的問題與思考
利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動態(tài),進而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點。但是在分布式計算與學(xué)習(xí)增量的情況下,我們不得不需要進一步地改進算法,以適合當(dāng)前及未來的個性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢。
參考文獻(xiàn)
[1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)研究[D].揚州:揚州大學(xué),2009.
[2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報,2005(12).
[3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(自然科學(xué)版),2005(10).
[4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.
[5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.
[6]王志強.基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint
Begin
FOR each (k-1)-subsets of c DO
IF S ? Ik-1 THEN
Return true;
Return False;
END
End
2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則
關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績分析上,如知識點與測試成績之間函數(shù)關(guān)系。通過對籃球課程的活動記錄與相應(yīng)的測試成績的數(shù)據(jù)分析,我們可以找到一些對今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。
2.1 整理數(shù)據(jù)
學(xué)生的學(xué)習(xí)記錄庫中記錄了學(xué)生的個人信息與基本學(xué)習(xí)過程信息。如學(xué)生姓名、學(xué)號、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時間、學(xué)習(xí)路徑、測試成績等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫。
2.2 生成事物數(shù)據(jù)庫選擇自主學(xué)習(xí)內(nèi)容,以代碼代替
2.3 生成頻繁項集
通過以上的對應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項集。
2.4 關(guān)聯(lián)規(guī)則生成
在Apriori算法中,對于每一個頻繁k-項集都要找出其中所有可能的真子集,計算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗證一個項子集都要重新掃描一遍Ik-1。在對某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運球技能與防守戰(zhàn)術(shù)同時成績優(yōu)秀,則發(fā)現(xiàn)的該生在實踐活動中的投籃技能成績也一般為優(yōu)秀。通過該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個性化學(xué)習(xí)方案。
3 多項目集的Apriori算法改進
我們發(fā)現(xiàn),由于Apriori算法對數(shù)據(jù)庫的掃描次數(shù)過多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時,系統(tǒng)I/O負(fù)載會變大,每次掃描數(shù)據(jù)庫的時間就會越長。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識節(jié)點太多而導(dǎo)致分析的頻繁項集個數(shù)太多會產(chǎn)生大量的侯選項集。這會導(dǎo)致運算時間顯著增加。所以根據(jù)不同的課程,我們可以改進Apriori算法,采用減低候選項目數(shù)量的方法,我們稱之為AprioriTid。此算法無需此次掃描數(shù)據(jù)庫,當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫之后,第二次只需要掃描前一次產(chǎn)生的項目集而不再需要完全的掃描數(shù)據(jù)庫,這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運算時間。
具體改進為在事務(wù)集TID中。當(dāng)k=1時,C1掃描數(shù)據(jù)庫D,C1=數(shù)據(jù)庫D,但當(dāng)k>1時,有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。
此外,我們還可以在AprioriTid的基礎(chǔ)上通過把項目集中一些無關(guān)的屬性先去掉以及通過把兩個元素結(jié)合在一起組成一個新屬性的辦法來減少工作量,又或者在產(chǎn)生頻繁k-項集以后去掉一些非頻繁項集來簡化掃描時間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。
4 現(xiàn)存的問題與思考
利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動態(tài),進而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點。但是在分布式計算與學(xué)習(xí)增量的情況下,我們不得不需要進一步地改進算法,以適合當(dāng)前及未來的個性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢。
參考文獻(xiàn)
[1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)研究[D].揚州:揚州大學(xué),2009.
[2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報,2005(12).
[3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(自然科學(xué)版),2005(10).
[4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.
[5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.
[6]王志強.基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint