亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)聯(lián)規(guī)則Apriori算法在個性化學(xué)習(xí)系統(tǒng)中的應(yīng)用研究

        2014-04-21 10:05:47繆廣寒
        新媒體研究 2014年5期
        關(guān)鍵詞:項集數(shù)據(jù)挖掘關(guān)聯(lián)

        繆廣寒

        摘 要 關(guān)聯(lián)算法是實現(xiàn)學(xué)習(xí)系統(tǒng)的個性化、自主化的有效工具,利用Apriori算法我們可以在學(xué)習(xí)系統(tǒng)中尋找到學(xué)生的學(xué)習(xí)規(guī)律,進而實現(xiàn)個性化的學(xué)習(xí)推薦,是為個性化學(xué)習(xí)系統(tǒng)不可取少的功能模塊。

        關(guān)鍵詞 Apriori算法;個性化學(xué)習(xí)系統(tǒng);AprioriTid算法;數(shù)據(jù)挖掘

        中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-7597(2014)05-0047-02

        目前,眾多的學(xué)習(xí)系統(tǒng)大多類似,主要表現(xiàn)在:通用型較多,有專業(yè)特色的開發(fā)者少;理論類多,實踐類少;大眾類多,個性化少。而對于目前的個性化系統(tǒng)來說,由于缺乏一個可以量化的個性化的標(biāo)準(zhǔn),所以在具體實現(xiàn)上很難真正的實現(xiàn)個性化學(xué)習(xí),即在內(nèi)容上、模塊上、結(jié)構(gòu)上很難有較為系統(tǒng)、全面、高質(zhì)量的系統(tǒng)出現(xiàn)。同時,人們的網(wǎng)絡(luò)學(xué)習(xí)已經(jīng)不再滿足于傳統(tǒng)書本的電子化。交互性、自主性、個性、多元化等各種學(xué)習(xí)特征急需實現(xiàn)。因此,許多教育學(xué)者協(xié)同學(xué)習(xí)系統(tǒng)開發(fā)者們都不斷投入到個性化學(xué)習(xí)系統(tǒng)中的個性化的開發(fā)建設(shè)中去,希望能在技術(shù)層面解決個性化需求與海量學(xué)習(xí)資源之間的矛盾,實時給網(wǎng)絡(luò)學(xué)習(xí)者個性化的學(xué)習(xí)指導(dǎo),實現(xiàn)真正的因材施教。

        基于上述問題的解決,本文構(gòu)建設(shè)計了一個課外體育的個性化學(xué)習(xí)系統(tǒng),并利用數(shù)據(jù)挖掘技術(shù)中Apriori算法來改進當(dāng)前的個性化學(xué)習(xí)系統(tǒng)的學(xué)習(xí)模式,對每一個網(wǎng)絡(luò)學(xué)習(xí)者提供個性化的學(xué)習(xí)進程。

        1 個性化學(xué)習(xí)系統(tǒng)及其技術(shù)支持

        個性化學(xué)習(xí)是指根據(jù)學(xué)習(xí)者的個性特征實施教育活動,充分發(fā)揮學(xué)習(xí)者的主動性,促進學(xué)生全面、自由、協(xié)調(diào)的發(fā)展,從而進一步發(fā)展學(xué)生的個性和潛能激發(fā)。個性化學(xué)習(xí)是一種創(chuàng)造性、實踐性和探索性的學(xué)習(xí)方式,它的根本目標(biāo)是讓每個學(xué)生獲得個性發(fā)展,實現(xiàn)個性化學(xué)習(xí)的關(guān)鍵主要是看個性化系統(tǒng)能否適應(yīng)學(xué)生的個性化差異,其中包括學(xué)生的學(xué)習(xí)能力的差異、學(xué)習(xí)興趣的差異、學(xué)習(xí)適應(yīng)性差異和學(xué)習(xí)經(jīng)驗差異。

        為了滿足學(xué)習(xí)者個性化、自主式學(xué)習(xí)要求,網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)平臺也在不斷的發(fā)展改進,以各種技術(shù)支撐的學(xué)習(xí)系統(tǒng)應(yīng)運而生,如自適應(yīng)學(xué)習(xí)系統(tǒng)、課程點播系統(tǒng)系統(tǒng)、課程視頻會議等,還有以建設(shè)個性化學(xué)習(xí)環(huán)境為主的WEB2.0技術(shù),RSS聚合技術(shù)、Ajax技術(shù)、Ontology本體檢索技術(shù)、數(shù)據(jù)挖掘技術(shù)、數(shù)據(jù)庫技術(shù)等應(yīng)運而生??梢哉f從國家到學(xué)校,各種相關(guān)研究和投入已經(jīng)多有嘗試,頗具規(guī)模。

        要實現(xiàn)學(xué)習(xí)系統(tǒng)個性關(guān)鍵在于從信息資源的海洋中得到關(guān)于學(xué)習(xí)者對系統(tǒng)資源使用模式的相關(guān)知識,并進一步結(jié)合這些知識根據(jù)學(xué)習(xí)者的個人興趣特征實現(xiàn)對學(xué)習(xí)者的個性化推薦,提供相應(yīng)資源。目前這些功能的實現(xiàn)主要采用數(shù)據(jù)挖掘技術(shù)來實現(xiàn)。其中,關(guān)聯(lián)規(guī)則就是數(shù)據(jù)挖掘技術(shù)中的一個重要分析模式。

        1.1 關(guān)聯(lián)規(guī)則

        數(shù)據(jù)關(guān)聯(lián)是指數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。如果兩個或多個變量的取值之間存在某種規(guī)律性,就可稱之為關(guān)聯(lián)。數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則實在滿足一定支持度和置信度算法的同時在事務(wù)數(shù)據(jù)庫數(shù)量龐大的關(guān)聯(lián)規(guī)則中找到強規(guī)則。Apriori算法是一個典型的關(guān)聯(lián)規(guī)則算法 ,也稱廣度優(yōu)先算法。是R Agrawal和R Srikant 于1994年提出的。

        1.2 Apriori算法

        Apriori算法的基本思想是:1)找出所有的頻集,這些項集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣;2)從頻繁項集發(fā)現(xiàn)強關(guān)聯(lián)規(guī)則。從一開始找到的頻繁項集的規(guī)則中找出只包含集合的項的所有規(guī)則。掃描項集,使用遞歸的方法找出所有頻繁項集,為了生成所有頻集,使用了遞歸的方法。具體算法偽代碼如下:

        Input:數(shù)據(jù)庫D;最小支持度MinSuport_count。

        Output:數(shù)據(jù)庫D中的頻繁項集I。

        Begin

        a、獲得所有支持度不小于 MinSupport的1-項目集

        Im=large1-Itemsets;

        b、找出數(shù)據(jù)庫D 中所有的頻繁項集I

        FOR(k=2;Ik-1≠Ф;k++)DO

        Ck=apriori_gen(Ik-1);

        FOR 所有transactions l ∈D DO

        Ct=subset(CK,t);

        FOR 所有候選 c∈Ct DO

        c.count++

        END

        END

        Ik={ c ∈Ck|c.count≥MinSuport_count}

        END

        I=∪Ik

        End

        其中,apriori_gen(Ik-1)算法按照上一次迭代發(fā)現(xiàn)新的候選項集,分為鏈接和修剪兩個部分。具體描述如下:

        1.2.1 鏈接

        Begin

        FOR 所有項目集 p∈Lk-1 DO

        FOR 所有項目集 q∈Lk-1 DO

        IF p.item1=q.item1,p.item2=q.item2…p.itemk-2=

        q.itemk-2, p.itemk-1=q.itemk-1, THEN {

        C=p∪q; //鏈接,產(chǎn)生候選集

        IF has_infrequent_subset(c,Ik-1) THEN

        Delete c; // 修剪。去掉無用候選項

        ELSE add c to Ck}

        Return Ck

        End

        1.2.2 修剪

        在上述算法中,語句“IF has_infrequent_subset(c,Lk-1) THEN刪除”是判斷c 是否需要加入到 k-候選集中,不需要就修剪掉。endprint

        Begin

        FOR each (k-1)-subsets of c DO

        IF S ? Ik-1 THEN

        Return true;

        Return False;

        END

        End

        2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則

        關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績分析上,如知識點與測試成績之間函數(shù)關(guān)系。通過對籃球課程的活動記錄與相應(yīng)的測試成績的數(shù)據(jù)分析,我們可以找到一些對今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。

        2.1 整理數(shù)據(jù)

        學(xué)生的學(xué)習(xí)記錄庫中記錄了學(xué)生的個人信息與基本學(xué)習(xí)過程信息。如學(xué)生姓名、學(xué)號、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時間、學(xué)習(xí)路徑、測試成績等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫。

        2.2 生成事物數(shù)據(jù)庫選擇自主學(xué)習(xí)內(nèi)容,以代碼代替

        2.3 生成頻繁項集

        通過以上的對應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項集。

        2.4 關(guān)聯(lián)規(guī)則生成

        在Apriori算法中,對于每一個頻繁k-項集都要找出其中所有可能的真子集,計算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗證一個項子集都要重新掃描一遍Ik-1。在對某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運球技能與防守戰(zhàn)術(shù)同時成績優(yōu)秀,則發(fā)現(xiàn)的該生在實踐活動中的投籃技能成績也一般為優(yōu)秀。通過該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個性化學(xué)習(xí)方案。

        3 多項目集的Apriori算法改進

        我們發(fā)現(xiàn),由于Apriori算法對數(shù)據(jù)庫的掃描次數(shù)過多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時,系統(tǒng)I/O負(fù)載會變大,每次掃描數(shù)據(jù)庫的時間就會越長。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識節(jié)點太多而導(dǎo)致分析的頻繁項集個數(shù)太多會產(chǎn)生大量的侯選項集。這會導(dǎo)致運算時間顯著增加。所以根據(jù)不同的課程,我們可以改進Apriori算法,采用減低候選項目數(shù)量的方法,我們稱之為AprioriTid。此算法無需此次掃描數(shù)據(jù)庫,當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫之后,第二次只需要掃描前一次產(chǎn)生的項目集而不再需要完全的掃描數(shù)據(jù)庫,這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運算時間。

        具體改進為在事務(wù)集TID中。當(dāng)k=1時,C1掃描數(shù)據(jù)庫D,C1=數(shù)據(jù)庫D,但當(dāng)k>1時,有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。

        此外,我們還可以在AprioriTid的基礎(chǔ)上通過把項目集中一些無關(guān)的屬性先去掉以及通過把兩個元素結(jié)合在一起組成一個新屬性的辦法來減少工作量,又或者在產(chǎn)生頻繁k-項集以后去掉一些非頻繁項集來簡化掃描時間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。

        4 現(xiàn)存的問題與思考

        利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動態(tài),進而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點。但是在分布式計算與學(xué)習(xí)增量的情況下,我們不得不需要進一步地改進算法,以適合當(dāng)前及未來的個性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢。

        參考文獻(xiàn)

        [1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)研究[D].揚州:揚州大學(xué),2009.

        [2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報,2005(12).

        [3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(自然科學(xué)版),2005(10).

        [4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.

        [5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.

        [6]王志強.基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint

        Begin

        FOR each (k-1)-subsets of c DO

        IF S ? Ik-1 THEN

        Return true;

        Return False;

        END

        End

        2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則

        關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績分析上,如知識點與測試成績之間函數(shù)關(guān)系。通過對籃球課程的活動記錄與相應(yīng)的測試成績的數(shù)據(jù)分析,我們可以找到一些對今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。

        2.1 整理數(shù)據(jù)

        學(xué)生的學(xué)習(xí)記錄庫中記錄了學(xué)生的個人信息與基本學(xué)習(xí)過程信息。如學(xué)生姓名、學(xué)號、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時間、學(xué)習(xí)路徑、測試成績等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫。

        2.2 生成事物數(shù)據(jù)庫選擇自主學(xué)習(xí)內(nèi)容,以代碼代替

        2.3 生成頻繁項集

        通過以上的對應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項集。

        2.4 關(guān)聯(lián)規(guī)則生成

        在Apriori算法中,對于每一個頻繁k-項集都要找出其中所有可能的真子集,計算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗證一個項子集都要重新掃描一遍Ik-1。在對某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運球技能與防守戰(zhàn)術(shù)同時成績優(yōu)秀,則發(fā)現(xiàn)的該生在實踐活動中的投籃技能成績也一般為優(yōu)秀。通過該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個性化學(xué)習(xí)方案。

        3 多項目集的Apriori算法改進

        我們發(fā)現(xiàn),由于Apriori算法對數(shù)據(jù)庫的掃描次數(shù)過多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時,系統(tǒng)I/O負(fù)載會變大,每次掃描數(shù)據(jù)庫的時間就會越長。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識節(jié)點太多而導(dǎo)致分析的頻繁項集個數(shù)太多會產(chǎn)生大量的侯選項集。這會導(dǎo)致運算時間顯著增加。所以根據(jù)不同的課程,我們可以改進Apriori算法,采用減低候選項目數(shù)量的方法,我們稱之為AprioriTid。此算法無需此次掃描數(shù)據(jù)庫,當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫之后,第二次只需要掃描前一次產(chǎn)生的項目集而不再需要完全的掃描數(shù)據(jù)庫,這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運算時間。

        具體改進為在事務(wù)集TID中。當(dāng)k=1時,C1掃描數(shù)據(jù)庫D,C1=數(shù)據(jù)庫D,但當(dāng)k>1時,有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。

        此外,我們還可以在AprioriTid的基礎(chǔ)上通過把項目集中一些無關(guān)的屬性先去掉以及通過把兩個元素結(jié)合在一起組成一個新屬性的辦法來減少工作量,又或者在產(chǎn)生頻繁k-項集以后去掉一些非頻繁項集來簡化掃描時間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。

        4 現(xiàn)存的問題與思考

        利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動態(tài),進而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點。但是在分布式計算與學(xué)習(xí)增量的情況下,我們不得不需要進一步地改進算法,以適合當(dāng)前及未來的個性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢。

        參考文獻(xiàn)

        [1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)研究[D].揚州:揚州大學(xué),2009.

        [2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報,2005(12).

        [3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(自然科學(xué)版),2005(10).

        [4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.

        [5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.

        [6]王志強.基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint

        Begin

        FOR each (k-1)-subsets of c DO

        IF S ? Ik-1 THEN

        Return true;

        Return False;

        END

        End

        2 使用Apriori 算法獲得學(xué)習(xí)者的學(xué)習(xí)規(guī)則

        關(guān)聯(lián)規(guī)則挖掘算法可以應(yīng)用在學(xué)生的成績分析上,如知識點與測試成績之間函數(shù)關(guān)系。通過對籃球課程的活動記錄與相應(yīng)的測試成績的數(shù)據(jù)分析,我們可以找到一些對今后指導(dǎo)學(xué)生課外學(xué)習(xí)的有用規(guī)律。其具體流程如下。

        2.1 整理數(shù)據(jù)

        學(xué)生的學(xué)習(xí)記錄庫中記錄了學(xué)生的個人信息與基本學(xué)習(xí)過程信息。如學(xué)生姓名、學(xué)號、學(xué)習(xí)風(fēng)格、學(xué)習(xí)時間、學(xué)習(xí)路徑、測試成績等內(nèi)容。整理數(shù)據(jù)的目的是為了使學(xué)生的數(shù)據(jù)記錄等符合Apriori算法所需的項目集開展數(shù)據(jù)挖掘,首先需要將關(guān)系表轉(zhuǎn)換成相應(yīng)的事務(wù)數(shù)據(jù)庫。

        2.2 生成事物數(shù)據(jù)庫選擇自主學(xué)習(xí)內(nèi)容,以代碼代替

        2.3 生成頻繁項集

        通過以上的對應(yīng)抽象,我們可知事務(wù)集,假設(shè)最小支持度為25%,使用Apriori算法尋找D的所有頻繁項集。

        2.4 關(guān)聯(lián)規(guī)則生成

        在Apriori算法中,對于每一個頻繁k-項集都要找出其中所有可能的真子集,計算出相應(yīng)規(guī)則的置信度。當(dāng)我們發(fā)現(xiàn)某一規(guī)則的置信度大于設(shè)定的最小置信度就導(dǎo)出該規(guī)則。其中,每驗證一個項子集都要重新掃描一遍Ik-1。在對某學(xué)生的籃球?qū)W習(xí)記錄中分析,最小置信度閾值設(shè)置為75%則可以發(fā)現(xiàn)強規(guī)則I01∧I08→I03。此規(guī)則告訴我們發(fā)現(xiàn)如果某生的運球技能與防守戰(zhàn)術(shù)同時成績優(yōu)秀,則發(fā)現(xiàn)的該生在實踐活動中的投籃技能成績也一般為優(yōu)秀。通過該例,我們可以發(fā)現(xiàn)數(shù)據(jù)關(guān)聯(lián)算法可以發(fā)現(xiàn)學(xué)生學(xué)習(xí)中的一些隱藏的學(xué)習(xí)規(guī)律,而這些規(guī)律正好可供學(xué)習(xí)系統(tǒng)給學(xué)習(xí)者提供下一步個性化學(xué)習(xí)方案。

        3 多項目集的Apriori算法改進

        我們發(fā)現(xiàn),由于Apriori算法對數(shù)據(jù)庫的掃描次數(shù)過多,所以在有限的內(nèi)存容量下存放大量的事務(wù)數(shù)據(jù)時,系統(tǒng)I/O負(fù)載會變大,每次掃描數(shù)據(jù)庫的時間就會越長。此外,如果學(xué)習(xí)系統(tǒng)中某一課程的知識節(jié)點太多而導(dǎo)致分析的頻繁項集個數(shù)太多會產(chǎn)生大量的侯選項集。這會導(dǎo)致運算時間顯著增加。所以根據(jù)不同的課程,我們可以改進Apriori算法,采用減低候選項目數(shù)量的方法,我們稱之為AprioriTid。此算法無需此次掃描數(shù)據(jù)庫,當(dāng)?shù)谝淮螔呙钄?shù)據(jù)庫之后,第二次只需要掃描前一次產(chǎn)生的項目集而不再需要完全的掃描數(shù)據(jù)庫,這樣就可以有效的減少了I/O負(fù)載和數(shù)據(jù)運算時間。

        具體改進為在事務(wù)集TID中。當(dāng)k=1時,C1掃描數(shù)據(jù)庫D,C1=數(shù)據(jù)庫D,但當(dāng)k>1時,有算法產(chǎn)生Ck,Ck=apriori-gen(Lk-1)。

        此外,我們還可以在AprioriTid的基礎(chǔ)上通過把項目集中一些無關(guān)的屬性先去掉以及通過把兩個元素結(jié)合在一起組成一個新屬性的辦法來減少工作量,又或者在產(chǎn)生頻繁k-項集以后去掉一些非頻繁項集來簡化掃描時間。以上兩種方法的結(jié)合使用類似于矩陣中逐漸去掉行與列。

        4 現(xiàn)存的問題與思考

        利用Apriori算法與AprioriTid算法,我們可以有效的挖掘出個性化學(xué)習(xí)中學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動態(tài),進而更深入了了解學(xué)生的學(xué)習(xí)規(guī)律與特點。但是在分布式計算與學(xué)習(xí)增量的情況下,我們不得不需要進一步地改進算法,以適合當(dāng)前及未來的個性化學(xué)習(xí)系統(tǒng)發(fā)展的趨勢。

        參考文獻(xiàn)

        [1]劉美玲.基于數(shù)據(jù)挖掘技術(shù)的個性化學(xué)習(xí)系統(tǒng)研究[D].揚州:揚州大學(xué),2009.

        [2]盛立,高明,劉希玉.一種高效的關(guān)聯(lián)規(guī)則的算法研究[J].濱州學(xué)院學(xué)報,2005(12).

        [3]盛立,劉希玉,高明.數(shù)據(jù)關(guān)聯(lián)規(guī)則中AprioriTid[J].山東師范大學(xué)學(xué)報(自然科學(xué)版),2005(10).

        [4]李曼.Web日志挖掘技術(shù)在心靈家園網(wǎng)中的應(yīng)用研究[D].河南:河南大學(xué),2013.

        [5]何月順.關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D].江蘇:南京航空航天大學(xué),2010.

        [6]王志強.基于遠(yuǎn)程教育網(wǎng)站的信息采集與數(shù)據(jù)挖掘技術(shù)研究[D].上海:華東師范大學(xué),2007.endprint

        猜你喜歡
        項集數(shù)據(jù)挖掘關(guān)聯(lián)
        “苦”的關(guān)聯(lián)
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        奇趣搭配
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        一種頻繁核心項集的快速挖掘算法
        計算機工程(2014年6期)2014-02-28 01:26:12
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        語言學(xué)與修辭學(xué):關(guān)聯(lián)與互動
        欧美第一黄网免费网站| 国产精品一区二区韩国av| 一本色道久久亚洲加勒比| 女人高潮内射99精品| 国产真实夫妇交换视频| 亚洲国产成人手机在线电影| 久久国产精品一区二区| 久草中文在线这里只有精品| 日韩在线 | 中文| 成人免费777777被爆出| 亚洲国产中文在线二区三区免| 熟女系列丰满熟妇av| av毛片亚洲高清一区二区| 久久久久久夜精品精品免费啦| 孕妇特级毛片ww无码内射| 亚洲人成网站免费播放| 国产一级r片内射免费视频| 国产精品成人一区二区在线不卡| 免费人成在线观看视频高潮| 国产真人性做爰久久网站| 中文字幕无码专区一VA亚洲V专| 97中文字幕一区二区| 亚洲一区二区三区国产| 久久青青草原精品国产app| 久久人妻少妇嫩草av蜜桃| 宅宅午夜无码一区二区三区| 91国产精品自拍视频| 无码精品国产一区二区三区免费| 97人人模人人爽人人喊电影| 99热国产在线| 精品国产一区二区av麻豆不卡| 色哟哟亚洲色精一区二区 | 蜜桃久久综合一区二区| 色88久久久久高潮综合影院| 精品欧洲av无码一区二区三区| 国产成人一区二区三区高清| 久久精品国产亚洲av豆腐| 特黄 做受又硬又粗又大视频| 国产精成人品| 中国女人a毛片免费全部播放| 亚洲一区中文字幕一区|