余 如,黃麗霞,黃名選
(廣西教育學(xué)院,廣西 南寧 530023)
教育信息化的迅猛發(fā)展使教育系統(tǒng)積累了海量的教育信息化數(shù)據(jù),如何從這些教育信息數(shù)據(jù)中發(fā)現(xiàn)潛在的、有用的教育模型、教學(xué)模式和數(shù)據(jù)間的各種關(guān)聯(lián),以便更好地為教育教學(xué)決策提供科學(xué)依據(jù),是近年來(lái)一個(gè)重要的研究熱點(diǎn)。針對(duì)這些問(wèn)題,教育數(shù)據(jù)挖掘應(yīng)運(yùn)而生,并得到蓬勃發(fā)展,被國(guó)內(nèi)外專家學(xué)者廣泛關(guān)注和研究。教育數(shù)據(jù)挖掘是一個(gè)多學(xué)科的研究領(lǐng)域,是數(shù)據(jù)挖掘技術(shù)在教育系統(tǒng)領(lǐng)域的具體應(yīng)用,涉及教育學(xué)、計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)等學(xué)科,是一種從教育系統(tǒng)中各種原始數(shù)據(jù)發(fā)現(xiàn)事先未知的,但具有價(jià)值的和有用的教育信息和模式的過(guò)程。不同學(xué)者從不同的角度和方法對(duì)教育數(shù)據(jù)挖掘進(jìn)行研究,其中在教務(wù)管理[1-2]、成績(jī)分析[3-10]、教育評(píng)價(jià)[11-12]等方面取得了豐碩的研究成果。文獻(xiàn)[1]應(yīng)用關(guān)聯(lián)規(guī)則挖掘(Apriori算法[13])方法對(duì)高校研究生課程、學(xué)生計(jì)劃、課程成績(jī)等數(shù)據(jù)進(jìn)行挖掘,試圖發(fā)現(xiàn)數(shù)據(jù)間的相關(guān)性和依存性,為研究生課程體系設(shè)置提供有效的決策支持。文獻(xiàn)[2]采用傳統(tǒng)的數(shù)據(jù)挖掘方法挖掘教學(xué)環(huán)境數(shù)據(jù)中的學(xué)生行為模式,為教務(wù)管理提供科學(xué)依據(jù)。文獻(xiàn)[3-8]利用傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘方法對(duì)課程考試成績(jī)數(shù)據(jù)進(jìn)行挖掘,發(fā)現(xiàn)和分析課程間的相關(guān)性,取得了良好的效果。文獻(xiàn)[9-10]對(duì)課程考試成績(jī)數(shù)據(jù)引入加權(quán)關(guān)聯(lián)規(guī)則挖掘方法,克服了傳統(tǒng)的挖掘方法沒(méi)有考慮項(xiàng)目權(quán)值的缺陷。文獻(xiàn)[11-12]將關(guān)聯(lián)規(guī)則挖掘方法引入課程評(píng)價(jià)和教學(xué)評(píng)價(jià),對(duì)網(wǎng)絡(luò)課程資源和教學(xué)評(píng)價(jià)數(shù)據(jù)樣本進(jìn)行數(shù)據(jù)分析,試圖發(fā)現(xiàn)有價(jià)值的數(shù)據(jù)模式和評(píng)價(jià)模式,為教學(xué)管理提供合理、科學(xué)的決策支持。
綜上所述,數(shù)據(jù)挖掘技術(shù)在課程考試成績(jī)數(shù)據(jù)分析中得到了廣泛的應(yīng)用。其所用的挖掘技術(shù)主要是傳統(tǒng)的項(xiàng)無(wú)加權(quán)關(guān)聯(lián)規(guī)則挖掘方法(如Apriori算法)以及項(xiàng)加權(quán)關(guān)聯(lián)規(guī)則挖掘方法。這些方法都存在難以避免的缺陷,即所得到的數(shù)據(jù)關(guān)聯(lián)模式會(huì)存在很多無(wú)效的和不準(zhǔn)確的模式。主要原因是:課程考試成績(jī)數(shù)據(jù)的一個(gè)顯著特點(diǎn)是不僅課程之間具有不同的重要性,而且每門(mén)課程對(duì)不同的學(xué)生也具有不同的重要性。項(xiàng)無(wú)加權(quán)關(guān)聯(lián)規(guī)則挖掘方法顯然沒(méi)有考慮課程成績(jī)數(shù)據(jù)的這些特點(diǎn),只考慮課程在數(shù)據(jù)庫(kù)中出現(xiàn)的頻度,并且將數(shù)據(jù)庫(kù)中各個(gè)課程以平等一致的方式處理,不考慮課程之間和課程在學(xué)生中具有不同的重要性。項(xiàng)加權(quán)關(guān)聯(lián)規(guī)則挖掘方法雖然引入了課程項(xiàng)目權(quán)重,以體現(xiàn)課程之間具有不同的重要性,但沒(méi)有重視課程在學(xué)生中具有不同的重要性。針對(duì)上述問(wèn)題,本文提出基于矩陣加權(quán)模式發(fā)現(xiàn)技術(shù)的課程成績(jī)數(shù)據(jù)關(guān)聯(lián)模式發(fā)現(xiàn)與分析方法,對(duì)課程考試成績(jī)數(shù)據(jù)進(jìn)行關(guān)聯(lián)模式挖掘,不僅考慮課程在課程成績(jī)數(shù)據(jù)庫(kù)中出現(xiàn)的頻度和課程間的不同重要性,而且還重視課程在不同學(xué)生中具有不同的重要性,有效地克服了現(xiàn)有課程成績(jī)關(guān)聯(lián)模式發(fā)現(xiàn)方法的缺陷,得到的數(shù)據(jù)關(guān)聯(lián)模式更有效、更合理,通過(guò)模式分析發(fā)現(xiàn)課程教學(xué)中的教學(xué)規(guī)律和問(wèn)題,為教學(xué)管理、教學(xué)改革與決策提供科學(xué)依據(jù)。
教育信息化進(jìn)程中積累了大量的課程考試成績(jī)數(shù)據(jù),這些數(shù)據(jù)的特點(diǎn)是每個(gè)學(xué)生選修了若干門(mén)課程,每門(mén)課程成績(jī)隨著學(xué)生的不同而變化。將課程成績(jī)數(shù)據(jù)庫(kù)中的課程當(dāng)作項(xiàng)目,課程成績(jī)當(dāng)作項(xiàng)目權(quán)值,每個(gè)學(xué)生記錄當(dāng)作一個(gè)事務(wù)記錄,則課程考試成績(jī)數(shù)據(jù)模型可以描述如下。
設(shè)Course={s1,s2,…,sn}是課程成績(jī)數(shù)據(jù)庫(kù)(CD:Course Database),si(1≤i≤n)表示CD 中的第i個(gè)學(xué)生(student)記錄,subject={c1,c2,…,cm}表示CD中所有課程(Course)項(xiàng)目集合,cj(1≤j≤m)表示 CD 中第 j個(gè)課程項(xiàng)目,r[si][cj](1≤i≤n,1≤j≤m)表示第j門(mén)課程cj在學(xué)生記錄si中的成績(jī)(權(quán)值),如 cj?si,則 cj在該學(xué)生記錄 si的成績(jī)權(quán)值 r[si][cj]=0,課程成績(jī)數(shù)據(jù)模型可以用表1表示。
課程項(xiàng)目權(quán)值隨著學(xué)生事務(wù)記錄不同而變化的課程成績(jī)數(shù)據(jù)稱為矩陣加權(quán)課程成績(jī)數(shù)據(jù),也稱為完全加權(quán)課程成績(jī)數(shù)據(jù)。
表1 課程成績(jī)數(shù)據(jù)庫(kù)(CD)
考察課程成績(jī)數(shù)據(jù)庫(kù)(CD),設(shè)I1,I2是其課程項(xiàng)集subject的2個(gè)子項(xiàng)集,I1={c1,c2,…,cm1}(m1< m),I2={c1,c2,…,cm2}(m2 < m),I1?subject,I2?subject,且I1∩I2=Φ,參照傳統(tǒng)的支持度和置信度概念,給出如下基本定義。
定義1 矩陣加權(quán)課程關(guān)聯(lián)模式。矩陣加權(quán)課程關(guān)聯(lián)模式指的是矩陣加權(quán)課程項(xiàng)目集(I1,I2)的關(guān)聯(lián)規(guī)則:I1→I2。
定義2 矩陣加權(quán)課程項(xiàng)集支持度(matrixweighted course support,簡(jiǎn)稱 mwcsup)。參照文獻(xiàn)[14]的完全加權(quán)支持度定義,給出mwcsup(I)的定義。mwcsup(I)指的是矩陣加權(quán)課程項(xiàng)集I在課程成績(jī)數(shù)據(jù)庫(kù)(CD)各個(gè)學(xué)生事務(wù)記錄中的權(quán)值之和與學(xué)生事務(wù)記錄總數(shù)n和課程項(xiàng)集I的項(xiàng)目個(gè)數(shù)k乘積的比值,即:
定義3 矩陣加權(quán)課程關(guān)聯(lián)模式置信度(matrixweighted course confidence,簡(jiǎn)稱mwcconf)。參照文獻(xiàn)[14]的完全加權(quán)關(guān)聯(lián)規(guī)則置信度定義,給出矩陣加權(quán)課程關(guān)聯(lián)規(guī)則置信度計(jì)算公式,即:
式(2)中,k1為項(xiàng)集I1的課程項(xiàng)目個(gè)數(shù),k12為項(xiàng)集(I1∪I2)的課程項(xiàng)目個(gè)數(shù)。
定義4 矩陣加權(quán)課程強(qiáng)關(guān)聯(lián)模式。給定最小矩陣加權(quán)課程項(xiàng)集支持度閾值minmwcsup和最小矩陣加權(quán)課程關(guān)聯(lián)規(guī)則置信度閾值minmwcconf。如果矩陣加權(quán)課程關(guān)聯(lián)模式(I1→I2)滿足以下4個(gè)條件,就稱為矩陣加權(quán)課程強(qiáng)關(guān)聯(lián)模式:(1)mwcsup(I1)≥minmwcsup;(2)mwcsup(I2)≥minmwcsup;(3)mwcsup(I1∪I2)≥minmwcsup;(4)mwcconf(I1→I2)≥minmwcconf。
課程成績(jī)數(shù)據(jù)關(guān)聯(lián)模式發(fā)現(xiàn)的基本思想是:首先對(duì)課程成績(jī)數(shù)據(jù)進(jìn)行預(yù)處理,建立矩陣加權(quán)課程成績(jī)數(shù)據(jù)庫(kù)和課程項(xiàng)目庫(kù);然后,在課程成績(jī)數(shù)據(jù)庫(kù)中挖掘矩陣加權(quán)候選課程1-項(xiàng)集,根據(jù)課程項(xiàng)集支持度與minmwcsup的比較得出頻繁課程1-項(xiàng)集;從2-項(xiàng)集起,由候選(i-1)-項(xiàng)集(i≥2)進(jìn)行 Apriori連接[13]生成候選i-項(xiàng)集,通過(guò)候選i-項(xiàng)集支持度與k-項(xiàng)集(k≥2)的k-支持期望[14]和最小矩陣加權(quán)課程項(xiàng)集支持度閾值minmwcsup的比較,采用逐層搜索的策略生成矩陣加權(quán)課程頻繁k-項(xiàng)集;最后,根據(jù)矩陣加權(quán)課程關(guān)聯(lián)模式支持度和置信度與minmwcsup和minmwcconf的比較,從矩陣加權(quán)課程頻繁項(xiàng)集挖掘出矩陣加權(quán)課程強(qiáng)關(guān)聯(lián)模式,并且對(duì)這些模式進(jìn)行有效的分析。
輸入:課程成績(jī)數(shù)據(jù)庫(kù)(CD),minmwcsup和minmwcconf。
輸出:矩陣加權(quán)課程強(qiáng)關(guān)聯(lián)模式。
Begin
(1)對(duì)課程成績(jī)數(shù)據(jù)進(jìn)行預(yù)處理:為了讓課程成績(jī)權(quán)值在0至1之間,將成績(jī)除以100;將沒(méi)有成績(jī)的課程一律設(shè)置為0,建立課程成績(jī)數(shù)據(jù)庫(kù)和課程項(xiàng)目庫(kù),課程項(xiàng)目庫(kù)包括學(xué)生選修的所有課程,課程成績(jī)數(shù)據(jù)庫(kù)包括所有學(xué)生的課程成績(jī)。
(2)從課程項(xiàng)目庫(kù)中提取課程候選1-項(xiàng)集,計(jì)算矩陣加權(quán)課程候選1-項(xiàng)集支持度和2-項(xiàng)集的2-支持期望,將項(xiàng)集支持度與minmwcsup比較得出課程頻繁1-項(xiàng)集。
(3)從2-項(xiàng)集起,通過(guò)連接候選(i-1)-項(xiàng)集(i≥2)進(jìn)行Apriori連接得到課程候選i-項(xiàng)集。
(4)刪除課程候選i-項(xiàng)集中含有i-支持期望的(i-1)-項(xiàng)集的所有課程候選i-項(xiàng)集。
(5)如果課程候選i-項(xiàng)集不為空集,計(jì)算其矩陣加權(quán)支持度和i-支持期望,同時(shí)刪除其支持度為0的課程候選i-項(xiàng)集。
(6)將課程候選i-項(xiàng)集支持度與minmwcsup比較得出矩陣加權(quán)課程頻繁i-項(xiàng)集。
(7)i加1后,重復(fù)步驟(3)到步驟(6),直到課程候選i-項(xiàng)集為空,頻繁項(xiàng)集挖掘結(jié)束,轉(zhuǎn)入步驟(8)。
(8)對(duì)于矩陣加權(quán)課程頻繁i-項(xiàng)集I,如果存在項(xiàng)集 I1?I,I2?I,(I1∪I2)=I,(I1∩I2)= Φ,mwcsup(I1)≥minmwcsup,mwcsup(I2)≥minmwcsup,mwcsup(I1∪I2)≥minmwcsup,mwcconf(I1→I2)≥minmwcconf以及 mwcconf(I2→I1)≥minmwcconf,則得出矩陣加權(quán)課程關(guān)聯(lián)模式I1→I2和I2→I1。
(9)輸出矩陣加權(quán)課程關(guān)聯(lián)模式。
(10)挖掘結(jié)束。
End
實(shí)驗(yàn)數(shù)據(jù)來(lái)源于教務(wù)部門(mén)真實(shí)的課程考試成績(jī)數(shù)據(jù),選擇歷屆畢業(yè)生在校考試成績(jī)數(shù)據(jù)作為本文實(shí)驗(yàn)數(shù)據(jù)測(cè)試集,共500位學(xué)生,學(xué)生選修的課程有53門(mén),經(jīng)過(guò)二維處理,得出如表2所示的課程成績(jī)數(shù)據(jù)庫(kù)(CD)。
表2 歷屆畢業(yè)生課程成績(jī)數(shù)據(jù)庫(kù)(CD)
實(shí)驗(yàn)數(shù)據(jù)預(yù)處理如下:(1)將成績(jī)都除以100,使成績(jī)數(shù)據(jù)在0到1之間;(2)將課程名稱用I代號(hào)表示,如現(xiàn)代文學(xué)用I1表示,文學(xué)概論用I2表示等。
編寫(xiě)了課程考試成績(jī)數(shù)據(jù)關(guān)聯(lián)模式發(fā)現(xiàn)方法的實(shí)驗(yàn)源程序,將傳統(tǒng)的 Apriori算法[13]作為對(duì)比算法,2種方法挖掘出的課程關(guān)聯(lián)模式如表3、表4和表5所示。
表3 兩種方法挖掘出的課程候選項(xiàng)集數(shù)量比較
表3表明,本文方法和Apriori算法所挖掘出的課程候選項(xiàng)集數(shù)量基本一樣,主要原因是本文方法中產(chǎn)生候選項(xiàng)集的方法和Apriori算法的一樣,即候選i-項(xiàng)集都是由候選(i-1)-項(xiàng)集通過(guò)Apriori連接生成。
表4 兩種方法挖掘出的課程頻繁項(xiàng)集數(shù)量比較
表5 兩種方法挖掘出的課程關(guān)聯(lián)規(guī)則數(shù)量比較
表4和表5表明,本文方法挖掘出的課程關(guān)聯(lián)模式數(shù)量(即課程頻繁項(xiàng)集和課程關(guān)聯(lián)規(guī)則數(shù)量)比Apriori算法的少得多,其中頻繁1-項(xiàng)集的數(shù)量平均減少61.11%,頻繁2-項(xiàng)集的數(shù)量平均減少66.48%,頻繁3-項(xiàng)集的數(shù)量平均減少73.58%,關(guān)聯(lián)規(guī)則數(shù)量平均減少80.62%,說(shuō)明本文所使用的方法比傳統(tǒng)的Apriori算法更有效、更合理。主要的原因分析如下:Apriori算法只考慮課程項(xiàng)目出現(xiàn)的頻次,即課程是否被學(xué)生選修,或者說(shuō)同一門(mén)課程被多少學(xué)生選修,并不考慮課程被學(xué)生選修后學(xué)習(xí)的效果(即學(xué)習(xí)成績(jī)),因而,Apriori算法挖掘出的課程關(guān)聯(lián)模式只能反映課程選修關(guān)系的關(guān)聯(lián)模式,表明某門(mén)課或者某幾門(mén)課的選修應(yīng)該先選修哪些課程等。一般來(lái)說(shuō),在學(xué)校環(huán)境中,課程被選修的機(jī)會(huì)都會(huì)很多,因此,課程項(xiàng)目頻度很高而且差別不大是教育信息化課程數(shù)據(jù)的顯著特點(diǎn)之一,這樣的特點(diǎn)導(dǎo)致Apriori算法挖掘出的課程關(guān)聯(lián)模式特別龐大,無(wú)效的模式就會(huì)增多。另外,從實(shí)驗(yàn)中還發(fā)現(xiàn),上述的特點(diǎn)使得課程關(guān)聯(lián)模式的支持度都在0.9以上,導(dǎo)致表4和表5的頻繁項(xiàng)集和關(guān)聯(lián)規(guī)則數(shù)量在支持度為0.9以下都保持一致,沒(méi)有發(fā)生變化。本文方法克服了Apriori算法的缺陷,不僅考慮課程的選修頻次,還特別重視學(xué)生選修和學(xué)習(xí)課程的效果,即考慮課程成績(jī),把課程成績(jī)當(dāng)成權(quán)重處理,這樣挖掘出來(lái)的關(guān)聯(lián)模式不僅表明了課程的選修關(guān)系,還特別表明了課程之間的學(xué)習(xí)效果關(guān)系,即學(xué)好了某門(mén)課或者某幾門(mén)課程就能學(xué)好哪些課程等。由于是以課程成績(jī)作為項(xiàng)目權(quán)重,挖掘的課程關(guān)聯(lián)模式顯然少了,同時(shí)其模式能客觀地反映課程學(xué)習(xí)效果關(guān)系。
課程成績(jī)數(shù)據(jù)關(guān)聯(lián)模式發(fā)現(xiàn)方法挖掘出的關(guān)聯(lián)模式實(shí)例及其對(duì)應(yīng)的支持度和置信度如表6所示。
表6 課程成績(jī)數(shù)據(jù)關(guān)聯(lián)模式實(shí)例
從表6可以知道,在159位學(xué)生中,有80.06%的學(xué)生選修了《古代文學(xué)(一)》的同時(shí)選修了《文學(xué)概論(二)》和《古代文學(xué)(二)》,并且在選修了《古代文學(xué)(一)》的學(xué)生中,學(xué)好《古代文學(xué)(一)》課程就能學(xué)好《文學(xué)概論(二)》和《古代文學(xué)(二)》,其可信度高達(dá)99.08%。同理,選修《古代文學(xué)(一)》課程后再選修《文學(xué)概論(二)》的有80.9%的學(xué)生,學(xué)好《古代文學(xué)(一)》就能學(xué)好《文學(xué)概論(二)》,其可信度達(dá)100%。再如,學(xué)好《古代文學(xué)(二)》就能把《文學(xué)概論(二)》學(xué)好,并能把畢業(yè)論文做好等,通過(guò)這些關(guān)聯(lián)模式分析可以發(fā)現(xiàn)教務(wù)管理以及課程教學(xué)中的教學(xué)規(guī)律和問(wèn)題,為教學(xué)管理、教學(xué)改革與決策提供科學(xué)依據(jù)。
處于數(shù)字化時(shí)代的校園教務(wù)環(huán)境累積了海量的教育信息化數(shù)據(jù),這些數(shù)據(jù)是研究教育系統(tǒng)領(lǐng)域中各種教育規(guī)律、教育模式等的寶貴資源。本文以真實(shí)的學(xué)生課程成績(jī)數(shù)據(jù)為數(shù)據(jù)集,研究在課程成績(jī)數(shù)據(jù)庫(kù)中發(fā)現(xiàn)課程關(guān)聯(lián)模式的方法,采用矩陣加權(quán)模式發(fā)現(xiàn)技術(shù)發(fā)現(xiàn)課程成績(jī)數(shù)據(jù)中隱藏的數(shù)據(jù)關(guān)聯(lián)規(guī)則。通過(guò)規(guī)則分析得出課程教學(xué)中的教學(xué)規(guī)律和問(wèn)題,為教學(xué)管理、教學(xué)改革與決策提供科學(xué)依據(jù)。實(shí)驗(yàn)表明,與現(xiàn)有的數(shù)據(jù)關(guān)聯(lián)模式發(fā)現(xiàn)方法比較,本文的方法更有效、合理。下一步的研究將不斷地完善挖掘方法,加大實(shí)驗(yàn)數(shù)據(jù)量,擴(kuò)展到教育領(lǐng)域的各種數(shù)據(jù)關(guān)聯(lián)模式的挖掘,以便能發(fā)現(xiàn)更多、更準(zhǔn)確和更合理的教育模式和規(guī)律。
[1]李蕓,瞿偉,張文.數(shù)據(jù)挖掘技術(shù)在研究生教育管理工作中的應(yīng)用[J].西安建筑科技大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2009,28(4):70-74.
[2]Hogyeong Jeong,Gautam Biswas.Mining student behavior models in learning-by-teaching environments[C]//Proceedings of the 1st International Conference on Educational Data Mining.Montreal,Canada,2008:127-136.
[3]方毅,張春元.基于數(shù)據(jù)挖掘的多策略研究生教育課程成績(jī)分析方法研究[J].計(jì)算機(jī)工程與科學(xué),2009,31(6):106-108.
[4]Agathe Merceron,Kalina Yacef.Interestingness measures for association rules in educational data[C]//Proceedings of the 1st International Conference on Educational Data Mining.Montreal,Canada,2008:57-66.
[5]湛德照.基于關(guān)聯(lián)規(guī)則的考試數(shù)據(jù)挖掘[J].五邑大學(xué)學(xué)報(bào):自然科學(xué)版,2009,23(2):64-68.
[6]侯亞榮,萬(wàn)雅奇,張書(shū)杰.教育考試數(shù)據(jù)挖掘的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(16):132-134.
[7]Merceron A,Yacef K.Revisiting interestingness of strong symmetric association rules in educational data[C]//Proceedings of the 2007 International Workshop on Applying Data Mining in e-Learning(ADML’07).Crete,Greece,2007:3-12.
[8]Minaei-Bidgoli B,Tan P-N,Punch W F.Mining interesting contrast rules for a Web-based educational system[C]//Proceedings of the 2004 International Conference on Machine Learning and Applications(ICMLA 2004).Louisville,USA,2004:320-327.
[9]陳世保,徐峰,吳國(guó)鳳.基于難度系數(shù)的加權(quán)關(guān)聯(lián)規(guī)則在試卷評(píng)估中的應(yīng)用[J].井岡山大學(xué)學(xué)報(bào):自然科學(xué)版,2013,34(1):70-74.
[10]劉建煒,張穎.基于加權(quán)關(guān)聯(lián)規(guī)則算法的學(xué)生成績(jī)數(shù)據(jù)挖掘研究[J].福建教育學(xué)院學(xué)報(bào),2012(3):122-125.
[11]王滿,徐朝軍.網(wǎng)絡(luò)課程資源自動(dòng)量化評(píng)價(jià)研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2010(1):88-93.
[12]李橋,陽(yáng)春華.關(guān)聯(lián)規(guī)則Apriori算法在教學(xué)評(píng)價(jià)中的應(yīng)用[J].計(jì)算機(jī)與數(shù)字工程,2010,38(6):49-51,81.
[13]Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large database[C]//Proceeding of the 1993 ACM SIGMOD International Conference on Management of Data.Washington D C,1993:207-216.
[14]譚義紅,林亞平.向量空間模型中完全加權(quán)關(guān)聯(lián)規(guī)則的挖掘[J].計(jì)算機(jī)工程與應(yīng)用,2003,39(13):208-211.