吉珊珊,李淑飛,江務(wù)學(xué)
(東莞職業(yè)技術(shù)學(xué)院,廣東 東莞 523808)
基于Apriori算法對(duì)移動(dòng)課堂微信APP中熱點(diǎn)問(wèn)題的關(guān)聯(lián)分析
吉珊珊,李淑飛,江務(wù)學(xué)
(東莞職業(yè)技術(shù)學(xué)院,廣東 東莞 523808)
隨著我國(guó)互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,微信作為新一代通訊軟件,憑借著自身信息發(fā)布便捷、互動(dòng)性強(qiáng)、成本低廉等優(yōu)勢(shì)得到了廣大互聯(lián)網(wǎng)用戶(hù)的青睞。微信應(yīng)用范圍的擴(kuò)大,使得該通訊軟件逐漸成為教學(xué)活動(dòng)開(kāi)展的一個(gè)主要手段。但就實(shí)際應(yīng)用情況來(lái)看,仍存在一些有待解決的問(wèn)題,比如說(shuō),信息形式單一、互動(dòng)性弱、時(shí)效性不強(qiáng)等。為此,文章介紹了Apriori算法,以期利用Apriori算法來(lái)進(jìn)行關(guān)聯(lián)分析,從而形成問(wèn)題的分析結(jié)果,將移動(dòng)課堂微信APP的優(yōu)勢(shì)最大限度地發(fā)揮出來(lái)。
Apriori算法;移動(dòng)課堂;微信App;關(guān)聯(lián)分析
在互聯(lián)網(wǎng)技術(shù)飛速發(fā)展的今天,一些基于移動(dòng)端的新媒介不斷涌現(xiàn),微信就是眾多新媒介中的一種。為了可以給互聯(lián)網(wǎng)用戶(hù)提供更加優(yōu)質(zhì)的體驗(yàn),騰訊公司一直在對(duì)微信進(jìn)行更新與完善,使微信用戶(hù)群體得到了進(jìn)一步擴(kuò)大。微信用戶(hù)的持續(xù)增加給教學(xué)活動(dòng)的開(kāi)展提供了新的途徑。隨著移動(dòng)課堂微信APP應(yīng)用范圍的不斷擴(kuò)大,軟件應(yīng)用過(guò)程中也呈現(xiàn)出了一些有待解決的問(wèn)題,如信息形式單一、互動(dòng)性弱等。為了解決上述問(wèn)題,文章主要介紹了Apriori算法,利用該算法對(duì)問(wèn)題進(jìn)行關(guān)聯(lián)提取,并在此基礎(chǔ)上對(duì)問(wèn)題進(jìn)行分析,得出分析結(jié)果進(jìn)而將移動(dòng)課堂微信APP的優(yōu)勢(shì)充分發(fā)揮出來(lái)。
1.1關(guān)聯(lián)規(guī)則基本概念
在移動(dòng)課堂微信APP使用過(guò)程中,勢(shì)必會(huì)產(chǎn)生大量數(shù)據(jù),在海量數(shù)據(jù)中,勢(shì)必會(huì)隱藏著一些有價(jià)值的信息,如何將這些數(shù)據(jù)信息的價(jià)值最大限度發(fā)揮出來(lái)是數(shù)據(jù)挖掘的主要目的。就目前數(shù)據(jù)挖掘工作的現(xiàn)狀來(lái)看,其主要研究方向就是關(guān)聯(lián)規(guī)則挖掘。所謂關(guān)聯(lián)規(guī)則挖掘技術(shù),主要是指通過(guò)對(duì)事務(wù)項(xiàng)集和項(xiàng)集之間關(guān)系的分析,對(duì)數(shù)據(jù)信息所隱藏的實(shí)用價(jià)值進(jìn)行挖掘和探索的一種技術(shù)。
1.2關(guān)聯(lián)規(guī)則挖掘步驟
一般來(lái)說(shuō),關(guān)聯(lián)規(guī)則挖掘主要分為兩個(gè)步驟,首先是頻繁項(xiàng)集的構(gòu)建。頻繁項(xiàng)集是關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用中必不可少的一項(xiàng)內(nèi)容,比如說(shuō),將用A表示已知事務(wù)數(shù)據(jù)庫(kù),那么項(xiàng)目集就可表示為{A1,A2,…An},并用上述已知數(shù)據(jù)信息,找出符合最小支持度要求的頻繁項(xiàng)集。其次是規(guī)則的構(gòu)建。關(guān)聯(lián)規(guī)則挖掘技術(shù)共涉及兩種類(lèi)型的規(guī)則,即強(qiáng)關(guān)聯(lián)規(guī)則和弱關(guān)聯(lián)規(guī)則。其中,強(qiáng)關(guān)聯(lián)規(guī)則主要是指既符合用戶(hù)指定的支持度閾值,又符合可信度閾值。反之,則為弱關(guān)聯(lián)規(guī)則。
在上述兩個(gè)步驟中,頻繁項(xiàng)目的構(gòu)建是否科學(xué)合理,不僅直接關(guān)系著算法總體性能的好壞,而且也是判定關(guān)聯(lián)規(guī)則好壞的重要指標(biāo),在整個(gè)挖掘過(guò)程中具有重要作用。規(guī)則的構(gòu)建是以頻繁項(xiàng)集為基礎(chǔ)計(jì)算得出的,所以相對(duì)來(lái)說(shuō)比較簡(jiǎn)單,其主要目的就是為了將判斷關(guān)聯(lián)規(guī)則的強(qiáng)弱。
1.3關(guān)聯(lián)規(guī)則分類(lèi)
根據(jù)分類(lèi)標(biāo)準(zhǔn)不同,可將關(guān)聯(lián)規(guī)則分為多種不同類(lèi)型,按照處理變量類(lèi)型的不同,可將其分為數(shù)值型關(guān)聯(lián)規(guī)則和布爾型關(guān)聯(lián)規(guī)則;按照數(shù)據(jù)在規(guī)則中的抽象層次,可將其分為單層關(guān)聯(lián)規(guī)則和多層關(guān)聯(lián)規(guī)則;按照數(shù)據(jù)在規(guī)則中涉及的維數(shù),則可將其分為單維關(guān)聯(lián)規(guī)則和多維關(guān)聯(lián)規(guī)則。了解管理規(guī)則分類(lèi),可以更好地促進(jìn)關(guān)聯(lián)規(guī)則挖掘技術(shù)的合理應(yīng)用。
1.4Apriori算法介紹
自從關(guān)聯(lián)規(guī)則挖掘技術(shù)在1993年被提出以來(lái),廣大學(xué)者給予了高度重視,并加大了對(duì)該技術(shù)的研究力度,同時(shí)也對(duì)原有算法進(jìn)行了優(yōu)化與完善,Apriori算法應(yīng)運(yùn)而生。與傳統(tǒng)算法不同,Apriori算法在使用過(guò)程中,需要進(jìn)行多次迭代算法。首先,需要通過(guò)對(duì)數(shù)據(jù)信息一次性?huà)呙?,?duì)數(shù)據(jù)信息中單個(gè)項(xiàng)目的計(jì)數(shù)進(jìn)行統(tǒng)計(jì),并在此基礎(chǔ)上將滿(mǎn)足最小支持度要求的單個(gè)項(xiàng)目提取出來(lái)形成頻繁項(xiàng)集,得出的這一頻繁項(xiàng)集就是下一次掃描的對(duì)象,然后重復(fù)此項(xiàng)操作,直到數(shù)據(jù)庫(kù)中無(wú)法生產(chǎn)頻繁項(xiàng)集為止。
移動(dòng)課堂微信APP在已經(jīng)成為當(dāng)前教學(xué)活動(dòng)的一個(gè)主要手段,軟件中承載著大量數(shù)據(jù)信息。所以,Apriori算法在微信熱點(diǎn)事件關(guān)聯(lián)分析中的應(yīng)用也成為一個(gè)必然趨勢(shì)。通過(guò)對(duì)微信中大量數(shù)據(jù)信息的分析和挖掘,可以將信息中隱藏的應(yīng)用價(jià)值充分發(fā)揮出來(lái)。
2.1Apriori算法在移動(dòng)課堂微信APP的關(guān)聯(lián)分析模型
利用Apriori算法對(duì)移動(dòng)課堂微信APP進(jìn)行關(guān)聯(lián)分析,首先應(yīng)該將信息中的頻繁項(xiàng)集,充分挖掘出來(lái),然后在此基礎(chǔ)上構(gòu)建關(guān)聯(lián)分析的規(guī)則,每一條規(guī)則的右部只有一項(xiàng),采用的是中規(guī)則的定義。一旦這一規(guī)則被生成,那么只有那些大于用戶(hù)給定的最小可信度的規(guī)則才會(huì)被留下來(lái)。為了生成所有頻集,可以選用遞歸的方法。
Apriori算法的基本實(shí)現(xiàn)原理:
輸入:數(shù)據(jù)集A,最小支持度minsupport
輸出:所有的頻繁項(xiàng)集
L1=find_Frequent_itemsets(A,minsupport)
for(K=2;Lk-1!=NULL;k++)
{Ck=apriori_gen(Lk-1)}
for each item t包含于A
do {Ct=subset(Ck,t)for each candidate c包含于Ct count++}
通過(guò)對(duì)微信數(shù)據(jù)信息的挖掘分析總結(jié)出,在微信熱點(diǎn)問(wèn)題關(guān)聯(lián)分析中,能夠?qū)Ψ治鼋Y(jié)果產(chǎn)生影響的因素有很多,例如,事件屬性、閱讀量、點(diǎn)贊量等。
2.2Apriori算法在移動(dòng)課堂微信APP分析中的數(shù)據(jù)分析
為了更好地對(duì)Apriori算法在移動(dòng)課堂微信APP關(guān)聯(lián)分析中的作用進(jìn)行分析,研究人員在萃取大量微信事件數(shù)據(jù)之后,抽取了其中的部分事件,并根據(jù)各個(gè)事件的具體情況,將上述幾個(gè)影響因素的實(shí)際情況錄入到數(shù)據(jù)庫(kù)中,具體內(nèi)容如表1所示。
表1 移動(dòng)課堂微信APP事件信息
在對(duì)移動(dòng)課堂微信APP事件信息進(jìn)行分析之后,利用Apriori算法對(duì)微信熱點(diǎn)事件進(jìn)行了關(guān)聯(lián)規(guī)則挖掘分析,挖掘結(jié)果如表2所示。
表2 微信熱點(diǎn)事件關(guān)聯(lián)規(guī)則挖掘結(jié)果
表2給出的是部分微信熱點(diǎn)事件的關(guān)聯(lián)情況,左邊部分主要是事件屬性,右部分則是該事件的支持度,是衡量該熱點(diǎn)事件關(guān)聯(lián)規(guī)則強(qiáng)弱的重要指標(biāo)。
從上文的分析能夠看出,當(dāng)前移動(dòng)課堂微信APP在使用過(guò)程中,信息的發(fā)布多以文字為主,形式十分單一,而且與學(xué)生之間沒(méi)有建立良好的互動(dòng),這勢(shì)必會(huì)影響到微信APP的應(yīng)用效果。Apriori算法具有簡(jiǎn)單清晰、易于實(shí)現(xiàn)等諸多優(yōu)點(diǎn),在當(dāng)前社會(huì)各領(lǐng)域的發(fā)展中都有廣泛應(yīng)用。但同時(shí),該算法也存在一些有待解決的問(wèn)題。比如說(shuō),算法思想無(wú)法滿(mǎn)足當(dāng)前學(xué)生學(xué)習(xí)需求以及算法描述過(guò)于繁瑣等。所以,隨著微信數(shù)據(jù)量的不斷增加,Apriori算法的改進(jìn)設(shè)計(jì)也勢(shì)在必行。所以,筆者就當(dāng)前Apriori算法的應(yīng)用現(xiàn)狀,從算法思想和算法描述兩個(gè)方面著手,提出以下改進(jìn)措施。
3.1改進(jìn)算法思想
算法思想的改進(jìn)應(yīng)該從兩個(gè)方面著手,一是上三角支持度矩陣的構(gòu)造。首先要明確上三角支持度矩陣中所涉及的內(nèi)容,就該矩陣的內(nèi)容來(lái)看,主要是微信數(shù)據(jù)庫(kù)中全部項(xiàng)目的個(gè)數(shù),無(wú)論是行標(biāo)還是列標(biāo),都可視為項(xiàng)目的集合。其次要明確上三角支持度矩陣的作用,在矩陣中,支持度本身就可以作為統(tǒng)計(jì)計(jì)數(shù),所以在最小支持度閾值給定的前提下,可以此為依據(jù)直接獲取到頻繁項(xiàng)集1,2,3。通常情況下,上述3個(gè)頻繁項(xiàng)集屬第二個(gè)頻繁項(xiàng)集生產(chǎn)過(guò)程最為復(fù)雜,需要經(jīng)過(guò)多次比較才能夠得到最終結(jié)果,而且上三角支持度矩陣只能生成3個(gè)頻繁項(xiàng)集,如果想要生成后續(xù)項(xiàng)集,就需要借助事務(wù)二進(jìn)制向量表,這也是算法思想改進(jìn)的第二個(gè)方面,接下來(lái)筆者就對(duì)其進(jìn)行詳細(xì)闡述。二進(jìn)制向量表的生成是與上三角支持度矩陣同時(shí)開(kāi)展的,在微信熱點(diǎn)事件數(shù)據(jù)庫(kù)中,每個(gè)熱點(diǎn)事件都有一個(gè)或多個(gè)項(xiàng)目與之對(duì)應(yīng),可以根據(jù)項(xiàng)目的具體數(shù)量來(lái)確定編碼長(zhǎng)度。在某一熱點(diǎn)事件中,項(xiàng)目存在的位置用“1”表示,項(xiàng)目不存在的位置用“0”表示。由此,根據(jù)二進(jìn)制向量的意義引出相關(guān)概念。
3.2改進(jìn)算法描述
算法描述的改進(jìn)也是Apriori算法改進(jìn)設(shè)計(jì)的一項(xiàng)重要內(nèi)容。對(duì)于此項(xiàng)內(nèi)容的改進(jìn)同樣需要從兩個(gè)方面著手,一是執(zhí)行步驟描述改進(jìn),二是偽代碼描述改進(jìn)。根據(jù)當(dāng)前Apriori算法的應(yīng)用現(xiàn)狀來(lái)看,在對(duì)執(zhí)行步驟描述進(jìn)行改進(jìn)的時(shí)候,應(yīng)使其按照以下幾個(gè)步驟進(jìn)行:(1)對(duì)微信事件數(shù)據(jù)庫(kù)進(jìn)行掃描,同時(shí)生成上三角支持度矩陣和二進(jìn)制向量表,并在基礎(chǔ)上根據(jù)矩陣中的具體內(nèi)容生成頻繁1-項(xiàng)集和頻繁2-項(xiàng)集。(2)以頻繁1-項(xiàng)集和頻繁2-項(xiàng)集為基礎(chǔ)生成頻繁3-項(xiàng)集,然后通過(guò)對(duì)事件進(jìn)行向量計(jì)算和統(tǒng)計(jì)確定事件滿(mǎn)足最小支持度。(3)當(dāng)頻繁項(xiàng)集掃描到一定程度之后,就可以通過(guò)二進(jìn)制表確定支持度,判斷是否滿(mǎn)足條件,如果不滿(mǎn)足頻繁項(xiàng)集生成條件,那么就退出循環(huán),算法結(jié)束。
Apriori算法偽代碼的改進(jìn)描述如下:
輸入:事務(wù)數(shù)據(jù)庫(kù),最小支持度min_sup
輸出:頻繁項(xiàng)集
#生成帶權(quán)值的上三角矩陣,讀取一條記錄,此條記錄記作ti#
For i,j in ti:#若記錄中任意兩項(xiàng)i,j都為1則對(duì)上三角矩陣M[i][j]加1
For each i=1&&j=1:
M[i][j]++
#生成二進(jìn)制表
For i in range(事務(wù)數(shù)):B=0,Ci=0
綜上所述,隨著微信用戶(hù)規(guī)模的不斷擴(kuò)大,移動(dòng)課堂微信APP的有效應(yīng)用可以進(jìn)一步提升教學(xué)活動(dòng)效率,促進(jìn)教學(xué)目標(biāo)的順利實(shí)現(xiàn)。從本文的分析可以看出,互動(dòng)性弱、時(shí)效性差是當(dāng)前移動(dòng)課堂微信APP應(yīng)用中兩個(gè)重要問(wèn)題,為了將這些問(wèn)題有效解決,文章介紹了Apriori算法,并根據(jù)其使用情況從算法思想和算法描述上進(jìn)行了優(yōu)化,使得該算法的數(shù)據(jù)提取效率更高,分析結(jié)果也更具科學(xué)性和參考性,不僅提高了學(xué)生的學(xué)習(xí)效率,而且對(duì)教學(xué)質(zhì)量的提升也具有重要意義。
[1]劉偉,鄭世鈺.基于Apriori算法的對(duì)微信熱點(diǎn)事件的關(guān)聯(lián)分析與研究[J].計(jì)算機(jī)與數(shù)字工程,2016(1):31-34.
[2]任健,王心璐.國(guó)內(nèi)新媒體學(xué)術(shù)研究的新態(tài)勢(shì)與新特征[J].編輯之友,2014(5):60-64.
[3]陶立秋.改進(jìn)的Apriori算法在微信熱點(diǎn)分析中的應(yīng)用研究[D].武漢:華中師范大學(xué),2015.
[4]張宏旭.現(xiàn)代信息技術(shù)在高職職業(yè)教育教學(xué)的應(yīng)用—基于微信的移動(dòng)課堂APP服務(wù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].無(wú)線互聯(lián)科技,2014(5):229.
The Analysis and Research of the Hot Spot problem of WeChat APP in Mobile Classroom Based on Apriori Algorithm
Ji Shanshan, Li Shufei, Jiang Wuxue
(Dongguan Technology and Vocational College, Dongguan 523808, China)
With the rapid development of Internet technology in China, micro channel advantages as a new generation of communications software,by virtue of its information convenient, strong interactivity, low cost, etc. the majority of Internet users favor. The expansion of scope of application,making the communication software has gradually become a major means in teaching activities. But the point of view of practical application, there are still some problems to be solved, for example, information in the form of a single, weak interaction, timeliness is not strong. Therefore, this paper introduces the apriori algorithm, by using the apriori algorithm to carry on the correlation analysis, so as to form the results of the analysis of the problem , will move the classroom to maximize the advantages of WeChat app play out.
Apriori algorithm; mobile classroom; wechat App; correlation
項(xiàng)目名稱(chēng):2015年度廣東省教育研究院教育研究課題(職業(yè)教育類(lèi));項(xiàng)目編號(hào):GDJY-2015-B-b060。2015年廣東省高職教育教學(xué)改革項(xiàng)目;項(xiàng)目名稱(chēng):基于MOOC和微信APP的計(jì)算機(jī)應(yīng)用基礎(chǔ)翻轉(zhuǎn)課堂教學(xué)的研究與實(shí)踐;項(xiàng)目編號(hào):GDJG2015001。項(xiàng)目名稱(chēng):廣東省教育技術(shù)教學(xué)改革研究項(xiàng)目;項(xiàng)目編號(hào):No.2015021
吉珊珊(1985-),女,廣東梅州,碩士,講師,工程師;研究方向:計(jì)算機(jī)智能信息處理與控制,計(jì)算機(jī)教育,計(jì)算機(jī)應(yīng)用。