亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于模糊數(shù)值約束的成績數(shù)據(jù)庫關(guān)聯(lián)規(guī)則挖掘

        2020-12-14 04:37:08李毅
        電腦知識與技術(shù) 2020年28期
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則

        李毅

        摘要:綜合來說,基于對關(guān)聯(lián)規(guī)則的約束一般可以由成績數(shù)值信息數(shù)據(jù)生成。同時(shí)成績數(shù)據(jù)還可以和與之相關(guān)聯(lián)的數(shù)據(jù)共同構(gòu)成一條完善的成績記錄。鑒于此,本文主要分析如何借助模糊數(shù)值約束對相關(guān)的關(guān)聯(lián)規(guī)則進(jìn)行約束 ,并結(jié)合一些實(shí)際案例對其約束方法的實(shí)效性進(jìn)行分析。

        關(guān)鍵詞:關(guān)聯(lián)規(guī)則;模糊數(shù)值約束;成績數(shù)據(jù)庫

        中圖分類號:TP315 ? ? ?文獻(xiàn)標(biāo)識碼:A

        文章編號:1009-3044(2020)28-0051-03

        1引言

        為了對我校內(nèi)部的成人教育管理系統(tǒng)記錄的理念成績數(shù)據(jù)進(jìn)行分析,并結(jié)合成績分析如何從諸多的歷史成績數(shù)據(jù)中挑選出一些比較具有針對性的數(shù)據(jù)來指導(dǎo)教學(xué)活動(dòng)。下表是從校園歷年成績中選取出的一部分樣本實(shí)例:

        為了更好地對數(shù)據(jù)信息進(jìn)行挖掘和分析,可以借助信息數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則找到數(shù)據(jù)庫中各類數(shù)據(jù)之間的相關(guān)性。

        為了更好地對數(shù)據(jù)之間的相關(guān)性進(jìn)行分析,技術(shù)人員可以按照課程類別對事物數(shù)據(jù)庫進(jìn)行分類,然后根據(jù)分類過程中各個(gè)項(xiàng)目之間存在的關(guān)聯(lián)規(guī)則進(jìn)來有效挖掘問題。但是需要注意的是,如果使用傳統(tǒng)的數(shù)據(jù)管理挖掘方法進(jìn)行數(shù)據(jù)挖掘和分析時(shí),所選用事物數(shù)據(jù)庫內(nèi)部不得擁有過多的數(shù)值型項(xiàng)目。舉例來說,針對我校成人成績進(jìn)行關(guān)聯(lián)規(guī)則挖掘時(shí),其相關(guān)的規(guī)則為:高等數(shù)學(xué)成績較好、計(jì)算機(jī)基礎(chǔ)成績較好。其中,可以將成績好作為關(guān)聯(lián)規(guī)則進(jìn)行約束。在針對傳統(tǒng)的關(guān)聯(lián)規(guī)則進(jìn)行約束評價(jià)的過程中,往往采用“支持度-置信度”這類評價(jià)方法,但是這類評價(jià)方法不能從根本上反映出模糊約束數(shù)值的條件。鑒于此,在此基礎(chǔ)上,很多學(xué)者圍繞受約束的關(guān)聯(lián)規(guī)則進(jìn)行了研究和分析。學(xué)者R.T.N提出了受約束的關(guān)聯(lián)查詢概念。而學(xué)者R.Srikant則對受約束的項(xiàng)集約束進(jìn)行了分析,經(jīng)過分析后得出約束的項(xiàng)集中包含布爾表達(dá)式的頻繁項(xiàng)集。學(xué)者Robert J.BayardoJr還就稠密數(shù)據(jù)庫的特征進(jìn)行了分析和研究,并在此基礎(chǔ)上提出了改進(jìn)度的相關(guān)概念。

        鑒于此,本文通過模糊關(guān)聯(lián)規(guī)則、模糊查詢以及語言量詞等技術(shù),對模糊數(shù)值約束的關(guān)聯(lián)規(guī)則挖掘問題進(jìn)行了分析,并結(jié)合成人考試數(shù)據(jù)庫的現(xiàn)實(shí)案例對挖掘結(jié)果進(jìn)行了分析。

        2 模糊關(guān)聯(lián)規(guī)則

        定義1 ?何為模糊關(guān)聯(lián)規(guī)則, 即在一個(gè)項(xiàng)目被限定的模糊數(shù)中,擁有很多包含關(guān)聯(lián)規(guī)則的前后項(xiàng)。一般情況下,評判模糊關(guān)聯(lián)規(guī)則的三個(gè)重要參數(shù)分別為:①支持度S;②置信度C;③真度。其數(shù)學(xué)表達(dá)式如下:

        在公式中,[X、Y]分別代表去除調(diào)規(guī)則中模糊約束的前、后項(xiàng)項(xiàng)集,其中[T]表示事務(wù)記錄,[D]用來表示數(shù)據(jù)庫;[Q]則表示[Zadeh] 語言量詞,[P]代表模糊概率。結(jié)合定義1可以推導(dǎo)出相應(yīng)的模糊關(guān)聯(lián)規(guī)則——高等數(shù)學(xué)的成績優(yōu)異;多數(shù)學(xué)生的計(jì)算機(jī)成績優(yōu)異。

        同時(shí),為了更好地確定相應(yīng)的模糊關(guān)聯(lián)規(guī)則,可進(jìn)行如下假設(shè):可以將該模糊關(guān)聯(lián)規(guī)則的支持度S設(shè)置為1,置信度設(shè)置1,此時(shí)的真度數(shù)值為0.8。由此可以得出以下結(jié)論:在一般情況下,高等數(shù)學(xué)成績較為優(yōu)異的學(xué)生其計(jì)算機(jī)基礎(chǔ)成績也較為優(yōu)異。其中的“成績優(yōu)異”分別是指高等數(shù)學(xué)成績和計(jì)算機(jī)數(shù)學(xué)成績這兩個(gè)模糊數(shù),而支持度和置信度可以用以表示集合項(xiàng)中的學(xué)生都學(xué)習(xí)過高等數(shù)學(xué)和計(jì)算機(jī)課程。而真度則主要用來展示高等數(shù)學(xué)成績和計(jì)算機(jī)基礎(chǔ)課程成績優(yōu)異學(xué)生的整體比例。

        3 成績數(shù)據(jù)模糊化

        在數(shù)學(xué)領(lǐng)域,成績優(yōu)異是一個(gè)較為模糊的概念,一般情況下,可以借助確定范圍的方法來對其進(jìn)行加以明確。舉例來說,可以將閾值范圍處于[80,100]的分?jǐn)?shù)劃分為成績好。但是就實(shí)際案例而言,由于成人教育學(xué)生生源類型較為復(fù)雜,不同科目對成績優(yōu)異的劃分區(qū)間,可能存在一定差異,并不以[80,100]為統(tǒng)一的劃分標(biāo)準(zhǔn)。但是如果將[80,100]作為唯一的劃分標(biāo)準(zhǔn),又會(huì)對后期的真度數(shù)值計(jì)算產(chǎn)生影響。鑒于此,一般采用模糊集來對不同閾值內(nèi)的屬性值進(jìn)行轉(zhuǎn)換。使用模糊集進(jìn)行屬性值轉(zhuǎn)換的過程中,需要經(jīng)過以下兩步驟:首先,要建立和“成績優(yōu)異”相匹配的隸屬度函數(shù);其次,可以通過模糊查詢的方式找到和其屬性相對應(yīng)的模糊數(shù)據(jù)庫。

        3.1 隸屬度函數(shù)的定義

        一般情況下,不同屬性成績數(shù)據(jù)的分布方式為正相關(guān),其隸屬度函數(shù)的定義為:

        其中的值域?yàn)閇μ(x)],[0,1]參數(shù):[P_max],各科目成績好數(shù)值的確定上限:[μ],各科成績的平均值:[σ],各科成績的標(biāo)準(zhǔn)差。

        3.2模糊查詢

        定義2 何為模糊查詢?模糊查詢主要是指在同一個(gè)關(guān)系數(shù)據(jù)庫內(nèi),其查詢語句where中的子句內(nèi)含有單個(gè)或者多個(gè)的模糊數(shù)。和普通查詢相比,模糊查詢不僅可以對滿足查詢條件的數(shù)集進(jìn)行記錄,同時(shí)還可以對返回記錄的隸屬度進(jìn)行記錄。舉例來說,可以用where子句中的邏輯預(yù)算符號“∧”和“∨”來指代子句中的,and或者or。

        但是傳統(tǒng)查詢方式和模糊查詢方式仍然存在一定的差異,舉例來說:當(dāng)輸入查詢指令select all workers whose weight is greater than 60 kg”時(shí),此時(shí)該指令的具體含義為找出所有工人體重在60千克以上的,其布爾達(dá)描述特征也為體重>60kg。但是在模糊查詢之中,由于其使用模糊數(shù)如大小、高低等進(jìn)行查詢,所以,可以用模糊數(shù)“有多重?”來進(jìn)行模糊查詢。

        3.3模糊數(shù)據(jù)記錄集的生成

        結(jié)合我校的成人考試成績數(shù)據(jù)片段,為了從數(shù)據(jù)庫中找出高等數(shù)學(xué)成績數(shù)值處于優(yōu)異范圍內(nèi)的學(xué)生,可以進(jìn)行如下模糊查詢:

        其中,可以用大寫字母[Q]來替代[Query],用大寫字母[DB]來表示對應(yīng)的關(guān)系數(shù)據(jù)庫,用Ti來表示第i條記錄。綜合起來用查詢語句可以表示為:“select * from DB where 高等數(shù)學(xué)成績= much”。這就是一條簡單的模糊數(shù)據(jù)查詢語句。但是值得注意的是,和標(biāo)準(zhǔn)的查詢語句不同,模糊查詢語句中的關(guān)系謂詞“高等數(shù)學(xué)成績”可用much進(jìn)行表示。在這條魔術(shù)查詢語句的where子句之中,僅展示了一個(gè)關(guān)系謂詞,其隸屬度計(jì)算公式表示如下:

        4 模糊關(guān)聯(lián)規(guī)則真度的計(jì)算

        利用表2生成的模糊數(shù)據(jù)記錄集,對生成的模糊關(guān)聯(lián)規(guī)則計(jì)算真度可以判斷關(guān)聯(lián)規(guī)則與模糊數(shù)“大多數(shù)”是否相容。如果真度逼近1那么規(guī)則置信度越高;相反真度逼近0那么規(guī)則置信度就越低。通常對記錄數(shù)多的大型數(shù)據(jù)庫來說,相容程度較高的模糊關(guān)聯(lián)規(guī)則可以通過設(shè)定真度實(shí)現(xiàn)。計(jì)算真度步驟如下:

        ① 對模糊關(guān)聯(lián)規(guī)則計(jì)算滿足其屬性約束模糊數(shù)的模糊概率,計(jì)算公式為:

        在公式中,用[i]表示第幾條記錄,用T來表示“∧”運(yùn)算,用Ti來表示記錄,n用來表示所記錄的數(shù)量。根據(jù)學(xué)者Zadeh給出的語言量詞記錄概念可知,在語言量詞記錄中,Q (·)主要用來表示(most)的隸屬函數(shù),其真度的計(jì)算公式如下: τ= Q (P ).

        以“高等數(shù)學(xué)成績優(yōu)異的學(xué)生多數(shù)計(jì)算機(jī)基礎(chǔ)成績也較為優(yōu)異”這條關(guān)聯(lián)規(guī)則為例,其真度計(jì)算公式如下:

        那么如何判斷模糊關(guān)聯(lián)規(guī)則的可信度呢?一般情況下,可以通過分析預(yù)設(shè)的真度數(shù)值和實(shí)際的真度閾值數(shù)值來判斷模糊關(guān)聯(lián)規(guī)則的可信度。舉例來說,一條以“高等數(shù)學(xué)成績優(yōu)異、多數(shù)學(xué)生計(jì)算機(jī)基礎(chǔ)成績優(yōu)異”為主的模糊關(guān)聯(lián)規(guī)則,其真度閾值等于0.65,但是其實(shí)際的預(yù)設(shè)真度數(shù)值等于0.6,此時(shí)模糊真度關(guān)聯(lián)規(guī)則的真度數(shù)值超過預(yù)設(shè)真度數(shù)值,則可以判斷該模糊關(guān)聯(lián)規(guī)則的可信度較高。

        5 挖掘結(jié)果分析

        該模糊關(guān)聯(lián)規(guī)則查詢系統(tǒng)開發(fā)公司為微軟公司,開發(fā)工具為net,支持在win10系統(tǒng)中運(yùn)行,使用后臺(tái)數(shù)據(jù)庫為[SQL Server2007]。成績數(shù)據(jù)來源年份為2002~2005年,容量約為15萬條左右。通過專家分析可知,該模糊查詢關(guān)聯(lián)規(guī)則的最小支持度數(shù)值=0.57,最小置信度數(shù)值=0.69,真度閾值=0.63。運(yùn)用Apriori算法進(jìn)行計(jì)算得出最終的關(guān)聯(lián)規(guī)則符號最小支持度和最小置信度。其最終的真度計(jì)算結(jié)果如表3所示:

        根據(jù)專家學(xué)者的意見可以將其預(yù)設(shè)真度的下限指調(diào)整為0.7,根據(jù)表3數(shù)值得出如下結(jié)論:

        一般情況下,高等數(shù)學(xué)和應(yīng)用高等數(shù)學(xué)均較為成績優(yōu)異的學(xué)生其高等數(shù)學(xué)和應(yīng)用高等數(shù)學(xué)兩門學(xué)科的成績普遍較為優(yōu)異,而表3中的模糊規(guī)則也對其進(jìn)行了說明。由此可見,理科成績之間存在良性互動(dòng)關(guān)系的可能性較高。同時(shí),在理科成績和文科成績之間,也可以發(fā)現(xiàn)相似的關(guān)系。鑒于此,基層教師在實(shí)際的教學(xué)過程中,應(yīng)該做好學(xué)科互動(dòng)工作,借此來大幅提高學(xué)生的各科成績和課堂學(xué)習(xí)效果。

        參考文獻(xiàn):

        [1] Srikant,vuq.Mining association rules withItemconstraints[C]. Proc. of the Third Int'l Conf. on Knowledge Discovery in DataBases and Data Mining.CA,USA:AAAI Press,1997:67-73.

        [2] Ng R T,Lakshmanan L VS,Han J W,etal.Exploratory mining and pruning optimizations of constrained associations rules[C]//Proceedings of the 1998 ACM SIGMOD internationalconference on Management of data - SIGMOD '98.June1-4,1998.Seattle,Washington,USA.New York:ACM Press,1998:13-24.

        [3] Bayardo R J,Agrawal J R . Constraint-based rule mining in large, dense database[J]. Data Mining and Knowledge Discovery,2000,4(2/3):217-240.

        [4] 劉松.一種新的多層次關(guān)聯(lián)規(guī)則挖掘算法[J].微計(jì)算機(jī)信息,2006,22(12):223-225.

        [5] Yager R R.Fuzzy summaries in database mining[C]//Proceedings the 11th Conference on Artificial Intelligence for Applications.20-23Feb.1995,LosAngeles,CA,USA.IEEE,1995:265-269.

        [6] Zadeh L A.A computational approach to fuzzy quantifiers in natural languages[J].Computers& Mathematics with Applications,1983,9(1):149-184.

        [7] AgrawalR,ImielińskiT,SwamiA.Mining association rules between sets of items in large databases[C]//Proceedings of the 1993 ACM SIGMOD international conference on Management of data - SIGMOD '93.May25-28,1993.Washington,D.C.,USA.New York:ACM Press,1993:207-216.

        【通聯(lián)編輯:梁書】

        猜你喜歡
        關(guān)聯(lián)規(guī)則
        數(shù)據(jù)挖掘技術(shù)在電站設(shè)備故障分析中的應(yīng)用
        基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘技術(shù)的研究與應(yīng)用
        工業(yè)大數(shù)據(jù)挖掘分析及應(yīng)用前景研究
        基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
        基于關(guān)聯(lián)規(guī)則和時(shí)間閾值算法的5G基站部署研究
        關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價(jià)體系中的應(yīng)用
        關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)入侵檢測方法
        基于關(guān)聯(lián)規(guī)則的中醫(yī)肺癌數(shù)據(jù)挖掘應(yīng)用研究
        科技視界(2016年12期)2016-05-25 11:09:58
        毛片免费全部无码播放| 亚洲精品国产电影| 久久久av波多野一区二区| 韩日美无码精品无码| 国产欧美亚洲另类第一页| 成人影院羞羞的视频免费观看| 日本高清在线一区二区三区| 88久久精品无码一区二区毛片| 精品国产福利久久久| 国产精品自拍视频免费看| 国产精品久久久久久妇女| 久久国产热这里只有精品 | 国产精品高清国产三级国产av| 国产爆乳无码一区二区麻豆| 精品久久人人爽天天玩人人妻 | 99久久国产精品网站| 亚洲综合国产一区二区三区| 最新无码国产在线播放| 精品少妇一区二区三区四区| 欧美性色欧美a在线播放| 国产成人无码一区二区在线观看| 日本久久久久| 国产精品髙潮呻吟久久av| 国产又色又爽无遮挡免费软件| 精品一区二区三区在线观看| 视频精品熟女一区二区三区| 漂亮丰满人妻被中出中文字幕| 国自产精品手机在线观看视频| 日本在线视频网站www色下载| 久久久一本精品久久久一本| 国产免费又色又爽粗视频| 国产午夜精品久久久久免费视| 亚洲香蕉毛片久久网站老妇人| 亚洲av色av成人噜噜噜| 亚洲熟女www一区二区三区| 免费人成又黄又爽的视频在线| 亚洲精品一区二区三区国产| 久久综合噜噜激激的五月天| 在线永久免费观看黄网站| japanese色国产在线看视频| 日本超级老熟女影音播放|