亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        課程評價中考慮誤導抑制的關聯(lián)規(guī)則高效提?、?/h1>
        2021-05-21 07:22:32張利生薛頌東楊曉梅
        計算機系統(tǒng)應用 2021年5期
        關鍵詞:項集置信度關聯(lián)

        張利生,薛頌東,楊曉梅

        1(太原科技大學 計算機科學與技術學院,太原030024)

        2(太原科技大學 經濟與管理學院,太原030024)

        1 引言

        課程是人才培養(yǎng)的核心要素.教育部部署進行的高校“金課”建設,即一流課程建設,事關一流專業(yè)這個人才培養(yǎng)基本單元的建設成效和一流本科教育的成敗[1].課程評價是課程建設的有力抓手,評價結果可用來指導課程建設方向和課程改革實踐.為此,教育部制定了包括教學隊伍、教學內容、教學資源等維度的課程評價指標體系[2].洞悉評價指標間關系,可為高校的教育管理決策提供有效支撐.數(shù)據驅動的管理與決策,是傳統(tǒng)的模型驅動或流程驅動決策范式的有益補充和拓展[3].數(shù)據分析和數(shù)據挖掘,則為數(shù)據驅動的管理決策提供了技術支持.通過挖掘課程評價數(shù)據,能夠提取有價值的知識,為課程管理決策提供依據.

        評價指標體系直接關系課程評價結果.2010年,國家精品課程評審指標(本科)制定,體現(xiàn)了《教育部財政部關于實施高等學校本科教學質量與教學改革工程的意見》(教高[2007] 1 號)、《教育部關于進一步深化本科教學改革全面提高教學質量的若干意見》(教高[2007] 2 號)和《教育部關于啟動高等學校教學質量與教學改革工程精品課程建設工作的通知》(教高[2003] 1 號)等文件精神[4].某高校也結合自身實際,制定了涵蓋教學隊伍、教學內容、教學資源等維度的精品課程評價指標體系,設置了包括教師風范、教學水平、教研活動及成果、教師知識結構、年齡結構的觀測點.

        課程評價的目的,在于輔助教學管理決策,指導課程建設.鑒于評價指標間存在關聯(lián)關系,故可用關聯(lián)規(guī)則挖掘算法來提取關聯(lián)規(guī)則.任高舉等[5]通過視圖對Apriori 算法的頻繁項集產生進行了改進,使用改進的Apriori 算法挖掘教學評價數(shù)據,發(fā)現(xiàn)學歷、職稱和教齡等影響課程質量,但僅考慮教師對課程的影響,分析因素比較單一.郭鵬等[6]通過加入興趣度的方式對Apriori 算法產生的強規(guī)則進行了過濾,使用改進的Apriori 算法對不同課程的成績進行挖掘分析,發(fā)現(xiàn)不同課程成績之間存在關聯(lián)關系.以上工作,從單一角度對課程教學數(shù)據進行關聯(lián)規(guī)則的挖掘分析,對于課程建設的指導作用有限.為此,選取某校本科生課程作為研究對象,提出一種基于差異興趣度的Apriori 算法,對課程評價指標進行多維度的關聯(lián)規(guī)則提取,期望提升教學管理的科學化水平.

        2 基于興趣度的Apriori 關聯(lián)規(guī)則挖掘算法

        傳統(tǒng)的Apriori 算法,是一種挖掘布爾關聯(lián)規(guī)則頻繁項集的算法,建立在先驗原理的廣泛優(yōu)先搜索基礎上[7].為進行關聯(lián)規(guī)則篩選,提出了支持度和置信度兩個概念.

        (1)關聯(lián)規(guī)則

        關聯(lián)規(guī)則,是描述事務的某些屬性與其他事務的若干屬性同時出現(xiàn)的規(guī)則和模式[8].對于課程評價,關聯(lián)規(guī)則可描述如下:設數(shù)據集合I={i1,i2,···,im}是課程評價屬性中所有屬性數(shù)據的集合,m是課程評價數(shù)據中屬性的個數(shù).一個關聯(lián)規(guī)則是形如X?Y的蘊含式,X?I,Y?I,且X∩Y=?.這里,X稱為規(guī)則前件,Y是后件.

        關聯(lián)規(guī)則的強度用支持度和置信度衡量[9].支持度指事務數(shù)據集D中包含項集X和Y的事務個數(shù)占總數(shù)的比例,記為S upport(X?Y);置信度指D中同時包含項集X和Y的事務個數(shù)占包含X事務個數(shù)的比例,記為Con fidence(X?Y),見式(1)和式(2).

        要確定一條規(guī)則為強關聯(lián)規(guī)則,須看其是否同時滿足最小支持度和最小置信度閾值條件.最小支持度用來測量項集在統(tǒng)計中出現(xiàn)的最小頻率,記為min_sup(0<min_sup<1),最小置信度用來衡量關聯(lián)規(guī)則的最小可靠性,記為min_conf(0<min_con f<1).

        (2)興趣度

        傳統(tǒng)Apriori 算法,僅使用支持度和置信度閾值來提取關聯(lián)規(guī)則,結果可能并非均屬有趣,甚至可能引起誤解[10].其原因是,支持度缺陷會導致部分有意義的規(guī)則由于支持度小而遭忽略;置信度的缺陷,則由于忽視了規(guī)則后件項集在事務中的支持度導致非有趣結果的產生.如式(3)所示,文獻[11]引入差異興趣度進行規(guī)則的有趣性判斷,進而對頻繁項集進行篩選.

        這里,興趣度Interest的取值范圍為[-1,1].當Interest=0 時,表示X和Y相互獨立,Interest>0為正相關,Interest<0時,表示負相關.

        (3)基于興趣度的Apriori 算法

        頻繁項集篩選的目的,在于抑制誤導性關聯(lián)規(guī)則的生成.基于差異興趣度的頻繁項集篩選,以及改進的Apriori 算法流程見算法1.

        算法1.改進的Apriori 算法輸入:數(shù)據集D,最小支持度,最小置信度,最小興趣度過程:C1k=1 1)掃描全部數(shù)據D,產生候選頻繁1-項集的集合,;C1 L1 2)根據最小支持度,由候選1-項集的集合 產生頻繁1-項集的集合;

        3)對,重復執(zhí)行步驟4)~ 6);Lk (k+1)-Ck+1 k>1 4)由 執(zhí)行連接和減枝操作,產生候選 項集的集合;(k+1)-Ck+1 (k+1)-Lk+1 5)根據最小支持度,由候選 項集的集合,產生頻繁 項集的集合;L ? k=k+1 6)若 不等于,則,轉4),否則結束;7)根據最小置信度和興趣度,由頻繁項集產生強關聯(lián)規(guī)則,結束.輸出:符合條件的規(guī)則.

        3 挖掘過程及結果分析

        3.1 數(shù)據采集

        用于分析的420 條數(shù)據,來自某校10 門本科生課程的問卷調查,面向學生、教師、同行專家和教學督導組等4 類人群,經由課程評價指標設計的課程評價問卷調查系統(tǒng)采集,課程評價部分指標見表1,其中每個二級指標評分可取A、B、C、D、E 五個等級中的一個,數(shù)據結構見表2.經過集成,每條記錄包括教學隊伍、教學內容、教學資源、教學方法與手段等4 個維度的12 個屬性.部分原始數(shù)據見表3.

        3.2 數(shù)據預處理

        為了提高數(shù)據挖掘結果的準確性,需要對原始數(shù)據進行預處理.數(shù)據預處理主要包括數(shù)據清洗和數(shù)據變換等環(huán)節(jié).

        表1 課程評價指標

        表2 數(shù)據結構

        (1)數(shù)據清洗

        通過問卷調查系統(tǒng)采集的原始數(shù)據中,由于人為因素存在極端現(xiàn)象,譬如全部好評或差評,對這部分數(shù)據做了刪除處理.由于問卷調查系統(tǒng)采集數(shù)據時存在系統(tǒng)或者人為因素影響,有部分指標的采集結果缺失,對于缺失的數(shù)據項,受數(shù)據集的限制,不宜進行刪除,經分析之后,發(fā)現(xiàn)其中某選項出現(xiàn)的頻率在50%以上,為此我們采用眾數(shù)的填補方法.因為出現(xiàn)頻率最高的選項,比例已經超過一半,所以使用眾數(shù)對部分空白的填補并不會影響整個數(shù)據的分析.經過數(shù)據清理,記錄數(shù)為412,占樣本數(shù)據的98.1%.

        表3 部分原始數(shù)據

        (2)數(shù)據轉換

        Apriori 算法主要適用于單維屬性值數(shù)據,換言之,數(shù)據的屬性值都可以看成A是否存在的簡單形式[10].但在現(xiàn)實中,數(shù)據常是多維的,意味著無法直接使用Apriori 算法來挖掘關聯(lián)規(guī)則.根據國家精品課程的評審及教育教學的改革要求,設計的一級評價指標教學隊伍、教學內容教學條件等,為了更加全面的表述一級指標,需要在一級指標下設計二級指標,包含課程負責人與主講、教學隊伍結構及整體素質、教學改革與研究等.而根據課程評價指標采集到的數(shù)據涉及到多個維度,無法直接使用Apriori 算法進行分析.

        針對上述問題,提出一個解決辦法.其思想是,用3 位十進制數(shù)表征課程評價數(shù)據的屬性,其中,第一位數(shù)表示一級指標,分別取1,2,…;第二位數(shù)表示二級指標,根據觀測點的實際設置情況,分別取1,2,…;第三位數(shù),按照采樣數(shù)據等級A/B/C/D/E,分別表示為1/2/3/4/5,見圖1.

        圖1 數(shù)據轉換規(guī)則

        依據轉換規(guī)則構造完成數(shù)據集.譬如,將“一級指標=‘1 教學隊伍’”“二級指標=‘1-1 課程負責人與主講教師’”,與“課程主要觀測點=‘教師風范、學術水平與教學水平’”對應的“等級=‘B’”評價數(shù)據,轉換表征為112.轉換后的部分數(shù)據見表4.

        表4 部分數(shù)據轉化結果

        3.3 實驗環(huán)境

        實驗環(huán)境為i5-6300HQ(2.3 GHz)CPU、16 GB 內存和Microsoft Windows 10 專業(yè)版操作系統(tǒng).在Jetbrains-PyCharm2019.3 集成開發(fā)環(huán)境下,使用Python3.6 作為編程語言,anaconda 作為解釋器.

        3.4 規(guī)則提取與分析

        分別使用傳統(tǒng)Apriori 算法、基于文獻[11]概率興趣度的Apriori 算法和本文采用的基于差異興趣度的Apriori 算法,對形如表3的轉換后課程評價數(shù)據進行關聯(lián)規(guī)則挖掘,并分析結果.

        (1)誤導抑制效果分析

        經過多次重復實驗,設定最小支持度Smin=0.2,最小置信度Cmin=0.45,最小興趣度Imin=0.5.此時,使用傳統(tǒng)Apriori 算法可獲取25 條關聯(lián)規(guī)則.這些關聯(lián)規(guī)則中,很多系無意義或誤導性的,部分誤導性規(guī)則見表5.引入興趣度后只能提取18 條關聯(lián)規(guī)則.

        表5 提取的部分無意義或誤導性關聯(lián)規(guī)則

        以表5中的規(guī)則1為例.現(xiàn)實世界中,指標項“網絡教學資源”與“教學隊伍結構及整體素質”之間存在內在關聯(lián)的支持度并不高,很難揭示資源類和人員類事務間的邏輯蘊含關系.但規(guī)則1 卻顯示,網絡教學資源獲評“優(yōu)”時,教學隊伍結構及整體素質將以較大概率獲評“中”,顯得牽強.類似地,規(guī)則2 顯示,條件類事務與人員類事務間存在關聯(lián)關系,也很難成立.

        進一步地,分別改變參數(shù)設置(最小置信度Cmin=0.3,最小興趣度Imin=0.5 )、(最小支持度Smin=0.2,最小興趣度Imin=0.5)、(最小支持度Smin=0.2,最小置信度Cmin=0.3),使用Apriori的傳統(tǒng)算法、概率興趣度的Apriori 算法和改進算法在不同條件下,進行提取規(guī)則實驗,以考察改進的Apriori 算法對提取有趣規(guī)則的篩選作用.圖2至圖4顯示了不同組合條件下,3 個算法提取的關聯(lián)規(guī)則數(shù)量變化.

        圖2至圖4顯示,在支持度、置信度、興趣度等參數(shù)組合的各自設定范圍內,提取的規(guī)則數(shù)量分別隨支持度、置信度、興趣度的增大而減少.

        圖2 不同支持度下3 種算法提取規(guī)則數(shù)量比較(Cmin=0.3,Imin=0.5)

        圖2在設定置信度和興趣度參數(shù)的前提下,隨著支持度增大,使用改進的Apriori 算法提取的規(guī)則數(shù)量開始時較使用傳統(tǒng)算法減少較多,最后逐漸接近,而改進的Apriori 算法提取的規(guī)則數(shù)量較概率興趣度的Apriori 算法雖然有部分較多,但整體趨勢還是少于概率興趣度的Apriori 算法,表明加入興趣度的Apriori算法可減少誤導性規(guī)則產生,改進的Apriori 算法更能減少誤導性規(guī)則的產生.

        圖3 不同置信度下3 種算法提取規(guī)則數(shù)量比較(Smin=0.2,Imin=0.5)

        圖3在設定支持度和興趣度參數(shù)的前提下,隨著置信度增大,使用改進的Apriori 算法產生的規(guī)則數(shù)量開始時較使用傳統(tǒng)Apriori 算法少許多,最后逐漸接近,而改進的Apriori 算法產生的規(guī)則數(shù)量整體趨勢少于概率興趣度Apriori 算法,表明引入興趣度之后可減少誤導性規(guī)則生成的數(shù)量,改進的Apriori 算法更能減少誤導性規(guī)則的產生.

        圖4在設定支持度和置信度參數(shù),且在Apriori 算法中引入興趣度的前提下,隨著興趣度增大,概率興趣度Apriori 算法以及改進的Apriori 算法提取的規(guī)則數(shù)量逐漸變少,從整體趨勢觀察,改進的Apriori 算法產生的規(guī)則數(shù)量要少于概率興趣度Apriori 算法.與之相比,使用傳統(tǒng)Apriori 算法進行挖掘,提取的規(guī)則數(shù)量沒有變化,表明引入興趣度可減少誤導性規(guī)則的產生,改進的Apriori 算法更能減少誤導性規(guī)則的產生.

        圖4 不同興趣度下3 種算法提取規(guī)則數(shù)量比較(Smin=0.2,Cmin=0.3)

        綜上所述,使用本文算法較使用傳統(tǒng)Apriori 算法以及概率Apriori 算法提取的規(guī)則數(shù)量少,能夠有效抑制無意義的誤導性關聯(lián)規(guī)則的產生,提高了數(shù)據挖掘的效率和數(shù)據中隱含的知識的精確性.

        (2)提取的規(guī)則解析

        設定支持度Smin=0.2,最小置信度Cmin=0.45,最小興趣度Imin=0.5,運行改進的Apriori 算法,提取到18 條強關聯(lián)規(guī)則.部分規(guī)則及其解析見表6.

        根據獲得的關聯(lián)規(guī)則,繪制課程評價關聯(lián)規(guī)則網絡圖,以直觀了解課程指標間的關系以及不同指標的重要性差異,見圖5.由18 條強關聯(lián)規(guī)則構成的網絡圖中,點代表課程評價指標,點的大小取決于點的粗度;邊為有向邊,由規(guī)則前件指向規(guī)則后件,邊的粗細由規(guī)則的置信度決定,越粗代表置信度越大;各點之間的連通反映了各指標之間的影響.

        表6 提取的部分強關聯(lián)規(guī)則及其解析(Smin=0.2,Cmin=0.45,Imin=0.5)

        考察提取到的關聯(lián)規(guī)則,可以發(fā)現(xiàn)人的因素對于課程建設的重要性.表6中的規(guī)則1 至4 顯示,在一支教學團隊中,可通過發(fā)揮教師的能動性,提升教材選用、教學改革及教學設計等的質量.由此啟發(fā)高校的教學管理者,應在課程建設過程中,注意發(fā)揮人的中心地位,對課程負責人和主講教師的遴選給予足夠重視.對于教師團隊建設,應優(yōu)先選用學歷高教齡長的教師出任課程負責人,同時保持學歷結構和年齡結構等的平衡,以提高課程教學設計、教學改革與研究的水平,奠定教學質量提升的基礎.

        圖5 課程評價指標間的關聯(lián)規(guī)則網絡圖

        接著考察教學資源對課程建設的物質保障作用.表6中的規(guī)則5,6 及規(guī)則9 顯示,各類教學資源對于課程內容遴選、教學設計等具有基礎性物質保障作用.由此啟發(fā)高校的教學管理者,在課程建設中,資源配置要更多地向教學資源傾斜.特別是,在教育部倡導并加大線上線下混合式一流課程建設力度的今天,網絡教學資源的重要性愈發(fā)凸顯.若在網絡教學資源建設方面掉隊,人的作用縱然能充分發(fā)揮,也難免會有“無米之炊”之虞.

        最后考察信息技術和教學方法對課程建設的支撐性作用.表6中規(guī)則7,8 顯示,信息技術和多種教學方法的綜合使用,有利于提高教學設計、教學改革與研究的水平.反之,信息技術素養(yǎng)欠缺,以及基于信息技術教學方法落伍,將以較大概率導致教學設計質量變差.作為高校的教學管理者,應重視教學方法和信息技術在發(fā)揮教師能動性和教學資源物質保障作用中的支撐和橋梁作用,一方面提高學校的教育信息化建設水平,另一方面,通過加強建設信息技術的校園文化,營造學習和提高信息技術水平的氛圍,同時引進社會資源,加大教師培訓力度,提高教師的信息化素養(yǎng),掌握更多的基于現(xiàn)代信息技術的工具使用技能.

        4 結論

        從服務課程建設的目的出發(fā),對數(shù)據驅動的課程評價方法進行研究.通過挖掘多維度課程評價數(shù)據,提取隱含的知識和模式,將發(fā)現(xiàn)的知識用于指導課程建設,輔助教學管理決策.在不同支持度、置信度和興趣度下,使用改進Apriori 算法對課程評價數(shù)據進行關聯(lián)規(guī)則挖掘的結果,與使用傳統(tǒng)Apriori 算法所得結果的比較顯示,本文方法能明顯抑制誤導性規(guī)則的生成,提高挖掘效率,增強隱含在多維度評價數(shù)據中知識指導的精準度.未來研究,將重點圍繞高等教育領域更多的數(shù)據驅動管理決策需求和數(shù)據挖掘效率提升展開.

        猜你喜歡
        項集置信度關聯(lián)
        硼鋁復合材料硼含量置信度臨界安全分析研究
        “一帶一路”遞進,關聯(lián)民生更緊
        當代陜西(2019年15期)2019-09-02 01:52:00
        正負關聯(lián)規(guī)則兩級置信度閾值設置方法
        計算機應用(2018年5期)2018-07-25 07:41:26
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        置信度條件下軸承壽命的可靠度分析
        軸承(2015年2期)2015-07-25 03:51:04
        關聯(lián)規(guī)則中經典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        一種頻繁核心項集的快速挖掘算法
        計算機工程(2014年6期)2014-02-28 01:26:12
        多假設用于同一結論時綜合置信度計算的新方法?
        電訊技術(2011年11期)2011-04-02 14:00:37
        語言學與修辭學:關聯(lián)與互動
        當代修辭學(2011年2期)2011-01-23 06:39:12

        中文天堂一区二区三区| 亚洲∧v久久久无码精品| 91av小视频| 蜜桃av观看亚洲一区二区| 国产一级内射一片视频免费| 少妇久久久久久被弄高潮| 亚洲精品92内射| 18分钟处破好疼哭视频在线观看| 免费视频一区二区| 亚洲一道一本快点视频| 国产情侣自拍偷拍精品| 国产三区三区三区看三区| 亚洲色图专区在线视频| 国产精品精品自在线拍| 国产午夜福利精品久久2021| 欧亚精品无码永久免费视频| 草青青在线视频免费观看| 一本丁香综合久久久久不卡网站| 蜜臀aⅴ国产精品久久久国产老师| 精品的一区二区三区| 亚洲熟女熟妇另类中文| 一区二区三区高清在线观看视频 | 精品欧美在线| 日本成人在线不卡一区二区三区| 亚洲精一区二区三av| 波多野结衣中文字幕一区二区三区 | 免费国精产品自偷自偷免费看 | 国产三级欧美| 少妇aaa级久久久无码精品片| 欧美拍拍视频免费大全| 国产毛片黄片一区二区三区| 精品乱人伦一区二区三区| 无码三级在线看中文字幕完整版| 五月天婷婷一区二区三区久久| 日本在线观看一二三区| 国产草草影院ccyycom| 欧美熟妇色ⅹxxx欧美妇| 国产成人福利在线视频不卡| 国产激情免费观看视频| 一本色道无码不卡在线观看| 亚洲人成亚洲精品|