亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于主題模型的教學(xué)評(píng)價(jià)研究

        2019-05-24 14:12:12張揚(yáng)武
        電腦知識(shí)與技術(shù) 2019年7期
        關(guān)鍵詞:教學(xué)評(píng)價(jià)

        張揚(yáng)武

        摘要:教學(xué)評(píng)價(jià)在促進(jìn)課堂教學(xué)方面所起到的作用越來(lái)越重要,學(xué)生的主觀評(píng)價(jià)內(nèi)容往往過(guò)于繁雜,而且主題分散,不容易形成中心聚焦。針對(duì)教學(xué)評(píng)價(jià)中的內(nèi)容分散,難以凝聚情感傾向的問(wèn)題,本文提出一種基于主題模型的教學(xué)評(píng)價(jià)方法,根據(jù)貝葉斯概率理論,學(xué)生評(píng)價(jià)語(yǔ)句是學(xué)生對(duì)教師教學(xué)效果的情感主題的分布,然后在一定主題下的詞語(yǔ)分布中產(chǎn)生一個(gè)詞語(yǔ),這個(gè)產(chǎn)生過(guò)程通過(guò)發(fā)現(xiàn)潛在主題分布,獲得有價(jià)值的主題。實(shí)驗(yàn)結(jié)果表明,主題模型教學(xué)評(píng)價(jià)比傳統(tǒng)方法更能獲得真實(shí)有效的評(píng)價(jià)數(shù)據(jù),幫助教師提升教學(xué)質(zhì)量。

        關(guān)鍵詞:教學(xué)評(píng)價(jià);主題模型;LDA

        中圖分類號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1009-3044(2019)07-0032-03

        Abstract:Teaching evaluation plays a more and more important role in promoting teaching.Aiming at the problem of scattered content and difficult to condense emotional tendency in teaching evaluation, this paper proposes a teaching evaluation method based on topic model.According to Bayesian probability theory, the evaluation sentences are the distribution of emotional topics of students' teaching effect to teachers, and then a word is generated in the distribution of words under certain themes. The experimental results show that the model of teaching evaluation can obtain more real and effective evaluation data than traditional methods, and help teachers to improve the quality of teaching.

        Key words: Teaching evaluation; Topic model; LDA

        1 引言

        隨著以計(jì)算機(jī)技術(shù)為代表的因特網(wǎng)的快速發(fā)展,數(shù)據(jù)生產(chǎn)涉及社會(huì)各個(gè)方面,其中包括社交、學(xué)習(xí)和工作等。數(shù)據(jù)訪問(wèn)具有移動(dòng)、存儲(chǔ)量大和帶寬高等特點(diǎn),因此,對(duì)數(shù)據(jù)的存儲(chǔ)、訪問(wèn)以及使用將會(huì)越來(lái)越困難,也將越來(lái)越迫切。在海量分布的數(shù)據(jù)中發(fā)現(xiàn)有用的模式,以及如何對(duì)數(shù)據(jù)進(jìn)行挖掘成為當(dāng)前技術(shù)研究的熱點(diǎn)和應(yīng)用場(chǎng)景的要求。主題模型(Latent Dirichlet Allocation, LDA)是主題模型領(lǐng)域非常著名的算法,由David M. Blei等人于2003年提出的[1]。LDA模型是一種基于概率的非監(jiān)督機(jī)器學(xué)習(xí)方法,可以識(shí)別大規(guī)模文檔集或語(yǔ)料庫(kù)中潛在的隱藏信息。文檔中的詞語(yǔ)是有背后隱藏主題隨機(jī)抽取出來(lái)的,因此,LDA可以說(shuō)是由文檔產(chǎn)生主題分布,由主題產(chǎn)生詞分布的概率生成模型,在文本分類、話題跟蹤、數(shù)據(jù)挖掘和情感發(fā)現(xiàn)等領(lǐng)域有著廣泛地應(yīng)用。

        教學(xué)評(píng)價(jià)是為了激發(fā)和調(diào)動(dòng)學(xué)生學(xué)習(xí)的積極性,引導(dǎo)教師開(kāi)展課堂教學(xué)活動(dòng),促進(jìn)學(xué)校教育教學(xué)質(zhì)量的提升,落實(shí)教學(xué)中心地位[2]。依據(jù)教學(xué)目標(biāo)對(duì)課堂實(shí)施過(guò)程進(jìn)行教學(xué)評(píng)價(jià),評(píng)價(jià)結(jié)果用來(lái)服務(wù)提升教學(xué)質(zhì)量的教學(xué)決策。很多學(xué)校開(kāi)始逐漸從代替?zhèn)鹘y(tǒng)的紙質(zhì)方式過(guò)渡到網(wǎng)絡(luò)方式開(kāi)展對(duì)課堂的教學(xué)評(píng)價(jià)。建立合理的教學(xué)評(píng)價(jià)機(jī)制是衡量教學(xué)水平的重要標(biāo)志,評(píng)價(jià)結(jié)果可讀性是發(fā)揮教學(xué)評(píng)價(jià)機(jī)制作用的前提和保障。提高結(jié)果可讀性需要從大量評(píng)價(jià)數(shù)據(jù)中搜索隱藏其中的重要信息,通過(guò)規(guī)則和統(tǒng)計(jì)規(guī)律獲得可解釋的內(nèi)容,主題模型就是一種統(tǒng)計(jì)模型。

        2 相關(guān)工作

        LDA模型已經(jīng)被學(xué)術(shù)界廣泛接受,給應(yīng)用帶來(lái)前所未有的啟發(fā)和高度,能夠滿足大數(shù)據(jù)需求,適用各種文本生產(chǎn),解決用戶生成數(shù)據(jù)問(wèn)題。LDA主題模型是一種多項(xiàng)式分布的概率生成模型,可以上溯到巴塞爾問(wèn)題,歐拉在解決巴塞爾問(wèn)題的同時(shí),發(fā)現(xiàn)了gamma函數(shù),被廣泛應(yīng)用在概率論。解析數(shù)論的創(chuàng)建者Dirichlet提出了Dirichlet分布。二項(xiàng)分布的參數(shù)符合Beta分布,而多項(xiàng)式分布的參數(shù)符合Dirichlet分布,并且后驗(yàn)分布和先驗(yàn)分布是一對(duì)共軛分布。后來(lái),Blei發(fā)展了PLSA模型,在Dirichlet分布的基礎(chǔ)上,結(jié)合貝葉斯先驗(yàn)概率,提出了LDA模型。LDA模型隱含變量和參數(shù)非常多,求解問(wèn)題十分復(fù)雜,最初用EM變分方法訓(xùn)練,后來(lái)使用吉布斯采樣來(lái)求解[3]。在主題模型中,每個(gè)詞的產(chǎn)生過(guò)程屬于獨(dú)立同分布的重復(fù)實(shí)驗(yàn)。當(dāng)一個(gè)詞被產(chǎn)生時(shí),根據(jù)貝葉斯假設(shè)的概率選擇某個(gè)主題,繼而以另一個(gè)假設(shè)概率在該主題下產(chǎn)生某個(gè)詞典中的詞[4],周而復(fù)始地重復(fù)此過(guò)程便產(chǎn)生了語(yǔ)料集。獨(dú)立同分布的主題分布,根據(jù)文檔和頻率學(xué)派,生成潛在主題分布和觀察結(jié)果的詞,這是一種詞袋模型[5]。教學(xué)評(píng)價(jià)中的詞主觀性強(qiáng)、上下文強(qiáng)和多義性強(qiáng)等特點(diǎn),如果只是簡(jiǎn)單分類,將會(huì)導(dǎo)致主題分布具有一定的局限性[6]。很顯然,在教學(xué)評(píng)價(jià)文本中,在統(tǒng)計(jì)概率模型上進(jìn)行分類和發(fā)現(xiàn)。本文提出一種主題模型的教學(xué)評(píng)價(jià)分類方法,在詞與詞之間發(fā)現(xiàn)背后的主題聯(lián)系,按照主題進(jìn)行分類和排序。

        3 教學(xué)評(píng)價(jià)主題模型

        3.1 LDA模型

        對(duì)于數(shù)據(jù)集中的每一篇文檔,文檔生成過(guò)程分為三步[7],其過(guò)程如圖1所示。方框表示獨(dú)立重復(fù)實(shí)驗(yàn)次數(shù),也就是采樣次數(shù)。因此,M為文檔總數(shù),也就是M框圖里的步驟重復(fù)次數(shù)。N為文檔中單詞數(shù)量[8],主題數(shù)量為K。

        3.2 評(píng)價(jià)主題模型

        中文詞語(yǔ)與英文單詞不一樣,英文單詞用空格分開(kāi)間隔,而中文句子之間才有標(biāo)點(diǎn)符號(hào),句子內(nèi)部詞語(yǔ)之間并沒(méi)有確定的間隔標(biāo)識(shí),此外,還要考慮到中文詞匯的復(fù)雜上下文環(huán)境,詞語(yǔ)的歧義和多義性。因此,中文文本在預(yù)處理階段需要分詞,并且還需要進(jìn)行去除標(biāo)點(diǎn)符號(hào)、刪除高頻詞和過(guò)濾停止詞等等操作[12]。

        根據(jù)教學(xué)評(píng)價(jià)指標(biāo)和教學(xué)質(zhì)量管理決策領(lǐng)域,設(shè)定主題數(shù)目K。依據(jù)先驗(yàn)參數(shù)經(jīng)驗(yàn),設(shè)置文檔到主題分布的超參數(shù)α,以及主題到詞分布的超參數(shù)β。對(duì)應(yīng)語(yǔ)料集和詞典數(shù)量,分配隱含主題Ζ矩陣和初始化LDA教學(xué)評(píng)價(jià)模型。然后,設(shè)置迭代次數(shù),進(jìn)行吉布斯采樣。達(dá)到停止條件后,輸出各個(gè)詞的主題編號(hào)Ζ矩陣,生成tassgin文件。輸出文檔到主題的分布θ矩陣,生成theta文件,M行K列。輸出文檔到主題的分布φ矩陣,生成phi文件,K行V列。教學(xué)評(píng)價(jià)主題模型框架如圖2所示。

        吉布斯采樣是一種統(tǒng)計(jì)學(xué)中用于馬爾科夫蒙特卡洛(MCMC)的算法,在難以直接采樣時(shí),從某一多變量概率分布中近似抽取樣本序列,然后用后驗(yàn)概率偽隨機(jī)數(shù)來(lái)估計(jì)變量,該序列可用于近似聯(lián)合分布、部分變量的邊緣分布或計(jì)算積分,吉布斯采樣偽代碼如圖3所示。

        4 實(shí)驗(yàn)結(jié)果

        實(shí)驗(yàn)語(yǔ)料集選自教學(xué)管理系統(tǒng),評(píng)價(jià)數(shù)為686篇,經(jīng)過(guò)分詞后的詞典中詞數(shù)為1783,主題數(shù)量設(shè)置如表1所示。設(shè)置文檔到主題分布超參數(shù)α為0.5,設(shè)置主題到詞分布超參數(shù)β也為0.5,迭代次數(shù)為1000,各個(gè)主題下排序的詞數(shù)為5。

        將上述參數(shù)值更新到配置文件setting.conf中,讀取語(yǔ)料集文件train.dat。按照迭代次數(shù)進(jìn)行吉布斯采樣,完成后輸出4個(gè)文件,分別是model_theta、model_phi、model_tassign和model_twords文件。model_theta是文檔到主題的分布,model_phi是主題到詞的分布,model_tassign是詞的隱含主題編號(hào),model_twords是每個(gè)主題下按分布概率進(jìn)行排序并且位置靠前的詞,排序情況如表2所示。

        5 結(jié)束語(yǔ)

        教學(xué)評(píng)價(jià)越來(lái)越重視主觀評(píng)價(jià),評(píng)價(jià)用語(yǔ)越來(lái)越傾向網(wǎng)絡(luò)語(yǔ)言化趨勢(shì),有著與普通文本不同的特征。針對(duì)學(xué)生的主觀評(píng)價(jià)內(nèi)容分散和不容易形成突出點(diǎn),本文提出一種基于主題模型的教學(xué)評(píng)價(jià)方法,通過(guò)中文文本預(yù)處理,將分詞詞語(yǔ)輸入到教學(xué)評(píng)價(jià)模型,根據(jù)參評(píng)學(xué)生數(shù)量合理設(shè)置主題數(shù)量,然后在貝葉斯概率模型和Dirichlet分布的基礎(chǔ)上進(jìn)行吉布斯抽樣,輸出詞語(yǔ)的主題分布情況。實(shí)驗(yàn)結(jié)果表明,主題模型教學(xué)評(píng)價(jià)比傳統(tǒng)方法可以獲得更好的分類效果和主題推薦詞,為教育教學(xué)決策活動(dòng)提供有效支持。

        參考文獻(xiàn):

        [1] David M. Blei, Andrew Y. Ng, Michael I. Jordan. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research,2003(3):993-1022.

        [2] 李民.強(qiáng)化教學(xué)評(píng)價(jià)機(jī)制推動(dòng)臨床醫(yī)學(xué)教學(xué)質(zhì)量提升[J].重慶醫(yī)學(xué),2011,40(11):1131-1133.

        [3] David M. Blei, J. Lafferty. Correlated Topic Models. The Proceeding of International Conference on Machine Learning, 113-120, 2006.

        [4] David M. Blei, J. Lafferty, D. John. Dynamic Topic Models. The Proceedings of the International Conference Machine Learning, 113-120, 2006.

        [5] Y. Yao, Q. Li. Term Weighting Schemes for Emerging Event Detection. The IEEE International Conference on Web Intelligence & Intelligent Agent Technology, Vol.1:105-112, 2013.

        [6] P. A. Chew. Terms Weighting Schemes for Latent Dirichlet Allocation. The Proceeding of the North American Chapters of the Association for Computation Linguistics, 2010(3):465-473.

        [7] 徐戈, 王厚峰. 自然語(yǔ)言處理中主題模型的發(fā)展[J].計(jì)算機(jī)學(xué)報(bào), 2011,34(8) .

        [8] 張晨逸,孫建伶. 基于MB-LDA模型的微博主題挖掘[J].計(jì)算機(jī)研究與發(fā)展,2011,48(10).

        [9] 郭藍(lán)天,李揚(yáng)等.一種基于LDA主題模型的話題發(fā)現(xiàn)方法[J].西北工業(yè)大學(xué)學(xué)報(bào),2016,34(4):697-701.

        [10] 石晶,胡明,石鑫.基于LDA模型的文本分割[J].計(jì)算機(jī)學(xué)報(bào),2008,31(10).

        [11] 李文波, 孫樂(lè).基于Labeled-LDA模型的文本分類新算法[J].計(jì)算機(jī)學(xué)報(bào),2008,31(4).

        [12] 王和勇,崔蓉.在線用戶評(píng)論的主題研究[J].現(xiàn)代情報(bào),2015,35(5).

        猜你喜歡
        教學(xué)評(píng)價(jià)
        論初中英語(yǔ)教學(xué)評(píng)價(jià)的有效性
        考試周刊(2016年91期)2016-12-08 22:04:50
        多元化評(píng)價(jià)在小學(xué)信息技術(shù)教學(xué)中的應(yīng)用
        教師·下(2016年10期)2016-12-03 09:37:03
        中小學(xué)信息技術(shù)教學(xué)評(píng)價(jià)研究綜述
        東方教育(2016年16期)2016-11-25 02:42:00
        基于馬爾科夫預(yù)測(cè)的課程教學(xué)模糊綜合質(zhì)量評(píng)價(jià)
        新課標(biāo)背景下初中英語(yǔ)教學(xué)多元評(píng)價(jià)研究
        淺談小學(xué)美術(shù)課堂中教學(xué)評(píng)價(jià)的有效性
        將“旋律——感受”反饋機(jī)制融入中學(xué)生物課堂的嘗試
        試論通過(guò)評(píng)價(jià)促進(jìn)學(xué)生的語(yǔ)言習(xí)得
        信息技術(shù)—Internet實(shí)用教程教學(xué)設(shè)計(jì)的思考與實(shí)踐
        對(duì)農(nóng)村小學(xué)數(shù)學(xué)課堂教學(xué)評(píng)價(jià)的認(rèn)識(shí)和看法
        考試周刊(2016年85期)2016-11-11 01:23:32
        欧美日韩国产在线观看免费| 日韩精品一区二区三区视频| 久久日本视频在线观看| 久久精品人人做人人爱爱| 啪啪无码人妻丰满熟妇| 中文字幕人妻中文| 一区二区三区成人av| 精品国产yw在线观看| 高清偷自拍第1页| 国产美女69视频免费观看| 经典亚洲一区二区三区| 插插射啊爱视频日a级| a级毛片高清免费视频就| 久久久综合九色合综国产| 精品国产麻豆免费人成网站| 日本在线视频www色| 伊人狠狠色丁香婷婷综合| 国产在线欧美日韩一区二区| 亚洲精品无人区一区二区三区| 亚洲日本一区二区在线| 日韩精品久久久久久免费| 精品久久久久久久久久久aⅴ| 国产乱人伦AV在线麻豆A| 亚洲女同性恋在线播放专区| 欧美老妇牲交videos| 亚洲国产韩国欧美在线| 欧美黑人xxxx性高清版| 精品人妻码一区二区三区红楼视频| 99在线精品视频在线观看| 欧洲女人性开放免费网站| 精品国产免费久久久久久| 国产午夜三级精品久久久| 色综合久久久无码中文字幕| 广东少妇大战黑人34厘米视频| 亚洲国产成人精品91久久久| 国产自拍成人在线免费视频| 国产av国片精品有毛| 午夜福利92国语| 92精品国产自产在线观看48页| 人妻少妇被粗大爽视频| 中文字幕乱码亚洲精品一区|