李博 齊耀龍
摘要:“消費(fèi)者就是上帝”對于教育行業(yè)來說也一樣,所以來自“上帝”——學(xué)生的反饋就是推動(dòng)教學(xué)的助推劑。和各級教育機(jī)構(gòu)一樣,在高校中也會(huì)有學(xué)生對教師的評教,有的分項(xiàng)打分,有的可以文字?jǐn)⑹觥S捎趯W(xué)生人數(shù)較多,直接打分還好處理,主觀評價(jià)的分析就比較困難了。在耗費(fèi)了大量的T時(shí)后可能還是不能得到想要的結(jié)論,那就要考慮自動(dòng)分析了。這里在比較了主流自動(dòng)分析方法后,推薦使用深度學(xué)習(xí)的方法來進(jìn)行數(shù)據(jù)挖掘達(dá)到了很好的效果。
關(guān)鍵詞:情感分析;深度學(xué)習(xí);評教;自動(dòng)分析;python
中圖分類號:TP311.1 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2020)20-0082-02
1引言
在高校的基礎(chǔ)計(jì)算機(jī)教學(xué)中,由于教師和學(xué)生見面的時(shí)間比較短,再加上班級人數(shù)有時(shí)比較多,所以學(xué)生評教就成為反饋中的重中之重。2020年初的學(xué)期由于疫情的影響,都在進(jìn)行網(wǎng)上授課,與學(xué)生之間的見面時(shí)間更是基本為零,特殊時(shí)期教師與學(xué)生之間溝通的方法除了社交媒體就剩下網(wǎng)上評教系統(tǒng)了。
評教系統(tǒng)一般分為客觀打分和主觀評語兩部分,其中客觀打分可以直接在Excel中進(jìn)行分析,形成圖表,而主觀評語部分以往都是人工進(jìn)行查看,但是評語太多,工作人員往往走馬觀花,抓不住要點(diǎn);或者直接發(fā)給教師自己看,也會(huì)因?yàn)樘?,大部分教師根本不看。造成了本來最重要的學(xué)生的心聲反而被丟棄了,長此以往評教必將成為面子事,失去了教師學(xué)生間的最好最直接的溝通橋梁。
2解決思路
學(xué)生對教師的評語實(shí)質(zhì)上就是情感問題,可以進(jìn)行情感分析。情感分析也稱為意見挖掘(Opinion Mining),是自然語言處理(NLP)的一個(gè)領(lǐng)域,它構(gòu)建的系統(tǒng),用于在文本中識別和提取觀點(diǎn)。學(xué)生對于教師的評語主要分為主觀性評價(jià)和客觀性評價(jià)??陀^性評價(jià)是客觀性描述,不帶有感情色彩和情感傾向,主觀性評價(jià)則是學(xué)生對教師或者教學(xué)方法的看法或想法,帶有自己的喜好厭惡等情感傾向。區(qū)分主客觀評價(jià)主要以情感詞識別為主。
目前主觀性文本情感傾向性分析的研究工作,主要研究思路分為基于語義的情感詞典方法和基于機(jī)器學(xué)習(xí)的方法?;谡Z義的情感詞典方法主要利用已構(gòu)建的詞典(目前中文情感詞典的構(gòu)建主要是對知網(wǎng)How net的擴(kuò)充),對語料庫進(jìn)行中文分詞處理,然后掃描每個(gè)單詞,與情感詞典中的詞進(jìn)行語義相似度計(jì)算,當(dāng)相似度達(dá)到一定閾值時(shí)即可判斷該詞的情感傾向和權(quán)值。由于中文的多樣性靈活性,加上詞典龐大的詞匯量和不夠高效的匹配算法,這種方法的分析正確性難以突破。而另一方面,最近幾年,以Google公司和Facebook公司為首的企業(yè)在深度學(xué)習(xí)領(lǐng)域有了很大的突破。所以我們決定采用基于機(jī)器學(xué)習(xí)的方法,用Python這種在AI方面有突出應(yīng)用的語言來對學(xué)生評價(jià)進(jìn)行分析數(shù)據(jù)挖掘,形成有用的模型,反饋回教師進(jìn)行改進(jìn)提高。
3具體實(shí)現(xiàn)
評語分析,用的是Python的基于SnowNLP類庫的數(shù)據(jù)分析挖掘方法。原有庫的字典是以電子商務(wù)的買賣東西的評價(jià)為基礎(chǔ)的,所以我們又把以往對教師和教學(xué)的評價(jià)詞語,包括褒貶以及權(quán)值加入字典中,進(jìn)行訓(xùn)練后,再用來分析評教評語。
下面是對評價(jià)的具體分析步驟(以一條評語為例):斜體為輸出結(jié)果。
from snownlp import SnowNLP
text=‘備課充分,講的也還可以。但是不注意和學(xué)生的互動(dòng),尤其是對提問缺乏耐心。
s= SnowNLP(text)
1結(jié)果一:分詞
print(s.words)
[‘備,‘課,‘充分,‘,,‘講,‘的,‘也,‘還,‘可以,‘。,‘但是,‘不,‘注意,‘和,‘學(xué)生,‘的,‘互動(dòng),‘,,‘尤其,‘是,‘對,‘提問,‘缺乏,‘耐心,‘。]
l結(jié)果二:詞性標(biāo)注
tags=[x for x in s.tags]
print(tags)
[(‘備,‘v),(‘課,‘n ),(‘充分,‘a(chǎn)d),(‘,,‘w),(‘講,‘v),(‘的,‘u),(‘也,‘d),(‘還,‘d),(‘可以,‘v),(‘。,‘w),(‘但是,‘c),(‘不,‘d),(‘注意,‘v),(‘和,‘c),(‘學(xué)生,‘n),(‘的,‘u),(‘互動(dòng),‘v),(‘,,‘w),(‘尤其,‘d),(‘是,‘v),(‘對,‘p),(‘提問,
收稿日期:2020-03-16
基金項(xiàng)目:河北大學(xué)工商學(xué)院第二批課程建設(shè)項(xiàng)目(2019KCJS38);河北大學(xué)第二批“課程思政改革試點(diǎn)課程”建設(shè)項(xiàng)目(KCSZ-02-117)
作者簡介:李博(1973-),男,河北保定人,講師,碩士,主要研究方向?yàn)橛?jì)算機(jī)軟件設(shè)計(jì)、人工智能等。‘vn),(‘缺乏,‘v),(‘耐心,‘a(chǎn)n ),(‘。,‘w )]
l結(jié)果三:斷句
print(s.sentences)
[‘備課充分,‘講的也還可以,‘但是不注意和學(xué)生的互動(dòng),‘尤其是對提問缺乏耐心]
l結(jié)果四:情緒判斷
返回值為正面情緒的概率,越接近1表示正面情緒,越接近0表示負(fù)面情緒
print(text, s.sentiments)
備課充分,講的也還可以。但是不注意和學(xué)生的互動(dòng),尤其是對提問缺乏耐心。0.6773729723566638
l結(jié)果五:關(guān)鍵字抽取
print(s.keywords(limit=10))
[‘互動(dòng),‘學(xué)生,‘不,‘耐心,‘缺乏,‘提問,‘課,‘備,‘還,‘講]
l結(jié)果六:概括總結(jié)文章
print(s.summary(limit=4))
[‘備課充分,‘講的也還可以,‘但是不注意和學(xué)生的互動(dòng),‘尤其是對提問缺乏耐心]
l結(jié)果七:信息衡量
TF-IDF是一種統(tǒng)計(jì)方法,用以評估某一字詞對于整體文件的重要程度。TF詞頻越大越重要,但是文中會(huì)的“我”,“你”,“的”,“得”等無意義詞頻很大,卻信息量幾乎為0,這種情況導(dǎo)致單純看詞頻評價(jià)詞語重要性是不準(zhǔn)確的,因此加入了idf。lDF的主要思想是:如果包含詞條t的文檔越少,也就是n越小,IDF越大,則說明詞條t越重要。TF-IDF綜合起來,才能準(zhǔn)確的綜合的評價(jià)一詞對文本的重要性。
s= SnowNLP([[‘講的一般,‘比較充分],[‘很好,‘有耐心,‘有耐心],[‘很好,‘易懂,‘比較好][‘好老師][‘比較好,‘好老師]])
print(s.tf)
[{‘講的一般:1,‘比較充分:1},{‘很好:1,‘有耐心:2},{‘很好:1,‘易懂:1,‘比較好:1},{‘好老師:1},{‘比較好:1,‘好老師:1}]
print(s.idf)
{‘講的一般:1.0986122886681098,‘比較充分:1.0986122886681098,‘很好:0.33647223662121295,‘有耐心:1.0986122886681098,‘易懂:1.0986122886681098,‘比較好:0.33647223662121295.‘好老師:0.33647223662121295}
l結(jié)果八:文本相似性
print(s.sim([‘好老師]))
[0,O, 0.44592706058233045. 0.3508241329699851]
print(s.sim([‘有耐心]))
[0,1.4052017645754893,0,0,0]
分析完成后,用圖表的方式把每個(gè)專業(yè)的分析結(jié)果直觀地顯示出來(圖l)。
4結(jié)論
目前系統(tǒng)經(jīng)過幾次對學(xué)生主觀評價(jià)的分析,準(zhǔn)確率能達(dá)到86%左右。而且隨著使用的次數(shù)數(shù)據(jù)越來越多,深度學(xué)習(xí)的優(yōu)勢就會(huì)越來越明顯。把原有的人工分析方法占用的教師和教輔的時(shí)間釋放出來更好地為實(shí)際教學(xué)服務(wù)。
以前的評教基本上是每學(xué)期一次,因?yàn)樵瓉矸治龇椒浜?,評教后的結(jié)論遲遲不能出爐?,F(xiàn)在學(xué)生其實(shí)可以做到每次課后都提供實(shí)時(shí)評價(jià),系統(tǒng)實(shí)時(shí)提供結(jié)論,就可以更好的在教學(xué)中做到揚(yáng)長避短,根據(jù)每個(gè)班的實(shí)際情況進(jìn)行教學(xué)的實(shí)時(shí)調(diào)整,真正做到因材施教。
參考文獻(xiàn):
[1]厲小軍,戴霖,施寒瀟,等.文本傾向性分析綜述[J].江大學(xué)學(xué)報(bào),2011,45(7): 1167-1175.
[2] Kuma R A, Sehastian T M. Sentiment analysis on twitter[J].International Journal of Computer ScienCe lssues, 2012, 9(4):628-633.
[3]李方濤.基于產(chǎn)品評論的情感分析研究[D].北京:清華大學(xué),2011.
[4]朱嫣嵐,閔錦,周雅倩,等.基于How Net的詞匯語義傾向計(jì)算[J].中文信息學(xué)報(bào),2006,20(1): 14-20.
【通聯(lián)編輯:王力】