楊立彬?楊芳?尹慧
摘要:隨著教育現(xiàn)代化的發(fā)展,高校學(xué)生的作業(yè)抄襲問題日益突出,嚴重影響了教學(xué)質(zhì)量。過去的研究主要關(guān)注學(xué)生之間的抄襲行為,而本文將注意力放在個體學(xué)生上。采集了學(xué)生的作業(yè)成績、平時測驗成績、期末成績等信息,并采用基于大數(shù)據(jù)分析的方法,建立作業(yè)抄襲檢測模型。通過合理設(shè)置參數(shù),對學(xué)生個體的成績進行比對,以確定是否存在抄襲行為。這種研究有助于教師全面了解學(xué)生的學(xué)業(yè)情況,并能有針對性地提供輔導(dǎo)。通過檢測作業(yè)抄襲行為,不僅可以改善學(xué)風,還能為教師提供有效的教學(xué)管理工具。這種模型的建立和應(yīng)用,對于提高教學(xué)質(zhì)量、減少作業(yè)抄襲現(xiàn)象具有重要意義。
關(guān)鍵詞:作業(yè)抄襲;檢測方法;大數(shù)據(jù)分析;數(shù)學(xué)模型
作業(yè)是評估學(xué)生學(xué)習效果的重要手段,也是教師了解學(xué)生學(xué)習情況和開展個性化教學(xué)的基礎(chǔ)。然而,在高校中,學(xué)生之間抄襲作業(yè)的現(xiàn)象比較普遍。為了省事和圖便利,許多學(xué)生會直接復(fù)制他人的作業(yè)或從網(wǎng)絡(luò)文檔中找到模板,稍作修改甚至不修改就提交給老師,試圖蒙混過關(guān)。這種行為對學(xué)生本身極不負責任,嚴重影響了教學(xué)質(zhì)量,讓許多教師感到困擾。特別是隨著互聯(lián)網(wǎng)的發(fā)展和教育現(xiàn)代化的推進,高校學(xué)生的作業(yè)抄襲問題變得更加突出,逐漸侵蝕并嚴重影響國家人才培養(yǎng)的質(zhì)量[1]。
一、作業(yè)抄襲檢測方法研究分析
(一)研究現(xiàn)狀
對于作業(yè)抄襲問題的研究,教師一直非常關(guān)注且感到困擾。研究可以分為兩類。一類是通過分析學(xué)生抄襲作業(yè)的原因,采取一些措施來遏制抄襲行為。例如,降低作業(yè)的題目難度,增加主觀題,使作業(yè)結(jié)合學(xué)生的生活經(jīng)驗,為每個學(xué)生留下不同的作業(yè)等方式。另一類則是將人工智能算法和數(shù)據(jù)處理分析技術(shù)結(jié)合起來,分析學(xué)生作業(yè)之間的相似度,提出作業(yè)抄襲檢測方法。以王鵬在2017年發(fā)表的《計算機程序抄襲檢測系統(tǒng)的設(shè)計方案》為例,該研究通過對學(xué)生提交的程序?qū)嵺`作業(yè)進行程序相似度計算,找出相似度較高的程序文檔對,進而篩選出疑似抄襲的作業(yè)。另外,楊寅在2019年提出了在大學(xué)生作業(yè)抄襲檢測中應(yīng)用多線程爬蟲技術(shù)的方法。于俊在2021年提出了基于KR和Winnowing的程序代碼作業(yè)相似度檢測算法,該算法提高了學(xué)生作業(yè)相似檢測的精準度,并增加了不同學(xué)生之間作業(yè)相似結(jié)果的區(qū)分度。通過對以上算法的研究發(fā)現(xiàn),以往的作業(yè)抄襲檢測系統(tǒng)主要側(cè)重于對不同學(xué)生作業(yè)之間的相似度進行檢測,從而讓教師能夠宏觀地了解班級整體的作業(yè)完成情況和學(xué)業(yè)水平。這種方法在抄襲檢測方面取得了不錯的效果。然而,這種方法無法對學(xué)生個體的知識點掌握情況進行具體把控,也無法預(yù)測學(xué)生的學(xué)習效果。因此,本文采用的方法恰好彌補了這個不足,并取得了重要的進展。采用基于大數(shù)據(jù)分析的方法,結(jié)合學(xué)生的作業(yè)成績、平時測驗成績和期末成績等數(shù)據(jù),來比對學(xué)生個體的成績情況,從而確定是否存在作業(yè)抄襲行為。這種方法不僅幫助教師全面了解學(xué)生的學(xué)業(yè)情況,還能為他們提供有針對性的輔導(dǎo),進一步提高學(xué)習效果。
(二)問題的分析
本文采用的方法以學(xué)生個體為研究對象,重點比較同一名學(xué)生在每次作業(yè)中不同知識點的得分率與測驗的得分率。通過設(shè)置適當?shù)膮?shù),篩選出差異較大的數(shù)據(jù),以判斷是否存在作業(yè)抄襲行為。這種方法有助于教師全面了解每位學(xué)生的學(xué)習情況,進行有針對性的輔導(dǎo),并準確預(yù)測學(xué)生的總評成績。對于學(xué)生來說,這種方法更有說服力,因為通過數(shù)據(jù)對比,能夠清晰展現(xiàn)每位學(xué)生在不同知識點上的掌握情況和努力程度。同時,該方法有效地杜絕了作業(yè)抄襲現(xiàn)象,對學(xué)風建設(shè)有積極的推動作用。
二、作業(yè)抄襲檢測方法研究主要工作
(一)檢測流程設(shè)計
1.采集數(shù)據(jù)
在超星學(xué)習通平臺中,可以導(dǎo)出學(xué)生的作業(yè)成績、測驗成績和期末成績等數(shù)據(jù)。
作業(yè)成績的采集:作業(yè)總共6個模塊。其中,第一模塊是關(guān)于極限與連續(xù),包含7個知識內(nèi)容;第二模塊是導(dǎo)數(shù)及其應(yīng)用,包含8個知識內(nèi)容;第三模塊是不定積分,包含3個知識內(nèi)容;第四模塊是定積分及其應(yīng)用,包含3個知識內(nèi)容;第五模塊是微分方程,包含2個知識內(nèi)容;第六模塊是空間解析幾何,包含1個知識內(nèi)容??傆嫻灿?4個知識內(nèi)容。
測驗成績的采集:章末測驗共有5次,每次測驗安排10個小題;期中測試1次,安排10個小題,共60個小題。
期末考試成績的采集:期末考試共22個題,其中填空題5個小題,單項選擇題5個小題,判斷題5個小題,解答題7個小題。
綜上共需采集106條數(shù)據(jù)。
2.數(shù)據(jù)的分析
在每一模塊作業(yè)完成后,安排一次章末測驗,以此評估學(xué)生對知識點的掌握情況。具體的評估方法是計算測驗成績與作業(yè)成績之間的差值,若兩者差值在0.3~0.7,則存在一定作業(yè)抄襲嫌疑;差值高于0.7,則存在明顯作業(yè)抄襲現(xiàn)象;低于0.3,則無作業(yè)抄襲嫌疑。接著進行下一模塊的作業(yè)和章末測驗,再次評估學(xué)生對知識點的掌握情況。若差值在0.3~0.7之間則存在一定作業(yè)抄襲嫌疑,高于0.7存在明顯抄襲嫌疑,低于0.3無抄襲嫌疑。如此循環(huán),若每次評測都不存在抄襲行為則進行期末考試,并計算各知識點掌握程度。
3.建立作業(yè)抄襲檢測系統(tǒng)模型
通過以上分析的結(jié)果,建立數(shù)學(xué)模型,分析學(xué)生知識點掌握程度。
4.模型的檢驗
通過對海量的學(xué)生作業(yè)、測驗成績進行采集,利用統(tǒng)計分析的方法將作業(yè)成績與測驗成績進行對比,以及與學(xué)生交談等方式,評測模型的準確性,并通過修改測評指標找到適當?shù)脑u估指標,建立數(shù)學(xué)模型,繼續(xù)不斷優(yōu)化。
(二)檢測步驟
Step1:作業(yè)成績采集。采集學(xué)生第一模塊知識內(nèi)容1~知識內(nèi)容7各次作業(yè)的得分,計算出得分率;
Step2:測驗成績采集。采集學(xué)生章末測驗一中知識內(nèi)容1~知識內(nèi)容7各小題的得分,計算出得分率;
Step3:合理性判定。評估第一模塊中各知識點掌握合理性。
若作業(yè)成績與測驗成績得分率差值在0.3~0.7,則此學(xué)生作業(yè)存在一定作業(yè)抄襲嫌疑;
若作業(yè)成績與測驗成績得分率差值大于0.7,則此學(xué)生作業(yè)存在作業(yè)抄襲嫌疑;
若作業(yè)成績與測驗成績得分率差值小于0.3,則此學(xué)生作業(yè)不存在作業(yè)抄襲嫌疑。
Step4:結(jié)果分析。
若作業(yè)成績與測驗成績得分率差值小于0.3,則進行第二模塊的作業(yè)與測驗,并重復(fù)Step1~Step3;
若作業(yè)成績與測驗成績得分率差值大于或者等于0.3,則教師采取一定的措施,確定學(xué)生是否存在抄襲。針對確實存在抄襲的作業(yè),要求學(xué)生改正后,再進入第二模塊的學(xué)習。
Step5:重復(fù)以上步驟,直至完成第六模塊的作業(yè)與測驗,并進行期末考試。
Step6:計算期末考試各知識點的得分,計算知識點掌握程度,評估課程目標達成度。
Step7:出具課程學(xué)業(yè)評價報告。
(三)檢測過程可能存在的問題
雖然學(xué)生的課后作業(yè)成績可以通過學(xué)習通平臺導(dǎo)出,且較為方便,但是整個班級的期末考試成績及每小題得分需要手動采集,工作量較大,對數(shù)據(jù)進行整理和分析問題也比較困難。
考慮到整個檢測系統(tǒng)的嚴謹性,僅憑數(shù)據(jù)不能完全確定該學(xué)生是否存在抄襲行為。所以在后續(xù)過程中需要利用一定的時間,持續(xù)性觀察學(xué)生們的實時情況,多和學(xué)生交流,對比每個學(xué)生平時章末測試的成績和最終期末的成績。對于浮動范圍較大的學(xué)生要多多留意,叫到辦公室談話或者向班級其他同學(xué)詢問的方式來加以驗證,最終檢驗出模型的合理性。
三、作業(yè)抄襲檢測方法實現(xiàn)
以2022級工商管理專業(yè)1班的兩名同學(xué)的成績?yōu)槔M行數(shù)據(jù)的采集、分析等。
(一)采集學(xué)生課后作業(yè)成績及測驗成績,繪制散點圖
學(xué)生第一模塊課后作業(yè)及章末測驗知識內(nèi)容得分率如表1所示,散點圖誒圖1所示。
(二)數(shù)據(jù)分析
通過數(shù)據(jù)比對發(fā)現(xiàn),李娜同學(xué)知識點3的作業(yè)得分率為1.00,測驗的得分率為0.50,兩者之差大于0.3,存在一定的作業(yè)抄襲嫌疑;知識點5的作業(yè)得分率為1.00,測驗的得分率為0.75,兩者之差小于0.3,基本上不存在作業(yè)抄襲嫌疑;知識點6的作業(yè)得分率為0.80,測驗的得分率為1.00,不存在作業(yè)抄襲嫌疑。
周夢玲同學(xué)知識點3的作業(yè)得分率為0.75,測驗的得分率為0.50,兩者之差小于0.3,基本不存在作業(yè)抄襲嫌疑;知識點6的作業(yè)得分率為0.60,測驗的得分率為1.00,存在一定的作業(yè)抄襲嫌疑。
(三)模型檢驗
為了進一步驗證結(jié)果的準確性,在教學(xué)中教師會多多關(guān)注該同學(xué)的表現(xiàn),以了解其學(xué)習情況。并在課后答疑時,與該學(xué)生交流。
針對李娜同學(xué),經(jīng)過一段時間的了解,該同學(xué)承認作業(yè)3知識點(無窮小與無窮大的概念)較難,課上并未完全理解,所以在做測驗時去網(wǎng)上搜索了答案。知識點5(無窮小的比較)的測驗在計算時出現(xiàn)了失誤,導(dǎo)致扣分。知識點6(函數(shù)的連續(xù)性)在做作業(yè)時未理解概念的含義,在老師講解作業(yè)后化解疑問,考試掌握較好。
針對周夢玲同學(xué),經(jīng)過一段時間的了解,該同學(xué)承認作業(yè)3知識點(無窮小與無窮大的概念)較難,課上并未完全理解,作業(yè)和測驗成績均不理想。知識點6(函數(shù)的連續(xù)性)在課上未理解概念的含義,在聽了老師的作業(yè)講解后,經(jīng)與同學(xué)討論,掌握該知識點。
(四)模型改進
在對學(xué)生的課后作業(yè)及章節(jié)測驗成績進行比對時發(fā)現(xiàn),當測驗成績低于作業(yè)成績時,檢測模型基本符合實際,但是當測驗成績高于作業(yè)成績時,往往意味著學(xué)生經(jīng)過努力,鞏固了所學(xué)內(nèi)容,所以成績會有一定的提高。此時檢測模型與實際會有偏差。因此考慮改進模型。
當測驗成績高于作業(yè)成績時,評估與之關(guān)聯(lián)的知識點掌握的合理性。若在關(guān)聯(lián)知識點的評價中學(xué)生存在抄襲嫌疑,則通過談話的方式確定最終結(jié)論;若關(guān)聯(lián)知識點的評估合理,則消除學(xué)生抄襲嫌疑。
此方法通過知識點之間的關(guān)聯(lián)進行判斷,有利于教師全面了解學(xué)生的學(xué)業(yè)情況,進一步優(yōu)化教學(xué),對學(xué)生而言也更具有說服力。
(五)模型評價
1.模型的優(yōu)點
本文提出的新的作業(yè)抄襲檢測方法,與過去針對學(xué)生之間的作業(yè)相似度檢測不同,這個方法著重關(guān)注個別學(xué)生,通過對比他們的作業(yè)成績和測驗成績來評估他們的學(xué)習情況。這種方法對教師來說具有精準掌握學(xué)生學(xué)習情況、因材施教的優(yōu)勢。經(jīng)過一個學(xué)期的驗證,該方法被證明是方便可行的,且具有較高的檢測準確度。這表明該方法在實際應(yīng)用中具有一定的價值。
2.模型的缺點
在使用過程中,模型的準確度可能受到人為主觀因素的影響,這是需要進一步提升的方面。當發(fā)現(xiàn)學(xué)生存在抄襲嫌疑時,教師需要依靠自身的經(jīng)驗和與學(xué)生的交流等方式,進一步確定是否存在抄襲行為。這種方式引入了主觀因素,可能會影響判斷的效率和準確度。但隨著使用時間的增長和數(shù)據(jù)量的積累,模型的參數(shù)可以進一步改進,降低主觀因素的影響。通過對更多樣本的觀察和分析,不斷優(yōu)化模型,提高其準確性和可靠性。
四、結(jié)束語
研究作業(yè)抄襲檢測問題已經(jīng)有多年的歷史,而以學(xué)生個體為研究對象,基于大數(shù)據(jù)分析的方法進行作業(yè)抄襲檢測則是相對較新的思路。本文通過比對學(xué)生自身的課后作業(yè)、章節(jié)測驗及期末成績,設(shè)置合理的參數(shù),評估學(xué)生對知識點的掌握情況,進而判斷是否存在抄襲嫌疑。初步的研究驗證表明,該方法具有合理性和可行性。在未來的研究中,將繼續(xù)收集大量數(shù)據(jù),并不斷完善作業(yè)抄襲檢測系統(tǒng),以提高檢測的準確性和效率。這種檢測方法為各大高校的教師提供了一種合理化的手段,提高了對學(xué)生的管理效率。從而更好地遏制了學(xué)生抄襲作業(yè)的現(xiàn)象,提升作業(yè)完成的質(zhì)量。另外,這種方法能夠為改善學(xué)風提供有力的保障。
參? 考? 文? 獻
[1]鄒恩岑,馬壯,申宇,等.一種高校電子作業(yè)抄襲檢測系統(tǒng)設(shè)計[J].物聯(lián)網(wǎng)技術(shù),2020(10):51-56。
[2]于俊等. 高教程序代碼作業(yè)抄襲檢測的方法研究與實踐[J].中國科學(xué)技術(shù)大學(xué)學(xué)報,2020(8):1048-1057。
[3]羅云華,姬增利.網(wǎng)絡(luò)教學(xué)中大學(xué)生作業(yè)抄襲現(xiàn)象的預(yù)防策略研究[J].教學(xué)研究,2020(1):77-78.
基金項目:遼寧省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項目(202213208034)。
楊立彬(2001.05-),男,漢族,河南平頂山,本科在讀,研究方向:道路橋梁與渡河工程。