亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工智能方法在探究小學生作業(yè)作弊行為及其關鍵預測因子中的應用*

        2024-02-18 09:25:44趙均榜傅根躍
        心理學報 2024年2期
        關鍵詞:小學生作業(yè)模型

        趙 立 鄭 怡 趙均榜 張 芮 方 方 傅根躍 李 康

        (1 杭州師范大學心理學系;2 杭州師范大學經亨頤教育學院,杭州 311121)(3 浙江師范大學兒童發(fā)展與教育學院,杭州 311231) (4 杭州市夏衍小學,杭州 311121)(5 北京大學心理與認知科學學院,行為與心理健康北京市重點實驗室,北京 100871)(6 加拿大多倫多大學,安大略教育研究所,安大略 M5R 2X2)

        1 引言

        學業(yè)作弊是古往今來困擾教育工作者的難題。它是指學生為獲得理想的學業(yè)成績或排名而采取的秘密且有意破壞學業(yè)誠信準則的行為,其重要表現形式之一為作業(yè)作弊。雖然自“雙減”以來,我國小學生的課業(yè)負擔明顯減輕,但不可否認,較之國外,“作業(yè)”依然是我國義務教育階段小學生最主要的學業(yè)任務,作業(yè)作弊行為在小學生中仍普遍存在。小學階段是個體道德意識形成及道德行為習慣塑造的關鍵期,這一階段學生做出的作業(yè)作弊行為既會導致其學業(yè)成績不佳進而在考試中作弊,久而久之,又容易使其作弊行為習慣化。并且,對兒童期的作弊行為若不重視并加以及時引導和干預,很容易導致個體在成人后表現出更嚴重的問題行為,如違法亂紀或犯罪(Williams &Williams,2012)。且“雙減”政策在強調“減負”的同時,也明確了提高作業(yè)質量的需求,并提倡杜絕“唯成績論”??梢灶A期,相較于考試成績,小學生的作業(yè)質量等平時學業(yè)表現在未來的學業(yè)評價體系中可能更為重要。為此,本研究就作業(yè)作弊行為在小學階段的發(fā)展及其關鍵性影響因素進行深入考察,以期為探索作弊的發(fā)展機制以及提出有針對性的早期干預方法提供科學依據。

        在學術界,有關學業(yè)作弊的研究已有近百年歷史(Hartshorne &May,1928)。縱觀現有的實證研究,絕大多數都來自國外,且研究對象幾乎全部聚焦于大學生和中學生群體(參見 Anderman &Midgley,2004;Cizek,1999;Hrabak et al.,2004),極少有研究關注小學生群體(Hartshorne &May,1928)。雖然,早在1928 年,Hartshorne 和May 的研究就已揭示小學階段兒童會自發(fā)地做出學業(yè)作弊行為。但在此之后,因西方教育體制改革導致國外小學階段的考試和作業(yè)一度被取消,故針對小學生作弊的實證研究也一度停滯。與此同時,在研究內容方面,國外學業(yè)作弊的研究主要集中于考試作弊(Bong,2008;Freire,2014),針對作業(yè)作弊的研究非常少。可以說,到目前為止尚未有研究專門考察過小學生的作業(yè)作弊行為。

        與國外相比,國內有關學業(yè)作弊的實證研究起步更晚,且研究對象全部集中于大學生群體(如:舒首立 等,2018;易曉明,2021),針對小學生作弊(尤其是作業(yè)作弊)的實證研究尚屬空白。雖然有關大學生學業(yè)作弊的研究結果可以為小學生作業(yè)作弊研究提供一定的思路和借鑒。但與大學生相比,小學生的道德認知發(fā)展水平更低,故針對前者的研究結果是否適用于小學生群體尚不明確。鑒于此,本研究將立足我國國情,以國內外現有實證研究結果為基礎,重點考察影響當前我國小學生作業(yè)作弊行為的可能因素,并從中尋找關鍵性影響因素。本研究結果旨在為建構兒童誠信行為發(fā)展的理論模型,以及道德行為發(fā)展理論的完善和本土化提供重要的科學依據。

        具體說來,本研究將以2 至6 年級小學生為研究對象,采用大樣本問卷調查法和機器學習(Machine Learning,Pedregosa et al.,2011)相結合的方法,考察小學生作業(yè)作弊行為的年級發(fā)展趨勢,重點分析不同因素對作業(yè)作弊的影響及其相對重要性。

        機器學習是數智時代新興的數據分析方法,也是人工智能的核心方法,它依賴于計算機算法,旨在通過數據分析和建模實現對人類行為的模擬。近年來,不少心理學研究者已將機器學習應用于諸如情緒(Just et al.,2017)和精神病理學等方面的研究(如Bartlett et al.,2014;Livieris et al.,2018),也有少數研究者開始將該方法用于兒童研究(Bruer et al.,2019;Zanette et al.,2016)。與傳統(tǒng)的統(tǒng)計建模相比,機器學習具有以下4 個方面的優(yōu)勢。

        首先,機器學習對原始數據的處理有助于提高最終模型的外部效度。傳統(tǒng)分析方法(如,廣義線性模型GLM、廣義估計方程GEE,等等)通常將所有數據統(tǒng)一納入分析,往往導致模型過度擬合,所獲模型的概化能力即外部效度較差。與之不同,機器學習(往往需要較大的樣本量)事先將數據分為3 個子集:訓練集(train set)、測試集(test set)和留出集(holdout set)。首先用訓練集數據來擬合模型,然后用測試集數據來檢驗模型。再對這兩個子集進行重組,重新隨機劃分為新的訓練集和新的測試集,進行模型擬合和驗證。這個過程將重復多次,并產生多個可預測結果變量的模型。最后,用事先預留的留出集數據對這些模型的預測力做進一步評估,即驗證這些模型的預測力能否概化到新的數據中。這種驗證實現了對模型外部效度的評估(Campbell,1986)。

        其次,機器學習囊括了多種算法,可被靈活應用于處理各類復雜多變的變量間關系。本研究將采用近年來廣受關注的集成學習法(Ensemble Learning,參見Ykhlef &Bouchaffra,2017)。該方法首先通過不同機器學習算法對同一樣本群體進行訓練。具體算法包括描述變量間線性關系的邏輯回歸(Logistic Regression,Yarkoni &Westfall,2017),描述變量間非線性關系的多層感知機(Multilayer Perceptron,MLP)、極端梯度提升(eXtreme Gradient Boosting,XGBoost)和隨機森林(Random Forest)等(參見Golino et al.,2014)。隨后,將所有算法的訓練結果整合起來。集成法的優(yōu)勢在于能夠集各種算法之長,最大程度上對預測變量和結果變量的關系進行解釋,從而使最終模型的預測效果達到最佳。

        第三,機器學習可通過Shapley 值,量化不同影響因素在整個模型中的相對重要性。Shapley 值于1953 年由諾貝爾經濟學獎獲得者Lloyd Shapley 提出(Shapley,1953),主要用于衡量各個預測變量對結果變量的相對貢獻大小,是機器學習結果的重要參考指標之一(Smith &Alvarez,2021)。該值越大,代表該預測因素對結果變量的預測力越強;反之,則代表該因素的預測力越弱。若該值趨近于零時,則代表該因素對結果變量幾乎不存在有效預測力。

        最后,機器學習能夠將所有預測變量對結果變量的預測效應進行量化,從而創(chuàng)建一個關于結果變量(如“小學生作業(yè)作弊的概率”)的預測模型。模型建立后,若將某個學生在相應預測變量上的得分輸入模型,即可輸出該學生作業(yè)作弊的可能性(即作弊的概率)。依據這一結果,能夠初步預測學生有多大的可能性會在作業(yè)中作弊,以便于教師或家長進行必要的關注,并結合學生的實際表現采取針對性的教育和干預措施。

        基于上述機器學習的優(yōu)勢,本研究將重點考察部分因素(即預測因素)對小學生作業(yè)作弊行為的影響。在影響因素選取方面,由于國內外對小學生作業(yè)作弊行為影響因素的研究幾乎為空白,故本研究主要參考了Murdock 和Anderman (2006)的學業(yè)作弊動機模型,以及以往針對大中學生作業(yè)作弊行為的研究成果。

        Murdock 和Anderman (2006)的學業(yè)作弊動機模型是目前為止在作弊(尤其是考試作弊)研究領域影響力最大且應用最廣的模型之一。該模型整合了一系列以大中學生為主要研究對象的研究成果,從“作弊的代價”、“作弊的目的”及“作弊前對自我和結果的認知(我能做到嗎)”三個方面對學業(yè)作弊動機進行了劃分。其中,“作弊的代價”主要包括作弊后被抓的后果、個體道德水平、同伴作弊的后果、關于誠信的規(guī)章制度等等;“作弊的目的”包括同伴壓力、智力、課堂氛圍等因素;“作弊前對自我和結果的認知”則主要為自我效能及個體對結果的預期(Murdock &Anderman,2006)。

        依據上述學業(yè)作弊動機模型,在綜合考慮了研究成果未來在小學中的可實踐性和可推廣性,同時參考了以往有關大中學生學業(yè)作弊的實證研究結果,本研究對可能影響小學生作業(yè)作弊行為的因素(即小學生作業(yè)作弊的預測因素)進行了篩選,重點包括以下幾方面。

        第一,作弊后果的嚴重性。一方面,在Murdock和Anderman (2006)的學業(yè)作弊動機模型中,作弊的后果被看作是學業(yè)作弊的主要動機之一。隨后更多的實證研究也表明,作弊的后果嚴重性對大中學生學業(yè)作弊行為存在影響(Kam et al.,2017;McCabe &Trevi?o,1997;Molnar &Kletke,2012)。另一方面是基于實踐證據。眾所周知,“懲罰”一直被我國教育實踐工作者視作防止作弊發(fā)生的“最有效/最佳措施”。然而,無論是古時將科舉舞弊者量刑入罪,還是如今教育主管部門及各級各類學校制定的針對作弊的處罰制度(如取消考試成績、取消考試資格、通報批評等),均只針對考試作弊。相較于考試作弊,目前少有學校對學生的作業(yè)作弊行為予以重視和深究。這既是因為作業(yè)作弊相對不容易被發(fā)現,又是由于其頻繁性和參與人數可能更高。正是因為作業(yè)作弊往往被看成是一種風險極低且無不良后果的違規(guī)行為,導致了作業(yè)作弊的普遍性和頻率往往較高。因此,本研究假設,作弊后果嚴重性程度是影響小學生作業(yè)作弊行為的首要因素。

        第二,作弊的可接受性。Murdock 和Anderman(2006)的學業(yè)作弊動機模型認為,個體的道德水平是影響學業(yè)作弊的另一個重要因素。以往針對大學生和中學生的實證研究表明,個體的道德意識水平影響其對作弊可接受程度的判斷(Cheung et al.,2016;Lee et al.,2020),以及他人對作弊接受程度的判斷(Ives &Giukin,2020)。錯誤的判斷很可能導致個體美化或弱化學業(yè)作弊行為。故本研究假設,個體自身以及他人對作弊的可接受性是影響小學生作業(yè)作弊行為的重要因素。

        第三,小學生對作業(yè)作弊預防措施的有效性評價。Murdock 和Anderman (2006)的學業(yè)作弊動機模型指出,學校與誠信相關的規(guī)章制度對作弊行為具有一定的影響。這一觀點在之后的實證研究中也得到了證實(Ramberg &Modin,2019)。但另一些調查發(fā)現,學生對于學校制定的學業(yè)誠信政策或許并不十分了解(Bretag et al.,2014;Gullifer &Tyson,2014),這可能是導致學業(yè)作弊屢禁不止的潛在原因之一,即相關政策并未發(fā)揮應有的約束作用。因此,本研究假設,學生對作弊預防措施的評價,能夠有效預測其作業(yè)作弊行為。

        第四,同伴作弊行為。以往在大中學生中開展的實證研究曾表明,觀察到同伴做出作弊行為,可能會導致個體對作弊這一行為進行合理化(Jurdi et al.,2011;McCabe et al.,2008),進而影響其自身參與作業(yè)作弊行為的概率(Hrabak et al.,2004)。而另一方面,觀察到同伴參與作弊行為,也可能使觀察者產生“不公平感”,進而更傾向于作弊。故本研究假設,同伴作弊行為能夠有效預測小學生的作業(yè)作弊行為。

        除了上述預測變量外,本研究還考察了包括年齡、性別、以及自我報告的自身學業(yè)成績水平等一系列人口統(tǒng)計學或個人背景變量對小學生作業(yè)作弊行為的預測作用。其中,以往針對大中學生的研究發(fā)現,成績較差的學生更易為了獲得好成績而參與學業(yè)作弊行為(Newstead et al.,1996;?zcan et al.,2019),且自我效能感低(即對自身能力認知較差)的學生作弊的可能性也越高(see Murdock &Anderman,2006);而諸如年齡、性別等人口統(tǒng)計學變量(B?achnio,2019;Cizek,1999;Freire,2014;Jurdi et al.,2011)與個體的學業(yè)作弊行為也存在相關。故本研究假設,上述變量對小學生作業(yè)作弊行為存在顯著預測作用。

        綜上,本研究將采用問卷調查法,結合機器學習技術,考察(1)作業(yè)作弊對個體可能造成的后果及其嚴重性的感知,(2)個體自身及感知到同伴對作業(yè)作弊的接受程度,(3)對各種預防作業(yè)作弊措施的有效性評價,(4)感知到同伴的作業(yè)作弊行為,以及(5)年齡、性別等人口統(tǒng)計學變量對小學生作業(yè)作弊行為的影響;在此基礎上,構建機器學習模型,采用集成法分析比較上述因素對作業(yè)作弊行為的預測效應。

        2 方法

        2.1 被試

        本研究事先經過了杭州師范大學學術倫理委員會的倫理審查,并征得了學生所在學校及學生家長的知情同意。在浙江省某地級市選取了3 所不同類型的小學:普通公辦小學(以下簡稱“公辦小學”)、含外來務工人員較多的公辦小學(以下簡稱“民工子弟小學”)及民辦小學各1 所,選擇2 至6 年級,從每個年級中隨機抽取若干班級,進行問卷調查(考慮到1年級小學生的識字水平和閱讀理解能力均十分有限,且其家庭作業(yè)很少,故本次調查未將其納入;張芮,2019)。共計2300 名小學生參與了本次問卷調查。其中,157 份問卷完成率不足70%,45 份問卷結果變量相關題目未作答,予以剔除。最終得到有效問卷2098 份。有效樣本的平均年齡為10.04±1.40 歲(男生占53%),全體學生均為漢族,年級、性別及學校等分布情況見表1。

        表1 2098 名有效被試的部分人口統(tǒng)計學信息情況

        2.2 研究工具

        2.2.1 問卷編制與施測

        考慮到國內外尚未有專門針對小學生作業(yè)作弊行為的問卷,故本研究采用自編的問卷進行測量,問卷在以往針對大中學生學業(yè)作弊的相關研究的基礎上編制而成。問卷編制過程分為3 個階段。

        第一階段是訪談?;贚im 和See (2001)對大學生學業(yè)作弊的現狀、態(tài)度、后果嚴重性等的問卷調查結果,編制訪談提綱。訪談主要針對學生和教師兩類群體開展。在學生層面,訪談內容主要涉及當前小學生作弊(尤其是作業(yè)作弊)行為的現狀、表現形式及其對作弊的認知和態(tài)度等;在教師層面,除上述內容外,訪談還涉及學校、家庭在應對學生作弊問題方面的一些方法和措施,及其所取得的成效。來自上述3 所小學中的39 名學生(這些受訪學生不再參與后續(xù)的正式問卷調查)和9 名教師參與訪談。訪談全程錄音,并由兩位不知研究目的的心理學碩士生進行轉錄和編碼。訪談結果表明:作業(yè)作弊在2 年級小學生中就已存在,主要表現為抄標準答案和抄同學作業(yè)等;小學生普遍認為的作弊的嚴重后果主要涉及被老師或家長批評,被同學嘲笑等;其認為能夠減少作弊的有效措施主要有努力學習掌握知識點、加大懲罰力度和告知家長等。

        第二階段為小范圍試測。在訪談的基礎上,進一步參考Bucciol 等人(2017)有關大學生學業(yè)作弊的研究問卷,編制本研究的初測問卷。在上述3 所學校,隨機選取來自2 年級、4 年級和5 年級的共158名學生(初測被試同樣不參與后續(xù)的正式問卷調查)進行小范圍試測。根據問卷作答情況,結合試測過程中學生的現場反饋,對初測問卷進行修訂,并對部分表述不清,難以理解,或有疑問的條目及選項進行了修訂和完善。邀請兩位心理測量學方面的專家對修改后的問卷進行了審定,最終形成本研究的正式問卷。

        第三階段為正式調查。在上述3 所學校,從2至6 年級的各個班級中按一定比例抽取學生進行問卷調查(為保證被試代表性,抽樣時確保參與調查學生的學業(yè)成績分布較為廣泛)。問卷調查采用一對多的方式,在各個班級內獨立進行。問卷現場發(fā)放,當場收回。為最大程度地消除學生的顧慮,問卷采用匿名的形式,且問卷發(fā)放、填寫和回收的整個過程均由研究助理出面組織,班主任或任課教師均未在現場,也未參與整個問卷調查過程。

        2.3 正式問卷構成

        正式問卷主要對兩部分內容進行測量。一是研究的關鍵結果變量——作業(yè)作弊行為,二是預測變量,即作業(yè)作弊行為影響因素,包括個體心理變量和人口統(tǒng)計學變量兩個方面。

        2.3.1 結果變量——作業(yè)作弊行為(簡稱“作弊行為”)

        請作答者就自身“在平時學習中做過類似抄別人的作業(yè)/抄答案/讓別人幫忙寫作業(yè)等的行為嗎?”,從“1”(從不)到“5”(非常多)進行5 點利克特量表評分。

        筆者在后續(xù)的數據分析中發(fā)現,全體樣本對該問題的評分呈明顯的正偏態(tài)(即評分為“1”的學生比例很高,評分為“2”~“5”的學生比例相當且均較低),無法按照近似正態(tài)分布處理。為避免統(tǒng)計偏差,遂將結果變量重新編碼為二分變量,其中將評分為“1”者編碼為“無作弊行為者”,以0 計;將評分為“2”~“5”者編碼為“有過作弊行為者”,以1 計。

        2.3.2 預測變量(影響因素)的測量

        (1)對作業(yè)作弊行為可能導致后果的嚴重性評價(簡稱“后果嚴重性”)

        根據訪談結果,列舉了 5 種作業(yè)作弊行為(Cronbach's α 系數為0.787)可能導致的后果(如“老師批評”等),請作答者就每一后果的嚴重性程度,從“1”(一點也不嚴重)到“5”(非常嚴重)進行5 點利克特量表評分。

        (2)對作業(yè)作弊行為的可接受性(簡稱“可接受性”)

        包括兩個條目:a.小學生自身對作業(yè)作弊行為的可接受程度(簡稱“自我可接受性”);b.感知到同伴對作業(yè)作弊行為的可接受程度(簡稱“同伴可接受性”)。請作答者從“1”(完全不能接受)到“5”(完全能接受)進行5 點利克特量表評分。

        (3)對能夠減少作業(yè)作弊行為策略的有效性評價(簡稱“策略有效性”)

        根據訪談結果,列舉了旨在減少作業(yè)作弊行為的9 種(Cronbach's α 系數為0.781,具有較高的內部一致性)比較常用的策略(如“老師批作業(yè)更加仔細,從而找出那些作弊的同學”等),請作答者就每一策略的有效性,從“1”(一點兒也沒有用)到“5”(非常有用)進行5 點利克特量表評分。

        (4)觀察到的同伴的作業(yè)作弊行為(簡稱“同伴作弊行為”)

        采用3 個條目進行測量:a.同伴作業(yè)作弊行為的普遍性(簡稱“同伴作弊-普遍性”),請作答者就作業(yè)作弊行為在周圍同學中的普遍性進行“1”(從未見有人這樣做過)到“5”(幾乎所有人都會做)的5 點利克特量表評分。

        b.同伴作業(yè)作弊行為的總體頻率(簡稱“同伴作弊-總體頻率”),請作答者就周圍同學做出作業(yè)作弊行為的頻率進行“1”(從未)到“5”(經常)的5 點利克特量表評分。

        c.同伴所采取的不同形式的作業(yè)作弊行為的頻率(簡稱“同伴作弊-具體頻率”),列舉了訪談中提及率較高的3 種作業(yè)作弊的具體形式(即做作業(yè)時抄答案、抄他人作業(yè)、讓他人幫忙寫作業(yè)),請作答者就周圍同學做出每一種具體作弊行為的頻率,進行“1”(從未)到“5”(經常)的5 點利克特量表評分。

        (5)人口學信息

        具體包括:學校類型(公辦小學、民工子弟小學及民辦小學)、年齡、性別、年級(2 至6 年級)、是否為獨生子女以及有關學習成績的自我評價(自身成績高于、等于或低于班級平均水平)。

        2.4 機器學習模型建構

        采用SPSS 24.0 軟件分析數據。首先進行描述性統(tǒng)計分析,在此基礎上運用機器學習進行統(tǒng)計建模分析??紤]到機器學習算法的多樣性,以及預測變量和結果變量間關系的未知性,本研究采用集成學習法,首先通過4 種不同算法對小學生作業(yè)作弊行為的預測模型進行擬合,然后基于Stacking 法將4 種不同算法的訓練結果進行整合。這4 種算法具體為:邏輯回歸、多層感知機(MLP)、極端梯度提升(XGBoost)和隨機森林。

        2.4.1 四種機器學習算法及步驟

        邏輯回歸是一種廣義線性回歸,是用邏輯函數解決對分類變量(以二分變量居多)進行預測的問題。多層感知機(MLP)是一種前饋人工神經網絡模型,它由輸入層、輸出層和一個以上的隱藏層組成,每一層均有若干神經元,通過逐步調整神經元間不同連接的權重來擬合模型。極端梯度提升(XGBoost)是集成學習方法中常用的策略,通過不斷訓練及優(yōu)化決策樹,并將每次訓練所得的輸出值相加,以獲得最終預測值。隨機森林算法與XGBoost 具有一定的相似性,但兩者最大的區(qū)別在于隨機森林的輸出值僅僅是簡單多數投票的結果,對不同決策樹的訓練結果也沒有做進一步的優(yōu)化提升。

        本研究在MLP 中構建的網絡由隱藏層和雙曲正切激活函數組成。在訓練開始前首先將協(xié)變量進行標準化處理,訓練過程中則采用共軛梯度下降法(Conjugate Gradient Descent,λ=0.0000005,σ=0.00005,區(qū)間中心0,區(qū)間偏移±0.5)來調整神經元間連接的權重,以達到將連續(xù)訓練過程中的預測誤差(針對劃分至訓練集的樣本)最小化的目的。該算法還將在每次訓練結束時計算測試集中的預測誤差,以確保每次訓練后預測誤差的減少不是由于對訓練集數據的過度擬合所致。XGBoost 是將訓練過程中的所有模型參數設置為默認,并采用基于樹模型(gbtree)的方法進行決策樹遞增。其中,決策樹的遞增數量為 100 棵,η(提升學習速率,boosting learning rate)默認值為0.3,以其作為特征縮減技術(shrinkage)的設定值,同樣用于防止訓練集數據的過度擬合。此外,用于訓練集和測試集的協(xié)變量都需預先進行標準化處理。隨機森林算法在訓練中構建決策樹時采用的是自展法(bootstrap)抽樣,決策樹的數量同樣默認為100 棵,且尋找最佳分割屬性時,把需要考慮的特征數量設置為樣本特征的平方根。上述兩個參數可用于提高預測準確性并防止模型過度擬合。此外,用于訓練集和測試集的協(xié)變量也預先得到了標準化處理。

        上述4 種機器學習算法均包含以下5 個步驟。第一,將所有數據隨機拆分成3 個獨立的數據集:訓練集、測試集和留出集(訓練集占總被試量的64%,測驗集占16%,留出集占20%)。第二,在訓練集中對數據進行訓練,訓練時共有32 個特征輸入。其中22 個特征來自9 道問卷問題(為表2 的8 個問題及其選項,以及學生對學習成績的自我評價);剩余10個特征是通過對學校、年級、性別及是否為獨生子女等二分變量轉換為虛擬變量(啞變量,其中學校的參照水平為普通公辦學校,年級的參照為二年級,性別的參照為女,是否為獨生子女參照獨生子女)而得到。最終輸入32 個特征,通過訓練獲得第一個模型。第三,將該模型在測試集中進行測試,以獲得其性能指標。第四,將訓練集和測試集結合起來,重新將這些數據隨機劃分為新的訓練集和測試集,重復第二和第三步,再次訓練得到第二個模型。通過重復100 次第二至第四步的建模過程(“劃分-訓練-測驗-重組-劃分”),最終可獲得100 個模擬模型,從而確保無論樣本被劃分到訓練集還是測試集,所得結果均能保持一定程度的穩(wěn)定性。第五,使用最初分配到留出集的數據(此前未參與過任何一次訓練或測試)對模型進行最終驗證,即進行外部效度的檢驗。

        表2 作弊行為預測變量的描述統(tǒng)計結果

        2.4.2 機器學習結果的集成

        在采用上述4 種機器學習算法進行分析的基礎上,本研究使用stacking 法對4 種算法進行整合(即集成)。具體說來,首先設置邏輯回歸、MLP、XGBoost 和隨機森林4 種算法對原始數據進行訓練,然后將4 種算法的訓練結果進行整合(stacking 法設置為五折交叉驗證法),最后再對整合后的訓練結果進行測試集驗證和留出集驗證(驗證算法設置為邏輯回歸),從而實現對4 種算法的取長補短,獲得最終且最佳模型。

        2.4.3 機器學習模型的關鍵指標

        無論是針對每一種機器學習算法,還是對不同算法結果的集成,采用留出集對最終模型進行驗證均可得到模型的兩個關鍵指標。其一為計算機模型的受試者工作特征曲線(Receiver Operating Characteristic,ROC)下方面積(Area under the Curve,AUC)。ROC 和AUC 是常用于衡量機器學習性能的指標,表現了分類模型的特征。其中,ROC 是通過真陽率(True Positive Rate,正確預測出的陽性的數量/所有陽性的數量)和假陽率(False Positive Rate,將陰性誤判為陽性的數量/所有陰性的數量)繪制而來的曲線(見圖1),AUC 值為ROC 曲線下方的面積,AUC 越大表明分類器的效果越好,它可以用于評估模型的敏感性(即真陽率,本研究中表現為能夠準確預測“存在作業(yè)作弊行為”這一情況的比例)和特異性(1-假陽率,本研究中表現為能夠準確預測“不存在作業(yè)作弊行為”這一情況的比例)。敏感性和特異性之間存在著一種函數關系,在不同敏感性條件下,特異性會朝相反的方向變化,而在ROC 曲線的對角線位置將達到兩者的最優(yōu)組合。在實際應用過程中,因具體應用情境不同,在ROC 曲線上以多少的敏感性和特異性作為標準,需要根據實際情況來決定。

        圖1 計算機模型的受試者工作特征曲線(ROC)描繪了模型敏感性(真陽率)隨著特異性(假陽率)變化的規(guī)律。曲線下的面積(AUC)表示模型的整體性能,曲線距離恒等式線(虛線對角線)越遠,代表模型的分類能力越好,反之則越差。

        其二為各個預測變量的Shapley 值。Shapley 值常用于處理復雜分配問題(Shapley,1953)。如A、B、C 三人共同完成一項工作,在為A 分配獎金時,若要尋求相對公平,則需通過Shapley 值法獲得A 在其中的邊際貢獻。該方法首先需要計算:僅有A 參與時能夠完成的工作量;B 和C 與A 合作時所能完成的工作量減去B/C 單人能夠完成的工作量;B 和C與A 合作時完成的工作量減去僅B 和C 合作時完成的工作量。然后計算這些數值的均值,即為A 最終的邊際貢獻。Shapley 值法全面考慮了在所有合作或單人關系中,A 所能帶來的增益,對A 的邊際貢獻性進行了公平且科學的計算。正因為此,越來越多的研究者開始借助Shapley 值法,對預測變量在預測模型中的相對貢獻性展開科學評估(Ghorbani &Zou,2019;Lundberg &Lee,2017)。

        本研究的機器學習中,對各預測變量(影響因素)Shapley 值的計算完全遵循上述計算規(guī)則。其中,“A、B、C”即為不同的預測變量,而“工作量”為變量在模型中的貢獻性大小,即預測準確性。預測變量的Shapley 值代表其對總體模型預測準確性的實際邊際貢獻。通過計算每一個預測變量的Shapley 值,Shapley 值的大小代表這些預測變量在模型中的相對重要性大小。

        3 結果與分析

        3.1 描述性統(tǒng)計

        3.1.1 作弊行為

        圖2 顯示了2 至6 年級小學生自我報告參與過作弊的人數百分比。由圖可見,作弊行為的發(fā)生率在3 年級時有了明顯的增長,而在4 年級開始相對趨于穩(wěn)定。以年級為預測變量(其中設2 年級為參考組),作弊行為為結果變量,進行二元邏輯回歸分析。結果表明,不同年級小學生的作弊率存在顯著差異(p< 0.001),其中2 年級的作弊率顯著低于其他各年級(2 年級vs 3 年級:p=0.002,B=0.51,OR=1.67,95% CI=1.21~2.29;2 年級vs 4/5/6 年級:ps<0.001,B=0.70,0.57,0.87;OR=2.01,1.77,2.39,95%CI=1.46~2.75,1.30~2.40,1.77~3.22),但3、4、5、6四個年級間的作弊率兩兩差異不顯著(ps > 0.05)。

        圖2 2~6 年級自我報告存在作弊行為的人數百分比

        3.1.2 作弊行為的影響因素

        表2 顯示了全體受試者在每個預測變量上的得分均值和標準差。由表可見,小學生普遍認為“受老師懲罰”(M=3.65)是作弊的最嚴重后果,且作弊是不能被接受的(M=1.81,與3 代表“中立”相比,p<0.001)。與此同時,他們也傾向于認為周圍同伴對作弊的接受程度較低(M=2.13,與3 相比,p< 0.001)。此外,小學生普遍認為“加強課堂練習,在課堂上把知識弄懂”(M=3.28)是減少作弊的最有效策略,“抄他人的作業(yè)”(M=2.01)是同伴作弊最常采用的形式。

        3.2 機器學習分析

        為了更加準確地計算不同變量對小學生作業(yè)作弊行為的預測效果,研究僅將預測變量相關問題作答率達到100%的被試數據納入機器學習,故最終進入機器學習分析的被試量為1637。如方法部分所述,本研究在使用4 種機器學習算法進行分析的基礎上,重點對4 種算法所獲結果進行集成。

        3.2.1 四種機器學習算法及集成學習法所獲模型的AUC 均值分析

        表3 顯示了4 種機器學習算法所各自模擬出的100 個模型的AUC 的均值,以及集成學習所模擬出的100 個最終模型的AUC 的均值。由表可見,這些AUC 均值均顯著高于隨機水平(50%,ps< 0.001)。其中,集成學習法的最終預測模型的AUC 均值達到了80.46%,意味著該模型有80.46%的概率能夠準確預測小學生是否會做出作業(yè)作弊行為。

        表3 四種機器學習算法及集成學習法下留出集驗證所產生的100 個模型的AUC (%)均值和標準差

        圖3 顯示了4 種不同算法以及集成學習分別所得的100 個模型的具體AUC 值。如圖所示,集成學習算法下的模型總體具有較高的敏感性和特異性(1-假陽性率)。由于集成學習法綜合了4 種算法的優(yōu)點,故后續(xù)的分析將重點關注集成學習法所獲結果。將表3 中集成學習法的AUC 均值轉換為Cohen’sd值,所得的 Cohen’sd均值為 1.214 (95% CI:1.205~1.222),表明該方法所獲的100 個最終模型的平均效應量很大(Cohen,1988;Cohen’sd> 1.2 時表示效應量非常大)。

        圖3 四種不同算法及集成學習分別獲得的100 個模型的AUC 值

        3.2.2 集成學習法所獲最終模型中各變量的Shapley值分析

        在集成學習中,采用留出集對最終模型進行檢驗,得到所有預測變量的Shapley 均值,這些值均顯著高于0 (ps < 0.05),即所有預測變量皆對該模型具有顯著的邊際貢獻。將這些預測變量按照Shapley 值的大小進行排列,可直觀顯示這些預測變量在模型中的相對重要性排序。圖4 列舉了對模型預測準確性的邊際貢獻大于或等于1%的主要預測變量。這些變量間的相對重要性依然存在較大的差異。根據重要性由高到低可大致將這些預測變量分為以下4 個組。

        第一組為小學生自身對作弊的接受性(接受性越高,就越有可能作弊)。該預測變量的Shapley 值高達 10.49%,代表其對總體模型預測準確性的實際邊際貢獻為10.49%。配對樣本t檢驗結果顯示,該變量的Shapley 值顯著高于3.83% (排序第二的預測變量對應Shapley 值,t=23.88,df=327,p<0.001),表明其在模型中的預測力最佳且遠高于其他變量。

        第二組變量的Shapley 值均在2%~4%內。首先是同伴作弊的普遍性,該預測變量的Shapley 值為3.83%,對模型預測準確性的貢獻性顯著高于剩余所有變量(vs 3.26%,t=1.98,df=327,p=0.048)。其次是小學生自身成績在全班同學中所處的相對水平(反向計分)、同伴作弊的頻率,以及同伴做出“抄他人作業(yè)”這一特定作弊行為的頻率。這3 個變量的Shapley 值間不存在顯著的差異(具體數值參見圖4,t=0.57,1.78,1.23,dfs=327,p=0.57,0.22,0.08),且后兩者間有顯著的相關關系(r=0.21,p< 0.001),即三者對小學生作業(yè)作弊行為的預測力相當。具體說來,上述變量均對作弊行為存在顯著的正向預測作用,即自我評價的成績越差也越有可能作弊;同伴作弊行為發(fā)生得越普遍或越頻繁,個體自身越有可能作弊。

        第三組變量的Shapley 值均在1%~2%內,在模型中的邊際貢獻較小,該組變量中最大的Shapley值(1.75%)顯著低于2.9% (t=-6.99,df=327,p<0.001)。包括:小學生所處年級(6 和4 年級學生的作弊率高于2 年級學生),感知到的同伴對作弊行為的接受程度,同伴做出“做作業(yè)時抄答案”這一作弊行為的頻率(感知到的可接受性/頻率越高,作弊的可能性越大),小學生對“受父母懲罰”、“受父母批評”和“受老師懲罰”這3 種作弊可能帶來的后果的嚴重性評價(越是認為這些后果嚴重,越不可能作弊;r=0.44,0.34,0.36,ps < 0.001),以及學校類型(民工子弟學校的作弊率低于普通公辦學校)。

        除了上述預測變量,剩余的變量雖對模型預測準確性具有顯著的貢獻(ps < 0.05),但重要性非常弱(Shapley 值 < 0.01)。這些預測力非常弱的變量主要包括:小學生對所有9 項減少作弊的策略的有效性評價,對部分作弊可能帶來后果的嚴重性評價(“受老師批評”和“受周圍同學的批評或嘲笑”),以及人口學信息(見表4)。

        表4 次要預測變量在預測作業(yè)作弊行為時的Shapley 值(%)的均值和標準差及其95%置信區(qū)間

        4 討論

        本研究采用問卷調查及機器學習這一人工智能的核心方法,首次系統(tǒng)考察了小學生的作業(yè)作弊行為,及其與個體認知和情境變量(對作弊后果的嚴重性的感知、自身對作弊的接受性和感知到的同伴對作弊的接受性、對作弊干預策略的有效性評價等)、同伴作弊的普遍性和頻率,以及性別、年級及學校類型等人口學變量之間的關系,得到以下結果。

        第一,總體而言,約33%的小學生自我報告曾經有過作業(yè)作弊行為,且這一作弊發(fā)生率隨年級的增長呈現出一定的變化趨勢。具體表現為:2 年級為小學生作業(yè)作弊的萌發(fā)階段;3 年級為激增階段,隨后進入平緩期;到6 年級時,小學生作業(yè)作弊率已達40.5%。這表明,作業(yè)作弊在2 年級小學生中就已經出現,到6 年級已相對普遍。導致3 年級作業(yè)作弊率迅速增長的原因可能在于3 年級的作業(yè)量及作業(yè)頻率的增加。而4 年級及以后表現出的作弊率趨于平緩,這表明了道德發(fā)展水平在小學階段并非影響其作弊行為的關鍵因素(該假設在小學生說謊行為的研究中得到了證實,見 Lee,2013)。由此可見,作弊作為一種習慣性行為,一旦形成,若不及時采取有效的干預手段,將可能持續(xù)存在甚至呈增長趨勢,這從側面也反映出早期誠信教育和對作弊進行早期干預的重要性。

        第二,本研究所考察的各個預測變量均對小學生作業(yè)作弊行為具有顯著的預測效果。機器學習結果表明,通過集成學習法對不同算法所獲模型進行整合,最終模型在預測作業(yè)作弊行為時具有較高的敏感性和特異性(AUC 均值高達80.46%)。這一結果意味著:該模型有80.46%的可能性能夠基于這些預測變量對小學生是否作弊作出正確預測。轉化AUC值所得的Cohen’sd也顯示,模型在通過這些預測變量對小學生作業(yè)作弊行為進行預測時,所得結果的效應量很大(Cohen’sd> 1.2)。

        第三,機器學習模型各變量的Shapley 值分析結果進一步表明,所有預測變量均對最終模型的較高預測準確率和良好擬合作出了顯著貢獻。然而,這些預測變量的重要性存在比較明顯的差異。具體說來:

        首先,小學生自身對作業(yè)作弊行為的接受程度是其是否作弊的最關鍵的預測變量。他們越是認為作業(yè)作弊是可接受的,就越有可能報告自己曾經有過這樣的行為。這一結果與以往在大中學生群體中的發(fā)現基本一致(Abaraogu et al.,2016;Ives &Giukin,2020)。Murdock 和Anderman 通過對以往研究進行綜述后提出,個體對作弊行為可接受性的判斷差異可能基于兩種原因:第一,個體認為作弊的可接受性高可能是由于其并不認為作弊是不道德的行為;第二,個體雖然知道作弊是不道德的行為,但出于為自己辯護,故對其自身作弊行為進行了合理化,以此減少作弊行為與自身道德認知的沖突(Murdock &Anderman,2006)。由此可見,與大中學生一樣,小學生對作弊行為可接受性的判斷可能也受到了這兩個原因的影響。

        其次,同伴做出作業(yè)作弊行為的普遍性和頻率也是個體是否作弊的重要預測變量,即同伴作業(yè)作弊行為是影響小學生自身作業(yè)作弊行為的重要因素。該結果與以往針對大學生和中學生群體的研究所獲結果較為一致,即同伴作弊行為能夠導致個體對其自身作弊行為進行合理化(Hrabak et al.,2004;Ghanem &Mozahem,2019;McCabe &Trevi?o,1993)。近期一項針對來自世界多國研究的元分析也顯示,同伴作弊是個體學業(yè)作弊行為的最重要因素之一,且這種“跟風效應”受到文化因素的調節(jié)——其在集體主義文化背景下較個體主義文化背景表現更為明顯(Zhao,Mao et al.,2022)。

        同時,對學業(yè)成績的自我評價這一預測變量也具有與同伴作弊行為相似的重要性。具體表現為,自我評價成績較差的小學生更有可能報告自己有過作業(yè)作弊行為。這一結果也與針對大中學生的研究所獲結果基本相同(Newstead et al.,1996;?zcan et al.,2019),其反映出作弊行為背后的一種潛在動機:成績較差的學生希望通過作弊來避免失敗(參見Oran et al.,2016)。此外,還有研究發(fā)現,成績好的學生更容易受到“學習、掌握新知識”這一學習動機的驅動,成績較差的學生卻更容易受到“獲得較高的成績”的驅動,為了考得更好而做出作弊行為(Putarek &Pavlin-Bernardic,2020)。還有一種可能性是,自我評價學業(yè)成績較差的學生的自我效能感可能相對較弱,而自我效能感弱的學生往往更容易做出學業(yè)作弊行為(see Murdock &Anderman,2006)。

        此外,對小學生作業(yè)作弊行為具有一定預測作用的因素還包括年級,學校類型,同伴對作弊的接受性和作弊后果的嚴重性,但這些變量的預測效應相對較弱。例如,本研究發(fā)現,來自普通公辦小學的學生相較于民工子弟小學的學生,表現出了更高的作業(yè)作弊率。導致這種學校間差異的原因可能與校園風氣、教學政策以及師生關系等有關(Ramberg &Modin,2019;McCabe et al.,2012),這些因素往往決定了一所學校所特有的學習氛圍。

        再如,本研究發(fā)現,感知到的同伴對作弊行為的接受程度對小學生作業(yè)作弊行為具有較弱的預測作用。并且,該變量的預測力明顯弱于小學生自身對作弊的可接受性,及觀察到同伴的作弊行為的普遍性或頻繁性。由此可見,同伴行為對作弊的影響主要表現在其被觀察到的外部行為上,即小學生通過觀察同伴是否作弊,達到對自身行為進行合理化的目的(Jurdi et al.,2011;McCabe et al.,2008)。然而,他人的道德意識水平并非是影響小學生是否作弊的主要因素。研究發(fā)現“受周圍同學的批評或嘲笑”這一作弊后果嚴重性對作弊的預測作用也非常小,該結果在一定程度上佐證了上述結論。

        對作弊后果的嚴重性感知也是較為次要的預測因素,即作弊后果嚴重性對小學生作業(yè)作弊行為的預測貢獻性較小。這一結果與本研究假設相悖。究其原因,可能是因為我國并不存在實質性的作業(yè)作弊“懲罰”制度。小學生對作業(yè)作弊后果的認知非常有限,有限的認知主要來源于對考試作弊可能導致后果的認識(如被父母、老師懲罰等)。但值得反思的是,盡管各級各類學校大多制定了嚴格的考試作弊“懲罰”制度,卻始終無法徹底杜絕考試作弊行為。這也表明,過度依賴于外部強制力量而忽略了對學生自身能動性的培養(yǎng)(即對學生道德價值觀的培養(yǎng))的作弊懲罰方法是無法真正起到遏制作弊的效果。

        最后,小學生對減少作弊策略有效性的評價及其他部分人口統(tǒng)計學因素是重要性最低的預測因素(但其對模型預測的重要性仍然顯著高于0)。其中,就減少作弊策略的有效性而言,之所以其預測作用弱,很可能與小學生普遍傾向于認為這些常見的抑制作業(yè)作弊行為的策略效果不佳、對其有效性打分普遍偏低有關。

        本研究具有一定的理論創(chuàng)新性:作為國內首個聚焦于小學生作業(yè)作弊行為及其影響因素的研究,初步建立了關于小學生作業(yè)作弊影響因素的綜合模型,并將這些影響因素根據量化后的重要性指標進行了排序。特別需要指出的是,本研究發(fā)現小學生作業(yè)作弊的影響因素與大中學生學業(yè)作弊行為的影響因素構成并不完全相同,存在其特殊性。如在Murdock 和Anderman (2006)的模型中,后果嚴重性是能夠預測大中學生考試作弊的至關重要的作弊動機,但該指標對小學生作業(yè)作弊的影響卻遠不如預期之大。可見小學生群體具有其發(fā)展的特殊性。此外,本研究還發(fā)現,除了后果嚴重性,還有一些被以往研究證明能夠影響大學生和中學生學業(yè)作弊行為的因素,在預測小學生作業(yè)作弊時貢獻也非常微弱,如是否是獨生子女(Tsui &Ngo,2016,兄弟姐妹數量越多的大學生越有可能作弊)、性別(Galloway,2012,男高中生作弊率高于女生)等;但部分對小學生作業(yè)作弊具有較強預測作用的變量在大中學生學業(yè)作弊行為中卻不存在顯著效應,如年級(Ives et al.,2017)等。

        但是,研究結果也表明,Murdock 和Anderman(2006)提出的一些影響大中學生作弊行為的關鍵要素也能夠預測小學生的作業(yè)作弊,即也存在一定的相似性。如個體自身對作業(yè)作弊行為的可接受性,同伴作業(yè)作弊的普遍性和發(fā)生頻率,及其自身的成績水平是預測小學生作業(yè)作弊的關鍵變量??梢?多個影響著大學生和中學生學業(yè)作弊行為的因素,也同樣會對小學生的作業(yè)作弊行為存在顯著影響(Abaraogu et al.,2016;Ghanem &Mozahem,2019)。

        此外,本研究還發(fā)現,個體對情境的認知(如“個體自身對作業(yè)作弊行為的可接受性”等)在影響作業(yè)作弊行為中也發(fā)揮著重要的作用。這一結果為一個長久以來的有關作弊是情境驅動還是個體特質驅動這一爭議提供了新的思路和理論依據。過去關于作弊的研究似乎更加認可個體的作弊行為是受情境而非個人特質驅動的(Hartshorne &May,1928)。而本研究的結果則表明,情境和個人特質的交互作用可能也在其中發(fā)揮著重要的作用。

        本研究在方法上也具有一定的創(chuàng)新性。近年來,隨著人工智能在醫(yī)學、化學及生物學等領域的廣泛應用,機器學習技術已在成人(Bartlett et al.,2014;Just et al.,2017;Livieris et al.,2018)乃至兒童(Bruer et al.,2019;Zanette et al.,2016)研究中得到越來越廣泛的應用。本研究首次將機器學習運用于兒童道德研究領域,對小學生作業(yè)作弊行為的影響因素進行深入分析。結果表明,機器學習法在分析兒童行為發(fā)展數據上是可行的,在數智時代背景下,為后續(xù)更多的兒童心理學領域同行提供了一種新的研究和數據分析思路。

        本研究還具有較強的實踐創(chuàng)新性。本研究采用機器學習方法創(chuàng)建了能夠預測小學生有多大的概率會做出作業(yè)作弊行為的模型(預測準確率達80%以上),未來可基于該模型創(chuàng)建相關app 或網頁版測試,在小學中投入應用。具體來說,首先由小學生在app或網頁上填寫本研究的問卷并提交,后臺基于已有模型對提交的數據進行計算并輸出結果(即每位小學生作業(yè)作弊的可能性或概率,0%至100%)。根據輸出的結果,教師或家長能夠初步了解小學生當下有多大的可能性會在作業(yè)中作弊,以便于教師或家長進行必要的關注。但值得注意的是,我們并不能依據一次測試的結果就給學生“貼標簽”,關于如何使用預測模型的結果,還需結合研究倫理和學校教育方式加以綜合考慮。此外,由于目前問卷涉及的部分預測變量對預測作業(yè)作弊的貢獻性非常小,如對預防作弊的方法的有效性評價等。后續(xù)研究可繼續(xù)刪除問卷中的相關條目并重新建模,開發(fā)出更簡短的問卷。此舉將進一步推進研究成果在學校和家庭教育中的推廣應用。

        此外,本研究還為誠信教育的方式方法提供了具體、可操作的實踐方案。首先,個體對作弊的可接受性(或者說“道德意識”),而非作業(yè)作弊后果的嚴重性,能夠較好地預測小學生的作業(yè)作弊行為。這就給予家長、老師及廣大教育工作者以啟示:不應一味強調作弊的后果,相反,更有效的做法是從積極的角度幫助學生建立正確的學業(yè)誠信認知,引導其認識到作弊是“零容忍”的不道德行為。其次,由于同伴作弊對個體作業(yè)作弊影響很大,因此教師和家長應注意減少同伴行為所產生的負面影響,并嘗試通過各種方法樹立同伴的正面影響。例如,給予那些即使作業(yè)做得不好,但仍然選擇獨立完成的學生以充分肯定,讓學生認識到,獨立完成作業(yè)比正確率更重要(Misselbrook,2014;Siev &Kliger,2019)。再次,學校還應積極響應教育部倡導的“雙減”政策,重“質”不重“量”,并著力建立起一種良性的學習氛圍,杜絕“唯成績論”:讓學生認識到,做作業(yè)僅僅是對課上知識的查漏補缺和及時鞏固,并不是為了讓同班同學“一較高下”(Misselbrook,2014;Siev &Kliger,2019)。最后,作弊是一種習慣性行為(Davy et al.,2007),鑒于小學生的學業(yè)作弊率在所有年齡段中相對較低(Cochran,2015),尚處于萌發(fā)階段,我們更應該“從娃娃抓起”,適時在小學乃至幼兒園階段推廣誠信教育,將作弊行為“扼殺在搖籃里”。

        本研究存在一定的局限性。首先,本研究所創(chuàng)建的小學生作業(yè)作弊行為的預測模型達到了80.46%,但仍存在近20%的預測錯誤的可能性,因此仍需在未來的研究中進一步優(yōu)化模型。一方面,可以通過理論探索,尋找更多新的可能影響作業(yè)作弊的預測變量來完善模型。本研究主要參考了影響大學生和中學生學業(yè)作弊行為的因素,且側重于考察與學校有關的情境因素對小學生作業(yè)作弊行為的影響,因此不能排除還有其他預測因素的存在。且研究結果表明,相較于大中學生,影響小學生作業(yè)作弊的因素也具有一定的特殊性,未來的研究可依據上述領域進行拓展,更充分地挖掘影響小學生作弊的因素,進而創(chuàng)建一個科學而完備的、專門適用于小學生作業(yè)作弊的理論模型。另一方面,機器學習是服務于大數據的方法,未來可將本研究問卷轉變?yōu)閍pp 或網頁,可以通過進一步擴大樣本量,再增加一個外部驗證的數據集,對參數進行調優(yōu),進一步完善模型,提高模型的預測準確性。其次,本研究對于小學生作業(yè)作弊行為的測量采用的是自我報告法,雖然問卷是匿名性質的,但受社會稱許性影響仍存在個體自我報告的作弊率低于真實作弊率這一可能性。未來研究可嘗試通過自我報告法和行為實驗法相結合的方式來解決該問題。事實上,最近已有越來越多的研究者開始采用實驗法來研究作弊問題,但這些實驗范式比較適合年齡相對較大的學生群體或成人(Cizek,1999;Zhao et al.,2021;Zhao,Peng et al.,2022),實驗法在兒童群體中的適用性還有待于更多研究加以檢驗。最后,本研究考察了不同作業(yè)作弊方式的普遍性,但這些方式以“抄作業(yè)”、“抄答案”等傳統(tǒng)方式為主,并未涉及數智時代下一些新型的作弊方式(如,采用“愛作業(yè)”等批改作業(yè)的app 進行作弊,或其他“線上”方式作弊)。未來研究可對上述新型作弊方式加以探討。

        5 結論

        本研究首次聚焦小學生作業(yè)作弊行為,采用機器學習集成算法,系統(tǒng)考察了影響小學生作業(yè)作弊行為的關鍵因素及其相對重要性。結果表明,33%的小學生自我報告曾經做過作業(yè)作弊行為,且作弊行為的發(fā)生率隨年級的增長呈上升趨勢;機器學習集成算法得到的預測模型AUC 值達80.46%,能夠較準確地預測小學生的作業(yè)作弊行為??偟膩碚f,小學生的作業(yè)作弊行為很大程度上取決于他們對于作業(yè)作弊的接受性,同伴的作業(yè)作弊行為,及其自身的成績水平。上述結果為兒童誠信行為發(fā)展的理論構建以及學業(yè)作弊的早期干預提供了科學依據。此外,本研究也表明,機器學習作為人工智能的核心方法,是一種可用于分析發(fā)展性數據的有效方法。

        猜你喜歡
        小學生作業(yè)模型
        一半模型
        重要模型『一線三等角』
        快來寫作業(yè)
        重尾非線性自回歸模型自加權M-估計的漸近分布
        怎樣培養(yǎng)小學生的自學能力
        甘肅教育(2020年22期)2020-04-13 08:10:56
        3D打印中的模型分割與打包
        作業(yè)
        故事大王(2016年7期)2016-09-22 17:30:08
        我是小學生
        我想要自由
        三十六計第七計:無中生有
        大屁股人妻女教师撅着屁股| av在线网站一区二区| 日韩欧美中文字幕不卡| 最新永久免费AV网站| 不卡免费在线亚洲av| 蜜桃一区二区三区视频| 精品国产粉嫩内射白浆内射双马尾 | 中文字幕中文一区中文字幕| 阴唇两边有点白是怎么回事| 人妻少妇偷人精品久久性色av| 无码人妻丰满熟妇区五十路| 欧美极品少妇性运交| 麻豆国产巨作AV剧情老师| 2021久久精品国产99国产| 日本骚色老妇视频网站| 国产精品久久久在线看| 无码任你躁久久久久久老妇| 亚洲乱码国产一区三区| 亚洲人成网站在线播放观看| 国产精品一区二区三区蜜臀| 成人大片在线观看视频| 又黄又刺激的网站久久| 国产精品美女久久久久av超清| 成年女人永久免费看片| 91精品91| 99视频一区二区日本| 一本丁香综合久久久久不卡网站| 亚洲日韩一区二区三区| 国产精品无码片在线观看| 北岛玲精品一区二区三区| 蜜桃av在线播放视频| 久久在一区二区三区视频免费观看| 久久精品国产色蜜蜜麻豆| 精品国产乱码久久久久久口爆网站| 久久人妻AV无码一区二区| 在线亚洲精品一区二区三区| 日本久久精品视频免费| 免费网站看v片在线18禁无码| √最新版天堂资源在线| 无码久久精品蜜桃| 日韩在线精品免费观看 |