基礎(chǔ)教育是國民教育體系的根基,評價改革是加快基礎(chǔ)教育現(xiàn)代化進(jìn)程的關(guān)鍵環(huán)節(jié)。當(dāng)前人工智能技術(shù)為基礎(chǔ)教育評價改革帶來新的契機(jī),但在具體實踐中,仍面臨理念偏差、主體制約與技術(shù)依賴等諸多困境。推進(jìn)教育數(shù)字化轉(zhuǎn)型,基礎(chǔ)教育評價改革應(yīng)率先明晰發(fā)展方向,從厘清評價理念、增強主體關(guān)照、夯實技術(shù)基礎(chǔ)三方面入手,促進(jìn)人工智能賦能基礎(chǔ)教育評價改革。
一、人工智能賦能基礎(chǔ)教育評價改革面臨的現(xiàn)實困境
隨著教育數(shù)字化轉(zhuǎn)型的深入推進(jìn),人工智能賦能基礎(chǔ)教育評價改革呈現(xiàn)出蓬勃發(fā)展態(tài)勢,但其面臨的諸多困境同樣不容忽視。
(一)理念偏差:科學(xué)教育評價觀的遲滯
教育評價理念是人對教育評價認(rèn)識的直觀反映。《深化新時代教育評價改革總體方案》明確指出,要破除“五唯”痼疾,樹立科學(xué)的基礎(chǔ)教育評價理念。當(dāng)前,一些地方仍存在的功利主義、工具主義與管理主義傾向遲滯了人工智能賦能基礎(chǔ)教育評價改革。其一,基于考評制度的功利主義評價傾向于片面追求分?jǐn)?shù)與升學(xué)率,忽視了學(xué)生全面發(fā)展。其二,工具主義造成技術(shù)理性膨脹,導(dǎo)致評價功能迷失。人工智能技術(shù)具備參數(shù)大、算力強、速率高等優(yōu)勢,教育評價者出于使用方便的考量,過于依賴監(jiān)測、評價、分析系統(tǒng),學(xué)生的多元個性被抽象為一組標(biāo)準(zhǔn)數(shù)據(jù),導(dǎo)致評價育人功能的弱化。其三,管理主義取向的評價導(dǎo)致對價值關(guān)注不夠。教育評價的本質(zhì)不僅是對學(xué)生過往成績的評判,還應(yīng)當(dāng)是對教育活動的改進(jìn)。管理主義導(dǎo)向的評價易導(dǎo)致評價成為一個自上而下的控制過程,難以真正提升教育評價效能。
(二)主體制約:教育評價主體素養(yǎng)不夠
教育評價主體素養(yǎng)缺乏是教育評價改革面臨的現(xiàn)實難題。教育評價主體對人工智能技術(shù)的思想認(rèn)識與實際應(yīng)用能力,是落實人工智能賦能教育評價改革的關(guān)鍵。數(shù)智新時代對教育評價主體提出了新要求,亟待提升其數(shù)字素養(yǎng)。一方面,部分教育評價主體缺乏人工智能教育知識,在教育評價中設(shè)計、應(yīng)用人工智能技術(shù)的能力不足,直接影響了教育評價活動的順利開展。另一方面,個別教育評價主體數(shù)字素養(yǎng)不夠,缺乏數(shù)據(jù)意識、計算思維與數(shù)字化創(chuàng)新能力,不能及時解決問題。
(三)技術(shù)依賴:教育評價應(yīng)然價值萎縮
教育評價應(yīng)然價值的實現(xiàn)要求技術(shù)必須服務(wù)于人特有的主體性。然而,在工具理性主導(dǎo)的教育評價實踐中,教育評價者的主體性可能因為技術(shù)依賴而被異化,導(dǎo)致被評價對象的需求被忽視,評價者的評價能力被削弱。同時,人工智能賦能的教育評價必然依賴于數(shù)據(jù)分析。海量數(shù)據(jù)分析支持的智能評價涉及評價主體的私人信息,數(shù)據(jù)的收集標(biāo)準(zhǔn)及其使用的安全性,可能會影響個體的信息安全。此外,囿于算法“黑箱”的復(fù)雜性,算法設(shè)計者的主觀偏見以及算法的固有缺陷,都可能在評價主體不知情的情況下,導(dǎo)致偏見與歧視等倫理問題。
二、人工智能賦能基礎(chǔ)教育評價改革的建設(shè)方向
人工智能賦能基礎(chǔ)教育評價改革困境的產(chǎn)生是多重因素共同作用的結(jié)果?;A(chǔ)教育評價改革亟須主動回應(yīng)技術(shù)變革,著力厘清理念、關(guān)照主體與技術(shù)保障,塑造人工智能賦能基礎(chǔ)教育評價改革新生態(tài)。
(一)厘清評價理念,樹立科學(xué)育人觀念
教育若想擺脫理念偏差的困境,亟待厘清評價理念,構(gòu)建科學(xué)育人觀念。一是深入了解教育主體的實際需求。新時代基礎(chǔ)教育評價要實現(xiàn)本質(zhì)功能,需增強對現(xiàn)實問題的把握。在進(jìn)行規(guī)?;?、批量化教育評價前,應(yīng)借助人工智能技術(shù)開展評價測試,基于診斷情況總結(jié)經(jīng)驗、提出改進(jìn)措施,以提升評價的針對性與可操作性。二是堅決摒棄“五唯”現(xiàn)象,堅持將立德樹人作為教育評價的本質(zhì),確立“知識為基,能力為重,素養(yǎng)導(dǎo)向,價值引領(lǐng)”的評價觀,關(guān)注學(xué)生的全方位、全過程的發(fā)展,從根本上扭轉(zhuǎn)分?jǐn)?shù)與效率至上的評價理念。三是工具理性應(yīng)與價值理性相互補充、協(xié)調(diào)與融合。在教育評價過程中,應(yīng)堅守教育的價值使命,真正回歸師生主體性本身,實現(xiàn)人、技術(shù)和教育的有機(jī)統(tǒng)一。
(二)增強主體關(guān)照,培育專業(yè)評價人才
全面關(guān)照基礎(chǔ)教育評價活動中的多元利益相關(guān)主體,是消解主體制約困境的有效策略。一方面,構(gòu)建評價主體的智能素養(yǎng)培訓(xùn)體系。人工智能賦能基礎(chǔ)教育評價改革涉及科研機(jī)構(gòu)、政府、學(xué)校與企業(yè)等多元主體,不同主體需承擔(dān)不同的角色與職責(zé)。提升人工智能賦能教育評價效能,需加強對各級各類主體智能素養(yǎng)培訓(xùn)的扶持。針對人工智能賦能基礎(chǔ)教育評價改革的核心訴求培育專業(yè)評價人才,實現(xiàn)對評價標(biāo)準(zhǔn)制定、評價過程開展、評價結(jié)果反饋以及評價實踐優(yōu)化的有效推進(jìn)。另一方面,探索多元主體協(xié)同參與的教育評價格局。借助人工智能技術(shù)建立多方參與的評價機(jī)制,為多元主體提供雙向或多向的協(xié)商對話,保障多元主體的良性互動,有助于形成多級主體相得益彰的評價格局。
(三)夯實技術(shù)基礎(chǔ),驅(qū)動評價效能提升
技術(shù)基礎(chǔ)是驅(qū)動人工智能賦能基礎(chǔ)教育評價改革的重要保障。其一,多維度、全過程的真實數(shù)據(jù)是訓(xùn)練智能評價模型的核心資源。只有真實性與精細(xì)程度高的數(shù)據(jù),才能有效杜絕偏見,開展接近真實狀態(tài)的循證評價。其二,智能驅(qū)動是人工智能賦能基礎(chǔ)教育評價改革的重要模式??茖W(xué)應(yīng)用自然語言處理與數(shù)據(jù)挖掘技術(shù),追蹤、處理與分析教育測評數(shù)據(jù),能夠挖掘海量數(shù)據(jù)內(nèi)隱的價值信息,實時反饋教育問題、精準(zhǔn)預(yù)測教育趨勢并持續(xù)優(yōu)化教育決策。其三,明確的人機(jī)協(xié)同機(jī)制是人工智能與基礎(chǔ)教育評價改革雙向賦能的有效路徑。在教育評價實踐中,不僅要破解技術(shù)層面的難題,注重技術(shù)倫理,助推人工智能技術(shù)向善賦能,更要明確評估所涉及人員的角色定位、責(zé)任權(quán)利與職業(yè)道德,使人工智能賦能教育評價改革走智能化、人性化、高效化發(fā)展道路。
三、人工智能賦能基礎(chǔ)教育評價改革的河南探索
作為教育大省,河南省對基礎(chǔ)教育評價改革的需求更為迫切,尋求智能技術(shù)賦能的動力也更加強勁。近年來,河南省基礎(chǔ)教育發(fā)展監(jiān)測與評價中心(以下簡稱“監(jiān)測中心”)開展了一系列監(jiān)測與評價創(chuàng)新和探索,從指標(biāo)體系研發(fā),到人才隊伍建設(shè),再到循證教育決策,全力推動人工智能的應(yīng)用。
(一)體現(xiàn)“五育”并舉理念,賦能指標(biāo)體系建構(gòu)
指標(biāo)體系是監(jiān)測與評價的靈魂,決定了評價改革的效用與效益。河南省在教育評價體系改革中,注重“五育”并舉,以師生數(shù)字素養(yǎng)評價豐富評價內(nèi)容,構(gòu)建了助力學(xué)生成長的“生態(tài)指標(biāo)體系”評價模型。在學(xué)生成長指標(biāo)設(shè)計中,不僅融合了學(xué)生發(fā)展核心素養(yǎng)、綜合素質(zhì)評價等相關(guān)體系的關(guān)鍵要素,還納入了社會情感能力、高階思維等最新研究成果,尤其突出了數(shù)字素養(yǎng)評價,以呼應(yīng)數(shù)智時代對學(xué)生發(fā)展的新要求。在學(xué)生發(fā)展相關(guān)因素架構(gòu)設(shè)計中,根據(jù)生態(tài)系統(tǒng)觀點,納入了國家義務(wù)教育優(yōu)質(zhì)均衡發(fā)展督導(dǎo)評估的所有縣級和校級指標(biāo),還通過調(diào)查學(xué)生、家長、教師、校長、教研人員和區(qū)域教育管理人員,納入了學(xué)生個體、學(xué)生家庭、教師、班級、學(xué)校、區(qū)域等多方面的影響因素,由此構(gòu)成了一體化、立體式、全方位的生態(tài)指標(biāo)體系,以期通過監(jiān)測與評價改革,帶動教研、教學(xué)、學(xué)校發(fā)展協(xié)同提升,全力支持學(xué)生健康與全面發(fā)展。
(二)強化教研教學(xué),賦能命題機(jī)制改革
在“生態(tài)指標(biāo)體系”指導(dǎo)下,命題是監(jiān)測評價的首要任務(wù)。人工智能賦能命題機(jī)制改革,不僅體現(xiàn)于命題內(nèi)容,也貫穿于命題過程,更有助于命題意圖落實到教學(xué)一線。在此過程中,命題的理念與思路,能否獲得教研人員的理解、認(rèn)同和實踐,是帶動一線教師教學(xué)和評價改革的關(guān)鍵。監(jiān)測中心通過開展監(jiān)測命題趨勢研討和系列培訓(xùn),匯聚相關(guān)教研人員,打造省域監(jiān)測命題專家?guī)?。在人工智能技術(shù)賦能下,以往命題各環(huán)節(jié)的技術(shù)壁壘、資源屏障、經(jīng)驗局限逐一被打破,不僅教研人員的命題能力得以快速提升,優(yōu)質(zhì)監(jiān)測題庫也得以快速構(gòu)建。
為更好實現(xiàn)這一目標(biāo),監(jiān)測中心根據(jù)教研協(xié)同進(jìn)展,逐步提供人工智能輔助評價與應(yīng)用系列培訓(xùn),以適當(dāng)形式開放監(jiān)測平臺,包括測試系統(tǒng)、閱卷系統(tǒng)、相關(guān)因素調(diào)查系統(tǒng)、數(shù)據(jù)分析系統(tǒng)和數(shù)字地圖可視化系統(tǒng),甚至在一定程度上開放監(jiān)測題庫,免費供一線教師使用。由此,最大限度降低了技術(shù)和資源門檻,力促一線教師參與評價改革,以期突破從監(jiān)測評價到質(zhì)量提升的下行瓶頸。
(三)提升分析技術(shù),賦能循證教育決策
從監(jiān)測評價到質(zhì)量提升,還存在一個上行瓶頸,即循證教育決策。服務(wù)教育決策,是監(jiān)測評價的重要職能。監(jiān)測中心面對紛繁復(fù)雜的多源異構(gòu)數(shù)據(jù),創(chuàng)新了一系列數(shù)據(jù)清洗、集成和處理方案,例如大規(guī)模非隨機(jī)缺失數(shù)據(jù)處理方案、中招成績數(shù)據(jù)潛在地市級評分偏差處理方案、校際差異率算法國家督導(dǎo)和優(yōu)均監(jiān)測的對標(biāo)校正方案、學(xué)業(yè)水平對標(biāo)分級方案等,探索建立適合省情的監(jiān)測體系和監(jiān)測工具,為開展基礎(chǔ)教育監(jiān)測和評價提供支持,為河南省基礎(chǔ)教育信息化建設(shè)與智能評價提供決策建議,推動基礎(chǔ)教育質(zhì)量監(jiān)測與評價轉(zhuǎn)向信息化、高效化、科學(xué)化。
(本文系2023年度河南省高校哲學(xué)社會科學(xué)應(yīng)用研究重大項目“技術(shù)賦能視域下河南促進(jìn)教師專業(yè)發(fā)展的行動路徑與實施策略研究”的研究成果,項目編號:2023-YYZD12;2021年度河南師范大學(xué)高等教育教學(xué)改革研究與實踐項目“‘互聯(lián)網(wǎng)+’背景下教育碩士實踐教學(xué)能力培養(yǎng)體系構(gòu)建與應(yīng)用”的研究成果,項目編號:YJS2021JG02)
(朱珂,河南省基礎(chǔ)教育發(fā)展監(jiān)測與評價中心主任,河南師范大學(xué)教育學(xué)部副部長,博士生導(dǎo)師;吳雅欣,河南師范大學(xué)教育學(xué)部在讀碩士研究生;李明,河南師范大學(xué)教育學(xué)部教師;孔德宇,河南師范大學(xué)教育學(xué)部在讀博士研究生)