吳龍凱 程浩 張珊 宋琰玉
[摘? ?要] 教育評價處于衡量與引導(dǎo)教育事業(yè)發(fā)展的樞紐環(huán)節(jié),以人工智能、大數(shù)據(jù)為代表的智能技術(shù)全面賦能教育評價改革,支撐教育系統(tǒng)全方位、全要素、全流程轉(zhuǎn)型。然而,目前有關(guān)智能技術(shù)賦能教育評價所引發(fā)的潛在倫理風險及其應(yīng)對措施的研究尚不明確?;诖?,文章系統(tǒng)回顧與分析了國內(nèi)外有關(guān)智能技術(shù)賦能教育評價的相關(guān)研究,闡釋了智能技術(shù)賦能教育評價的時代內(nèi)涵,探析了智能技術(shù)賦能新時代教育評價的倫理困境:技術(shù)至上僭越教育主體底線、算法偏見觸碰人本倫理防線、數(shù)據(jù)過度挖掘違背信息安全紅線、唯機器評價偏移教育公平普惠基準線、智能評價圍囿制約主體思維創(chuàng)新“高線”。提出了消解倫理困境的具體對策:明確評價主體地位,建立多級聯(lián)動保障新機制;審視智能算法偏差,驅(qū)動綠色評價技術(shù)新引擎;筑牢數(shù)據(jù)安全護欄,探索“彈性+柔性”共治新模式;兼容內(nèi)外評價范式,破解教育質(zhì)量公平倫理新難題;培養(yǎng)人工智能素養(yǎng),推動主體倫理道德新發(fā)展。
[關(guān)鍵詞] 智能技術(shù)賦能教育評價; 時代內(nèi)涵; 倫理困境; 對策研究; 算法偏見
[中圖分類號] G434? ? ? ? ? ? [文獻標志碼] A
[作者簡介] 吳龍凱(1976—),男,湖北漢川人。教授,博士,主要從事教育人工智能、智能教育評價、教育信息化、數(shù)字化政策與實踐等研究。E-mail:longkaiwu@ccnu.edu.cn。
一、引? ?言
教育評價處于衡量與引導(dǎo)教育事業(yè)發(fā)展的樞紐環(huán)節(jié),以大數(shù)據(jù)、人工智能為代表的智能技術(shù)全面賦能教育評價改革,支撐教育系統(tǒng)全方位、全要素、全流程轉(zhuǎn)型。2020年,中共中央、國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》(以下簡稱《總體方案》),明確提出發(fā)揮教育評價指揮棒作用,充分利用人工智能、大數(shù)據(jù)等信息技術(shù)改進結(jié)果評價、強化過程評價、探索增值評價、健全綜合評價,提高教育評價科學性、專業(yè)性、客觀性[1]。智能技術(shù)與教育評價的深度融合,已成為教育評價變革的關(guān)鍵契機與重要趨勢。然而,當前智能技術(shù)賦能教育評價的研究聚焦點主要在于宏觀的發(fā)展規(guī)劃、實踐路徑及微觀的概念理路、技術(shù)運用等方面,有關(guān)智能技術(shù)賦能教育評價所引發(fā)的潛在倫理風險及其應(yīng)對措施的研究仍待探賾。
2019年,歐盟人工智能專家委員會發(fā)布《可信賴的人工智能倫理準則》,旨在提升人工智能的可信任度[2]。2021年,聯(lián)合國教科文組織(UNESCO)發(fā)布首份關(guān)于人工智能倫理的全球協(xié)議《人工智能倫理問題建議書》,嘗試建立管治人工智能倫理問題的國際準則協(xié)議[3]。同年,國家新一代人工智能治理專業(yè)委員會發(fā)布《新一代人工智能倫理規(guī)范》,提出將倫理道德融入人工智能全生命周期,為人工智能在各領(lǐng)域的運用提供倫理指引[4]。2023年,世界數(shù)字教育大會在北京召開,會議強調(diào)要以數(shù)字技術(shù)為杠桿撬動教育整體變革,探索人工智能變革教育評價的新思路。在此背景下,推動人工智能在教育評價變革中的規(guī)范運用,提升智能技術(shù)在教育評價全過程的倫理效力,既是進行教育教學改革、實現(xiàn)高質(zhì)量發(fā)展的必然要求,也是推動教育評價改革落實落地的重要舉措。本研究旨在闡釋智能技術(shù)賦能教育評價的時代內(nèi)涵,探析智能技術(shù)賦能下教育評價倫理困境的核心范疇,在此基礎(chǔ)上,提出智能教育評價倫理困境的消解對策,探索實現(xiàn)智能教育評價和倫理風險規(guī)避統(tǒng)一同步的新理念、新方法。
二、 智能教育評價的時代內(nèi)涵
智能技術(shù)時代的到來,掀起了各產(chǎn)業(yè)、各領(lǐng)域智能化變革的浪潮,教育評價領(lǐng)域也不例外,以人工智能、大數(shù)據(jù)為代表的智能技術(shù)近年來不斷被應(yīng)用于教育領(lǐng)域,催生了新形態(tài)、新模式的智能教育,出現(xiàn)了智能畫像、機器評分、數(shù)據(jù)分析、人工智能輔助評價等教育評價新樣式,時代的訴求、技術(shù)的進步、教育的發(fā)展迫切需求教育評價改革創(chuàng)新,于是,智能技術(shù)賦能教育評價被正式提出[5]。關(guān)于智能技術(shù)賦能教育評價內(nèi)涵的本體論研究,業(yè)內(nèi)學者的內(nèi)涵闡述主要集中在智能技術(shù)賦能支持及教育評價要素轉(zhuǎn)型兩方面。
其一,從智能技術(shù)賦能角度看。鄭燕林等人認為,智能時代的評價關(guān)鍵在于通過數(shù)字技術(shù)手段收集、處理學習數(shù)據(jù),融合專家評價、教師評價、自我評價及同伴評價等多方面數(shù)據(jù),形成對學生的多維度、全方面評價[6]。劉邦奇等人綜合學者觀點指出,智能技術(shù)賦能教育評價在于運用智能技術(shù)助力教育評價數(shù)據(jù)的深度挖掘分析、反饋及應(yīng)用,本質(zhì)在于重構(gòu)傳統(tǒng)教育評價模式,形成智能化、數(shù)據(jù)化的新型教育評價模式[7]。張生等人提出,“學評融合”新理念以描述智能時代的新型教育評價,強調(diào)通過數(shù)字世界將評價融入學習活動,統(tǒng)籌評價的學習性與診斷性[8]。張志華等人從大數(shù)據(jù)賦能新時代教育評價轉(zhuǎn)型的技術(shù)邏輯出發(fā),提出數(shù)據(jù)驅(qū)動結(jié)果評價更加客觀、數(shù)據(jù)驅(qū)動過程評價更為立體、數(shù)據(jù)驅(qū)動增值評價更具發(fā)展性、數(shù)據(jù)驅(qū)動綜合評價更富效率[9]。教育的特殊性致使智能技術(shù)與教育領(lǐng)域的融合常滯后于其他領(lǐng)域,我國早期信息技術(shù)與教育評價的結(jié)合主要應(yīng)用于教學測驗評價、教育測量分析等方面,例如,網(wǎng)絡(luò)閱卷、上機考試、電子檔案等,技術(shù)帶給教育評價的影響并不明顯。但隨著圖像識別、智能掃描、大數(shù)據(jù)分析等技術(shù)的成熟,以及以ChatGPT為代表的解決多領(lǐng)域復(fù)雜問題的新型人工智能的興起,技術(shù)對教育評價的影響愈發(fā)深遠,智能技術(shù)賦能下的教育評價改革也愈發(fā)緊迫。
其二,從評價要素轉(zhuǎn)型視角看。朱德全等人從“第四范式”視角提出,智能時代的教育評價是教育全過程的伴隨式評價,教育評價與教學活動構(gòu)成反復(fù)迭代的循環(huán)回路,教育要成為“自我糾正系統(tǒng)”[10]。吳砥認為,智能技術(shù)賦能教育評價要推進教學評價組織過程自動化,考試評價智能化、精準化,學生評價過程化[11]。吳立寶等從評價主體、內(nèi)容、方式、結(jié)果等方面闡述智能技術(shù)賦能下評價的變革[12]。例如,以ChatGPT等為代表的生成式人工智能可高效完成知識的收集、呈現(xiàn),提供個性化的學習支持和輔導(dǎo),在此情形下,學生的創(chuàng)新能力、人機互動能力、批判思維能力習得尤為關(guān)鍵,傳統(tǒng)的以知識傳遞為目標的教育體系、以知識考察為目的的教學評價將難以滿足新形勢下人才培養(yǎng)的要求,教育的評價目標與評價方式迫切需要變革;依托智能算法、VR/AR、區(qū)塊鏈、虛擬現(xiàn)實等數(shù)字技術(shù)構(gòu)建的沉浸式、融合式、擬真式教育元宇宙,將使得學生情感態(tài)度、價值觀念、心理情緒等非結(jié)構(gòu)化數(shù)據(jù)得以便利采集,伴隨式、動態(tài)化教育評價將得以實現(xiàn),教育評價的內(nèi)容、方式和形式將得到極大豐富與轉(zhuǎn)變[13]。總之,人工智能技術(shù)與教育的深度融合為教育教學評價改革創(chuàng)新提供了可行路徑[14],教育評價系統(tǒng)的各要素亟須數(shù)字化轉(zhuǎn)型。
縱觀各方觀點,本研究認為,智能技術(shù)賦能教育評價的時代內(nèi)涵本質(zhì)在于評價目標、評價方式、評價主體、評價結(jié)果等全要素的數(shù)字化、智能化轉(zhuǎn)型;關(guān)鍵在于教育結(jié)果評價、過程評價、增值評價、綜合評價等全方位的突破性、全局性創(chuàng)新,實現(xiàn)教育體系的時代變革。
三、 智能教育評價的倫理困境
人工智能技術(shù)在教育領(lǐng)域的融合應(yīng)用推進了教育評價改革的創(chuàng)新發(fā)展,在釋放教育評價活力的同時,教育評價智能化轉(zhuǎn)型進程中出現(xiàn)的倫理問題同樣不可忽視?;谇拔乃?,考量各方觀點,本文對智能技術(shù)賦能下的教育評價倫理困境作出如下歸納:
(一)技術(shù)至上僭越教育主體底線
教育評價是以教育活動滿足社會或個體需要程度而進行的價值判斷,明確評價主體是教育評價實踐的首要問題。相較于工具化、輔助化的機器客體,擁有情感、創(chuàng)造力、判斷力的教育管理者、教師、學生等則是毋庸置疑的教育評價主體。隨著人工智能在教育中的深度應(yīng)用,技術(shù)至上、工具理性思維的異化滋生導(dǎo)致人技的主客位置顛倒,技術(shù)僭越教育評價主體底線的情形出現(xiàn),不得不引起人們對教育評價主體的擔憂和思考[15]。智能技術(shù)的發(fā)展帶給教育評價質(zhì)的改變,強大的機器學習能力、強勁的算力及學習分析能力賦予人工智能海量的知識儲備、快速高效的處理能力以及自我學習的優(yōu)化能力,使得智能技術(shù)在教育評價中凸顯出高速度、高效率、高準確率的優(yōu)勢,備受部分教育評價使用者青睞。但評價過程中過度關(guān)注效率、計算、手段的工具理性偏執(zhí)可能招致教育評價主體產(chǎn)生“技術(shù)依賴癥”[16],從而削弱主體進行評價分類、推演、計算、判斷的能力,思維認知產(chǎn)生鈍化,致使原本存在于教育評價活動中的情感、道德、自我需求等因素被忽視。教育評價不是簡單的紙質(zhì)報告,“人評”與“機判”的關(guān)系還需深入調(diào)和,基于客觀事實、數(shù)據(jù)分析所呈現(xiàn)的教育評價結(jié)果固然有利于教育評價標準化、科學化發(fā)展,但并不代表它能量化一切,偏執(zhí)地追求客觀理性,人特有的主體氣質(zhì)將難以評判詮釋,評價效果離克服《總體方案》中所提的“五唯”頑疾也將相隔甚遠。
(二)算法偏見觸碰人本倫理防線
智能時代越來越多的教育決策工作為機器、算法和人工智能所取代,技術(shù)帶來決策便利的同時,人工智能所挾裹的算法“黑箱”、算法歧視同樣不容小覷。其一,算法設(shè)計本身缺少道德倫理規(guī)范,致使教育評價所依據(jù)的數(shù)據(jù)自帶現(xiàn)實社會中的教育歧視[17]。2021年,英國由于疫情取消A-level考試,并使用新算法開發(fā)的智能評分系統(tǒng)按照學區(qū)綜合表現(xiàn)給學生劃分等級,最終導(dǎo)致學生所處的“學區(qū)”綜合實力成為決定成績的關(guān)鍵因素,大量學生成績被下調(diào),引發(fā)學生和教師不滿。其二,智能評價系統(tǒng)的訓練需要大量的數(shù)據(jù),如果數(shù)據(jù)本身存在性別歧視、種族主義、地域歧視等不當言論[18],其評價模型便會反映這類偏見,甚至產(chǎn)生自我強化學習的歧視與偏見反饋環(huán)路。一項關(guān)于AI模型性別歧視水平的測試結(jié)果表明,GPT-2模型有70.59%的概率將教師性別預(yù)測為男性,將醫(yī)生預(yù)測為男性的概率為64.03%。此外,有學者提出,人工智能在評判中存在將女性與“家庭”相聯(lián)系,男性與“事業(yè)”相關(guān)聯(lián),好“白”惡“黑”的歧視與偏見[19]。其三,研發(fā)者自身主觀或客觀局限性,造成算法偏見。一是研發(fā)者本身對于以人為本的教育價值觀、倫理道德觀認識不足,在研發(fā)過程中無意識地賦予算法偏見;二是算法的設(shè)計是由編程人員主觀選擇和判斷的結(jié)果,開發(fā)中能否客觀、公正地將既有的法律規(guī)范或道德準則編寫到程序中也值得懷疑。
(三)數(shù)據(jù)過度挖掘違背信息安全紅線
現(xiàn)代教育必然是數(shù)據(jù)驅(qū)動的,而非純粹的經(jīng)驗主義[20]。以數(shù)據(jù)為本的教育測評正逐漸成為智能時代教育的主導(dǎo)方式,客觀化的數(shù)據(jù)已成為教育質(zhì)量監(jiān)控、行為監(jiān)測的重要依據(jù)[21],但無處不在的數(shù)據(jù)挖掘勢必會威脅到主體的隱私安全和數(shù)據(jù)控制權(quán),引發(fā)新的評價倫理沖突[16]。一方面,實施智能化的教育評價,離不開對整個教育過程開展數(shù)據(jù)式收集、分析、處理及運用,包括對評價主體的情感、行為、動作、認知、學習效果、思維方式、生理或心理狀態(tài)等數(shù)據(jù)進行海量的挖掘分析,但數(shù)據(jù)挖掘會采集評價主體家庭背景、個人偏好等私人信息,這些隱私信息如果被不當使用或泄露,個體的信息安全勢必會受到影響和侵犯。此外,由于數(shù)據(jù)挖掘可以識別出主體的個人特征,如性別、種族、社會背景等,若數(shù)據(jù)不遵從道德標準失范使用,會導(dǎo)致偏見與歧視等倫理問題。另一方面,由于資本逐利的驅(qū)動,人工智能商家可以利用數(shù)據(jù)、算法和算力與用戶之間的不對等,在評價主體并非完全知情或明白的情況下,收集用戶信息和私人隱私,間接弱化評價主體的知情權(quán)和對數(shù)據(jù)的掌控權(quán)[22]。比如,多數(shù)未成年人在使用智能產(chǎn)品時,并不知曉使用產(chǎn)品前所需的權(quán)限賦予有何意義,以及選擇“同意”后會帶來什么樣的影響,或者為使用產(chǎn)品而不得不被動選擇賦予產(chǎn)品某些不對等的權(quán)限[23],從而失去數(shù)據(jù)掌控權(quán),造成個人信息被動收集,不經(jīng)意間產(chǎn)生隱私泄露危機。
(四)唯機器評價偏移教育公平普惠基準線
以人工智能、大數(shù)據(jù)、機器學習、算法等為核心的決策系統(tǒng)被廣泛應(yīng)用于教育評價中,但受傳統(tǒng)評價思維慣性牽制、技術(shù)發(fā)展限制以及數(shù)據(jù)質(zhì)量偏差的影響,由數(shù)字佐證的教育決策將難保評價的質(zhì)量與公平,引發(fā)新的倫理沖突。首先,傳統(tǒng)教育體系下的評價思維往往是基于標準化的測驗和單一的評價標準,其產(chǎn)生的思維慣性很可能被沿用到智能教育評價中。智能評價所產(chǎn)生的結(jié)果往往是依賴數(shù)據(jù)事實、算力分析,若只關(guān)注評價主體績效、成績、知識表現(xiàn)的思維不發(fā)生轉(zhuǎn)換,那么智能評價的結(jié)果不僅不能促進評價主體發(fā)展,反而會將教育主體“物化”,阻礙其進步。其次,教育評價的數(shù)據(jù)源采集往往來自數(shù)字基礎(chǔ)設(shè)施完備、軟硬件設(shè)施豐富、教育信息化水平較高的地區(qū)學校,資源水平落后地區(qū)的教育過程性數(shù)據(jù)往往難以采集或者被選擇性忽視[24],這導(dǎo)致教育決策者在作出某些決策時難以保證均衡公正,如人力、物力、財力資源分配。最后,教育過程中的智能評價系統(tǒng)通常由算法和模型驅(qū)動,若要求公開數(shù)據(jù)和算法原理,評價主體的隱私會產(chǎn)生泄露危機,因此,評價系統(tǒng)內(nèi)部的運行機制往往是非公開、不透明的,這也導(dǎo)致教育主體難以理解信任評判結(jié)果,從而影響對決策的判斷。此外,評價模型背后的數(shù)據(jù)集質(zhì)量欠佳,導(dǎo)致作出固化社會歧視、加劇社會不公的決策。
(五)智能評價圍囿制約主體思維創(chuàng)新“高線”
智能評價要關(guān)注學生創(chuàng)造性價值觀等高階能力的培養(yǎng),但現(xiàn)有評價實踐存在圍囿與束縛主體思維創(chuàng)新的現(xiàn)象。其一,智能技術(shù)在評價方面的高效準確可能導(dǎo)致評價主體過度依賴評價結(jié)果,將評價結(jié)果視為絕對真實和正確的標準,忽視評價過程的批判創(chuàng)新思維,導(dǎo)致主體的自主思考能力、創(chuàng)新能力降低。教育評價者放權(quán)完全由機器判斷作出決策,那么,這些由人工智能完成的測試再由人工智能評判所得來的結(jié)果,在消弭主體主觀能動性的同時,也會扼殺主體的思維創(chuàng)新、價值判斷能力。其二,基于大數(shù)據(jù)、算法的智能評價可能對教育主體的思維方式、認知結(jié)構(gòu)產(chǎn)生影響,比如,弱化主體對于交叉信息的判斷能力,限制跨領(lǐng)域、跨學科知識處理能力,降低教育主體處理解決復(fù)雜問題的能力。據(jù)在線課程供應(yīng)商Study.com的調(diào)查顯示,美國有89%的大學生承認使用ChatGPT完成家庭作業(yè),49%的學生承認使用ChatGPT完成測試,且作品完成質(zhì)量較高,致使教師發(fā)現(xiàn)寫作完成最好的作品是ChatGPT所完成[25]。其三,智能評價本身難以收集表現(xiàn)評價主體的創(chuàng)新能力的數(shù)據(jù),評價決策也自然無法體現(xiàn)主體在教育過程中的真實能力價值,這會導(dǎo)致評價結(jié)果效能感降低、評價激勵作用難以發(fā)揮,使得主體產(chǎn)生自我質(zhì)疑、思想倦怠,進而失去創(chuàng)新動力。
四、 智能教育評價倫理困境的消解對策
解決智能技術(shù)帶給教育評價的倫理問題要注重意識與實操兩個層面[26],要制定相關(guān)的政策保障機制,警惕算法歧視、數(shù)據(jù)泄露等潛在危害,辯證看待技術(shù)與倫理的關(guān)系,提升評價主體人工智能素養(yǎng),構(gòu)建綠色發(fā)展的智能教育評價生態(tài)。
(一)明確評價主體地位,建立多級聯(lián)動保障新機制
明確教育管理者、教師、學生等在教育評價活動中的主體地位,將教育評價各階段的倫理訴求嵌入到安全制度保障體系當中,是消解倫理風險的一道強硬防線。宏觀層面,政府部門應(yīng)加強頂層設(shè)計,規(guī)劃重點戰(zhàn)略布局,明確智能技術(shù)賦能教育評價的輔助者角色,持續(xù)完善智能技術(shù)管理的配套規(guī)范,融合、更新現(xiàn)有網(wǎng)絡(luò)、信息等法律法規(guī),增建有關(guān)智能技術(shù)建設(shè)、應(yīng)用和評價標準,完善權(quán)責劃分、歸屬、追責、問責機制,積極探索智能技術(shù)賦能教育評價過程中的理論和實踐問題,加強倫理治理法治實踐,營造綠色安全的技術(shù)應(yīng)用環(huán)境。中觀層面,相關(guān)組織機構(gòu)應(yīng)按需細化,針對智能技術(shù)的應(yīng)用需求建立彈性應(yīng)變機制,及時應(yīng)對技術(shù)倫理潛在的問題,服務(wù)教育評價切實落地,賦能師生綠色健康發(fā)展。微觀層面,將制度要求轉(zhuǎn)化為技術(shù)要求,提升技術(shù)準入門檻,明確技術(shù)應(yīng)用紅線,建立技術(shù)監(jiān)測平臺,完善技術(shù)平臺與系統(tǒng)間的身份認證、授權(quán)、審批流程,規(guī)范評價過程中的技術(shù)應(yīng)用行為,確保符合現(xiàn)有標準;完善現(xiàn)有監(jiān)督機制,并在此基礎(chǔ)上納入風險預(yù)警觸發(fā)機制,統(tǒng)籌技術(shù)與人工“雙重預(yù)警”,以快速應(yīng)對復(fù)雜多變的實時需求,及時進行調(diào)整。最終建立多流程聯(lián)動、全方位保障的安全防護體系,確保技術(shù)與教育評價的健康發(fā)展。
(二)審視智能算法偏差,驅(qū)動綠色評價技術(shù)新引擎
算法設(shè)計者的主觀影響、數(shù)據(jù)誤差和算法封裝等原因不可避免地導(dǎo)致算法偏差,使得某些潛在風險難以輕易察覺[32]。個體信息的自處理與保護機制倒逼算法偏差規(guī)避、透明公開[33],為確保智能教育評價應(yīng)用的良性運轉(zhuǎn),算法審視尤為重要。算法設(shè)計和算法選擇負載設(shè)計者的主觀價值,消除算法偏差首先應(yīng)明確并規(guī)范算法主體的責任,建立算法“問責制”,加強算法備案,明確算法設(shè)計的目的、原則、種類、程序、合法性與正當性。其次,遵循“運行前評估”與“運行中持續(xù)監(jiān)督”相結(jié)合的原則,助推算法透明化、公開化。算法投入應(yīng)用前對算法進行全方面安全評估,接受多階梯監(jiān)督、多層級審查與多情境測試,針對其中出現(xiàn)的問題進行主動有效干預(yù);投入運行后,持續(xù)關(guān)注算法風險變化,完善全過程動態(tài)評估,定期對算法進行質(zhì)量評估、模型訓練、系統(tǒng)升級,及時修補漏洞,實時更新數(shù)據(jù)。除此以外,建立風險自評估機制,增設(shè)自身風險監(jiān)測、預(yù)防、管控及自修復(fù)功能,通過特征提取技術(shù),建立算法風險模型,組建算法風險集成庫,以快速識別風險類型,進行事先預(yù)警、精準防控[34];針對算法風險破壞問題,應(yīng)及時更新防范數(shù)據(jù),自梳理分析應(yīng)對措施,啟動多層防護系統(tǒng)。通過搭建算法設(shè)計、選擇、運行、檢測、更新的良性生態(tài)鏈,驅(qū)動評價技術(shù)綠色發(fā)展新引擎,為教育評價提供算法倫理保障。
(三)筑牢數(shù)據(jù)安全護欄,探索“彈性+柔性”共治新模式
多樣化數(shù)據(jù)來源可有效支撐教育評價,例如,美國建立國家級、州級、學區(qū)級以及校級等各級各類教育數(shù)據(jù)系統(tǒng),支撐教育評價數(shù)據(jù)的獲取[29]。但其身后的數(shù)據(jù)安全風險是智能技術(shù)賦能教育評價過程中亟須解決的一大倫理問題,須從采集、處理、應(yīng)用、管理等數(shù)據(jù)全生命周期入手,制定數(shù)據(jù)安全保護框架,探索教育數(shù)據(jù)的彈性監(jiān)管與柔性治理模式。數(shù)據(jù)采集階段,為保證數(shù)據(jù)的質(zhì)量,應(yīng)確保數(shù)據(jù)收集過程的可追溯性,完善數(shù)據(jù)審查制度,保障數(shù)據(jù)的完整性、及時性、一致性、準確性和可靠性[30],明確數(shù)據(jù)的使用目的、相關(guān)主體、保存期限等問題。數(shù)據(jù)處理階段深度加工收集的數(shù)據(jù),對數(shù)據(jù)進行清洗、修正、脫敏,剔除冗余、無效、惡意數(shù)據(jù),對數(shù)據(jù)中的敏感和隱私信息進行篩選和加密保護,同時對剔除的數(shù)據(jù)進行妥善破碎與處理。數(shù)據(jù)應(yīng)用是智能技術(shù)賦能教育評價的關(guān)鍵,優(yōu)化數(shù)據(jù)供給模式,保障數(shù)據(jù)傳輸、存儲、分析、運用各環(huán)節(jié),確保數(shù)據(jù)的知情權(quán)、訪問權(quán)、使用權(quán)公開透明,規(guī)避教育數(shù)據(jù)篡改、師生隱私泄露等風險。各層級應(yīng)統(tǒng)籌協(xié)同作業(yè),規(guī)范數(shù)據(jù)標準格式,制定開放共享權(quán)限,建立安全統(tǒng)一的數(shù)據(jù)傳輸與流轉(zhuǎn)通道,互相檢驗數(shù)據(jù)質(zhì)量,監(jiān)督數(shù)據(jù)使用行為的正當性、合法性,同時聯(lián)通數(shù)據(jù)利益相關(guān)者,開展多主體協(xié)同監(jiān)督,對教育數(shù)據(jù)使用可能產(chǎn)生的邊界和偏誤問題進行綜合評估、倫理論證,形成常態(tài)化監(jiān)督與聚集輻射效應(yīng)。最后,個體是消解數(shù)據(jù)倫理問題的中堅力量,重視提升個體的數(shù)據(jù)安全意識,加強個體對數(shù)據(jù)中敏感信息、附帶權(quán)益與經(jīng)濟價值的識別與自我防護[31],提高辨別數(shù)據(jù)陷阱、預(yù)測數(shù)據(jù)風險的能力。
(四)兼容內(nèi)外評價范式,破解教育質(zhì)量公平倫理新難題
技術(shù)倫理發(fā)展至今,出現(xiàn)了辯證統(tǒng)一的“外在主義”與“內(nèi)在主義”兩種技術(shù)哲學觀點。其中,外在主義技術(shù)倫理進路基本模式是對技術(shù)帶來的后果進行倫理的反思與批判[27];與之相對的內(nèi)在主義技術(shù)倫理則主張將道德倫理“嵌入”技術(shù)中,目的在于運用技術(shù)解決倫理問題,達到對人的行為產(chǎn)生正面引導(dǎo)、規(guī)訓的效果[28]。辯證來看,兩種觀點各自側(cè)重了技術(shù)與倫理矛盾關(guān)系中的一方面,均為研究解決智能教育評價的倫理問題提供了新的視角,但技術(shù)與倫理本身是統(tǒng)一的,因此,在教育評價實踐中,需要兼顧“內(nèi)外”、融合發(fā)展兩種不同技術(shù)倫理進路。一方面,教育評價要反思評價結(jié)果的不足,重視以人為本的教育評價目標。確保技術(shù)的使用與發(fā)展契合人的目標與價值,注重評價對象的多元性、評價要素的多樣性以及評價指標的科學性;要確保評價過程、結(jié)果的公正透明,保證技術(shù)的使用符合人類的道德和倫理規(guī)范,避免評價結(jié)果受個人偏見或技術(shù)漏洞的影響。另一方面,教育評價要重視技術(shù)的道德規(guī)范,增強教育評價的社會責任。提高企業(yè)與技術(shù)從業(yè)人員的道德意識,鼓勵創(chuàng)新與社會環(huán)境、倫理道德等密切相關(guān)的技術(shù),確保未來教育評價所用技術(shù)本身具有較強的道德責任感,促成教育評價的工具理性與價值理性耦合;人工介入與監(jiān)管教育評價,提高評價過程、手段、方法、結(jié)果的公正性和準確性,提供反饋和建議,以優(yōu)化改進評價系統(tǒng)。
(五)培養(yǎng)人工智能素養(yǎng),推動主體倫理道德新發(fā)展
技術(shù)是人的延伸,教育評價的主角永遠是使用技術(shù)的人,應(yīng)對智能教育評價倫理危機,還需從評價主體自身出發(fā),著力提升人工智能素養(yǎng)。首先,強化主體理論教育。開展如何利用智能技術(shù)進行教育評價的理論培訓,掌握智能技術(shù)的基本概念、了解人工智能工作原理以及利用評價智能系統(tǒng)解決實際問題;引入具有智能化分析和處理功能的教育評價工具,理解大數(shù)據(jù)分析、算法處理等技術(shù)的應(yīng)用原理、應(yīng)用場景及局限性;加強人工智能倫理與道德法律教育,組織相關(guān)研討培訓活動、學習評價倫理最新案例,提升主體的技術(shù)倫理道德責任感。其次,注重主體實踐應(yīng)用。引導(dǎo)教育管理者有意識地使用智能評價工具,總結(jié)評價過程中的技術(shù)優(yōu)勢和潛在的倫理問題,提供反饋數(shù)據(jù)以優(yōu)化數(shù)據(jù)源、算法參數(shù)、結(jié)構(gòu)模型;注重評價對象參與感,提供數(shù)據(jù)分析、編程教育、信息安全競賽等多元學習方式,強化信息安全意識、數(shù)據(jù)隱私意識教育,增設(shè)計算機編程、數(shù)據(jù)科學等課程,提高師生數(shù)據(jù)素養(yǎng)[35];鼓勵教育評價主體在評價中探索人工智能技術(shù)的新應(yīng)用,提出創(chuàng)新性的評價方法與思路,發(fā)展主體創(chuàng)新意識。最后,積極開展人工智能技術(shù)與教育評價倫理的理論與實踐問題研究,組織引導(dǎo)專業(yè)研究團隊,針對技術(shù)倫理與教育評價融合的模式、方法、路徑、影響等問題開展研究,為評價主體智能素養(yǎng)的提高及道德倫理觀念的增強提供支撐。
五、 結(jié)? ?語
智能技術(shù)賦能教育評價是深化新時代教育評價改革的迫切需求。要破除傳統(tǒng)單一維度、唯分數(shù)論的評價機制;要充分發(fā)揮人工智能、大數(shù)據(jù)等技術(shù)優(yōu)勢,牽引教育領(lǐng)域綜合改革,助推教育現(xiàn)代化發(fā)展;要高度重視潛在的倫理風險,精準洞悉突破口;要以政策制度為保障基礎(chǔ)、理論創(chuàng)新為研究依據(jù)、數(shù)據(jù)治理與算法監(jiān)管為重要手段、智能素養(yǎng)提升為導(dǎo)向,實現(xiàn)智能技術(shù)全面賦能教育評價改革創(chuàng)新,撬動評價要素在實踐中融合重組與創(chuàng)新革新,構(gòu)建與新時代教育現(xiàn)代化目標一致的教育評價體系。
[參考文獻]
[1] 中華人民共和國教育部.中共中央 國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》[EB/OL].(2020-10-13)[2023-07-19]. http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202010/t20201013_494381.html.
[2] European Commissions' High-Level Expert Group on Artificial Intelligence[EB/OL]. (2018-04-08)[2023-07-19]. https://ec. Europa.eu/digital-single-market/en/news/ethics-guide-lines-trustworthy-ai.
[3] UNESCO. Draft text of the UNESCO recommendation on the ethics of artificial intelligence [EB/OL].(2021-09-26)[2023-07-19].https://unesdoc.unesco.org/ark:/48223/pf0000379920.page=14.
[4] 國家新一代人工智能治理專業(yè)委員會.《新一代人工智能倫理規(guī)范》發(fā)布[EB/OL].(2021-09-26)[2023-07-19].http://www.most.gov.cn/kjbgz/202109/t20210926_177063.html.
[5] 劉邦奇,吳曉如.中國智能教育發(fā)展報告[M].北京:人民教育出版社,2020,19-21.
[6] 鄭燕林,柳海民.大數(shù)據(jù)在美國教育評價中的應(yīng)用路徑分析[J].中國電化教育,2015(7):25-31.
[7] 劉邦奇,袁婷婷,紀玉超,等.智能技術(shù)賦能教育評價:內(nèi)涵、總體框架與實踐路徑[J].中國電化教育,2021,415(8):16-24.
[8] 張生,王雪,齊媛.人工智能賦能教育評價:“學評融合”新理念及核心要素[J].中國遠程教育,2021,553(2):1-8,16,76.
[9] 張志華,王麗,季凱.大數(shù)據(jù)賦能新時代教育評價轉(zhuǎn)型:技術(shù)邏輯、現(xiàn)實困境與實現(xiàn)路徑[J].電化教育研究,2022,43(5):33-39.
[10] 朱德全,吳慮.大數(shù)據(jù)時代教育評價專業(yè)化何以可能:第四范式視角[J].現(xiàn)代遠程教育研究,2019,31(6):14-21.
[11] 吳砥.利用智能技術(shù)賦能教學評價創(chuàng)新——談智慧教育示范區(qū)建設(shè)如何落地[J].教育家,2020,214(10):52-53.
[12] 吳立寶,曹雅楠,曹一鳴.人工智能賦能課堂教學評價改革與技術(shù)實現(xiàn)的框架構(gòu)建[J].中國電化教育,2021(5):94-101.
[13] 楊宗凱.元宇宙推動教育的全面數(shù)字化轉(zhuǎn)型[J].教育研究,2022,43(12):23-26.
[14] 楊宗凱.利用信息技術(shù)促進教育教學評價改革創(chuàng)新[J].人民教育,2020(21):30-32.
[15] 馮銳,孫佳晶,孫發(fā)勤.人工智能在教育應(yīng)用中的倫理風險與理性抉擇[J].遠程教育雜志,2020,38(3):47-54.
[16] 鹿星南,高雪薇.人工智能賦能教育評價改革:發(fā)展態(tài)勢、風險檢視與消解對策[J].中國教育學刊,2023,358(2):48-54.
[17] 滕長利,鄧瑞平.智能技術(shù)賦能教育高質(zhì)量發(fā)展:內(nèi)涵、挑戰(zhàn)及應(yīng)對[J].高教探索,2023,231(1):8-13.
[18] 周洪宇,李宇陽.ChatGPT對教育生態(tài)的沖擊及應(yīng)對策略[J].新疆師范大學學報(哲學社會科學版):2023(4):1-11.
[19] AYLIN C, JOANNA J, BRYSON, et al. Semantics derived automatically from language corpora contain human-like biases[J]. Science,2017,356(6334):183-186.
[20] 楊開城.教育何以是大數(shù)據(jù)的[J].電化教育研究,2019,40(2):5-11.
[21] 金生鈜.大數(shù)據(jù)教育測評的規(guī)訓隱憂——對教育工具化的哲學審視[J].教育研究,2019,40(8):33-41.
[22] 苗逢春.教育人工智能倫理的解析與治理——《人工智能倫理問題建議書》的教育解讀[J].中國電化教育,2022,425(6):22-36.
[23] BEREND B, LITTLE J A, BLAKEMORE M. AI in education: learner choice and fundamental rights[J]. Learning, media and technology,2020,45(3):312-324.
[24] 逯行.智能技術(shù)引發(fā)的教育主體行為失范如何判定:方法、類型與表現(xiàn)[J].現(xiàn)代遠程教育研究,2022,34(2):37-46.
[25] VICTOR T. 89 Percent of college students admit to using ChatGPT for homework[EB/OL]. [2023-07-19].https://futurism.com/the-byte/students-admit-chatgpt-homework.
[26] 陳麗,郭玉娟,高欣峰,等.人機協(xié)同的新時代:我國人工智能教育應(yīng)用的現(xiàn)狀與趨勢[J].開放學習研究,2019,24(5):1-8.
[27] 張衛(wèi).藏禮于器:內(nèi)在主義技術(shù)倫理的中國路徑[J].大連理工大學學報(社會科學版),2018,39(3):116-121.
[28] 張衛(wèi).內(nèi)在主義視域下的道德增強及其爭議[J].倫理學研究,2022(1):106-112.
[29] 陳明選,王詩佳.測評大數(shù)據(jù)支持下的學習反饋設(shè)計研究[J].電化教育研究,2018,39(3):35-42,61.
[30] 吳砥,饒景陽,吳晨.教育大數(shù)據(jù)標準體系研究[J].開放教育研究,2020,26(2):75-82.
[31] 祁志偉. 著力提升全民數(shù)據(jù)安全意識和素養(yǎng)[N]. 中國社會科學報,2023-02-08(007).
[32] 閆坤如.人工智能的算法偏差及其規(guī)避[J].江海學刊,2020,329(5):141-146.
[33] 杜永欣,周茂君.透明化生存中的自主性構(gòu)建:算法推薦的隱私問題與規(guī)制路徑[J].未來傳播,2022,29(6):10-19.
[34] 郭勝男,吳永和,張治.人工智能教育大腦模型構(gòu)建及實踐路徑[J].開放教育研究,2022,28(4):22-30.
[35] 雷勵華,張子石,李志昊,等.數(shù)據(jù)驅(qū)動教育優(yōu)質(zhì)均衡督導(dǎo)評估研究[J].電化教育研究,2022,43(12):39-45.
On Contemporary Connotation, Ethical Dilemmas and Countermeasures of Educational Evaluation Empowered by Intelligent Technologies
WU Longkai1,? CHENG Hao2,? ZHANG Shan2,? SONG Yanyu2
(1.National Engineering Research Center for E-Learning, Central China Normal University, Wuhan Hubei 430070; 2.Faculty of Artificial Intelligence Education, Central China Normal University, Wuhan Hubei 430070)
[Abstract] Educational evaluation is the key link to measure and guide the development of education. The intelligent technology represented by artificial intelligence and big data comprehensively empowered the reform of educational evaluation and supports the all-round, all-factor and whole-process transformation of the education system.However, at present, the research on the potential ethical risks caused by the educational evaluation empowered by intelligent technology and its countermeasures is not clear. Based on this, this paper systematically reviews and analyzes the relevant studies on the educational evaluation empowered by intelligent technology at home and abroad, explains its contemporary connotation, and explores its ethical dilemma in the new era: technological supremacy has overstepped the bottom line of the main body of education, algorithmic bias has touched the defense line of humanistic ethics, excessive data mining has violated the red line of information security, machine-only evaluation has deviated from the baseline of equity and inclusion in education, and intelligent evaluation has limited the "high line" of subject's thinking and innovation. Specific countermeasures are proposed to resolve the ethical dilemma: to clarify the status of the main body of evaluation and establish a new mechanism of multi-level linkage guarantee; to examine the deviation of intelligent algorithms and drive the new engine of green evaluation technology; to build a strong data security guardrail and explore a new model of "elasticity +flexibility" co-governance; to be compatible with internal and external evaluation paradigms and solve the new ethical problem of equity in educational quality; to cultivate artificial intelligence literacy and promote the new development of subject ethics.
[Keywords] Educational Evaluation Empowered by Intelligent Technologies; Contemporary Connotation; Ethical Dilemmas; Countermeasures Research; Algorithm Bias