劉邦奇 袁婷婷 紀玉超 劉碧瑩 李嶺
摘要:智能技術(shù)賦能為教育評價變革發(fā)展提供了重要機遇,促進智能技術(shù)與教育評價融合創(chuàng)新是深化新時代教育評價改革的必然選擇。據(jù)此,對智能技術(shù)賦能教育評價進行了系統(tǒng)研究,其歷史淵源可追溯到管理工程領(lǐng)域的智能綜合評價和教育評價領(lǐng)域計算機技術(shù)的應(yīng)用。本質(zhì)是基于智能技術(shù)對傳統(tǒng)教育評價的突破與創(chuàng)新,通過解構(gòu)、重構(gòu)形成新的教育評價模式,具有科學化、多元化、立體化、最優(yōu)化、精準化等主要特征。助力教育評價的智能技術(shù)及應(yīng)用由“5+1”的總體框架(基礎(chǔ)層、技術(shù)層、平臺層、應(yīng)用層、用戶層5個層次結(jié)構(gòu)和1個保障體系)構(gòu)成。通過智能技術(shù)賦能“四個評價”的具體場景應(yīng)用,采取理念引領(lǐng)、標準規(guī)范、主體關(guān)照、數(shù)據(jù)驅(qū)動、專業(yè)支持等整體推進策略,打造智能化教育評價生態(tài)體系。
關(guān)鍵詞:智能技術(shù);賦能;教育評價;總體框架;實踐路徑
中圖分類號:CJ434
文獻標識碼:A
一、引言
智能技術(shù)賦能教育評價提出的緣由,可以追溯到兩種歷史淵源。一種是在管理工程領(lǐng)域,為解決復(fù)雜系統(tǒng)問題,將智能化方法用于綜合評價,如引入遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、蒙特卡羅模擬方法、人工免疫算法和蟻群智能算法等,提高了綜合評價的智能特性。由此出現(xiàn)了智能化綜合評價[1]?,F(xiàn)代教育評價具有多元性、復(fù)雜性、系統(tǒng)性等特征,是多種學科專業(yè)、多種技術(shù)方法在教育評價領(lǐng)域的綜合應(yīng)用,管理工程領(lǐng)域形成的智能化綜合評價為創(chuàng)新教育評價模式提供了參考路徑。有學者梳理了國際上“智能化教育評價”研究的演進路徑,析出“智能化教育評價”演進過程中的關(guān)鍵節(jié)點文獻[2],其中3篇“智能化教育評價”文獻綜合了教育學、心理學、統(tǒng)計學、神經(jīng)計算科學、信息科學等學科和技術(shù)應(yīng)用。
另一種是在教育評價領(lǐng)域,起源于計算機技術(shù)在教育評價中的運用。近二十多年來,美國先后發(fā)布了六個國家教育技術(shù)計劃(National EducationTechnology Plan,簡稱NETP),NETP1996在學生學習進度評價中提出應(yīng)用多媒體技術(shù)和計算機技術(shù),形成學生作業(yè)的電子檔案和進行計算機自適應(yīng)測試[3]。NETP2000指出隨著互聯(lián)網(wǎng)的發(fā)展,改善傳統(tǒng)教育評價的機會出現(xiàn)了,要開發(fā)新的學生評價工具,傳統(tǒng)的紙筆測評不能再準確反映21世紀學生的學習情況,教育評價可以使用在線技術(shù)以更有效的方式進行[4]。NETP2004提出要建設(shè)集成數(shù)據(jù)系統(tǒng),指出集成、可互操作的數(shù)據(jù)系統(tǒng)是在線學生表現(xiàn)測評的關(guān)鍵,測評結(jié)果可驅(qū)動日常教學決策和設(shè)計教學干預(yù),幫助教師進行差異化教學[5]。NETP2010、NETP2016、NETP2017均將教育評價作為教育技術(shù)應(yīng)用的重要領(lǐng)域進行規(guī)劃,強調(diào)各級教育系統(tǒng)要利用技術(shù)去衡量什么最重要,并利用評價數(shù)據(jù)來持續(xù)改進和創(chuàng)新教育[6-8]。在我國,計算機技術(shù)最早運用于考試評價、教育測量分析等,典型應(yīng)用包括計算機化考試、網(wǎng)上評卷、網(wǎng)上錄取等。同時,現(xiàn)代信息技術(shù)也支持和發(fā)展了教學評價,如電子檔案、電子表決器、教學評價支持系統(tǒng)等技術(shù)應(yīng)用,有效提升了教育教學評價的信息化、智能化水平。
智能技術(shù)賦能教育評價的正式提出,是近幾年隨著人工智能、大數(shù)據(jù)等智能技術(shù)的迅速發(fā)展及其在教育領(lǐng)域廣泛應(yīng)用,催生了智能教育新模式、新形態(tài),出現(xiàn)了包括智能考試、智能評價等新樣式[9]。隨著智能時代的到來,智能技術(shù)為教育評價變革帶來了機遇,深度融合智能技術(shù)與教育評價是必然趨勢。早在2016年,楊現(xiàn)民提出大數(shù)據(jù)的發(fā)展使教育評價走向客觀性評價、伴隨性評價、綜合性評價和智能化評價,教育大數(shù)據(jù)驅(qū)動教育評價體系重構(gòu)[10]。董奇在2020年“人工智能與教育大數(shù)據(jù)峰會”上指出,科技賦能教育評價改革時機已至[11]??傊?,教育評價的改革發(fā)展需要先進和前沿的技術(shù)支撐,智能技術(shù)賦能為此提供了重要的方向和路徑。加強教育評價領(lǐng)域關(guān)鍵技術(shù)的研發(fā)力度,促進智能技術(shù)與教育評價的深度融合,是深化教育評價改革面臨的重要議題。
二、智能技術(shù)賦能教育評價的內(nèi)涵
智能時代技術(shù)為教育評價變革提供了支撐引領(lǐng),智能技術(shù)賦能教育評價正走向教育評價改革的主戰(zhàn)場,但目前業(yè)界對智能技術(shù)賦能教育評價的內(nèi)涵并沒有清晰的界定。有學者從技術(shù)視角提出如何賦能教育評價,Zhang Qingchen等人指出,在智能化教育評價中通過傳感器網(wǎng)絡(luò)和通信技術(shù)等實現(xiàn)大數(shù)據(jù)的收集.通過深度學習解決在圖像分析和語音識別等方面的問題[12]。Wiley和Hastings等人指出可通過機器學習和自然語言理解技術(shù)評價學生的想法和概念的運用,評價結(jié)果具有較高的準確度[13]。也有學者從技術(shù)驅(qū)動教育評價手段變革的視角給出解釋:通過利用技術(shù)的手段和方法,系統(tǒng)、科學、全面地采集、處理、分析各類教育數(shù)據(jù),對教育活動做出客觀判斷的過程,實現(xiàn)了從經(jīng)驗主義走向數(shù)據(jù)主義,從模糊走向精準[14];利用技術(shù)手段,有效采集和整合學生的各項數(shù)據(jù),將教師評價、自我評價等多種評價數(shù)據(jù)融合,從而對學生進行多維、全面、深入的評價,將碎片化評價轉(zhuǎn)化為系統(tǒng)化評價[15]。還有學者從傳統(tǒng)教育評價向技術(shù)驅(qū)動教育評價觀念轉(zhuǎn)變的視角給出解釋:技術(shù)使教育評價從“關(guān)注結(jié)果”轉(zhuǎn)為“關(guān)注過程”,從“單一的考試評價”轉(zhuǎn)為“多維度的綜合素質(zhì)評價”[16];以技術(shù)為支撐的教育評價將“傳統(tǒng)教育評價”轉(zhuǎn)變?yōu)椤爸悄芑慕逃u價”,從而真正走向“智慧評價”[17]。
綜合國內(nèi)外學者對智能技術(shù)運用于教育評價的理解,可以看到智能技術(shù)賦能教育評價將是未來發(fā)展的必然趨勢。根據(jù)以上分析,可以認為“智能技術(shù)賦能教育評價”是在走向智能時代背景下,充分利用人工智能、大數(shù)據(jù)等智能技術(shù)的優(yōu)勢,對傳統(tǒng)教育評價進行革新與發(fā)展,改進教育評價過程與方法,提升教育評價的數(shù)字化、智能化水平,實現(xiàn)科學、客觀和高效的評價與反饋,促進教育事業(yè)的改革與發(fā)展。
智能技術(shù)賦能教育評價本質(zhì)是對傳統(tǒng)教育評價的突破和創(chuàng)新,通過解構(gòu)、重構(gòu)形成新的有別于傳統(tǒng)的教育評價新模式。而其實施的關(guān)鍵在于用智能技術(shù)助力教育評價數(shù)據(jù)的采集、處理、分析和運用,實現(xiàn)教育評價的數(shù)據(jù)化、智能化,由此而引發(fā)教育評價形態(tài)的變革。具體來說,充分利用人工智能、大數(shù)據(jù)、云計算、區(qū)塊鏈等先進技術(shù),實現(xiàn)對全過程、全方位教育評價數(shù)據(jù)的采集,進行深度挖掘分析和反饋應(yīng)用,對教育教學過程、結(jié)果進行多元綜合評價,為教育教學改進提供全面、有效的決策依據(jù),實現(xiàn)了教育評價的現(xiàn)代化、專業(yè)化,同時由于智能化評價工具和手段的應(yīng)用,教育評價過程也更加智能、高效。
三、智能技術(shù)賦能教育評價的主要特征
(一)評價模型科學化
科學的評價模型是教育評價的核心。借助智能技術(shù)手段,通過教育評價人員、信息技術(shù)專業(yè)人員、教育教學人員等協(xié)作,針對不同評價對象和評價內(nèi)容構(gòu)建科學的指標體系、指標權(quán)重、評價模型。評價指標的設(shè)計是評價模型構(gòu)建的前提條件,是保證評價模型科學化的重要支撐,指標構(gòu)建方法有質(zhì)化方法、量化方法和復(fù)合性方法等,其中指標權(quán)重設(shè)計的合理性既能夠反映出決策的主觀價值,又可以獲得客觀準確的測量結(jié)果。通過計算機軟件系統(tǒng)、人工智能中的推理技術(shù)等構(gòu)建評價模型,實現(xiàn)模擬評價,具體方法有專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)、機器學習等。
(二)主體參與多元化
參與評價的主體由教師、家長、同伴、自我、評價專家等共同參與,形成“評價共同體”,使評價過程呈現(xiàn)民主化和人性化,評價結(jié)果也更具有真實性和可靠性。教師參與能夠給出更加具有專業(yè)性、實效性的評價信息;家長參與使評價結(jié)果不僅聚焦于在校情況,還包含家庭表現(xiàn)情況,使評價結(jié)果更加全面;同伴參與可有效調(diào)動學習者的積極性,加強溝通交流;自我評價使被評價者的主體地位得到充分發(fā)揮,有效提升參與意識,主動反思發(fā)現(xiàn)自身的不足;評價專家為評價對象提供更精準、客觀、全面的評價結(jié)果。
(三)數(shù)據(jù)獲取立體化
通過物聯(lián)感知技術(shù)、可穿戴設(shè)備技術(shù)、視頻監(jiān)控技術(shù)、網(wǎng)評網(wǎng)閱技術(shù)等對評價數(shù)據(jù)進行全過程、全方位、多維度的采集,改變過去人工采集記錄的方式,實現(xiàn)評價數(shù)據(jù)立體化獲取。全過程是指依托數(shù)據(jù)采集平臺和設(shè)備自動記錄評價對象在整個活動中產(chǎn)生的各項數(shù)據(jù),由過去的“間斷性記錄”轉(zhuǎn)變?yōu)椤叭^程記錄”;全方位強調(diào)數(shù)據(jù)的獲取打破時空界限,不僅局限于傳統(tǒng)教室,還包含線上學習數(shù)據(jù)的獲取、戶外教學活動數(shù)據(jù)的獲取等;多維度是指采集的數(shù)據(jù)種類會更多樣、更全面,包括行為數(shù)據(jù)、情感數(shù)據(jù)、體質(zhì)數(shù)據(jù)、管理數(shù)據(jù)等。
(四)診斷分析最優(yōu)化
通過采用數(shù)據(jù)融合、數(shù)據(jù)分析等技術(shù),對多模態(tài)數(shù)據(jù)進行診斷分析,實現(xiàn)了多維、全局數(shù)據(jù)處理和分析的最優(yōu)化,從而達成精準評估和測評。例如,在海量的多模態(tài)數(shù)據(jù)挖掘中,基于不同模態(tài)數(shù)據(jù)融合,可通過模態(tài)數(shù)據(jù)間的互補學習提取出復(fù)雜數(shù)據(jù)中的有效特征,從而提升了決策結(jié)果的準確性;使用機器學習等算法對不同種類的數(shù)據(jù)進行分析,包括文本分析、語音分析、圖像分析、視頻分析等,可準確表征評價對象的特征要素。
(五)評價反饋精準化
評價反饋是實現(xiàn)教育評價的應(yīng)用價值體現(xiàn),也是評價的重要組成部分。通過高度個性化定制、智能推薦引擎等技術(shù),將評價結(jié)果以交互式可視化的形式及時精準地推送給用戶,有效提升評價對象對自我的認知,使評價對象即時調(diào)整學習策略、教學目標等,進而有效地促進管理、教學、學習等。評價反饋貫穿整個教育活動的始終,有過程性的即時反饋,如課前的預(yù)習測評與反饋、課堂的實時檢測反饋等,能夠精準反饋評價結(jié)果即時調(diào)整學習策略;有根據(jù)評價結(jié)果精準推送教學和學習資源等,實現(xiàn)教師精準的教和學生個性化的學。
四、助力教育評價的智能技術(shù)及應(yīng)用框架
智能技術(shù)賦能教育評價不同于傳統(tǒng)的教育評價,它需要利用智能技術(shù)構(gòu)建一個多層次、多用戶、立體開放的教育評價生態(tài)體系。推進智能技術(shù)賦能教育評價的建設(shè)與應(yīng)用,需要從整體上把握智能技術(shù)背景下技術(shù)、業(yè)務(wù)、應(yīng)用和用戶間的關(guān)系以及對評價產(chǎn)生的影響。因此,借助信息化頂層設(shè)計的方法論,在筆者團隊提出的智能教育關(guān)鍵技術(shù)平臺參考框架的基礎(chǔ)上[18],結(jié)合智能技術(shù)賦能教育評價活動的實現(xiàn)過程,可以提出和構(gòu)建助力教育評價的智能技術(shù)及應(yīng)用總體框架,如圖1所示。
助力教育評價的智能技術(shù)及應(yīng)用由“5+1”的總體框架構(gòu)成,形成了科學化、多元化、立體化、最優(yōu)化、精準化的智能教育評價生態(tài)體系,具體包括基礎(chǔ)層、技術(shù)層、業(yè)務(wù)層、應(yīng)用層、用戶層5個層次結(jié)構(gòu)和1個保障體系。
(一)基礎(chǔ)層:技術(shù)賦能教育評價的基礎(chǔ)支撐
基礎(chǔ)層由硬件設(shè)施、計算框架、存儲設(shè)施等構(gòu)成,為智能技術(shù)賦能教育評價提供了必備的基礎(chǔ)設(shè)施條件,是智能化教育評價體系的基礎(chǔ)保證。(1)硬件設(shè)施為整個教育評價過程提供硬件支撐環(huán)境,在數(shù)據(jù)采集中提供智能傳感器、智能穿戴設(shè)備等;在數(shù)據(jù)處理和分析中提供智能芯片、計算集群等;在評價結(jié)果反饋中提供具有交互功能的智能終端設(shè)備,如智能手機、智能PC等。(2)計算框架為系統(tǒng)提供統(tǒng)一的計算服務(wù)、統(tǒng)一的機器特征提取和算法模型建模服務(wù),具體包含分布式計算、機器學習等。(3)存儲設(shè)施為整個評價過程提供統(tǒng)一的數(shù)據(jù)存儲、讀寫和管理等數(shù)據(jù)服務(wù),保障數(shù)據(jù)的安全等,具體有關(guān)系數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫、分布式文件系統(tǒng)等。
(二)技術(shù)層:實現(xiàn)技術(shù)賦能教育評價的核心
技術(shù)層是實現(xiàn)智能技術(shù)賦能教育評價的核心,通過利用各種智能技術(shù)實現(xiàn)數(shù)據(jù)的智能化采集、加工分析和可視化輸出等。(1)在數(shù)據(jù)獲取中,通過語音識別、圖像識別、日志抽取、數(shù)據(jù)庫ETL等技術(shù),解決“聽、說、看”等感知層面信息的轉(zhuǎn)化,實現(xiàn)對原始數(shù)據(jù)源中數(shù)據(jù)的抽取。(2)在信息加工與知識構(gòu)建中,通過自然語言處理、知識表示、數(shù)據(jù)分析、數(shù)據(jù)挖掘等技術(shù)實現(xiàn)對獲取數(shù)據(jù)的統(tǒng)一處理和分析,挖掘數(shù)據(jù)潛在規(guī)律和價值。(3)在智能輸出中,通過語音交互、體感交互、數(shù)據(jù)可視化等技術(shù),將結(jié)果以可視化的形式反饋給用戶。
(三)平臺層:技術(shù)賦能教育評價的關(guān)鍵支撐
平臺層是智能技術(shù)與教育評價深度融合的關(guān)鍵,其技術(shù)支撐體現(xiàn)在智能化教育評價系統(tǒng)的開發(fā)與運用,主要是通過人工智能、大數(shù)據(jù)等技術(shù)構(gòu)建智能化的評價系統(tǒng),為各類應(yīng)用提供支撐平臺。主要包括四類服務(wù):(1)評價指標設(shè)計的設(shè)置是整個教育評價體系的關(guān)鍵,具有系統(tǒng)性、獨立性、目標性等多重特點,提供質(zhì)量標準管理、指標庫管理、指標權(quán)重設(shè)計等服務(wù)。(2)評價數(shù)據(jù)獲取主要是有效獲取整個活動的各項數(shù)據(jù),是數(shù)據(jù)處理分析的基礎(chǔ),具體方法有考試評測、問卷調(diào)查、過程實錄等。(3)評價數(shù)據(jù)處理包含了對評價數(shù)據(jù)的清理、分析、挖掘等,能夠有效處理缺失、錯誤、重復(fù)的數(shù)據(jù),利用統(tǒng)計分析方法進行數(shù)據(jù)分析,用機器學習算法和計算機編程等實現(xiàn)數(shù)據(jù)的深度挖掘。(4)評價反饋是通過多種形式將評價結(jié)果反饋給不同用戶,是有效教與學發(fā)生的必備條件,根據(jù)評價反饋結(jié)果個性化推送相關(guān)資源,有效促進教與學等活動。
(四)應(yīng)用層:技術(shù)賦能教育評價的價值體現(xiàn)
智能化教育評價支持系統(tǒng)的應(yīng)用是各類教育評價場景應(yīng)用智能技術(shù)的體現(xiàn),為區(qū)域、學校、教師、學生等提供結(jié)果評價、過程評價、增值評價、綜合評價。結(jié)果評價:利用智能技術(shù)優(yōu)化智能閱卷與評測、智能考試分析等,注重對教學結(jié)果、學習成績或成就等進行評定;過程評價:基于智能技術(shù)進行伴隨式采集數(shù)據(jù),對管理、教學、學習等行為進行密切跟蹤,通過多模態(tài)診斷分析發(fā)現(xiàn)過程中存在的問題,即時反饋與調(diào)控;增值評價:有效促進教育的可持續(xù)發(fā)展,從發(fā)展性角度關(guān)注學生的學習進步程度、教師的教學進步程度、學校發(fā)展程度等;綜合評價:利用智能技術(shù)實現(xiàn)綜合評價模型的構(gòu)建與優(yōu)化、數(shù)據(jù)的深度挖掘分析等,實現(xiàn)對區(qū)域的教育質(zhì)量綜合評價、學生的綜合素質(zhì)評價等。
(五)用戶層:技術(shù)賦能教育評價的目的歸宿
用戶層是用智能技術(shù)賦能教育評價,以實現(xiàn)評價的目的,是教育評價的歸宿所在。具體來說,政府、學校、教師、學生、家長等用戶通過智能終端設(shè)備實現(xiàn)一站式登錄智能化教育評價系統(tǒng),為不同用戶提供不同的評價反饋,其評價反饋結(jié)果對用戶具有導(dǎo)向、診斷、鑒定、調(diào)控、改進等功能。對政府而言可宏觀了解區(qū)域教育發(fā)展情況,有助于促進區(qū)域教育優(yōu)質(zhì)均衡發(fā)展;對學校而言可有助于鑒定學校水平、評定學校優(yōu)劣、促進學校發(fā)展等;對教師而言可以整體了解教學情況,進一步提高教師教學水平;對學生而言有助于促進學生的全面發(fā)展;對家長而言有助于即時了解學校的發(fā)展狀況、學生的在校表現(xiàn)等。
(六)保障體系:技術(shù)賦能教育評價的重要保證
保障層是智能技術(shù)賦能教育評價有序?qū)嵤┑闹匾WC,使整個教育評價生態(tài)體系有效運轉(zhuǎn),包括政策制度、標準規(guī)范、運維管理、信息安全等保障。(1)以政策制度作為教育評價發(fā)展的根本導(dǎo)向,從建設(shè)內(nèi)容、建設(shè)舉措等方面制定支持教育評價的相關(guān)政策,并加強各地的督導(dǎo)落實。(2)建設(shè)工作要遵循技術(shù)標準規(guī)范,充分了解智能技術(shù)及其在教育評價中應(yīng)用的特點,制定智能技術(shù)賦能教育評價的技術(shù)標準規(guī)范,包括管理規(guī)范、質(zhì)量標準、技術(shù)標準等方面。(3)構(gòu)建政府、學校、企業(yè)等多方協(xié)同的運維管理保障工作機制,為智能化教育評價支持系統(tǒng)提供技術(shù)支撐與服務(wù)保障,確保系統(tǒng)正常運行。(4)建立智能化教育評價的安全保障制度,明確信息安全責任主體,構(gòu)建相關(guān)應(yīng)急處置機制。
五、智能技術(shù)賦能教育評價的主要途徑
《深化新時代教育評價改革總體方案》(下稱《總體方案》)明確提出“堅持科學有效,改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價,充分利用信息技術(shù),提高教育評價的科學性、專業(yè)性、客觀性”?!八膫€評價”各有特點和優(yōu)勢,也不同程度存在著有待改進的方面,亟需采用新的技術(shù)手段加以改革創(chuàng)新。智能時代用技術(shù)賦能教育評價,促進評價改革創(chuàng)新的主要途徑表現(xiàn)在智能技術(shù)賦能的結(jié)果評價、過程評價、增值評價和綜合評價等方面,如圖2所示。
(一)智能技術(shù)賦能結(jié)果評價
結(jié)果評價通常是在教育活動完成后對最終結(jié)果做出價值判斷,即結(jié)果與目標的一致程度的評價。結(jié)果評價具有目標性、規(guī)范性、客觀性和易操作性等特點。當前我國的結(jié)果評價主要應(yīng)用于教育考試,在科學命題、閱卷方式、測評方式上等方面還存在問題,亟待通過技術(shù)手段進一步優(yōu)化。通過智能技術(shù)賦能結(jié)果評價,將在命題與組卷、考場管理、組卷與評測、考試分析等方面推進評價工作的信息化和智能化水平提升,探索結(jié)果評價由“量”的評價向“質(zhì)”的評價轉(zhuǎn)變,實現(xiàn)智能化考評[19]。
智能技術(shù)賦能結(jié)果評價的主要應(yīng)用場景包括以下方面:一是智能命題與組卷。智能技術(shù)在題庫建設(shè)中的關(guān)鍵運用體現(xiàn)在試題難度預(yù)測方面,教師可以通過深度學習和人工特征兩種方案對試題難度進行預(yù)測?;陬}庫標注、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、試卷結(jié)構(gòu)生成、OCR文字識別、圖像定位和自然語言處理等技術(shù),依據(jù)教學需求檢索出需要的題目自動生成試卷,實現(xiàn)快速、高效的智能化組卷。二是智能考場管理?;谌斯ぶ悄芗夹g(shù)開發(fā)智能化的網(wǎng)絡(luò)電子巡查系統(tǒng)、考生身份驗證系統(tǒng)、作弊防控系統(tǒng)等。比如通過在考場安裝高清攝像頭,利用圖像識別技術(shù)、云技術(shù)、情感識別技術(shù),對考場的動態(tài)視頻數(shù)據(jù)進行實時監(jiān)測和智能識別,自動分析考生的行為狀態(tài),及時識別考場的異常行為,實現(xiàn)考試過程中的智能監(jiān)考。三是智能閱卷與評測。利用手寫識別、圖像識別、自然語言理解等技術(shù),對選擇題、填空題和是否判斷題等客觀題進行智能化閱卷;通過自動分析及訓(xùn)練構(gòu)建分數(shù)預(yù)測模型對中英文作文、翻譯、作答等主觀題進行智能評分;利用多媒體、AR/VR等技術(shù),構(gòu)建人機交互、模擬操作、場景再現(xiàn)的智能化考試環(huán)境,有效實現(xiàn)英語聽說、音樂、美術(shù)等方面的自動化考試。四是智能考試分析。利用數(shù)據(jù)挖掘、學習分析、數(shù)據(jù)預(yù)測模型等技術(shù),對試卷的命制質(zhì)量、教師教學質(zhì)量、試卷講評等提供客觀有“證據(jù)”的數(shù)據(jù)分析,為改進教與學提供強大的量化支持。
(二)智能技術(shù)賦能過程評價
過程評價是對教師的教學過程和學生的學習過程作出即時的評判,聚焦于關(guān)注學生成長過程,注重學習者習得過程的評估與測量,從而實現(xiàn)以評促學、以評促教。過程評價具有全過程、診斷性和即時性等特點。傳統(tǒng)的過程評價存在諸多問題,如缺乏客觀性、整體性,難以量化、不易操作等。在智能技術(shù)的賦能下過程評價發(fā)生了諸多改變,數(shù)據(jù)獲取實現(xiàn)了從小規(guī)模的簡單間斷性數(shù)據(jù)向大規(guī)模的復(fù)雜連續(xù)性數(shù)據(jù)轉(zhuǎn)變,數(shù)據(jù)分析實現(xiàn)了從數(shù)據(jù)結(jié)果的粗線條分析向多模態(tài)診斷分析轉(zhuǎn)變,數(shù)據(jù)反饋實現(xiàn)了由單一文本的事后反饋向融合文本、語音、圖片等多種方式的交互式實時反饋轉(zhuǎn)變。
智能技術(shù)賦能過程評價的應(yīng)用場景主要包括:一是全過程伴隨式數(shù)據(jù)采集。依托可穿戴設(shè)備、傳感器、視頻錄制技術(shù)、非接觸式感知技術(shù)等數(shù)據(jù)采集工具,實現(xiàn)全過程數(shù)據(jù)的實時采集和及時生成,通過智能技術(shù)采集的數(shù)據(jù)更加具有動態(tài)性、真實性、連續(xù)性。二是多模態(tài)數(shù)據(jù)診斷分析。用數(shù)據(jù)挖掘算法、內(nèi)容分析、預(yù)測性分析、系統(tǒng)建模等技術(shù)對行為數(shù)據(jù)、學習體征數(shù)據(jù)、學習資源數(shù)據(jù)、人機交互數(shù)據(jù)等進行多模態(tài)診斷分析,數(shù)據(jù)分析實現(xiàn)了從“不可量化”到“可量化”、從“碎片”到“集約”的轉(zhuǎn)變,通過智能技術(shù)分析的數(shù)據(jù)更加具有客觀性、準確性。三是實時反饋與調(diào)控。分析結(jié)果以可視化的形式即時反饋給管理者、教師、學生等不同對象,根據(jù)評價結(jié)果調(diào)控和改進管理、教學、學習等進程,評價結(jié)果涉及多個維度,如對學生的評價有學習動機態(tài)度、過程和效果等方面的反饋,通過數(shù)據(jù)可視化方法反饋數(shù)據(jù)更具有即時性、全面性。
(三)智能技術(shù)賦能增值評價
增值評價是以學生進步幅度來衡量學校努力程度的一種新型評價方式,重視學生的學習起點,關(guān)注學習過程,依據(jù)一段時間內(nèi)學生的學業(yè)水平、綜合能力和素質(zhì)等方面的表現(xiàn),開展縱向比較,引導(dǎo)學生專注于自身的綜合表現(xiàn),并獲得學校對學生的“凈增值”。增值評價具有成長性、階段性和激勵性等特點。近年來我國的增值評價研究取得了一定的進展,但是在研究內(nèi)容、數(shù)據(jù)采集、增值模型構(gòu)建等方面等依然存在著問題。在智能技術(shù)賦能下進行學習評價,能夠更加精準、全面地獲得增值評價的數(shù)據(jù),更加精確地剔除學生自身和家庭、教師和學校等因素對學生成績的影響,更加客觀地獲取到學生學業(yè)水平的“凈增長”,也能夠更加公正地對學生、教師和學校等進行評價,提升增值評價的科學性、客觀性、有效性。
智能技術(shù)賦能增值評價主要應(yīng)用場景包括如下:一是追蹤數(shù)據(jù)庫鏈接與整合。在進行增值評價時,建立大規(guī)模的追蹤數(shù)據(jù)庫是實施增值評價的前提條件。利用智能采集技術(shù)獲取學生學業(yè)水平成績、品德、學習能力、藝術(shù)審美等縱向數(shù)據(jù);利用數(shù)據(jù)庫鏈接技術(shù)實現(xiàn)學生數(shù)據(jù)庫與學生、教師、學校等數(shù)據(jù)庫之間的鏈接,達到數(shù)據(jù)之間的有效整合[20];通過SQL Server事件探查器的跟蹤技術(shù)對數(shù)據(jù)進行跟蹤,并在追蹤數(shù)據(jù)庫逐漸龐大時,利用智能技術(shù)完成對數(shù)據(jù)庫的維護。二是增值評價模型的構(gòu)建。開展增值評價,需要利用增值評價模型對收集的數(shù)據(jù)進行處理和分析,常用的主要有增分模型、成長達標模型、分類模型、殘差模型、回歸模型、學生成長百分等級模型、田納西增值評估系統(tǒng)7種[21]。目前尚不存在適用于所有數(shù)據(jù)的模型,需要利用人工智能技術(shù)、借助統(tǒng)計分析手段和算法構(gòu)建出能對學生進行全面、綜合性評價的增值模型。三是發(fā)展水平可視化報告。增值評價主要關(guān)注學生的縱向發(fā)展水平,通過可視化技術(shù)能夠?qū)W生的學業(yè)情況、個人發(fā)展指數(shù)等信息直觀形象、簡單易懂、全面清晰的呈現(xiàn)出來,便于學生、家長和教師等查看和理解。
(四)智能技術(shù)賦能綜合評價
綜合評價是從全面、多維的角度對教育活動作出系統(tǒng)的價值判斷,其重點在于對評價對象進行分析的基礎(chǔ)上,把多方面的評價結(jié)果整合起來,形成對評價對象清晰準確的總體認識。綜合評價具有系統(tǒng)性、多元性、復(fù)雜性和全面性等特點。綜合評價正在成為教育評價的趨勢和導(dǎo)向,但也存在標準難以客觀量化、數(shù)據(jù)復(fù)雜性增強、客觀公正不足等問題,亟需通過智能技術(shù)助力解決這些問題。楊宗凱認為,要推進多種主體評價等甚至是機器評價的融合發(fā)展,采用基于智能技術(shù)的不同方法進行綜合評價[22]。人工智能、大數(shù)據(jù)等作為健全綜合評價的關(guān)鍵技術(shù)支撐,在評價模型構(gòu)建、全域評價數(shù)據(jù)采集、數(shù)據(jù)深度挖掘分析、數(shù)字畫像等方面極大地提高操作效率、評價效果和評價效能。
智能技術(shù)賦能綜合評價應(yīng)用場景主要包括以下方面:一是通過層次分析法、專家系統(tǒng)、機器學習、人工神經(jīng)網(wǎng)絡(luò)等算法,在對數(shù)據(jù)的有效分析中提取評價規(guī)則,實現(xiàn)綜合評價模型的科學構(gòu)建與不斷優(yōu)化,有效解決綜合評價標準科學量化的問題。二是基于大數(shù)據(jù)和區(qū)塊鏈等智能技術(shù)建立統(tǒng)一的數(shù)據(jù)平臺,通過各類采集終端對評價對象進行全方位、全過程、全納、全員和非干預(yù)的自然狀態(tài)采集,匯聚全樣本、混雜、海量的數(shù)據(jù),解決綜合評價中信息量小、失真和結(jié)構(gòu)缺失的問題[23]。三是利用數(shù)據(jù)挖掘和學習分析技術(shù),充分挖掘評價對象的特征和關(guān)系,全面分析評價對象的綜合發(fā)展狀態(tài),深刻揭示評價結(jié)果的共性與個性,精準預(yù)測評價對象的發(fā)展?jié)摿εc未來趨勢。四是基于大數(shù)據(jù)分析技術(shù)和深度學習等算法,將最終的綜合評價結(jié)果進行可視化呈現(xiàn),生成個體或群體數(shù)字畫像,能夠讓學生、教師及教育管理者清晰直觀、形象生動地理解運用及分享綜合評價結(jié)果。
六、智能技術(shù)賦能教育評價的推進策略
智能技術(shù)賦能教育評價是一項復(fù)雜的系統(tǒng)性、整體性、協(xié)同性工程,應(yīng)以《總體方案》為依據(jù),以人工智能、大數(shù)據(jù)等技術(shù)為依托,圍繞服務(wù)各級各類教育主體,聚焦關(guān)鍵環(huán)節(jié),采取理念引領(lǐng)、標準規(guī)范、主體關(guān)照、數(shù)據(jù)驅(qū)動、專業(yè)支持等實施策略(如圖3所示),科學謀劃、整體推進、分類實施。
(一)理念引領(lǐng):樹立新時代教育評價觀
推進智能技術(shù)賦能教育評價,首要問題就是轉(zhuǎn)變思想理念,樹立新時代教育評價觀,扭轉(zhuǎn)不科學的教育評價導(dǎo)向。一是堅持立德樹人,樹立生態(tài)性評價發(fā)展觀。教育評價的最終目標是保障和促進學生的全面發(fā)展和教育質(zhì)量的全面提升,在實踐中引導(dǎo)各類主體形成正確的政績觀、育人觀和質(zhì)量觀,適應(yīng)新時代教育發(fā)展的生態(tài)性要求。二是落實“四個評價”,樹立科學性評價體系觀。堅持以破“五唯”為導(dǎo)向,針對不同主體和不同學段、不同類型教育特點,通過立體、多元的評價方式,結(jié)果評價、過程評價、增值評價和綜合評價相結(jié)合,形成科學的教育評價體系。三是聚焦智能轉(zhuǎn)型,樹立創(chuàng)新性評價技術(shù)觀。人工智能、大數(shù)據(jù)等智能技術(shù)可以賦能教育評價的各個環(huán)節(jié),形成基于數(shù)據(jù)的客觀性思維、動態(tài)變化的持續(xù)性思維和價值呈現(xiàn)的發(fā)展性思維等創(chuàng)新性技術(shù)思維,樹立教育評價實現(xiàn)智能化轉(zhuǎn)型。
(二)標準規(guī)范:構(gòu)建評價規(guī)范與技術(shù)標準
評價規(guī)范與技術(shù)標準是科學實施教育評價的前提,通過建立管理規(guī)范、質(zhì)量標準、技術(shù)標準“三位一體標準規(guī)范”,保障教育評價的專業(yè)、穩(wěn)定、可持續(xù)發(fā)展。(1)管理規(guī)范是從頂層設(shè)計視角制定系列配套政策和制度,統(tǒng)籌規(guī)劃教育評價改革。如制訂實施方案、行動計劃、實施指南等文件,明確目標任務(wù)、推進策略和T作機制,統(tǒng)籌實施教育評價的進度和具體安排。(2)質(zhì)量標準是在貫徹國家及教育部相關(guān)標準文件要求基礎(chǔ)上,結(jié)合區(qū)域?qū)嶋H構(gòu)建教育質(zhì)量評價指標體系,是對“評價什么”的具體描述和說明,也是評價工具的研發(fā)依據(jù)。《教育部2021年工作要點》明確指出要推動出臺中學生綜合素質(zhì)評價實施指南、義務(wù)教育質(zhì)量評價指南、普通高中辦學質(zhì)量評價指南等,為區(qū)域?qū)嵺`中教育質(zhì)量標準的制訂提供了指導(dǎo)和具體參考。(3)技術(shù)標準是推動智能技術(shù)賦能教育評價的重要技術(shù)準則,教育評價系統(tǒng)或平臺可通過遵循國家技術(shù)標準、借鑒國際技術(shù)標準和制訂地方技術(shù)標準三種形式構(gòu)建教育評價技術(shù)標準體系[24]。
(三)主體關(guān)照:分層設(shè)計多元評價主體參與
教育評價主體涉及黨委和政府、學校、教師、學生和社會等多種類型,各個主體處于縱向教育系統(tǒng)的不同層級之中,每個層級主體的權(quán)益不同,因而要分層設(shè)計,全面關(guān)照每個主體,保證被評價者在評價過程中有充分的參與權(quán)、選擇權(quán)、解釋權(quán),以體現(xiàn)教育評價的平等性和公正性。一方面,從評價主體權(quán)的利益訴求來看,可根據(jù)主體職責分工進行分層設(shè)計和管理主體權(quán)限賦予,確保各個主體按照各自的評價任務(wù)與責任深度參與評價過程,充分保障主體評價權(quán),從而促進評價目標的有效達成。另一方面,從教育評價主體的多元化來看,要培育平等、公正、包容的評價文化,保障被評價者能參與評價標準的構(gòu)建,并推進第三方評價、利益相關(guān)者評價和社會評價,使不同主體獲得歸屬感和認同感,從而實現(xiàn)教育評價的教育性和發(fā)展性價值,促進教育評價生態(tài)優(yōu)化。
(四)數(shù)據(jù)驅(qū)動:統(tǒng)籌評價中的教育數(shù)據(jù)挖掘
數(shù)據(jù)是教育評價實踐中最重要的“資源”,數(shù)據(jù)驅(qū)動教育評價是當前智能技術(shù)賦能教育評價的核心應(yīng)用模式。通過數(shù)據(jù)挖掘找準規(guī)律、發(fā)現(xiàn)問題和預(yù)測趨勢,從而提高教育評價的應(yīng)用效能和服務(wù)水平。(1)從整體視角規(guī)劃設(shè)計評價數(shù)據(jù)的采集、存儲、分析挖掘和應(yīng)用。包括統(tǒng)籌數(shù)據(jù)采集流程,做好數(shù)據(jù)選擇、數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換等數(shù)據(jù)處理;完善數(shù)據(jù)驗證,保證數(shù)據(jù)的一致性和相關(guān)性,以便從整體和宏觀上能夠發(fā)現(xiàn)教育本質(zhì)特征和潛在規(guī)律。(2)以內(nèi)在價值為導(dǎo)向加強數(shù)據(jù)挖掘的有效性。面向?qū)W習者,要以促進個性化學習為導(dǎo)向,通過對學習過程數(shù)據(jù)的深度挖掘,為學習者提供個性化學習建議。面向教師,要以差異化教學為導(dǎo)向進行學習者數(shù)據(jù)挖掘分析,支持教師及時診斷學習者學習情況。面向管理者,要提高管理效率和質(zhì)量為導(dǎo)向進行問題發(fā)現(xiàn)和趨勢預(yù)測分析,以幫助管理者合理配置資源和優(yōu)化教育決策。(3)提升評價數(shù)據(jù)的應(yīng)用價值。要提高數(shù)據(jù)挖掘分析的易用性,重視和加強數(shù)據(jù)的可視化,讓各類主體深度參與,強化大數(shù)據(jù)技術(shù)與教育評價深度融合的機制與能力,綜合發(fā)揮智能化教育評價的導(dǎo)向、鑒定、診斷、調(diào)控和改進作用。
(五)專業(yè)支持:打造專業(yè)化教育評價隊伍
專業(yè)化的評價需要專業(yè)化的評價隊伍,面對智能時代的挑戰(zhàn),亟需培養(yǎng)一支精通教育評價業(yè)務(wù)且具備智能素養(yǎng)的專業(yè)化教育評價隊伍。一方面,要大力提升教育評價相關(guān)人員專業(yè)能力。加強教育評價各個主體智能素養(yǎng)培養(yǎng),通過開展人工智能、大數(shù)據(jù)等智能技術(shù)的培訓(xùn)和實踐應(yīng)用,提升信息素養(yǎng)和智能技術(shù)應(yīng)用能力。加強一線校長、學科教師等主體的教育測量、教育評價等專業(yè)知識培訓(xùn),提升實施教育教學評價的能力。同時,加強與國內(nèi)外各種教育評價專業(yè)機構(gòu)的交流與合作,及時跟蹤教育評價的發(fā)展動態(tài)和技術(shù)革新。另一方面,整合多領(lǐng)域?qū)<伊α孔龊萌瞬艃??!犊傮w方案》明確提出支持有條件的高校設(shè)立教育評價、教育測量等相關(guān)學科專業(yè),培養(yǎng)教育評價專門人才。在教育評價實踐中,需要學科教學、心理學、統(tǒng)計學、計算機、教育測量、教育管理等領(lǐng)域的專家共同協(xié)作,各領(lǐng)域?qū)<野l(fā)揮各自的優(yōu)勢和特長,從而推進教育評價的創(chuàng)新研究[25]。同時要充分發(fā)揮心理學、統(tǒng)計學、計算機等基礎(chǔ)學科的力量培養(yǎng)教育評價、教育測量專門人才,增強其跨領(lǐng)域綜合應(yīng)用和協(xié)同創(chuàng)新能力,促進智能技術(shù)賦能的教育評價不斷改革創(chuàng)新,構(gòu)建智能化教育評價新體系。
參考文獻:
[1]楊勇.智能化綜合評價理論與方法研究[D]杭州:浙江工商大學.2014.
[2]張殿尉.智能化教育評價領(lǐng)域演進路徑、研究熱點與前沿的可視化分析[J].業(yè)技術(shù)與職業(yè)教育,2020,18(1):110-114.
[3] U.S.DEPARTMENT OF EDUCATION.The U.S.Department ofeducation.National Education Technology Plan 1996[EB/OL].https://files.eric.ed.gov/fulltext/ED3 98 899.pdf,2021 -02-19.
[4] U.S.DEPARTMENT OF EDUCATlON.The U.S.Department ofeducation.National Education Technology Plan 2000 [EB/OL].https://files.eric.ed.gov/fulltext/ED444604.pdf.2021 -02-19.
[5] U.S.DEPARTMENT OF EDUCATION.The U.S.Department ofeducation.National Education Technology Plan 2004 [EB/OLl.https://files.eric.ed.gov/fulltext/ED484046.pdf,2021 -02-19.
[6] U.S.DEPARTMENT OF EDUCATI()N.The U.S.Department ofeduclation.National Education Technology Plan 2010 [EB/OL].https://files.eric.ed.gov/fulltext/ED5 12681 .pdf,2021 -02-19.
[7] U.S.DEPARTMENT OF EDUCATION.The U.S.Department ofeducation.National Education Technology Plan 2016[EB/OL].https://tech.ed.gow/files/2015/1 2/NETP16.pdf,2021 -02-19.
[8] U.S.DEPARTMENT OF EDUCATlON.The U.S.Department ofeducation.National Education Technology Plan 2017 [EB/OL].https://tech.ed.gow/files/2017/0 l/NETP17.pdf.2021 -02-19.
[9]劉邦奇,吳曉如.中國智能教育發(fā)展報告[M].北京:人民教育出版社.2020. 19-21.
[10]楊現(xiàn)民,田雪松.互聯(lián)網(wǎng)+教育:中國基礎(chǔ)教育大數(shù)據(jù)[M].北京:電子工業(yè)出版社,2016.147.
[11]董奇,趙廣立.科技賦能教育評價改革時機已至[N].中國科學報,2021-01-12(07)
[12] Zhang Qingchen,Yang Laurence T.et al.A survey on deep learningfor big data [J].Inform Fusion,2018.(42):146-157.
[13] Wiley J,Hastings P,et al.Different approaches to assessing thequality of explanations following a multiple-dorument inquiryactivitv in science [J].International Journal of Artificial Intelligence inEducation.2017.27(4):758-790.
[14]楊現(xiàn)民,顧佳妮等.“互聯(lián)網(wǎng)+”時代數(shù)據(jù)驅(qū)動的教育評價體系構(gòu)架與實踐進展[J]浙江師范大學學報(社會科學版),2019.44(4):16-26.
[15]鄭燕林,柳海民.大數(shù)據(jù)在美國教育評價中的應(yīng)用路徑分析[J].中國電化教育,2015,(7):25-31.
[16]曹培杰.以新思維新技術(shù)破解教育評價痛點[EB/OL].https://epapergmw.cn/gmrh/html/201 9-12/10/nw.D IIOOgnrh_2019 121 0_4-13.htm,2021 -02- 05.
[17]朱成晨,同廣芬.現(xiàn)代化與專業(yè)化:大數(shù)據(jù)時代教育評價的新技術(shù)推進邏輯[J].清華大學教育研究,2018,39(5):75-80.
[18]劉邦奇,王亞飛.智能教育:體系框架、核心技術(shù)平臺構(gòu)建與實施策略[J]中國電化教育,2019.(10):23-31.
[19]范圍睿.教育評價改革需要新路向[N].鄭州日報,2020-07-24(08).
[20]邊玉芳,王燁暉.增值評價:學校辦學質(zhì)量評估的一種有效途徑[J].教育學報,2013.9(1):43-48.
[21]王曉平,齊森等.美國學?!俺砷L測量”的7種主要方法[J]中圉考試,2018.(6):21-27.
[22]楊宗凱.利用信息技術(shù)促進教育教學評價改革創(chuàng)新[J].人民教育,2020,(21):30-32.
[23]張治.戚業(yè)國.基于大數(shù)據(jù)的多源多維綜合素質(zhì)評價模型的構(gòu)建[J].中國電化教育,2017,(9):69-77+97.
[24]劉邦奇,張振超等.區(qū)域教育大數(shù)據(jù)發(fā)展參考框架[J].現(xiàn)代教育技術(shù),2018,28(4):5-12.
[25]張娜.從對教育的評價到促進教育的評價——教育評價國際研 究進展綜述[J]基礎(chǔ)教育,2017.(4):81-88.
作者簡介:
劉邦奇:教授,院長,認知智能國家重點實驗室智能教育研究中心主任,中國教育技術(shù)協(xié)會人工智能專業(yè)委員會常務(wù)理事,研究方向為人工智能教育應(yīng)用、智慧校園、智慧課堂、區(qū)域智慧教育規(guī)劃。
袁婷婷:碩士,研究方向為智能教育、智慧校園、智慧課堂。
紀玉超:碩士,研究方向為人工智能教育應(yīng)用、智慧課堂。
劉碧瑩:碩士,研究方向為智能教育、教育管理。
李嶺:碩士,研究方向為智慧課堂、智能教育。
Intelligent Technology Enabling Education Evaluation: Connotation, Overall Framework
and Practice Path
Liu Bangq1.2, Yuan Tingting1, Ji Yuchao1, Liu Biying1, Li Lingl
(l.iFLYTEK Educational Technology Institute, Hefei 230088, Anhui; 2.College of Educational Technology, Northwest
Normal University, Lanzhou 730071, Gansu)
Abstract: The enablement of intelligent technology provides an important opportunity for the reform and development of educationevaluation, and promoting the integration and innovation of intelligent technology and educational evaluation is the inevitablechoice to deepen the reform of education evaluation in the new era. Accordingly, the intelligent technology enabled evaluationeducation is studied systematically, and its historical origin can be traced back to the intelligent comprehensive evaluation in thefield of management engineering and the application of computer technology in the field of education evaluation. Its essence is thebreakthrough and innovation of traditional education evaluation based on intelligent technology, and the formation of a new educationevaluation model through deconstruction and reconstruction, which has the main characteristics of scientificalization, diversification,three-dimensional, optimization and precision. The intelligent technology and its application to assist education evaluation consists ofthe overall framework of "5+1" (five hierarchical structures of basic layer, technology layer, platform layer, application layer and userlayer and one guarantee system). Through the specific scene application of "four evaluations" enabled by intelligent technology, theoverall promotion strategies of concept guidance, standard norms, subject care, data-driven and professional support are adopted tobuild an ecological system of intelligent education evaluation.
Keywords: intelligent technology; enablement; education evaluation; overall framework; practice path
收稿日期 : 2021年3月18日
責任編輯:李雅瑄
*本文系認知智能國家重點實驗室2020年度智能教育開放課題重點課題“智能技術(shù)支持下的因材施教與教育治理”(項目編號:iED2020-2003)階段性研究成果。