亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大規(guī)模教育考試診斷性分數(shù)報告的研發(fā)與應(yīng)用
        ——以青島市初中畢業(yè)生學(xué)業(yè)水平考試成績報告單為例

        2020-05-13 01:30:24劉海龍
        教育測量與評價 2020年5期
        關(guān)鍵詞:描述性維度報告

        劉海龍

        我國大規(guī)模教育考試承擔著評價、診斷、選拔等多重任務(wù),是教育評價制度改革的關(guān)鍵一環(huán)?,F(xiàn)階段的大規(guī)模教育考試如中考和高考,考試組織嚴密規(guī)范,考試命題和數(shù)據(jù)的質(zhì)量很高,但也存在一些有待完善之處,如考試大多只報告原始分數(shù)而缺少對內(nèi)容領(lǐng)域、能力層級、學(xué)科素養(yǎng)發(fā)展水平的深層次診斷與反饋,如此,考試分數(shù)容易變成評價學(xué)生學(xué)業(yè)發(fā)展和教師教學(xué)質(zhì)量的唯一價值導(dǎo)向,更可能進一步加劇教育質(zhì)量觀和成才觀為考試分數(shù)所左右的狀況。[1]在這樣的背景下,創(chuàng)新考試分數(shù)報告模式,為公眾提供更加專業(yè)化、多樣化的服務(wù)型評價[2],充分發(fā)揮大規(guī)模教育考試的評價、診斷和反饋功能勢在必行。

        到目前為止,國內(nèi)對改革和創(chuàng)新大規(guī)??荚嚪謹?shù)報告的實踐研究尚不多見,較有影響力的是2011 年云南和海南兩省在教育部考試中心的主導(dǎo)下實施的“云海工程”。[3][4]“云海工程”采用原始分和百分等級分數(shù)為高考考生提供學(xué)科及內(nèi)容領(lǐng)域的分數(shù)報告,就改革和完善高考分數(shù)報告方式進行了有意義的探索。

        國際上的許多大型教育測評項目都研發(fā)了比較成熟的分數(shù)報告系統(tǒng)。作為美國高等學(xué)校入學(xué)考試之一的ACT,可為考生提供StudentReport[5]、High School Report[6]、College Report[7]等分數(shù)報告,這些分數(shù)報告從多個維度評價學(xué)生的學(xué)業(yè)水平[8],同時為考生提供大學(xué)專業(yè)規(guī)劃建議,有效地實現(xiàn)了考試的選拔、診斷、生涯規(guī)劃指導(dǎo)等功能[9]。國際學(xué)生評價項目(PISA)設(shè)計使用基于內(nèi)容領(lǐng)域的評價框架,構(gòu)建能力水平量表對學(xué)生素養(yǎng)進行測評,并結(jié)合影響學(xué)業(yè)成就的背景因素,提供直觀的多元化評價報告,其測評理念與方法非常值得我們借鑒參考。[10][11]

        青島市招生考試院以為大眾提供優(yōu)質(zhì)的考試評價服務(wù)為價值取向,于2017 年開始研發(fā)面向初中畢業(yè)生的網(wǎng)絡(luò)版診斷性分數(shù)報告——“青島市初中畢業(yè)生學(xué)業(yè)水平考試成績報告單”。該分數(shù)報告自2018 年正式發(fā)布以來,經(jīng)持續(xù)的研究和調(diào)整改進,已經(jīng)可以為中考考生提供能直接運用于學(xué)習改進以及初高中階段學(xué)習銜接的多角度、深層次的評價信息,并能幫助考生在高中階段課程選擇、生涯規(guī)劃等方面進行初步的定位,獲得了良好的社會反響。這充分說明在大規(guī)模教育考試中合理運用分數(shù)報告,可以從更多的維度解釋考試分數(shù)的含義,從而更好地促進考試的評價、診斷和反饋功能的發(fā)揮,助力教育評價的深層次改革。本文嘗試通過對青島市初中畢業(yè)生學(xué)業(yè)水平考試成績報告單的已有研究與實踐進行總結(jié),探析大規(guī)模教育考試診斷性分數(shù)報告研發(fā)和應(yīng)用的方法。

        一、診斷性分數(shù)報告的研發(fā)路徑

        1.測量評價層面的核心任務(wù)

        診斷性分數(shù)報告的研發(fā)在測量評價層面的核心任務(wù)有3 個:建構(gòu)分數(shù)報告的診斷性測評框架;依據(jù)所建構(gòu)的測評框架命制試題,并標定試題屬性;考試數(shù)據(jù)分析建模與測評框架效度驗證。

        (1)建構(gòu)分數(shù)報告的診斷性測評框架

        如圖1 所示,診斷性測評框架的建構(gòu)就是確定分數(shù)報告的結(jié)構(gòu)和分數(shù)轉(zhuǎn)換的方式,并基于學(xué)科知識領(lǐng)域評價維度開發(fā)描述性評價模型。診斷性測評框架應(yīng)在有關(guān)理論、實踐經(jīng)驗以及測評目標的基礎(chǔ)上構(gòu)建,各診斷維度的定義要求清晰、可測,并具有積極的教育意義和診斷評價的價值,可以被廣泛接受,同時測評框架對命題而言應(yīng)具有良好的可操作性。

        圖1 分數(shù)報告的診斷性測評框架

        (2)依據(jù)所建構(gòu)的測評框架命制試題,并標定試題屬性

        只有以測評框架為藍圖進行命題,所得到的分數(shù)報告才是有意義的,因此需要在命題環(huán)節(jié)依據(jù)測評框架設(shè)計多維細目表等命題工具,以管控試題結(jié)構(gòu)和質(zhì)量,保證其診斷效度。首先應(yīng)通過培訓(xùn),讓命題專家充分理解分數(shù)報告的目標、建構(gòu)診斷性測評框架的原理、命題工具的編制與操作方法,以保證所命制的試題能對測評框架進行充分表征,使試題真正成為測評框架的實現(xiàn)形式[12];其次應(yīng)組建獨立的審題組進行規(guī)范的試題審核[13];最后,由命、審題專家和測評專家共同完成對試題屬性的標定,并綜合分析評估試題對所屬測評維度測量和診斷的效度。

        (3)考試數(shù)據(jù)分析建模與測評框架效度驗證

        在獲取施測數(shù)據(jù)后,需要運用經(jīng)典測量理論(CTT)和項目反應(yīng)理論(IRT)來分析評估命題的質(zhì)量?;贑TT方法的評估雖有一定局限性,但也具有易理解、時效性強等優(yōu)勢。青島市招生考試院主要通過自主開發(fā)的考試數(shù)據(jù)分析系統(tǒng)獲取試卷與試題分數(shù)的集中量、差異量、難度、區(qū)分度、作答分布、得分分布等統(tǒng)計指標進行分析?;贗RT 的質(zhì)量評估,則主要運用Conquest[14]等軟件,采用分部計分模型(PCM)[15],獲取能力難度分布圖、ICC 曲線、題總相關(guān)等信息,用以評估測評框架下的命題及其作答反應(yīng)之間的因果關(guān)系是否成立[16]。特別地,由于描述性評價模型涉及水平等級的劃分,故還需要對其進行效度驗證,即運用AMOS 結(jié)構(gòu)方程模型進行驗證性因子分析[17],對描述性評價模型的試題標定進行調(diào)整,以求獲得較好的“數(shù)據(jù)—模型”擬合效果。之后,組織學(xué)科專家抽樣審閱試卷,借助對考試數(shù)據(jù)的分析,結(jié)合學(xué)生實際作答表現(xiàn)對描述性評價模型進行調(diào)整,并逐步明晰考生的不同能力水平與各評價維度中的分數(shù)表現(xiàn)的對應(yīng)關(guān)系。

        2.技術(shù)路徑

        診斷性分數(shù)報告的研發(fā)由3 個團隊協(xié)作完成:測量評價專家和命題專家組成測評組,負責分數(shù)報告的理論設(shè)計、命題及數(shù)據(jù)分析;考務(wù)管理組負責考試的組織實施及閱卷質(zhì)量監(jiān)測;網(wǎng)絡(luò)系統(tǒng)組負責根據(jù)測評組的需求進行軟件開發(fā)、數(shù)據(jù)處理、系統(tǒng)調(diào)試及網(wǎng)絡(luò)管理。

        在實際操作層面,診斷性分數(shù)報告研發(fā)的技術(shù)實現(xiàn)路徑如圖2 所示。在中考這樣的高利害考試中分析并報告考生分數(shù),存在較高的風險,且對分數(shù)報告的科學(xué)性要求也非常高。所以,首先要進行充分的調(diào)研,廣泛征求意見,研判風險并采取有效的保障措施,要組織高水平專家評審,對研發(fā)思路和方法進行指導(dǎo),并在此基礎(chǔ)上完成分數(shù)報告的初步設(shè)計。其次,要集中測評專家、學(xué)科專家以及軟件工程師進行多輪研討,研發(fā)測評框架、討論分數(shù)報告的呈現(xiàn)方式、開發(fā)網(wǎng)絡(luò)系統(tǒng),并使用往年數(shù)據(jù)進行初步效果測試。在入闈命題期間,要組織針對性培訓(xùn),以提升命題的質(zhì)量和診斷效能。最后,在實施考試獲取數(shù)據(jù)后,要依靠數(shù)據(jù)支撐來完善測評框架。在分數(shù)報告正式發(fā)布前,要進行充分的測試,確保分數(shù)報告發(fā)布的萬無一失。

        二、診斷性分數(shù)報告的設(shè)計

        圖2 診斷性分數(shù)報告研發(fā)流程

        圖3 A 考生分數(shù)報告示例——整體報告+數(shù)學(xué)學(xué)科報告

        診斷性分數(shù)報告包括整體報告和學(xué)科報告兩個部分,圖3 展示的就是A 考生分數(shù)報告的部分內(nèi)容。

        1.整體報告

        整體報告包含學(xué)科學(xué)業(yè)發(fā)展評價和綜合能力與素養(yǎng)發(fā)展評價兩個維度。

        (1)學(xué)科學(xué)業(yè)發(fā)展評價

        學(xué)科學(xué)業(yè)發(fā)展評價是對考生考試成績的整體評價,首先包含考生的語文、數(shù)學(xué)、英語、道德與法治、物理、化學(xué)、歷史、地理、生物等9 個筆試學(xué)科的分數(shù)及相應(yīng)等級(等級按區(qū)域中考錄取政策以固定比例劃定)。以往,學(xué)生考試后得到的主要反饋信息是這些科目的原始成績,以青島市初中學(xué)業(yè)水平考試為例,語文、數(shù)學(xué)、英語科的滿分為120 分,物理科的滿分為100 分,化學(xué)、歷史、地理、生物科的滿分為80 分,道德與法治的學(xué)科成績轉(zhuǎn)換為“合格”與“不合格”兩個等級。因為各個學(xué)科的分數(shù)并不在同一個評價量尺上,學(xué)生單從原始分數(shù)無法獲取更多自己學(xué)科發(fā)展水平的有效信息。同時,還要考慮在基礎(chǔ)教育階段,學(xué)生成績不允許進行排名、在分數(shù)報告中使用百分等級分數(shù)可能會引起誤解等情況。在這樣的情況下,分數(shù)報告可以將各學(xué)科的原始分數(shù)以線性轉(zhuǎn)換的方式轉(zhuǎn)換為導(dǎo)出分數(shù)T 分數(shù)[18],再將導(dǎo)出分數(shù)通過可視化技術(shù)(雷達圖)來呈現(xiàn)。這種基于統(tǒng)一評價量尺的分數(shù)轉(zhuǎn)換和報告方式,既能使考生不必糾結(jié)于導(dǎo)出分數(shù)的含義,又能清晰顯示學(xué)生在各個維度上的發(fā)展情況,可以幫助學(xué)生找到自己的優(yōu)勢學(xué)科和劣勢學(xué)科,分數(shù)報告更加直觀易讀。在分數(shù)報告的其他評價維度中,也采用了同樣的分數(shù)轉(zhuǎn)換和報告方式。

        (2)綜合能力與素養(yǎng)發(fā)展評價

        素養(yǎng)是學(xué)生通過長期學(xué)習積累而生成的高階綜合思維能力。[19]2017 年版普通高中課程標準凝練了各學(xué)科的核心素養(yǎng),盡管2011 年版義務(wù)教育課程標準沒有明確提出初中階段的學(xué)科核心素養(yǎng),但聚焦素養(yǎng)的評價是教育測評發(fā)展的重要趨勢,在分數(shù)報告中設(shè)計綜合能力與素養(yǎng)發(fā)展評價維度就是基于上述認知和教育實踐經(jīng)驗的一種嘗試。綜合能力與素養(yǎng)發(fā)展評價維度由學(xué)科專家依據(jù)義務(wù)教育課程標準,同時以普通高中課程標準提出的核心素養(yǎng)體系為參考,經(jīng)深入的探討而建構(gòu),劃分為人文素養(yǎng)和科學(xué)素養(yǎng)兩個子維度,其內(nèi)涵與結(jié)構(gòu)如圖4 所示。

        圖4 綜合能力與素養(yǎng)發(fā)展評價結(jié)構(gòu)

        以科學(xué)素養(yǎng)評價維度的建構(gòu)為例,首先由學(xué)科專家從學(xué)科測評目標中抽取出相關(guān)的素養(yǎng)要素,并進行充分的細化解構(gòu)(見表1),同時廣泛征求一線教師的意見以擴大討論范圍,對評價維度的解構(gòu)進行有效的補充,確保每一個評價維度的定義能被普遍接受,并且能夠清晰地與試題建立映射關(guān)系。

        表1 科學(xué)素養(yǎng)評價維度解構(gòu)

        聚焦學(xué)生素養(yǎng)發(fā)展的綜合能力與素養(yǎng)發(fā)展評價,部分基于理論,部分基于實踐,意義不止于診斷,更多指向反饋和引導(dǎo),即在對評價框架的建構(gòu)與解構(gòu)、考試命題、評價與分析的研究過程中,引導(dǎo)測評專家、學(xué)科專家、一線教師思考和探索對素養(yǎng)進行測量與評價的途徑,同時通過分數(shù)報告引導(dǎo)考生進入高中階段學(xué)習后更加關(guān)注學(xué)科核心素養(yǎng)的提升。

        2.學(xué)科報告

        考生的分數(shù)報告包含9 個學(xué)科報告,每個學(xué)科報告包含知識領(lǐng)域評價和能力層級評價兩個維度。

        (1)學(xué)科知識領(lǐng)域評價

        學(xué)科知識領(lǐng)域評價一方面使用雷達圖展示學(xué)生學(xué)科知識領(lǐng)域的表現(xiàn)情況;另一方面,根據(jù)學(xué)生在各學(xué)科知識領(lǐng)域中的作答表現(xiàn)提供個性化的描述性評價,并提出與學(xué)生自身能力相適應(yīng)的、有利于學(xué)生能力提升的建議。

        學(xué)科知識領(lǐng)域評價維度源自課程標準對學(xué)科知識的分類,這種分類不僅對學(xué)生和教師來說比較容易理解,而且對于學(xué)生知識領(lǐng)域表現(xiàn)的診斷來說也非常有意義。因為即使是學(xué)科分數(shù)相同的考生,他們在學(xué)科內(nèi)各領(lǐng)域中的表現(xiàn)也不盡相同,所以知識領(lǐng)域評價可以提供比學(xué)科分數(shù)更為深入也更有價值的信息。

        關(guān)于學(xué)科知識領(lǐng)域的劃分(見表2),需要重點考慮“夠不夠測”的問題,即如果一門學(xué)科的某知識領(lǐng)域在試卷中涉及的題量較少,則這個領(lǐng)域的測試信度不容易得到保證,所獲取的考試數(shù)據(jù)將無法充分支持對此領(lǐng)域的評價。這就需要學(xué)科專家、測評專家進行聯(lián)動,使劃分出的每個知識領(lǐng)域都具有一定的題量和合理的難度分布,以保證每個知識領(lǐng)域的測量數(shù)據(jù)都有較好的信度和效度。初中學(xué)業(yè)水平考試的學(xué)科試題題量以得分點記,一般都在50 個以上,每門學(xué)科以設(shè)置5~6個知識領(lǐng)域比較合適。而對于題量較少的部分知識領(lǐng)域,就需要進行具體的分析和評估,如考慮與其他領(lǐng)域整合,或減少描述性評價等級。

        盡管分數(shù)報告在知識領(lǐng)域評價維度采用了基于導(dǎo)出分數(shù)的可視化圖表報告分數(shù),但本質(zhì)上仍然是對考試結(jié)果的抽象表達。[20]因此,診斷性分數(shù)報告還需要通過描述性評價的方式清楚地告知學(xué)生“能做什么”,即在學(xué)科知識領(lǐng)域下建立描述性評價模型,以明確在每一個知識領(lǐng)域中,不同分數(shù)考生的外顯的作答反應(yīng)是怎樣的,并在此模型的基礎(chǔ)上,生成學(xué)科知識領(lǐng)域描述性評價報告。圖5 就是B 考生英語學(xué)科報告中的知識領(lǐng)域描述性評價與能力提升建議部分。

        圖5 B 考生英語學(xué)科報告截圖——知識領(lǐng)域描述性評價與能力提升建議

        描述性評價模型由描述性評價建構(gòu)圖、試題知識領(lǐng)域?qū)傩詷硕?、知識領(lǐng)域原始分數(shù)與導(dǎo)出分數(shù)、等級分數(shù)劃界值表組成。知識領(lǐng)域的描述性評價建構(gòu)圖是依據(jù)Mark Wilson 提出的建構(gòu)圖方法[16]建立的。以表3 的英語學(xué)科“閱讀理解與表達”知識領(lǐng)域為例:該知識領(lǐng)域表現(xiàn)水平劃分為5個等級,箭頭向上的方向表示高水平表現(xiàn);表格第一列的作答表現(xiàn)由學(xué)科專家依據(jù)經(jīng)驗進行歸納預(yù)設(shè),可以用得分率描述,也可以根據(jù)學(xué)科各知識領(lǐng)域的特點設(shè)置針對某些典型、關(guān)鍵問題作答情況的要求;描述性評價的內(nèi)容是由學(xué)科專家歸納的不同作答水平考生的能力表現(xiàn)特征;還要根據(jù)各級能力表現(xiàn)特征,找出學(xué)生在相應(yīng)領(lǐng)域的“最近發(fā)展區(qū)”[21],以便提出與學(xué)生能力水平相適應(yīng)的學(xué)習建議。

        需要說明的是:①描述性評價建構(gòu)圖的等級數(shù)要根據(jù)學(xué)科知識領(lǐng)域所涉及題目的難度來確定,一般劃分為2~5 個等級,如對于部分學(xué)科要求較為基礎(chǔ)的領(lǐng)域就可以只設(shè)置2 個等級;②描述性評價建構(gòu)圖在歸納時可先從兩端開始考慮,即先確定最高水平和最低水平應(yīng)有的表現(xiàn),然后通過對行為動詞的逐步強化或弱化[22],同時考慮內(nèi)容、能力的不同層次的要求,逐步完成對各等級作答表現(xiàn)水平的描述,在這里應(yīng)盡量使用激勵性評價的表述;③描述性評價建構(gòu)圖同時也是命題的標準,在命題時需要考慮什么樣的問題可以引發(fā)足夠的作答反應(yīng)信息來診斷這些不同的能力水平,只有這樣,才能依靠題目進行測量。

        雖然初中學(xué)業(yè)水平考試在屬性和特征上更加傾向于常模參照考試,但并不妨礙在分數(shù)報告中運用標準參照的方法進行診斷,這里依靠建構(gòu)圖建立的描述性評價模型就是一個標準參照模型。在實施考試獲取數(shù)據(jù)后,測評專家和學(xué)科專家在數(shù)據(jù)的支持下抽樣研判不同層次考生的具體作答情況,來對評價等級與作答表現(xiàn)的描述性評價內(nèi)容進行調(diào)整,并制定等級劃界值表。

        (2)學(xué)科能力層級評價

        設(shè)置學(xué)科能力層級評價的目的,是為了診斷并報告考生在不同能力水平的題目上的作答表現(xiàn),主要依據(jù)的是布盧姆的教育目標分類理論。但布盧姆教育目標分類理論在實際的框架設(shè)計過程中不能直接使用,需要綜合考慮測評性質(zhì)與目標、學(xué)科背景、文化和語言背景、學(xué)生的認知水平等諸多因素來進行調(diào)整。例如,在選擇其中的高階能力層級如“評價”“創(chuàng)造”進行評價時就需要非常慎重,因為初中學(xué)生的認知水平尚未完全達到這些層級,學(xué)生的學(xué)習內(nèi)容也較少能夠達到這些層級的標準,因此命題時涉及的題目非常少,也就無法在這些層級進行明確的診斷與評價。這就要求學(xué)科專家根據(jù)課程標準和教學(xué)實際合理劃分能力層級(見表4),同時對各層級要求、所涉題目比例等進行解構(gòu),這也是編制命題工具的基本要求。

        表3 英語科“閱讀理解與表達”知識領(lǐng)域的描述性評價建構(gòu)

        表4 各學(xué)科能力層級劃分

        三、診斷性分數(shù)報告的發(fā)布與使用

        在診斷性分數(shù)報告正式發(fā)布之前,我們需要對分數(shù)報告的實際展示效果進行廣泛驗證,重點評估包含極低分、極高分、數(shù)據(jù)部分缺失等極端情況的分數(shù)報告效果。同時,通過電視新聞、報紙、網(wǎng)絡(luò)等途徑積極宣傳、解讀發(fā)布分數(shù)報告的目的和意義,合理引導(dǎo)社會預(yù)期,同時編制簡潔易懂的分數(shù)報告使用手冊[23],幫助考生正確理解和使用分數(shù)報告。最終的分數(shù)報告以網(wǎng)絡(luò)形式發(fā)布,考生只需在發(fā)布頁面登錄,即可瀏覽自己的網(wǎng)頁版分數(shù)報告,同時也可下載PDF 格式的報告。

        運用診斷性分數(shù)報告,考生可以全方位、更加深入地了解自己在學(xué)業(yè)成長過程中一次關(guān)鍵考試的表現(xiàn)。在考試整體評價方面,如圖6 所示,C 考生可以通過雷達圖找到自己的優(yōu)勢學(xué)科為英語、語文、數(shù)學(xué),且英語學(xué)科表現(xiàn)最為突出,而物理、生物、地理學(xué)科表現(xiàn)稍差。圖6 還表明,該考生在人文素養(yǎng)上有一定的優(yōu)勢,在創(chuàng)新思維能力、信息處理能力、抽象邏輯思維能力等方面則需要多下功夫。

        又如前文圖3 中的A 考生可以通過診斷性分數(shù)報告,清楚地了解到自己在各學(xué)科都呈現(xiàn)了均衡發(fā)展的良好態(tài)勢,在數(shù)學(xué)、物理、地理學(xué)科上更是優(yōu)勢明顯。更進一步地,從能力素養(yǎng)的角度來看,該考生明顯在科學(xué)素養(yǎng)方面具有一定優(yōu)勢,特別是抽象邏輯思維能力和創(chuàng)新思維能力表現(xiàn)較好(見圖7)。

        診斷性分數(shù)報告在提供整體評價的同時,還深入到學(xué)科內(nèi)部,評價了考生學(xué)科知識領(lǐng)域和能力層級的深層次表現(xiàn)。仍以前文圖3 中的A 考生為例,盡管該考生各學(xué)科成績均具有明顯的優(yōu)勢,但在學(xué)科內(nèi)部,他仍然能夠找到自己相對突出或薄弱的領(lǐng)域(見圖8)。

        四、總結(jié)與思考

        1.總結(jié)

        本研究中的診斷性分數(shù)報告運用了教育測評理論和信息技術(shù),實現(xiàn)了科學(xué)的、普惠的、個性化的診斷性評價,提升了大規(guī)??荚嚪謹?shù)的可解釋性,為考生提供了更多的、有效的考試反饋信息,可以引導(dǎo)考生從“分分必究”的“應(yīng)試”思維中走出來,根據(jù)分數(shù)報告提供的描述性評價及學(xué)習建議,及時調(diào)整自己的學(xué)習策略,這對于考生初高中階段的學(xué)習銜接、高中學(xué)段課程的選擇,乃至職業(yè)生涯規(guī)劃都有著直接的幫助。診斷性分數(shù)報告的研發(fā)與實踐,串接了區(qū)域初中學(xué)業(yè)水平考試的標準設(shè)計、考試命題、考試數(shù)據(jù)統(tǒng)計分析、分數(shù)報告等各個環(huán)節(jié),促使市域管理的一項重大教育考試的各方面工作融合為一個有機整體;同時引領(lǐng)考試評價回歸教育本質(zhì),從關(guān)注分數(shù)轉(zhuǎn)向聚焦學(xué)生發(fā)展,體現(xiàn)了教育評價的素質(zhì)教育導(dǎo)向。診斷性分數(shù)報告的研發(fā)與實踐還極大地帶動了區(qū)域測評專業(yè)團隊的建設(shè),通過組織學(xué)習培訓(xùn)和實踐操作,逐步促使整個團隊對項目研究從認知到認同、從實踐到回饋,進而使整個區(qū)域教育測評研究的水平獲得提升。

        圖6 C 考生分數(shù)報告局部——考試整體評價

        圖7 A 考生分數(shù)報告局部——考試整體評價

        圖8 A 考生成績報告單局部

        2.進一步完善的思考

        第一,診斷性分數(shù)報告以雷達圖和描述性評價的方式呈現(xiàn),直觀易讀。但是,該診斷性分數(shù)報告給出的描述性評價仍舊缺乏可比較的參照標準,導(dǎo)致所提供的診斷信息仍然不夠直接和明確??蛇M一步考慮在學(xué)科內(nèi)部評價維度上建立百分等級常模,使用百分等級分數(shù)進行報告,以便考生和家長使用分數(shù)報告時可以獲取清晰的參照信息。[24]

        第二,診斷性分數(shù)報告在進行描述性評價時,選擇了在學(xué)科知識領(lǐng)域框架下進行,這更多地是考慮到在研究剛起步的狀態(tài)下,這種局部的描述性評價在理解和操作層面相對于面向?qū)W科素養(yǎng)的分級評價來說要容易一些。但隨著2017版普通高中課程標準以及高考評價體系[25]的發(fā)布,構(gòu)建以素養(yǎng)為主要維度的測評框架將是未來考試分數(shù)報告的重要研究目標。

        第三,診斷性分數(shù)報告通過專家評估的方式將考生的測評結(jié)果與學(xué)習行為進行聯(lián)結(jié),嘗試為學(xué)生提供可操作性的學(xué)習建議。但在這種模式下,無法保證分數(shù)報告中的學(xué)習建議與每位考生的實際情況完全相符。理想的方式是深度發(fā)揮分數(shù)報告網(wǎng)絡(luò)平臺的作用,開發(fā)在過程性評價中同樣可以操作和應(yīng)用的互動式考試分數(shù)報告和評價系統(tǒng)。如此,既可對學(xué)生的日常學(xué)業(yè)水平發(fā)展情況進行實時監(jiān)控與反饋,又能利用網(wǎng)絡(luò)平臺開展學(xué)生學(xué)習行為的問卷調(diào)查,還可通過對學(xué)生的學(xué)習行為與其考試作答情況進行相關(guān)性分析,找到學(xué)生學(xué)習行為與學(xué)習結(jié)果之間的良性與不良相關(guān)因素,從而真正實現(xiàn)數(shù)據(jù)驅(qū)動下的學(xué)習改進。

        猜你喜歡
        描述性維度報告
        虛構(gòu)人名的內(nèi)涵意義分析*——描述性理論面臨的挑戰(zhàn)和反駁
        淺論詩中“史”識的四個維度
        中華詩詞(2019年7期)2019-11-25 01:43:00
        一圖看懂十九大報告
        報告
        南風窗(2016年26期)2016-12-24 21:48:09
        淺析獨立主格結(jié)構(gòu)在大學(xué)英語四六級段落翻譯中的運用
        考試周刊(2016年90期)2016-12-01 19:39:34
        光的維度
        燈與照明(2016年4期)2016-06-05 09:01:45
        “五個維度”解有機化學(xué)推斷題
        一種基于英文網(wǎng)頁描述性信息的摘要算法
        報告
        南風窗(2015年22期)2015-09-10 07:22:44
        淺談?wù)Z文課堂中引讀的運用
        少妇三级欧美久久| 欲求不満の人妻松下纱荣子 | 丰满少妇三级全黄| 欧美日韩成人在线| 日本精品人妻在线观看| 久久蜜桃资源一区二区| 国产精品久久久久久久| 99亚洲精品久久久99| 韩国三级大全久久网站| 日本少妇熟女一区二区| 综合色就爱涩涩涩综合婷婷| 丰满人妻妇伦又伦精品国产| 亚洲av永久无码精品水牛影视| 久久精品免费视频亚洲| 一区二区三区视频| 久久久久无码精品亚洲日韩| 国产伪娘人妖在线观看| 亚洲国产精品国自产拍性色 | 婷婷亚洲久悠悠色悠在线播放| 国产午夜精品理论片| 色婷婷一区二区三区四| 国产 一二三四五六| 午夜成人无码福利免费视频| 久久男人av资源网站无码| 香蕉蜜桃av一区二区三区| 国内精品视频一区二区三区八戒| 欧美性xxxx狂欢老少配| 久久亚洲中文字幕精品一区四| 99久久国内精品成人免费| 久久视频在线| 亚洲av日韩aⅴ无码电影| 亚洲中文高清乱码av中文| 午夜成人理论福利片| 久久人人97超碰超国产| 亚洲日本人妻中文字幕| 日韩亚洲精品国产第二页| 人妻夜夜爽天天爽一区| 国产精品白浆视频免费观看| 日本中文字幕乱码中文乱码| 国产福利视频在线观看| 久久亚洲国产中v天仙www|