華薇娜 施云 岳泉
摘 要 論文以Web of Science數(shù)據(jù)庫為數(shù)據(jù)采集的對象,收集了世界范圍內(nèi)有關(guān)閱讀評價(jià)研究方面的核心期刊論文千余篇,并通過文獻(xiàn)計(jì)量學(xué)方法對這些期刊論文從多個(gè)角度進(jìn)行了量化分析,以反映國際學(xué)術(shù)界在閱讀評價(jià)研究領(lǐng)域的學(xué)術(shù)生產(chǎn)力、核心作者的貢獻(xiàn)、以及人們關(guān)注的熱點(diǎn)重點(diǎn)的研究論題等信息。
關(guān)鍵詞 閱讀 閱讀評價(jià) 文獻(xiàn)計(jì)量分析 Web of Science
Abstract Based on the articles collected from the database of WoS, it collects more than 1000 core journal papers on reading evaluation research in the world. Through bibliometric method, this paper makes quantitative analysis on these journal papers from multiple angles, so as to reflect the academic productivity, the contribution of core authors and the hot spots of peoples attention in the field of reading evaluation research in the international academic community.Keywords Reading. Reading assessment. Bibliometric study. Web of Science.
近年來,隨著社會的發(fā)展和網(wǎng)絡(luò)的普及,民眾的文化需求呈爆發(fā)式增長,全民閱讀氛圍得到很大程度的發(fā)展,愛讀書逐步成為一種社會風(fēng)氣。在這樣的大前提下,閱讀評價(jià)也成為了熱門的研究主題。閱讀評價(jià)是指根據(jù)一定的標(biāo)準(zhǔn)、通過一定的程序或手段對閱讀狀況進(jìn)行檢測、對閱讀成果的質(zhì)量或水平作出判斷。目前國內(nèi)對閱讀評價(jià)的學(xué)術(shù)研究主要集中在對學(xué)生文本閱讀成績的評價(jià),以及對國外一些特定的閱讀評價(jià)工具或標(biāo)準(zhǔn)所進(jìn)行的專題研究和推薦,而對國外閱讀評價(jià)的研究成果,尤其是國際核心期刊研究論文的系統(tǒng)性和綜述性報(bào)告目前則見之甚少。
Web of Science(簡稱WOS)是美國科技信息研究所基于WEB開發(fā)的大型綜合性、多學(xué)科核心期刊引文索引數(shù)據(jù)庫,現(xiàn)由科睿唯安公司(Clarivate Analytics,原湯森路透知識產(chǎn)權(quán)與科技事業(yè)部)向全球提供數(shù)據(jù)與分析服務(wù)[1] 。該數(shù)據(jù)庫收錄近萬種經(jīng)過嚴(yán)格篩選的國際著名核心期刊,幾乎覆蓋科學(xué)技術(shù)各個(gè)分支領(lǐng)域。本文選取 Web of Science系統(tǒng)三個(gè)子庫SCIE(科學(xué)引文索引擴(kuò)展板——1900~至今)、SSCI (社會科學(xué)引文索引——1900~至今)和A&HCI(人文藝術(shù)科學(xué)引文索引——1975~至今),以“reading assessment”“reading evaluation”等檢索詞(含英文檢索詞的各種變形)進(jìn)行題名檢索,共搜集到1932年(在本數(shù)據(jù)庫中第一篇與本文主題相關(guān)的文章是1932年出現(xiàn)的)至2019年閱讀評價(jià)領(lǐng)域的WOS論文1600余篇,經(jīng)人工鑒別并刪除不相關(guān)記錄(多為測量表“讀數(shù)”之類)后得到最終結(jié)果1300余篇。本文擬從出版年、期刊、作者、地區(qū)、機(jī)構(gòu)、學(xué)科、關(guān)鍵詞、篇名等角度對這千余篇論文進(jìn)行文獻(xiàn)計(jì)量學(xué)歸類和分析,以求深入挖掘國際學(xué)術(shù)界有關(guān)閱讀評價(jià)研究的歷史、現(xiàn)狀、研究熱點(diǎn)及研究內(nèi)容等信息。
1 各年發(fā)文量統(tǒng)計(jì)與分析
通過對特定信息源中特定研究主題各年發(fā)文量的統(tǒng)計(jì),可以管窺這一領(lǐng)域的發(fā)展?fàn)顩r、走勢等。圖1即是在美國WOS數(shù)據(jù)庫中檢索到的閱讀評價(jià)主題領(lǐng)域國際核心期刊論文各年發(fā)文量。
圖1中的數(shù)據(jù)顯示,自上個(gè)世紀(jì)30年代初期開始出現(xiàn)有關(guān)閱讀評價(jià)方面的國際核心期刊論文,但很長一段時(shí)間年度發(fā)文量都不超過10篇,60年代—70年代間有所增長,但仍缺乏大的突破,80年代中期出現(xiàn)明顯增長,但真正的發(fā)展還是從新世紀(jì)開始,2000年之后這一領(lǐng)域的研究呈上升態(tài)勢。
早在1932年,美國學(xué)者就對高中學(xué)生課外閱讀興趣進(jìn)行了評價(jià)研究,發(fā)表An Evaluation of the Outside Reading Interests of A Group of Senior-High-School Pupils一文,該文的合作作者Francis J. Brown任職于美國華盛頓的教育委員會(Amer Council Educ, Washington, DC USA),其在教育研究領(lǐng)域成果頗豐,1932—1955年間在國際核心期刊上發(fā)文81篇之多,多為個(gè)人單獨(dú)作品。他的研究側(cè)重于殘疾人教育,戰(zhàn)后教育的恢復(fù),以及教育與政治之間的關(guān)系等。這也從一個(gè)側(cè)面說明,教育和教學(xué)領(lǐng)域?qū)﹂喿x評價(jià)最為關(guān)注。
早年有關(guān)閱讀評價(jià)的文章多用Evaluation一詞,直到1961年在一篇有關(guān)閱讀與心理學(xué)研究的文章中才第一次出現(xiàn)Assessment一詞。隨著時(shí)間的推移,后者出現(xiàn)次數(shù)逐漸增多且密集,到80年代后期已經(jīng)出現(xiàn)了Reading Assessment多于Reading Evaluation的情況,如1989年有關(guān)Reading Assessment文章共11篇,而有關(guān)Reading Evaluation的文章只有3篇。從詞義辨析的角度看,Assessment更側(cè)重于收集、審核和使用數(shù)據(jù)的過程,而Evaluation則強(qiáng)調(diào)據(jù)特定標(biāo)準(zhǔn)作出判斷性質(zhì)的評價(jià)[2] ,其使用頻率的變化表明,閱讀評價(jià)中數(shù)據(jù)分析所占比重日益增加。
自2000年起,閱讀評價(jià)進(jìn)入了研究旺盛期,2000—2014年這15年的論文量超過了之前近60年的論文總量,2010—2019年這10年的論文量又與前15年相當(dāng)。可見,閱讀評價(jià)越來越受到人們的重視,近幾年是閱讀評價(jià)研究的鼎盛時(shí)期,并且仍處于上升階段。
這一領(lǐng)域也產(chǎn)生了諸多具有較高學(xué)術(shù)影響力的論文。在本文所統(tǒng)計(jì)范圍中,1300余篇論文共被引用1.6萬次以上,其中被引10次以上的有近400篇文章(含被引百次以上的22篇)。高被引論文并未受時(shí)代的影響,既有2000年以來體現(xiàn)新技術(shù)發(fā)展的研究,也有上世紀(jì)70年代、80年代有關(guān)教育學(xué)、心理學(xué)方面的論文,最早的1932年發(fā)表的文章也被引5次。同樣0被引文章也有近400篇,亦與發(fā)表年代無關(guān),早年近年的都有。
2 期刊統(tǒng)計(jì)與分析
對于一個(gè)比較成熟的主題領(lǐng)域來說,一般會形成80%的論文刊載在20%的期刊上的趨勢。有了核心期刊的線索,人們就可以方便快速地獲得較多的科學(xué)研究信息。本文所分析的跨度約80年的閱讀評價(jià)方面的論文涉及約540種國際核心期刊,平均每種期刊載文量為2.5篇(文獻(xiàn)總量/期刊種數(shù)),其中僅收錄1篇本主題論文的期刊高達(dá)約350種,收錄10篇以上論文的期刊僅有21種(437篇論文)??梢娺@一主題的文獻(xiàn)在國際核心期刊上還是比較分散的。表1是按照載文量進(jìn)行排序后的刊載閱讀評價(jià)文獻(xiàn)的核心期刊列表(僅列出刊載閱讀評價(jià)主題文獻(xiàn)量大于等于10的期刊)。
表1的數(shù)據(jù)在一定程度上反映了閱讀評價(jià)研究的重要核心刊物。載文量最多的前21種期刊只占本文所統(tǒng)計(jì)到的期刊總數(shù)的3.9%,卻刊載了文獻(xiàn)總數(shù)的32.3%。雖然與其他自然科學(xué)領(lǐng)域的主題相比,文科的期刊載文集中程度相對有限,但占比依然可觀,因此可將這些期刊看作國際閱讀評價(jià)研究方面的核心期刊。在這21種期刊中,除了2種影響因子數(shù)據(jù)缺失,有7種期刊的影響因子大于2,其中影響因子最高的超過5;有9種期刊的影響因子在1~2之間;而小于1的有3種,這在文科的研究中比較普遍,能夠反映閱讀評價(jià)領(lǐng)域的研究現(xiàn)狀。影響因子最高的期刊是美國心理學(xué)會主辦的《教育心理學(xué)雜志》,2019年的影響因子達(dá)5.028,五年影響因子更是高達(dá)6.133[3] ,在2019年教育心理學(xué)類國際核心期刊中按影響因子排名第2位??梢?,盡管閱讀評價(jià)的論文在核心期刊中還未形成足夠的集中力量,但還是有不少文章刊載在影響因子較高的刊物上,有一定數(shù)量的高質(zhì)量論文。從期刊的學(xué)科覆蓋范圍來看,閱讀評價(jià)方面的研究成果主要集中在“閱讀”“心理”“教育”領(lǐng)域,與其他學(xué)科交叉的領(lǐng)域主要集中在眼科學(xué)、健康康復(fù)等,但學(xué)科交叉的范圍相對比較局限。
3 作者統(tǒng)計(jì)與分析
在本文所統(tǒng)計(jì)到的論文中,包括全部合作者在內(nèi),共有作者3000多位,平均每篇論文有2.5位合作者,合著率相對并不高,單兵作戰(zhàn)的現(xiàn)象在這個(gè)主題的研究中較為常見,高產(chǎn)作者相對也有限。表2是對發(fā)文量不低于5篇的13位研究人員的發(fā)文量的統(tǒng)計(jì)。這一數(shù)據(jù)可在一定程度上反映閱讀評價(jià)領(lǐng)域的重要科研人員(高產(chǎn)作者)。
由表2數(shù)據(jù)可見,在閱讀評價(jià)領(lǐng)域的高產(chǎn)作者很少,幾乎沒有高產(chǎn)作者。閱讀評價(jià)領(lǐng)域發(fā)文較多的作者的研究集中在心理學(xué)、教育學(xué)、精神病學(xué)、眼科學(xué)、特殊教育以及康復(fù)這幾個(gè)研究分支,以教育心理學(xué)的研究為最。美國理海大學(xué)研究實(shí)踐提升中心(Lehigh Univ, Ctr Promoting Res Practice)的SHAPIRO E S較多地關(guān)注閱讀的教學(xué)實(shí)踐以及閱讀理解方面的標(biāo)準(zhǔn)化考試,如“雙語教育課堂中西班牙語學(xué)習(xí)者的基于課程的測量與閱讀技能評價(jià)”“以課程為基礎(chǔ)的評價(jià)和標(biāo)準(zhǔn)考試的措施”“利用閱讀理解能力提高風(fēng)險(xiǎn)評價(jià)的預(yù)測”等。德國圖賓根大學(xué)眼科中心的TRAUZETTEL-KLOSINSKI S以及他的合作團(tuán)隊(duì)專門進(jìn)行眼科學(xué)與閱讀障礙、精神障礙、閱讀速度之間的關(guān)系的研究,致力于歐洲各語種間的閱讀評價(jià)的對比以及新標(biāo)準(zhǔn)的詮釋與研究,如IReST (International Reading Speed Texts,國際閱讀速度標(biāo)準(zhǔn))。還有些作者關(guān)注閱讀評價(jià)標(biāo)準(zhǔn)的實(shí)踐研究,如美國俄勒岡大學(xué)的TINDAL G的“7年級8年級學(xué)生口語和閱讀教學(xué)為個(gè)案對美國CBM(Curriculum Based Measurement)閱讀評價(jià)標(biāo)準(zhǔn)有效性的研究”“朗讀流暢性規(guī)范:教師評價(jià)閱讀的有效工具”“在全州范圍內(nèi)進(jìn)行早期閱讀替代評價(jià)”。美國密西根大學(xué)(安娜堡)心理與教育系的PARIS S G的研究側(cè)重通過調(diào)查來收集閱讀方面的數(shù)據(jù),如 “幼兒園至三年級兒童的閱讀評價(jià):早期閱讀成績改善中心的調(diào)查結(jié)果”“脆弱的證據(jù):對閱讀評價(jià)的批判”“對兒童閱讀理解從元認(rèn)知角度的糾正與評價(jià)”“對閱讀理解匹配題目的與功能的評價(jià)”等??v觀作者所在的機(jī)構(gòu),閱讀評價(jià)的主要研究力量在高等院校。
4 國家/地區(qū)發(fā)文量統(tǒng)計(jì)與分析
根據(jù)作者所在國家/地區(qū)來統(tǒng)計(jì)文獻(xiàn)量,可幫助人們衡量、考察或了解某一國家/地區(qū)的科研業(yè)績和科研實(shí)力。就本文而言,統(tǒng)計(jì)國家/地區(qū)的整體發(fā)文量,可以幫助我們確定那些在閱讀評價(jià)研究方面實(shí)力較強(qiáng)的國家/地區(qū)。表3是按全部作者所在的國家/地區(qū)統(tǒng)計(jì)的論文量,一篇文章無論有幾個(gè)作者單位及其所在國,都一并計(jì)算在內(nèi)。本文共統(tǒng)計(jì)到63個(gè)國家/地區(qū),表中僅列文獻(xiàn)量大于等于10篇的國家/地區(qū)。
閱讀評價(jià)研究涉及國家較為廣泛,但主要集中在北美和西歐國家。表3中統(tǒng)計(jì)到的文獻(xiàn)量在10篇以上的18個(gè)國家/地區(qū)的文獻(xiàn)總量占比達(dá)88%之多,其中以美國的成果量最為突出,占全部研究成果的半數(shù)之多,遙遙領(lǐng)先于其他國家,是緊隨其后排名第2的英國的文獻(xiàn)量的6倍還多??梢娒绹浅V匾晫﹂喿x評價(jià)的研究。歐洲的許多國家對閱讀評價(jià)也都比較重視,英國、德國、法國這些發(fā)達(dá)國家在閱讀評價(jià)方面同樣走在前列。中國、西班牙、意大利、荷蘭、瑞典、瑞士、芬蘭等國在閱讀評價(jià)研究領(lǐng)域也有一定的建樹。
5 研究領(lǐng)域的統(tǒng)計(jì)與分析
對研究領(lǐng)域的統(tǒng)計(jì)與分析,有助于人們了解閱讀評價(jià)方面關(guān)注度比較集中和熱門的研究領(lǐng)域,較為準(zhǔn)確和全面地把握這項(xiàng)研究的現(xiàn)狀。本文所統(tǒng)計(jì)的1300余篇論文涉及的研究類目(Subject Category)有近百個(gè)。表4收錄的是文獻(xiàn)量不少于11篇的20個(gè)研究類目,其中教育研究、心理學(xué)及康復(fù)主題的文獻(xiàn)最多,近1200篇,約占總文獻(xiàn)的86%。
在一些發(fā)達(dá)國家,閱讀是學(xué)校教學(xué)活動的重要組成部分,有的學(xué)校甚至以閱讀來代替語文教學(xué)。美國教育專家認(rèn)為,如果閱讀跟不上,語言考試是很難過關(guān)的。因此,美國中小學(xué)特別重視對學(xué)生進(jìn)行閱讀訓(xùn)練[4] ,“教育研究”成為閱讀評價(jià)研究中最為突出的研究領(lǐng)域。
心理學(xué)的研究在閱讀評價(jià)中也是重頭,這里包括各種類型的心理學(xué)研究,根據(jù)數(shù)據(jù)庫的歸類,我們看到了諸如教育心理學(xué)、應(yīng)用心理學(xué)、臨床心理學(xué)、實(shí)驗(yàn)心理學(xué)、發(fā)展心理學(xué)、數(shù)學(xué)心理學(xué)、社會心理學(xué)、生物心理學(xué)等等,其中教育心理學(xué)的研究成果量占比最大;也有與其他學(xué)科緊密聯(lián)系的心理學(xué)研究,如管理學(xué)、語言學(xué)、精神病學(xué)等等??梢?,閱讀評價(jià)在很大程度上要考慮到心理學(xué)的因素。
康復(fù)作為第一研究領(lǐng)域(許多文章列有2個(gè),甚至2個(gè)以上的研究領(lǐng)域)納入本次統(tǒng)計(jì)的文章只有15篇,有的文章討論閱讀障礙者、盲人(含視障人士或視野缺損人士)的閱讀評價(jià)方案,有的文章對針對閱讀障礙設(shè)計(jì)的閱讀軟件的有效性進(jìn)行評價(jià),還有對慢性失語癥計(jì)算機(jī)輔助治療評價(jià)方面的文章,關(guān)注殘疾兒童父母閱讀狀況的調(diào)研,也有的研究從所閱讀作品對閱讀的影響角度進(jìn)行評價(jià)(如字體的大小與閱讀的關(guān)系)等等。更多的有關(guān)康復(fù)的研究是作為第二或第三研究領(lǐng)域被納入本次統(tǒng)計(jì)結(jié)果中的,其中與教育學(xué)、聽力學(xué)言語語言病理學(xué)、語言學(xué)、心理學(xué)、精神病學(xué)等方面的研究合作較多。
與康復(fù)研究領(lǐng)域不同的是,語言學(xué)方面的閱讀評價(jià)多以第一研究領(lǐng)域或獨(dú)立研究領(lǐng)域出現(xiàn),其研究側(cè)重于對不同對象語言學(xué)習(xí)中的閱讀理解、文本閱讀方面的評價(jià)、第二語言教學(xué)中的閱讀研究等。
眼科研究方面,除了少數(shù)幾篇與外科醫(yī)學(xué)的合作外,多以獨(dú)立主題出現(xiàn),主要是為解決眼疾患者閱讀障礙進(jìn)行的研究,如對為中心視野喪失者創(chuàng)建的閱讀輔助工具的評價(jià)、依據(jù)國際功能、殘疾與健康分類而進(jìn)行的閱讀能力的調(diào)查、對青光眼患者眼動模式的評價(jià)、老年人干眼癥對閱讀的影響、黃斑變性患者閱讀康復(fù)方案設(shè)計(jì)與評價(jià)等等;還有眼科醫(yī)生對視覺障礙患者進(jìn)行聽力閱讀評價(jià),也有的進(jìn)行語音閱讀評價(jià)。
總之,閱讀研究涉及方方面面各個(gè)學(xué)科,教育界之外的許多專業(yè)人員也都在致力于閱讀評價(jià)的研究,有許多專業(yè)性的研究成果面世。
6 閱讀評價(jià)研究內(nèi)容分析
本次統(tǒng)計(jì)到的千余篇有關(guān)閱讀評價(jià)論文的內(nèi)容繁雜,涉及學(xué)科廣泛,通過對所檢索文章的篇名、摘要及全文仔細(xì)閱讀,本文將那些能夠清晰反映研究成果的文章內(nèi)容歸類整理如下。
6.1 閱讀理解評價(jià)
這是本次所收集的閱讀評價(jià)數(shù)據(jù)中的一個(gè)大的文獻(xiàn)集合。該主題下集中了一批有關(guān)閱讀理解評價(jià)的論文。作者從不同的角度、不同的方法來討論這個(gè)基本的閱讀能力評價(jià)議題,如“閱讀理解試題短答案問題的自動生成”“評價(jià)方法對外語閱讀理解和詞匯習(xí)得的影響”“中學(xué)生在限時(shí)多選閱讀理解中的表現(xiàn)”“用知識組織評價(jià)法測試內(nèi)容文本的閱讀理解”“迷宮準(zhǔn)確反應(yīng)率在初中和小學(xué)高年級學(xué)生閱讀理解能力評價(jià)中的應(yīng)用”等等。這類研究內(nèi)容在閱讀評價(jià)中常年不衰,早年占比很大,但近年也未出現(xiàn)下降趨勢。
6.2 特殊的閱讀方式
本項(xiàng)研究中還收集到了一些特殊的閱讀方式,如唇讀(Lip-reading),“唇讀輔助的評價(jià)”“重度耳聾者唇讀評價(jià)”,研究的重點(diǎn)在于借助唇讀能力來判斷耳聾癥狀;朗讀(Oral Reading),如“計(jì)時(shí)在肯尼亞評價(jià)英語口語流利性和理解中的作用)”“基于課程的口語閱讀測評:進(jìn)度、持續(xù)時(shí)間和數(shù)據(jù)集質(zhì)量的多角度評估”“青年職業(yè)技術(shù)教育學(xué)生口語閱讀流利程度評價(jià)”;默讀(Silent Reading),如“用復(fù)雜性量表評價(jià)默讀流暢性:朗讀與默讀的橫向比較研究”“用迷宮法對小學(xué)生進(jìn)行默讀理解與朗讀的比較研究”;手語(Sigh Language),如“手語等多感官語言助力聾兒字詞學(xué)習(xí)和閱讀理解的干預(yù)效果評價(jià)”。
6.3 專類題材閱讀
一般說來,閱讀評價(jià)的樣本中多數(shù)指普通題材作品的閱讀,如市售圖書、教科書、兒童讀物,以及這類讀物的不同的載體,如電子版讀物、網(wǎng)絡(luò)版讀物等等。同時(shí),也有很多專題作品、專類題材的閱讀,比如關(guān)于藥品信息的閱讀;醫(yī)學(xué)文獻(xiàn)的閱讀(如“評價(jià)基于文獻(xiàn)的健康干預(yù)的內(nèi)在價(jià)值”);博物館評價(jià)項(xiàng)目的閱讀。另外,有作者提出專題科技文獻(xiàn)的閱讀應(yīng)注重實(shí)踐知識基礎(chǔ),如“實(shí)踐提高閱讀效果:大范圍生物實(shí)驗(yàn)課程注冊學(xué)生初次閱讀文獻(xiàn)能力評價(jià)”“科學(xué)素養(yǎng):目標(biāo)導(dǎo)向閱讀與評價(jià)在理解科學(xué)信息中的作用”;有針對詩歌的閱讀,如“醫(yī)學(xué)生性別、族裔、詩歌閱讀態(tài)度對臨床教育干預(yù)的影響評價(jià)”;還有針對“輕度中風(fēng)后生活信息在線閱讀能力的評價(jià)”,等等,諸如此類的專類題材和文獻(xiàn)類型的閱讀,既是閱讀范圍的擴(kuò)大,又體現(xiàn)了閱讀評價(jià)的深入。
6.4 各類閱讀障礙
研究文獻(xiàn)最多的是視力障礙病人(包括同側(cè)偏盲、象限盲、青光眼、老花眼等,甚至干眼癥)的閱讀評價(jià),如“盲文閱讀中手指自適應(yīng)算法的實(shí)驗(yàn)評價(jià)”。此外,也有聽力障礙病人、朗讀障礙病人、孤獨(dú)癥兒童(如“孤獨(dú)癥兒童的閱讀評價(jià)”)、腦損傷病人(如“閱讀理解策略在腦損傷大學(xué)生閱讀理解能力評價(jià)中的應(yīng)用”“成人創(chuàng)傷性腦損傷患者對說明文閱讀理解的評價(jià)”)、自閉癥病人、失語癥病人、運(yùn)動性言語障礙病人、肌營養(yǎng)不良癥患者、癲癇病人(如“顳枕葉癲癇青少年閱讀障礙者術(shù)前和術(shù)后閱讀評價(jià)”)。研究人員希望通過對閱讀更精準(zhǔn)的評價(jià)來把握各類閱讀障礙的干預(yù)。
6.5 閱讀能力預(yù)測
閱讀能力是個(gè)體取得成功所必備的重要能力。然而閱讀能力在個(gè)體間卻有著極大的差異,有些人能夠一目十行,而有些人卻總是來不及讀完電影字幕[5]。因此,對閱讀的評估也成為閱讀能力預(yù)測的研究內(nèi)容之一。如“通過對兒童記憶的自然觀察評價(jià)來預(yù)測認(rèn)知功能和閱讀能力[6] ”“對早期幼兒園兒童的大規(guī)模縱向的動態(tài)評價(jià)來預(yù)測一年級學(xué)生的閱讀困難”“幼兒園和一年級閱讀技能的計(jì)算機(jī)自適應(yīng)評價(jià)的預(yù)測效度”“利用動態(tài)評價(jià)預(yù)測拉丁美洲雙語兒童的閱讀能力”“利用計(jì)算機(jī)進(jìn)行的語音篩查和監(jiān)測評價(jià)閱讀結(jié)果的預(yù)測研究”“高水平閱讀能力的兒童閱讀能力自動預(yù)測”等等。
6.6 眼動研究
眼動追蹤是指通過測量眼睛的注視點(diǎn)的位置或者眼球相對頭部的運(yùn)動而實(shí)現(xiàn)對眼球運(yùn)動的追蹤。眼動儀是一種能夠跟蹤測量眼球位置及眼球運(yùn)動信息的一種設(shè)備,在視覺系統(tǒng)、心理學(xué)、認(rèn)知語言學(xué)的研究中有廣泛的應(yīng)用[7],如今也被應(yīng)用到閱讀評價(jià)的研究中,如“評價(jià)有無閱讀障礙兒童的眼動研究”“使用眼動跟蹤程序來評價(jià)閱讀效果:在對文本的反復(fù)閱讀中聯(lián)系目標(biāo)詞”。
6.7 對于家長的研究
在本文的統(tǒng)計(jì)數(shù)據(jù)中,有作者進(jìn)行了“對話性閱讀和分享閱讀對幼兒園過渡到小學(xué)階段的影響的初步研究:早期識字技能和父母態(tài)度”;也有作者研究親子閱讀,如“共同閱讀中對讀者和家長培訓(xùn)的實(shí)驗(yàn)評價(jià)”“創(chuàng)造性聯(lián)系:家長教養(yǎng)能力、兒童閱讀和從業(yè)者評估和干預(yù)”“柏林親子閱讀方案:概念設(shè)計(jì)與評價(jià)”“家長參與閱讀:基于課程的評價(jià)對親子閱讀效果的評價(jià)”“功能殘疾青少年的年輕父母的健康、安全和正常閱讀能力:規(guī)范性評估工具的構(gòu)建和初步驗(yàn)證”“閱讀項(xiàng)目中家長指導(dǎo)與同學(xué)指導(dǎo)的比較”。這一類的研究論文有數(shù)十篇之多,可見其熱門程度。
6.8 各類閱讀評價(jià)項(xiàng)目或工具
閱讀評價(jià)需要借助于項(xiàng)目(Programs)或工具(Instruments)。本文統(tǒng)計(jì)了一些與閱讀評價(jià)相關(guān)的成熟的項(xiàng)目,包括各類與閱讀相關(guān)的標(biāo)準(zhǔn)化考試,以及作者精心設(shè)計(jì)的工具,還有初創(chuàng)階段的作品。廣泛收集和深入研究這類信息,對閱讀評價(jià)的研究具有一定的參考價(jià)值。
(1)國際學(xué)術(shù)評價(jià)項(xiàng)目(Programme for International Student Assessment (PISA))是國際經(jīng)濟(jì)合作與發(fā)展組織(OECD)進(jìn)行的一項(xiàng)針對15歲學(xué)生閱讀、數(shù)學(xué)、科學(xué)能力的評價(jià)研究項(xiàng)目,從2000年開始,每3年進(jìn)行一次測評[8]。作為閱讀評價(jià)的國際性測試活動,本文檢索到自2010年以來人們對PISA不同角度的研究共10余篇之多,比如比利時(shí)和德國的幾位作者合作進(jìn)行了 “對2009年不同國家不同學(xué)校不同學(xué)生個(gè)體PISA閱讀測試中的差異的比較研究”;土耳其作者研究“國際學(xué)生閱讀能力(PISA)測評:學(xué)術(shù)閱讀影響因素的研究”;英國和美國的兩位作者研究“數(shù)學(xué)與閱讀成績的性別差異:國內(nèi)外PISA10年評價(jià)數(shù)據(jù)的比較”;也有西班牙的多位作者撰文質(zhì)疑“PISA能否評估閱讀能力?”。近年來,閱讀材料的載體有了很大的變化,2019年,有作者研究“基于紙本和計(jì)算機(jī)評估的PISA閱讀理解等效性的構(gòu)建”。
(2)美國國家教育進(jìn)展測評(NAEP(National Assessment of Educational Progress)Reading Assessments)是美國一項(xiàng)具有代表性的長期教育評價(jià)體系[9],該項(xiàng)目在全國測試的學(xué)科科目包括括藝術(shù)、公民、經(jīng)濟(jì)、地理、數(shù)學(xué)、閱讀、科學(xué)、技術(shù)與工程素養(yǎng)、美國歷史和寫作[10]。每一個(gè)由NAEP進(jìn)行評價(jià)的科目都會有一個(gè)評價(jià)框架,包括內(nèi)容、評價(jià)過程、評價(jià)問題的類型以及對評價(jià)管理的建議,每個(gè)框架可以指導(dǎo)大約10年的評價(jià),直到它被更新為止[11]。本文所收集的研究NAEP中閱讀科目測評的論文在年代分布上顯得特別有連續(xù)性,從上世紀(jì)70年代至今均有檢索結(jié)果。研究內(nèi)容很廣泛,比如“從全國教育進(jìn)展測評的數(shù)據(jù)來分析閱讀與寫作成績的性別差異”“幼兒時(shí)期閱讀能力與八年級的閱讀測評比較”“金錢激勵(lì)對12年級NAEP閱讀成績影響的實(shí)驗(yàn)研究”等等。
(3) E-Z 閱讀者模型(E-Z Reader Model)采用“最簡化”原則,為理解閱讀中詞匯識別、視覺加工、注意和眼動控制這幾個(gè)方面對眼動的時(shí)間和空間特性的交互影響提供了一個(gè)理論框架,是一個(gè)較成熟的計(jì)算型模型[12]。如“閱讀中眼睛注視的頻率與可預(yù)測性的影響:E-Z閱讀模型的評價(jià)”“法語閱讀中詞頻和可預(yù)測性效應(yīng):E-Z閱讀模型的評價(jià)”。這是一項(xiàng)專門結(jié)合眼動儀的閱讀模型的研究,不過近五年來中外學(xué)者對這一研究的更新并不多。
(4)基于課程的測試? ?(Curriculum Based Measurement,簡稱CBM)是美國普遍用于中小學(xué)課程學(xué)習(xí)能力的測試,包括閱讀、數(shù)學(xué)、寫作、以及其他學(xué)術(shù)課程內(nèi)容測試,按照不同的年齡段、不同的課程、不同的學(xué)科分別進(jìn)行[13],其下還有很多子標(biāo)準(zhǔn),如Curriculum-Based Measurement of Oral Reading (CBM-R)[14]是用來判斷朗讀流暢性的模板。有作者對“7年級8年級學(xué)生閱讀評價(jià)中口語和閱讀理解的CBM效度研究”;有作者研究“進(jìn)度、持續(xù)時(shí)間和數(shù)據(jù)集質(zhì)量對測試結(jié)果的多項(xiàng)目評價(jià)”;也有“教育工作者報(bào)告了CBM評估系統(tǒng)中1年級閱讀干預(yù)的教學(xué)特點(diǎn)”。近年來,有作者將這一測試計(jì)算機(jī)化,如“計(jì)算機(jī)化適應(yīng)性測驗(yàn)中整合基于課程的動態(tài)評價(jià):EDPL-BAI閱讀能力測驗(yàn)的發(fā)展及其效度”。這一測試工具也被其他國家所引用,比如2019年西班牙的作者研究“幼兒園基礎(chǔ)閱讀技能評估:基于西班牙語課程的測評”。
(5) 考題自動生成技術(shù)(Automatic item generation (AIG) techniques / Automatic generator),如劍橋大學(xué)語言技術(shù)實(shí)驗(yàn)室的Huang Yan與浙江大學(xué)國際學(xué)院He Lianzhen合作的“閱讀理解測試中短答案題的自動生成”的研究就是這方面的一次探索[15];美國卡內(nèi)基·梅隆大學(xué)計(jì)算機(jī)學(xué)院的多位計(jì)算機(jī)與語言技術(shù)專家以及中國臺灣信息管理方面的學(xué)者也合作進(jìn)行了“開發(fā)、評價(jià)和完善多項(xiàng)選擇完形填空題的自動生成器,以評估兒童閱讀時(shí)的理解能力”的研究。
(6) 認(rèn)知診斷DINA模型是認(rèn)知診斷潛在分類模型中的一種,它是一個(gè)簡單的隨機(jī)連接模型,由于該模型只涉及“失誤”和“猜測”兩個(gè)參數(shù),比其他模型更加簡潔、靈活和易于解釋,因此得到了廣泛的理論和應(yīng)用研究[16] 。如“廣義DINA模型框架下翻新非認(rèn)知診斷閱讀評價(jià)”“改進(jìn)非診斷性閱讀理解評估:G-DINA模型在高風(fēng)險(xiǎn)閱讀理解測試中的應(yīng)用”。
(7) 我和我的閱讀(Me and My Reading Profile,簡稱MMRP)是為課堂教學(xué)的教師設(shè)計(jì)的用于幼兒園至小學(xué)二年級學(xué)生早期閱讀動力的20題多項(xiàng)選擇測試文件,有文章專門介紹這個(gè)項(xiàng)目[17] 。
(8) 多動癥者的閱讀評測(ADHD symptoms (attention deficit hyperactivity disorder[18])),有作者著文“學(xué)齡前兒童執(zhí)行功能評價(jià)中基于行為的測試與行為評定:多動癥與閱讀成績的關(guān)系”“多動癥、自閉癥和讀寫障礙的長期心理社會和健康經(jīng)濟(jì)后果前瞻性服務(wù)評估項(xiàng)目”。
(9)PEPS-C(Profiling Elements of Prosody in Speech-Communication)是對成人和兒童的接受和表現(xiàn)韻律技能的半自動測試[19]。這項(xiàng)測試被應(yīng)用于多數(shù)英語國家,以及一些非英語國家,如法語、西班牙語、荷蘭語和挪威語國家及地區(qū)[20],如“用PEPS-C評價(jià)兒童韻律和閱讀結(jié)果的關(guān)系”。
(10) 低年級閱讀評價(jià)(Early grade reading assessment (EGRA))發(fā)端于2006年,是一項(xiàng)用于低幼年級學(xué)生識字階段閱讀能力的限時(shí)定量的標(biāo)準(zhǔn)化測試,包括認(rèn)識字母、朗讀字母、認(rèn)字、朗讀生詞、閱讀理解、完形填空、聽力、聽寫、回答問題等環(huán)節(jié)[21],現(xiàn)已被65個(gè)使用100多種拼音文字語言的國家/地區(qū)所改編和應(yīng)用。有作者就這一評價(jià)系統(tǒng)作了系統(tǒng)的綜述,如“低年級閱讀評價(jià):其理論基礎(chǔ)、目的、和局限性”,或者論述這一項(xiàng)目的長處與局限,如“評價(jià)低幼年級閱讀:每分鐘字?jǐn)?shù)的價(jià)值和局限”,更有多項(xiàng)研究擴(kuò)展至非英語國家,如“西班牙語采納“低年級閱讀評價(jià)”(EGRA)系統(tǒng)時(shí)的內(nèi)部結(jié)構(gòu)和標(biāo)準(zhǔn)分?jǐn)?shù)的研究”“對最貧困地區(qū)兒童的閱讀干預(yù):利比里亞EGRA+案例,小學(xué)一年級的閱讀評價(jià)和干預(yù)”“利用低年級閱讀評估(EGRA)數(shù)據(jù)進(jìn)行有針對性的教學(xué)支持:印尼的學(xué)習(xí)概況和教學(xué)需求”。
(11) 基于情景的評價(jià)(Scenario-based Assessment,簡稱SBA)指設(shè)置一種逼真的選題或場景,讓被試參與其中,并按測試者提出的要求完成任務(wù)。這種方法也被應(yīng)用到閱讀評價(jià)中,如“使用基于情景的評價(jià)擴(kuò)大閱讀理解的范圍:初步調(diào)查結(jié)果和挑戰(zhàn)”“基于場景的閱讀技巧評價(jià)——用于過程分析”。
(12)語音意識(Phonological Awareness,簡稱PA)指人們對語言最基本的語音單位以及較大的單位,比如音節(jié)的意識[22]。近年來,國外作者注重于基于計(jì)算機(jī)的語音意識篩查和監(jiān)測評價(jià),這些研究多數(shù)針對低幼兒童,如“課堂教學(xué)中利用計(jì)算機(jī)進(jìn)行語音意識的篩查和監(jiān)測評價(jià)來預(yù)測閱讀成果”“學(xué)齡前兒童網(wǎng)絡(luò)語音意識測驗(yàn)對學(xué)齡前閱讀困難的信度和效度研究”等等。這一類型的研究已經(jīng)延續(xù)了幾十年,從紙本時(shí)代到數(shù)字時(shí)代,從教室測試到網(wǎng)絡(luò)測試都有覆蓋。
(13)國際功能、殘疾和健康分類(International Classification of Functioning, Disability and Health,簡稱ICF)由世界衛(wèi)生組織正式頒布于 2001 年,在有關(guān)社會政策制定、統(tǒng)計(jì)、衛(wèi)生管理、臨床以及教育等領(lǐng)域得到廣泛的應(yīng)用,成為一種國際性的共同術(shù)語分類體系[23]。在閱讀評價(jià)研究領(lǐng)域也有多篇研究論文出現(xiàn),主要討論有關(guān)閱讀障礙患者的閱讀評價(jià),如“用荷蘭ICF活動量表評價(jià)閱讀、寫作和看電視”。
(14)國際閱讀速度文本(International Reading Speed Texts,簡稱IReST)是由歐洲的一些心理學(xué)家、眼科醫(yī)生發(fā)起建立的不同語種、同等難度和同類型內(nèi)容的、評估正常讀者閱讀速度的、標(biāo)準(zhǔn)化的試行文本,現(xiàn)已覆蓋了17種語言[24],文本規(guī)定了各文本每分鐘的閱讀字?jǐn)?shù)或字母數(shù)[25]。本文也收集到德國學(xué)者的有關(guān)介紹文章“新的國際閱讀速度標(biāo)準(zhǔn)文本(Standardized Assessment of Reading Performance: The New International Reading Speed Texts IReST)”;希臘和德國作者合作進(jìn)行的研究“用新的希臘標(biāo)準(zhǔn)化閱讀速度文本(IReST)評估閱讀表現(xiàn)的可變性”;以及美國學(xué)者2019年的文章“在評價(jià)頭戴式顯示器系統(tǒng)的比較研究中使用IReST評估閱讀性能的可行性”。
當(dāng)越來越多的人認(rèn)識到閱讀是一種生活方式的時(shí)候,閱讀評價(jià)成為學(xué)者關(guān)注的一個(gè)新的研究課題。他山之石,可以攻玉,希望本文能為關(guān)注閱讀評價(jià)的讀者提供一些可參考的信息。
關(guān)于科睿唯安[EB/OL].[2020-06-01]. https://clarivate.com.cn/about-us/what-we-do/.4 Difference between assessment and evaluation [EB/OL].
[2020-07-31]. https://keydifferences.com/difference-between-assessment-and-evaluation.html.2019 Journal Citation Report[EB/OL].[2020-07-01]. https://jcr.clarivate.com/.
美國中小學(xué)的閱讀教學(xué)[EB/OL].[2020-06-01]. http://www.jint.cn/d424-2595-15001.html.
徐苗,王旭,BEUCKELAER A, 等. 靜息狀態(tài)下低頻振幅率對個(gè)體詞匯閱讀能力的預(yù)測[C]. 北京:全國心理學(xué)學(xué)術(shù)會議,2014.
MOTA N B, WEISSHEIMER J, MADRUGA B, et al. A naturalistic assessment of the organization of childrens memories predicts cognitive functioning and reading ability [J]. Mind, Brain, and Education, 2016,10(3):184-195.
眼動研究[EB/OL].[2020-06-01]. https://www.baike.com/wiki/.
How does PISA work? [EB/OL].[2020-07-29]. http://www.oecd.org/pisa/aboutpisa/.
無言. 美國國家教育進(jìn)步評價(jià)[EB/OL].[2020-07-10].
http://blog.sina.com.cn/s/blog_570eb1710102w5cq.html.
張娣. 美國NAEP技術(shù)與工程素養(yǎng)評估及其進(jìn)展[J]. 世界教育信息,2020(3): 66-71,73.
專題:美國國家教育進(jìn)步評價(jià)[EB/OL].[2020-07-10].
http://blog.sina.com.cn/s/blog_570eb1710102w5cq.html.
胡笑羽,劉海健,劉麗萍,等. E-Z閱讀者模型的新進(jìn)展[J] . 心理學(xué)探新,2007,27(1): 24-29,40.
Curriculum based measurement warehouse: reading, math, and other academic assessments[EB/OL].[2020-06-01].http://www.interventioncentral.org/curriculum-based-measurement-reading-math-assesment-tests.
THEODORE J C, SCOTT P A. Curriculum-based measurement of oral reading: Passage equivalence and probe-set development [J]. Journal of? School Psychology, 2009(47):55-75.
HUANG YAN, ZHANG LIANZHEN. Automatic generation
of short answer questions for reading comprehension assessment[J]. Natural Language Engineering, 2016,22(3):457- 489.
張瀟,沙如雪. 認(rèn)知診斷DINA模型研究進(jìn)展[J]. 中國考試, 2013(1):32-37.
MARINNAK B A, MALLOY J B, GAMBRELL L B, et al. Me and my reading profile: a tool for assessing early reading motivation [J]. The Reading Teacher, 2015,69(1):51-62.
ADHD overview[EB/OL].[2020-07-30]. http://www.webmd.com/add-adhd/default.htm.
PEPPE S. Profiling elements of prosody in speech-communication (PEPS-C)[M]//VOLKMAR F R. Encyclopedia of autism spectrum disorders. New York: Springer, 2013.
FILIPE M, FROTA S, VICENTE S. Assessing prosody in European Portuguese for ages above 4: the profiling elements of prosody in speech-communication[EB/OL]. (2015-07-10) [2020-07-01]. https://repositorio.ul.pt/handle/10451/25588.
DUBECK M M, GOVE A. The early grade reading assessment (EGRA): its theoretical foundation, purpose, and limitations[J]. International Journal of Educational Development, 2015(40):315-322.
崔亞娜.語音意識對聽力理解作用初探[D]. 哈爾濱:哈爾濱理工大學(xué),2011.
邱卓英.《國際功能、殘疾和健康分類》在殘疾人事務(wù)中的應(yīng)用[J]. 中國康復(fù)理論與實(shí)踐,2003,9(9):547-552.
歐盟委員會. International Reading Speed Texts [EB/OL].[2020-08-03]. http://www.vision-research.eu/fileadmin/user_upload/documents/pdf/irest_2011/Irest_Flyer_310111.pdf.
Reading speed in the International Reading Speed Texts by native Portuguese readers[EB/OL]. [2020-08-03].http://repositorium.sdum.uminho.pt/bitstream/1822/4209
9/1/Macedo_et_al_eaoo_2013_final.pdf.