姜洪偉,唐 鑫(上海理工大學出版印刷與藝術設計學院)
在互聯(lián)網(wǎng)技術迅速發(fā)展的大背景下,小學生開始頻繁接觸電腦、手機、平板電腦等數(shù)字閱讀設備,一方面小學生急于體驗數(shù)字閱讀,渴求探索網(wǎng)絡世界,另一方面家長和老師持審慎或者傾向于禁止的態(tài)度。目前,我們對該領域的研究嚴重匱乏,從家庭教育到國家教育政策均處于探索階段。
“數(shù)字閱讀”包括“在線閱讀”和“離線閱讀”兩種類型,在線閱讀指“使用數(shù)字設備、必須接入互聯(lián)網(wǎng)才能進行的數(shù)字內容閱讀”,離線閱讀指“使用數(shù)字設備、離線狀態(tài)下能夠進行的數(shù)字內容閱讀?!保?]在線閱讀具有動態(tài)的、交互的特征,其文本因為常常包含彈窗、下拉條、選項卡、導航條、信息圖形、檢索命令、超鏈接等形式,不能直接轉化為版式相同的紙質文本,只能在互聯(lián)網(wǎng)上進行閱讀。而離線閱讀的文本,則單純地將紙質文本數(shù)字化,與紙質文本之間可以相互轉化,二者除了載體形式的不同,其他基本無差異。
國外的研究已經(jīng)發(fā)現(xiàn),學生的在線閱讀能力與紙質文本閱讀能力存在差異。Donald J,Leu教授與他人合作開發(fā)了在線閱讀理解的評估系統(tǒng),要求康涅狄格州的部分七年級學生從博客下載一份文件,并按要求搜索網(wǎng)絡,最終發(fā)布一條新的博客內容來傳達他們在網(wǎng)頁閱讀中的發(fā)現(xiàn)。研究結果表明,學生在美國國家評估中取得的紙質文本讀寫能力和在線文本閱讀能力并沒有統(tǒng)計學上的相關性。[2]由此可見,在線閱讀是一種獨立的閱讀能力。
基于上述認知,針對小學四年級學生的PIRLS于2016年第一次將在線閱讀引入測評體系,設計了一套獨立的題目,稱為ePIRLS。
“國際閱讀素養(yǎng)進展研究”(ProgressinInternational Reading Literacy Study,簡稱PIRLS)是一項針對9-10歲四年級學生的全球性閱讀素養(yǎng)研究項目,每隔五年舉行一次,以此來了解各國(地區(qū))學生閱讀素養(yǎng)的進展情況,并為教育政策制定者和研究者提供依據(jù)。2016開展的第四次PIRLS測評,包括PIRLS、PIRLS讀寫、ePIRLS三個獨立的部分。其中,ePIRLS是第一次正式推出的基于互聯(lián)網(wǎng)環(huán)境的信息性文本在線閱讀測評,它通過模擬的互聯(lián)網(wǎng)環(huán)境呈現(xiàn)給學生類似真實的學習情境,旨在評價學生使用網(wǎng)絡媒體進行數(shù)字閱讀的能力。其所發(fā)布的測評報告全名為“ePIRLS2016 InternationalResultsinOnlineInfermationalReading”,突出了文本的“在線”和“信息”屬性,[3]包括中國臺北在內的14個國家和地區(qū)參與了本次測評。
ePIRLS評估任務包括兩個部分。第一部分為在線閱讀能力測試,它通過計算機提供網(wǎng)頁、信息圖形、動畫、多個選項卡、彈窗等多種形式,以及指導學生完成研究任務的說明。第二部分為閱讀習慣和影響因素的調研,包括對學校、家長、老師等的調查,了解數(shù)字閱讀習慣的形成和指導。
目前,我國對離線數(shù)字閱讀的關注較多,而對在線閱讀研究較少。不少研究者認為,離線閱讀與紙質閱讀相比,二者并沒有顯著差異。王愛平等認為“閱讀材料的不同呈現(xiàn)方式對兒童閱讀理解無顯著影響”;[4]姜洪偉等認為“介質不是影響閱讀能力的根本原因,紙書與交互式電子書對兒童閱讀能力的影響沒有明顯區(qū)別”。[5]那么在線閱讀是否情況相同呢?
本研究目的:一是將ePIRLS在線閱讀測評的理念、方法、樣貌引入,以引起對“在線閱讀能力”這一“新生事物”的重視;二是測評我國9歲兒童在線閱讀的水平,了解當前的真實狀態(tài),以期為這一閱讀模式提供實踐經(jīng)驗。
筆者仿照ePIRLS2016的測評體系,將其公布的兩個測試任務全部翻譯,制作了中文版的測試系統(tǒng),并選取河南地區(qū)某校小學四年級兒童為樣本,評估其在線閱讀能力。該類型的測試在我國大陸地區(qū)尚屬首次。與ePIRLS測評的內容相同,本研究包括兩個部分:在線閱讀能力測評、數(shù)字閱讀習慣和影響因素調查。本文為第一部分“能力測評”的研究成果。
ePIRLS2016創(chuàng)造出一個封閉的、富有吸引力的網(wǎng)絡環(huán)境,讓學生在線完成一系列與自然科學或社會科學有關的探究性學習任務。每個文本任務40分鐘,學生需要瀏覽三個不同網(wǎng)址上的5-10個網(wǎng)頁,文本大約1,000字,每個網(wǎng)頁上都有不同的文本和圖像呈現(xiàn),包括網(wǎng)站導航、鏈接、彈窗等途徑。
在測試界面中,虛擬教師引導學生完成整個測試任務,回答有關問題。盡管數(shù)字閱讀需要導航技能和策略,但是ePIRLS測評的是學生的閱讀理解能力,而非導航技能和策略。整個測試過程中,虛擬教師引導學生進入特定網(wǎng)站;如果學生在定位個別網(wǎng)頁方面存在困難,虛擬教師也會給出指導。
ePIRLS 2016設計了五個測試任務,目前只公布了其中兩個:(《第一位女醫(yī)生》),分別涉及自然科學與社會科學。測評方式具有如下特點:整個測試必須置于在線狀態(tài)下才能完成,離開網(wǎng)絡無法進行。所有測試內容是動態(tài)進行的,無法將其放置于一個靜態(tài)的網(wǎng)頁,而是由各種鏈接、彈窗、下拉條、檢索、選擇等多個頁面組合而成。每道題目相關的內容也只有一次閱讀機會,答完即進入下一題,很符合互聯(lián)網(wǎng)信息性閱讀的特點。測試頁面上,左側為閱讀內容,右側為題目(見圖 1)。
圖1 《火星》測試網(wǎng)頁(英文版)
根據(jù)英文網(wǎng)頁,筆者全文翻譯了ePIRLS 2016已經(jīng)公布的兩個任務,重新在網(wǎng)絡平臺上開發(fā)制作了中文版測試系統(tǒng)。[6]在個別表達上,結合我國語言文化進行了適當?shù)谋就粱薷摹H绲诙弊g為“伊麗莎白·布萊克威爾”,為了易于接受,我們修改為《第一位女醫(yī)生》。《火星》為自然科學類文本,包含20道題目;《第一位女醫(yī)生》為社會科學類文本,包含17道題目。
系統(tǒng)分為兩個板塊,左邊為文本展示區(qū),包括利用互聯(lián)網(wǎng)瀏覽信息時需要出現(xiàn)的網(wǎng)頁、文字、圖片、動畫、鏈接、選項卡、導航條、彈窗等元素;右邊為題目展示區(qū),學生根據(jù)答題導引語的提示進行操作,根據(jù)左邊文本展示區(qū)的信息回答問題,每答完一題點擊“保存”按鈕,就會自動切換到下一題及其相對應的網(wǎng)頁,已經(jīng)答完的題目變?yōu)榛疑n}目樣貌如圖2所示,當進入第6題的回答,第5題反灰。
圖2 中文版測試題目樣例
完成所有的題目以后,可以回看檢查自己的答案并進行修改,修改過后再次點擊保存即可;確定所有答案無誤以后,點擊“注銷”按鈕,網(wǎng)頁跳轉到參考答案,學生可以進行一個參考,最后點擊“提交”按鈕,該場測試就完成了。
雖然借用了ePIRLS的測評理念和題目,但對測評結果的計分與評價,則使用了筆者自己的方法。
ePIRLS 2016所采用的成績統(tǒng)計方法相當復雜。它沒有對每一道題給定一個明確的分值并通過相加求總分,而是將所有學生的測試成績放在一起統(tǒng)計,得到一個綜合分數(shù),再根據(jù)這個分數(shù)給出每道題的相對分值,據(jù)此衡量每一道題的題目難度和每個學生的水平。即題目難度和學生水平,都是在統(tǒng)計測試結果之后所給出的相對數(shù)值。最后,結合不同國家和地區(qū)各自的發(fā)展水平以及學生的認知能力,得出一個最終成績。
ePIRLS將學生的在線閱讀水平劃分為四個基準,由低到高依次為“低級、中級、高級、先進”。當學生閱讀和瀏覽相對復雜的在線文本時,應具備的閱讀能力如表1所示。
表1 ePIRLS在線閱讀水平的國際基準
其中,400分表示達到了“低級”基準,475分表示達到“中級”基準,依此類推。然后,將所有的測試題目都給定一個難度值,這個值也用上述“400、475、550、625”這4個基準來表示。這樣,根據(jù)學生答題情況來判斷其閱讀水平屬于哪一個等級。
本研究作為獨立的小范圍測驗,無法直接套用ePIRLS的測評標準,也無法直接與國際水平進行對比。筆者經(jīng)過反復思考,采用如下兩種方法進行測評。① 按照ePIRLS公布的題目難度,將《火星》和《第一位女醫(yī)生》這兩篇的所有題目按照其難度賦予一個分值,再根據(jù)分值計算學生得分?!痘鹦恰饭?0道題目,每題5分,滿分100分;《第一位女醫(yī)生》共17道題目,滿分也為100分,其中13、15、16、17題的答案要點較多,其分值分別定為7分、8分、10分和10分,其余題目均為5分。② 根據(jù)題目難度和答題情況與國際基準進行對比?!痘鹦恰泛汀兜谝晃慌t(yī)生》這兩場測試的所有題目,其難度值如表2。
本研究分別統(tǒng)計受試學生在每一個等級內的答題情況,以此推斷學生的在線閱讀能力是否能夠達到該等級水平。如學生A能夠完全答對《火星》中的第2題、第5題和第9題,就以此推斷學生A能夠達到信息性文本閱讀的“低級國際標準”。如果能答對6題、7題、13題、18題、20題中的全部題目,則認為其達到了“先進國際基準”。
表2 兩篇測試的題目難度劃分
(1)樣本選取。本研究選取河南省信陽市一所公立小學四年級兒童為研究對象,選取四個班級共239名學生為樣本。
(2)使用設備。該小學擁有兩個計算機教室,共130臺計算機,每個學生獨立使用一臺計算機。研究者提前在所有計算機里統(tǒng)一輸入系統(tǒng)網(wǎng)址,然后利用電子白板向學生演示做題方法,講解注意事項。
(3)測驗過程。受試學生準備好以后,點擊測試系統(tǒng)首頁的“開始”按鈕即可進入答題模式,每個學生每次測試為40分鐘只要學生開始做題,測試系統(tǒng)會自動計算時間,學生必須在40分鐘內完成題目;如果完不成,系統(tǒng)也會提示時間到,學生無法繼續(xù)答題。,兩場測試之間休息10分鐘。測試完成后需要填寫一個調查問卷,大約需3-5分鐘,提交以后即可完成所有測試。每位參與測試的學生都會得到一份獎品,以獎勵他們配合測試和調查。
測試完成以后,將學生的測試成績和問卷調查數(shù)據(jù)錄入Excel表格和SPSS系統(tǒng)進行對比分析,得出相關結論。為了更好地理解本次測評成績,在盡可能使用國際指標的基礎上,也選取了學生平時語文成績、以及國內其他比較可靠的在線閱讀成績進行對比。
兩場參評學生均為239人,有效試卷239份,無效0份。兩篇滿分均為100分。第一場測評為《火星》,屬于自然科學類的文本,主要考察學生利用互聯(lián)網(wǎng)獲取科學知識、檢索和理解信息的能力。平均得分為42.87分,最高得分為83分,最低為0分。第二場測評為《第一位女醫(yī)生》,屬于社會科學類文本,主要考察學生利用互聯(lián)網(wǎng)獲取社科類信息及整合闡釋、反思評價的能力。本場測評滿分100,最高分91分,最低分0分,平均分32.8分(見表3)。
表3 《火星》和《第一位女醫(yī)生》測試成績
通過分析學生在兩個不同類型測試文本上取得成績的相關性,發(fā)現(xiàn)二者為正相關分布(P=0.041),即自然科學類文本成績越高的同學,其社會科學類文本測試的成績也會更佳(見表4)。
表4 兩種測試文本相關性分析
采用前述與國際基準的對比評價方法,將學生成績劃入4個等級之中。
《火星》這篇有28.03%學生能夠達到低級國際基準,11.72%的學生能夠達到中級,1.67%的學生能夠達到高級,0.84%的學生能夠達到先進。《第一位女醫(yī)生》這篇有43.09%的學生能夠達到低級,9.62%的學生能夠達到中級,2.93%的學生能夠達到先進??偲饋砜?,未達到“低級”的人數(shù)均在50%左右。
再來對比ePIRLS測評結果:6個國家得分在550-625之間,達到高級,包括新加坡、挪威、荷蘭、瑞典、丹麥和美國。7個國家或地區(qū)在475-550之間,達到中級。另外有迪拜和阿布扎比作為城市參與測評,阿布扎比得分431分,處于低級。[3]
由于筆者所使用的評價標準與國際測評不完全相同,與其結果的對比數(shù)據(jù)也只能作為參考。然而無論如何,可以看到受試學生未能達到基本要求的比例非常高,這是一個嚴峻的事實。
根據(jù)ePIRLS的理論框架,將數(shù)字閱讀的總體理解流程具體分為提取信息、直接推論、綜合與闡釋、反思與評價等四種閱讀理解技能。其中前兩項屬于“低層次閱讀”,后兩項能力為“高層次閱讀”。研究者將本次測評按照分值和題目性質分為以上四個板塊,每個板塊的分值均為25分,以測試學生在不同理解技能上的表現(xiàn)。詳情見圖3,縱軸表示滿分為25分。
圖3 兩篇文章四種閱讀技能的平均得分
可以看出,“提取信息、直接推論”這兩項低層次閱讀技能得分略高,最高的一項為13.77分,最低為8.77分,其均分得分率大約在40%左右;高層次閱讀技能表現(xiàn)較差,最高為9.53分,最低的一項,平均分只有2.9分,得分率僅為11%。然而從相關性分析來看,二者依然呈正相關分布,即低層次閱讀能力高的學生,高層次閱讀能力也會高一些。
與ePIRLS2016的測試結果對比來看,新加坡、中國臺北、葡萄牙、格魯吉亞、阿聯(lián)酋等在“提取信息、直接推論”兩方面相對更加擅長;美國和加拿大在“綜合與闡釋、反思與評價”方面表現(xiàn)相對更佳。其他國家或地區(qū)在幾個維度上沒有太明顯的差異。[3]
孤立的測評無法說明成績如何,需要在對比中觀察才有意義,紙質閱讀成績是一個比較好的參照物??上У氖?,本次研究中因各種條件限制,沒有對受試學生的紙質閱讀能力同時進行測試。因此,筆者向語文老師了解了受試學生上學期期末考試的語文成績。
參與測試的四個班級的學生,在2017年末的語文期末考試中的平均成績?yōu)?5.82分(百分制)。其中,閱讀類題目的分數(shù)占40%左右,且閱讀成績與總分成正相關,即總分高的學生,閱讀分數(shù)也高。因此,可以視為閱讀均分得分率在85%左右,遠遠高出他們在本次在線閱讀測試中的平均得分率。
筆者能找到的有關在線閱讀的數(shù)據(jù)非常有限,針對初三學生的PISA項目的在線測試成績也是一個有意義的參照。
國際學生評估項目PISA(Program for International Student Assessment)是一項由經(jīng)濟合作與發(fā)展組織統(tǒng)籌的學生能力國際評估計劃,主要對接近完成基礎教育的15歲學生進行評估,測試學生們能否掌握參與社會所需要的知識與技能。PISA評估于2000年首次舉辦,此后每3年舉行一次。評估主要分為3個領域:閱讀素養(yǎng)、數(shù)學素養(yǎng)及科學素養(yǎng),2012年首次嘗試引入了基于計算機的問題解決測試,即在線閱讀能力測試。
我國上海地區(qū)初三學生自2009年起參加PISA測試,2009年和2012年的閱讀素養(yǎng)測試都取得了世界第一名的好成績,但在2012年的在線閱讀測試中排名第六,位于新加坡、韓國、日本、中國澳門、中國香港之后。對比紙質閱讀,上海79%的學生的在線閱讀能力低于根據(jù)其紙筆測試預測的分值。[7]
本研究的測試結果表明,河南地區(qū)四年級兒童與PISA測試的初三學生存在共同點,可謂遙相呼應,即其在線閱讀能力都低于紙質閱讀能力,存在較大差距。不同之處在于:河南地區(qū)兒童在線閱讀能力與語文成績的差距更大,其數(shù)字閱讀水平可以用極其薄弱來形容;上海地區(qū)的差距相對要小一些。究其原因,一是年齡差異,四年級兒童數(shù)字接觸相對較少,遠不如初三學生接觸時間多;二是區(qū)域經(jīng)濟發(fā)展和教育水平差距所造成的差異。
(1)被試兒童在線閱讀能力與國際水平相比,還存在相當大的差距。
(2)與其語文考試成績相比,被試兒童的在線閱讀能力與紙質閱讀能力之間同樣存在很大的差距。參照中國學生PISA測試的在線閱讀成績來看,“低于紙質閱讀能力”具有普遍性。
(3)從四種閱讀技能來看,學生在低層次的“提取信息、直接推論”兩方面得分略高,在高層次閱讀技能“綜合與闡釋、反思與評價”方面表現(xiàn)很差。但二者呈正相關分布,即前者成績好的學生,后者的表現(xiàn)也會稍好一些。
(1)應當正視學生需要在線閱讀這一事實,并注意培養(yǎng)學生的在線閱讀能力。無論河南的小學生,還是上海的初中生,其在線成績都低于紙質閱讀,這充分說明教育環(huán)境的作用,即國內還沒有認識到這是一種獨立的能力,也不清楚該能力需要專門培養(yǎng)。僅憑計算機素養(yǎng)課或者學生自己探索來學習,存在差距是必然的。雖然該地區(qū)學生平時使用數(shù)字設備的頻率不低,學生也比較喜歡數(shù)字閱讀這種方式,但因在家庭和學校中沒有得到相應的指導和訓練,其數(shù)字閱讀能力發(fā)展緩慢。會上網(wǎng)不等于能夠“迅速、準確地”獲取信息,并給予正確的理解。因此,應正視學生需要在線閱讀這一事實,制訂合理的教育計劃,培養(yǎng)學生的在線閱讀能力。
(2)應當尋找在線閱讀與紙質閱讀成績差異顯著的原因。不少研究者認為,離線閱讀能力與紙質閱讀并沒有顯著差異。那么同為數(shù)字閱讀,究竟是哪些因素造成了學生在線閱讀能力的低下?與紙質閱讀、離線閱讀相比,它在形式和內容上有什么特殊性?
(3)應當擴大在線閱讀測評的范圍。通過對不同地區(qū)、不同層次的抽樣測評,逐步將數(shù)字閱讀測評方式合理化、本土化,探索適合中文閱讀測試的發(fā)展道路。限于團隊能力,本次研究只在一個小學進行,以后將會陸續(xù)在不同城市的小學展開。同時,也希望有更多學界和教育界同仁對此多加關注。
(4)應當自主開發(fā)中文版的在線閱讀測評系統(tǒng)。翻譯的內容,在專有名詞和一些句法上對我國學生估計會構成理解障礙。如外國人名的表達,《第一位女醫(yī)生》中主人公名字為“伊麗莎白·布萊克威爾”,對于我國小學生來說,平時學習和課外閱讀中接觸外國文學較少,對音譯的外國人名會感到難以記憶。在題目中,研究者盡可能多地使用“伊麗莎白”指代主人公,盡力避免音譯姓名給學生閱讀造成的負面影響。再如外國地名?!兜谝晃慌t(yī)生》中出現(xiàn)了紐約、法國、日內瓦等國家和城市的名字,如果受試學生不熟悉這些地名,在閱讀過程中就需要更多的時間來思考和反應。從實踐中反思,我國教育界應該盡快自主開發(fā)小學四年級學生的數(shù)字閱讀測試系統(tǒng),結合本土化的社會習俗和中文表達習慣設計測試題目,以便更加客觀地測評我國小學生的數(shù)字閱讀素養(yǎng)水平。
(5)應當學習PIRLS閱讀測評體系的科學性。該項目的整個理論架構、測試流程、評價方法,都體現(xiàn)出科學、嚴謹、細致的特點。其理論基礎建立在對9歲兒童心智發(fā)育與閱讀能力發(fā)展的分級評價,測試材料的認知水平與語言難度均符合該年齡段的水平。在“評價標準”的制定上,根據(jù)所有學生的數(shù)據(jù)來劃定4個基準,以此衡量每個學生的相對位置。再如一份對“方法與流程”的說明長達508頁,注重細節(jié)的準確與完善。通過這次研究,筆者閱讀了大量資料,也有個別細節(jié)還沒完全弄明白。
總的來說,本次測評既是對我國小學生在線閱讀水平的一次觀察,就測評過程來說也是一次學習,從對ePIRLS命題思想和評價方法的理解,到學生成績和教育環(huán)境,都有著深刻的啟發(fā)與思索。