記者|張競艷
在從經(jīng)驗走向科學的道路上,兒童分級閱讀文本難度測評系統(tǒng)的發(fā)布標志著中國兒童分級閱讀探索邁出突破性一步。
如何判斷一本兒童讀物的文本難度適合哪個年齡段的孩子閱讀?很長的時間里,我們主要依靠專家的經(jīng)驗判斷。“分級閱讀的本質(zhì)是閱讀的科學化。”作為先行者和探路人,人民教育出版社編審、兒童閱讀專家王林這些年一直致力于中文分級閱讀科學化的探索研究。近期,人民教育出版社王林團隊和北京大學計算機科學系吳云芳團隊聯(lián)合發(fā)布項目階段性成果——兒童分級閱讀文本難度測評系統(tǒng)(網(wǎng)址http://www.chinese-pku.com)?!斑@個系統(tǒng)采取了‘大型兒童語料庫+神經(jīng)網(wǎng)絡(luò)模型’的先進技術(shù)路線,可以幫助用戶較為科學地測評一本書、一篇文章的文本難度和適讀年齡段。”王林說。
在從經(jīng)驗走向科學的道路上,兒童分級閱讀文本難度測評系統(tǒng)的發(fā)布標志著中國兒童分級閱讀探索邁出突破性一步。
“分級閱讀并不是一個新鮮的話題,我國很早就開始了兒童閱讀的適應(yīng)性研究,但中文分級閱讀的概念被大家所熟知和討論,也就是近15 年的時間。”博士畢業(yè)后,王林一直致力于兒童閱讀推廣。他很早就意識到,中國缺乏像國外的藍思、A-Z 那樣成熟的分級閱讀體系,科學的中文分級閱讀需要語言學、教育學、圖書館學、兒童心理學、兒童文學、計算機科學等跨學科的合作?!拔倚哪恐械姆旨夐喿x一定是科研先行,不是理念先行。”在他看來,分級閱讀本質(zhì)上是閱讀的科學化,要去主觀意志,不能僅憑專家判定。“專家判定有兩個問題:一是不能去主觀意志,二是無法實現(xiàn)大規(guī)模的自動測評?!?/p>
早在2008 年和2009 年,王林曾連續(xù)籌辦過兩屆接力出版社主辦的“中國兒童分級閱讀論壇”。“我們當時想通過征集論文帶動學界研究,從中發(fā)現(xiàn)一些人才,讓中文分級閱讀在學界真正熱起來。但征集到的論文很少,水平也不是很高?!睂W術(shù)上難以突破,科學研究的技術(shù)條件也不成熟,“中國兒童分級閱讀論壇”沒有繼續(xù)舉辦。兒童分級閱讀從此成為王林一個未了的心愿。
此后,在人教社從事語文教材編寫的過程中,王林注意到,同一篇課文在不同版本的教材里被放在了不同年級,比如馮驥才的《珍珠鳥》,有時在五年級,有時在七年級、八年級?!爱斎贿@可能是因為教學重點、學生學習程度有所不同,但是從字詞句的難度、主題難度等來分析,一篇課文是否能大致錨定某個年級?”王林對此有些困惑,而他在做教材培訓時發(fā)現(xiàn)一線教師有同樣的疑問。在進行語文教育研究時王林也遇到了類似的困惑:語文試卷上的閱讀文章難度是否真的適合孩子?“我問過很多出卷的教研員、老師,他們也多是憑經(jīng)驗,而不是從字詞句的難度來分析。”
“國外所有兒童閱讀的研究最后都要觸及分級閱讀?!蔽戳说男脑负臀唇獾睦Щ?,引領(lǐng)著王林繼續(xù)踏上中文分級閱讀的研究之路。
因緣際會,2017 年王林從云南掛職回到人教社后,成功申報了一個專項資金項目。項目獲批后,王林先后邀請了很多海內(nèi)外專家進行研討交流,也做了一系列市場調(diào)研,最后決定和北京大學計算機科學系吳云芳團隊合作,建構(gòu)兒童分級閱讀體系,其基本的技術(shù)路線就是“大型兒童語料庫+神經(jīng)網(wǎng)絡(luò)模型”。據(jù)王林介紹,整個分級閱讀系統(tǒng)主要包括文本閱讀難度分級和個體的閱讀能力測評,他們已經(jīng)開展的項目主要關(guān)注文本閱讀難度的分級,通過不斷優(yōu)化算法,其自動測評文本難度的準確率達到了80%以上。目前,系統(tǒng)供所有用戶免費使用。
值得一提的是,項目組構(gòu)建了一個大規(guī)模的漢語分級語料庫,總字數(shù)規(guī)模達到3553 余萬字,包括學校教材語料庫、兒童圖書語料庫和輔助閱讀語料庫。學校教材語料庫搜集了國內(nèi)外各個不同出版社的中小學語文教材文本,并進行了比較仔細的錄入和核對。兒童圖書語料庫搜集了大約400 本經(jīng)典的廣泛閱讀的圖書,像《100萬只貓》《神奇校車》和《愛的教育》等中外名著,主要是根據(jù)2020 年教育部基礎(chǔ)教育課程教材發(fā)展中心發(fā)布的《中小學生閱讀指導目錄》,同時追加了《愛閱小學圖書館基本配備書目2018 版》中的童書。輔助閱讀語料庫通過搜集整理、人工錄入的方式采集了中小學課外輔助讀物作為分級語料的補充,包括人教社出版的輔助閱讀材料,如“課文作家作品”書系、中小學課外讀物、小學分年級閱讀題。這是一個很有價值的基礎(chǔ)資源部分,可以用于分級閱讀的研究,也可以用于語言學、教學的研究等。
項目組在四年多的時間里,主要做的工作除了分級語料庫的構(gòu)建,還有專家標注、分級詞表的研制、分級語料庫的基礎(chǔ)資源建設(shè)、基于傳統(tǒng)的機器學習文本難度分級方法、神經(jīng)網(wǎng)絡(luò)模型的文本難度分級方法和系統(tǒng)的網(wǎng)站開發(fā)。
北京大學、北京信息科技大學和北京語言大學的專家學者一致認為:兒童分級閱讀文本難度測評系統(tǒng)采取“大型語料庫+神經(jīng)網(wǎng)絡(luò)模型”的技術(shù)路線科學合理,目標是“閱讀的科學化”,超越了人工經(jīng)驗評定文本難度的傳統(tǒng)方式。不同于以往描述式的靜態(tài)的閱讀分級標準,分級系統(tǒng)能有效測定一篇文章和學生讀物的難度級別。該文本難度分級系統(tǒng)借助大數(shù)據(jù)和AI 技術(shù),可廣泛運用于考試閱讀試題文本難度、少兒閱讀童書難度的自動測評,并進一步匹配兒童閱讀能力,助力全民閱讀,提升兒童閱讀素養(yǎng)。
作為項目的出版成果,王林主編的“兒童分級閱讀書系”已經(jīng)上市。這套書系主要面向3 ~6 歲的孩子,共分10 級,目前已推出1 ~3 級。
分級讀物已經(jīng)被證明,對孩子早期的閱讀和識字很有幫助。王林指出,過去的分級讀本大多是基于經(jīng)驗層面,缺乏科學性。真正實用的兒童分級閱讀書系是什么樣的呢?一是強調(diào)科學性。人教版“兒童分級閱讀書系”基于科學的分級閱讀體系,選字精準,難度適宜。二是注重美觀性。人教版“兒童分級閱讀書系”邀請了中韓畫家參與創(chuàng)作,插圖精美,采用平裝本圖畫書形式,讓更多的家長能帶著孩子享受圖畫書的美。三是發(fā)揮指導性。人教版“兒童分級閱讀書系”設(shè)計了很多教學和游戲活動,和幼兒教育的五大領(lǐng)域密切相關(guān),通過閱讀策略的早期滲透,指導家長開展具有教育意義的親子共讀。人教社還特別制作閱讀指導手冊,并開發(fā)了帶有實景聲效的配套音頻,幫助家長更好地理解和使用分級讀物,更有效地幫助孩子閱讀、識字。
從市場情況來看,中文分級閱讀一度成為資本的風口。在項目初期的調(diào)查階段,王林拜訪了一些主打中文分級閱讀產(chǎn)品的企業(yè)后意識到,無論是閱讀還是教育行業(yè)都不能由資本來推動或催熟?!百Y本愿意來投這個領(lǐng)域一定是看到了它的市場。資本沒有惡意,但我的確看到了我所擔心的事情——對兒童閱讀市場的過度催熟。如果把由素質(zhì)教育出發(fā)倡導的理念變成應(yīng)試教育的工具和養(yǎng)料,變成加害童年的工具,這就違背了做這件事的初衷——為孩子匹配適合他年齡和閱讀認知能力的好書,不要做教育的加害者。”“雙減”政策出臺后,王林更加堅定了自己的判斷。
有人認為,中文分級閱讀正迎來一個爆發(fā)期。王林則表示,“我不愿用成熟、爆發(fā)這樣的詞匯來形容,這些詞在2009 年也用過。在我看來,中文分級閱讀的研究和出版都在路上,都還是進行時”。王林表示,未來團隊會進一步完善技術(shù)手段,提高測評的便捷度和準確率。他希望,兒童分級閱讀文本難度測評系統(tǒng)未來能幫助到更多的出版機構(gòu)和教育機構(gòu),推動中文分級閱讀繼續(xù)前行?!?/p>