王 敏,王曉明
(教育部 語言文字應(yīng)用研究所漢字與漢語拼音研究室,北京市 100010)
《漢語水平詞匯與漢字等級(jí)大綱》字表的收字分級(jí)考察例析
王 敏,王曉明
(教育部 語言文字應(yīng)用研究所漢字與漢語拼音研究室,北京市 100010)
選擇《漢語水平詞匯與漢字等級(jí)大綱》甲級(jí)字與現(xiàn)行國家漢字規(guī)范《現(xiàn)代常用獨(dú)體字規(guī)范》以及三個(gè)語料庫的字頻統(tǒng)計(jì)結(jié)果進(jìn)行對(duì)比,通過對(duì)數(shù)據(jù)資料的細(xì)致分析,對(duì)《大綱》甲級(jí)字收字提出了具體的建議。①乙級(jí)字1994年修訂本實(shí)際有804字。據(jù)劉英林 宋紹周《漢語水平詞匯與漢字等級(jí)大綱·論漢語教學(xué)字詞的統(tǒng)計(jì)與分級(jí)(代序)》,經(jīng)濟(jì)科學(xué)出版社,2001年6月,27-28頁。《大綱》選字分級(jí)應(yīng)優(yōu)先選擇對(duì)于理解漢字構(gòu)字規(guī)律有益的獨(dú)體字和構(gòu)詞能力強(qiáng)、有利于詞匯學(xué)習(xí)的漢字。②國家組織研制的漢字規(guī)范標(biāo)準(zhǔn),通常經(jīng)過較長期的研究醞釀,具有較高的可信度,對(duì)漢字應(yīng)用具有很高的指導(dǎo)意義。③《大綱》作為漢語教學(xué)的指導(dǎo)性規(guī)范,其字表首先應(yīng)強(qiáng)調(diào)基礎(chǔ)性、通用性、廣泛適用性,在最基礎(chǔ)、最核心的甲級(jí)字的選擇上尤其如此。
《漢語水平詞匯與漢字等級(jí)大綱》;甲級(jí)字;漢字規(guī)范標(biāo)準(zhǔn);教材用字
《漢語水平詞匯與漢字等級(jí)大綱》(以下簡稱《大綱》)定位為規(guī)范性的水平大綱,是我國初、中、高等漢語水平考試的主要依據(jù),主要適用于對(duì)外漢語教學(xué)領(lǐng)域的教學(xué)設(shè)計(jì)、教材編寫和成績測試,也可作為少數(shù)民族漢語教學(xué)和中小學(xué)語文教學(xué)的參考,和編制漢語水平四級(jí)通用字典等辭書的框架范圍。
《大綱》的字表部分在研制過程中主要依據(jù)現(xiàn)行國家漢字規(guī)范《現(xiàn)代漢語通用字表》,根據(jù)需要進(jìn)行了一定調(diào)整,“規(guī)定對(duì)外漢語教學(xué)漢字學(xué)習(xí)的總量,對(duì)這種總量進(jìn)行階段性分級(jí)”。特別要提出的是字表收字有針對(duì)性地依據(jù)詞表部分的用字進(jìn)行了調(diào)整,將字表的分級(jí)“與詞匯分級(jí)相銜接、相協(xié)調(diào)”,以求“常用詞和常用字之間要逐步建立一種科學(xué)的有機(jī)的聯(lián)系”[1]27-28。
《大綱》1992年出版后,于1994年至2001年間曾進(jìn)行修訂,但修訂主要針對(duì)詞表部分,在“修訂說明”中未提及字表部分。2009年,《大綱》的再次修訂已經(jīng)啟動(dòng)。本文希望通過對(duì)《大綱》的字表收字和分級(jí)狀況進(jìn)行考察,與現(xiàn)行國家漢字規(guī)范(如《現(xiàn)代漢語常用字表》《現(xiàn)代常用獨(dú)體字規(guī)范》),和通行的小學(xué)語文教材用字字頻統(tǒng)計(jì)結(jié)果分別進(jìn)行對(duì)比研究提供一個(gè)思考角度,以便《大綱》在修訂中更好地實(shí)現(xiàn)收字的合理性。
《大綱》收字共分為四個(gè)級(jí)別。甲級(jí)字800,乙級(jí)字804,丙級(jí)字601,丁級(jí)字700,分別對(duì)應(yīng)四個(gè)等級(jí)的詞匯表[1]17,共計(jì)2 905字。
據(jù)《大綱》代序《論漢語教學(xué)字詞的統(tǒng)計(jì)與分級(jí)》關(guān)于漢字部分的內(nèi)容,以上分級(jí)和收字的指導(dǎo)原則主要有三條。一,漢字的總量與分級(jí)以相對(duì)應(yīng)的詞匯總量與分級(jí)為基礎(chǔ)和必要條件;二,分級(jí)過程中主要參考《現(xiàn)代漢語常用字表》中的2 500字和1 000次常用字;三,分級(jí)過程中,定性與定量結(jié)合,在一定范圍內(nèi)進(jìn)行必要的“定向性聯(lián)想添加”?!岸ㄏ蛐月?lián)想”是《大綱》詞匯表制定的原則之一,目的是為了彌補(bǔ)詞頻和使用度統(tǒng)計(jì)的缺漏和偏差。舉例來說,比如“主題聯(lián)想”,有常用食品(面包),也就應(yīng)有常用飲料(汽水);“類聚聯(lián)想”“橘子、香蕉常買,梨、蘋果也常吃”[1]17,等等。
在字表的制定中,研制者不是完全依據(jù)字頻資料,而是運(yùn)用定性和定量結(jié)合,進(jìn)行必要的調(diào)整。調(diào)整的方法是“在源于詞匯分級(jí)的基礎(chǔ)上,主要參照《現(xiàn)代漢語常用字表》中的2 500常用字,對(duì)常用詞表進(jìn)行一定范圍內(nèi)的專家干預(yù),干預(yù)目的既要增補(bǔ)一定數(shù)量的常用詞,又要擴(kuò)充這些常用詞中所含的常用字種”。經(jīng)過反復(fù)篩選、協(xié)調(diào),最終結(jié)果達(dá)到“甲、乙級(jí)常用字(共1 600)字種要含全部一級(jí)常用字(1 000字種),多出的600左右,基本上應(yīng)在二級(jí)字范圍內(nèi)。甲、乙、丙、丁4級(jí)常用字(2 900)要含一、二級(jí)常用字(2 500),多出的400,多數(shù)應(yīng)在三級(jí)次常用字范圍內(nèi)”,允許含個(gè)別3 500常用字以外的字[1]26。
研制者的報(bào)告體現(xiàn)出,《大綱》的字表尊重了當(dāng)時(shí)已有的主要依據(jù)漢字頻度統(tǒng)計(jì)成果而研制的《現(xiàn)代漢語常用字表》,并且作為對(duì)外漢語教學(xué)和漢語水平測試的指導(dǎo)規(guī)范,也體現(xiàn)了語言學(xué)習(xí)以詞匯為基礎(chǔ)的理念。本文對(duì)《大綱字表》的考察,也將以字頻統(tǒng)計(jì)和構(gòu)詞能力等作為主要衡量指標(biāo)。
漢語作為母語的教學(xué),要求在基礎(chǔ)教育階段完成3 500常用字的教學(xué),其中小學(xué)階段要求掌握2 500常用字。與《大綱》的要求相比照,母語教學(xué)的小學(xué)階段字量大體與漢語作為第二語言的中級(jí)水平相當(dāng)。通過比較漢語在分別作為母語和第二語言的教學(xué)和測試中用字的要求與實(shí)現(xiàn)情況,對(duì)理解目前《大綱》的字表收字分級(jí)是否恰當(dāng)不無意義。
經(jīng)過具體比對(duì),我們認(rèn)為,漢字在母語教學(xué)和對(duì)外漢語教學(xué)中的選字差異,主要集中在前800字,也就是《大綱》甲級(jí)字的范圍。這也是我們選擇甲級(jí)字為例的重要原因。
本文選擇了兩種比較通行的小學(xué)語文教材進(jìn)行用字頻度統(tǒng)計(jì),分別由語文出版社和人民教育出版社2003年出版(以下簡稱語文社用字和人教社用字)。以此作為參照,按照頻度選取與《大綱》甲乙兩級(jí)對(duì)應(yīng)的兩個(gè)段,即頻度排序前800和前1 604的字,與《大綱》收字進(jìn)行對(duì)比。
甲級(jí)字與語文社用字字頻統(tǒng)計(jì)前800字不同的有244字,與人教社用字統(tǒng)計(jì)前800字不同的有236字。
當(dāng)我們將比較范圍擴(kuò)大到甲乙兩級(jí)字,對(duì)比的范圍也擴(kuò)大到教材用字頻度統(tǒng)計(jì)1 604字,與語文社用字的差異字有346字,與人教社用字的差異字有316字??紤]到總字量的增加幅度是從800到1 604,增長率超過50%,而甲級(jí)字與兩社用字的差異字的增長率均低于總字量的增長比例。語文社例中,增加幅度是244到346,增加102字;人教社例中,增加幅度是236到316字,增加80字。因此,我們認(rèn)為,差異字主要還是集中在甲級(jí)字與教材用字前800字的段上。
根據(jù)各類語料庫的字頻統(tǒng)計(jì),頻度最高的800漢字左右是基礎(chǔ)漢語水平的識(shí)字范圍。這些字可以滿足人類認(rèn)知世界的一般習(xí)慣和人類的一般知識(shí)系統(tǒng)所需[2-3]??紤]到這一范圍的字是常用度最高的字種,是基礎(chǔ)中的基礎(chǔ),目前《大綱》的甲級(jí)字與小學(xué)語文教材的最常用字之間的差異也最大,選擇這一范圍的字進(jìn)行討論,對(duì)于理解《大綱》收字的合理性較為適合。
為更好地分析甲級(jí)字收字,并進(jìn)一步提出優(yōu)化的可能方案,我們豐富了對(duì)比的參照系。從漢字的覆蓋率、構(gòu)詞能力,以及國家漢字規(guī)范標(biāo)準(zhǔn)——語言文字研究成果在國家文字規(guī)范中的體現(xiàn),多方位考察甲級(jí)字優(yōu)化的可能性。具體來說,我們采用了國家語委平衡語料庫的頻度統(tǒng)計(jì)排序、《漢語水平詞匯與漢字等級(jí)大綱(詞表)》(以下簡稱《大綱詞表》)用字的頻度統(tǒng)計(jì)排序和《現(xiàn)代常用獨(dú)體字規(guī)范》(以下簡稱《獨(dú)體字規(guī)范》)作為主要標(biāo)桿。
國家語委現(xiàn)代漢語通用平衡語料庫的選材全面涵蓋人文社會(huì)科學(xué)、自然科學(xué)和行政文書等其他門類的現(xiàn)代漢語語料,選取1919年以來的各類書面資料,至今仍在不斷補(bǔ)充,累計(jì)達(dá)到1億字符數(shù)[3]。平衡語料庫字頻統(tǒng)計(jì)的排序,體現(xiàn)的是該字在大規(guī)模的書面語料中出現(xiàn)的次數(shù),代表廣泛的社會(huì)領(lǐng)域用字考察 ;《大綱》詞表用字的頻度統(tǒng)計(jì)排序,體現(xiàn)的是該字的構(gòu)詞能力——優(yōu)先掌握構(gòu)詞能力強(qiáng)的漢字,對(duì)于學(xué)生的語言學(xué)習(xí)有益無害;《現(xiàn)代常用獨(dú)體字規(guī)范》列出了256個(gè)獨(dú)體字,即不能再進(jìn)行構(gòu)字分解的漢字,這些字既具有一個(gè)獨(dú)立漢字的音形義功能,又是構(gòu)建其他漢字的基本部件,若在漢語學(xué)習(xí)的基礎(chǔ)階段出現(xiàn),有利于學(xué)習(xí)掌握漢字的結(jié)構(gòu),形成漢字構(gòu)造的整體與系統(tǒng)觀念。
因本考察的目的是為甲級(jí)字的優(yōu)化提供參考,故特別注重了甲級(jí)字與兩社用字統(tǒng)計(jì)前800字的差異字。我們選取《大綱》甲級(jí)字與兩社用字統(tǒng)計(jì)前800字的差異字,分別與平衡語料庫字頻序前800字、《大綱詞表》字頻序前800字進(jìn)行比對(duì),分析評(píng)價(jià)這些差異字中哪些應(yīng)選入甲級(jí)字。
下表列出《大綱》甲級(jí)字與人教社用字前800字、語文社用字前800字的出入字,分別在平衡語料庫和《大綱詞表》用字的字頻序分段歸屬的情況。
表1 甲級(jí)字與兩部教材字頻統(tǒng)計(jì)前800字在平衡語料庫和《大綱詞表》字頻序中的分布
按照分段資料顯示,在兩個(gè)字頻序800字以內(nèi)的范圍,比較雙方的差距最大。兩社用字前800字超出甲級(jí)字范圍的,均有將近50%的字集中在這一段,并且均高于對(duì)照數(shù)據(jù)——即高出甲級(jí)字中不在兩社用字范圍的字?jǐn)?shù)。這就提示我們,基礎(chǔ)教材用字與大規(guī)模語料庫的常用字更為接近,基礎(chǔ)性相對(duì)更為突出,構(gòu)詞能力也稍勝,可作為甲級(jí)字修訂的選字參考。
特別要提出的是,兩社用字前800位的字,都有若干不僅不在甲級(jí)字范圍,也不在乙級(jí)字范圍,而是到了丙級(jí)。這些字中人教社用字有“伴奔華曲盛”,語文社用字有“奔華曲盛威壯”,二者的交集“奔華曲盛”,應(yīng)考慮納入甲級(jí)字。其中尤其是“華曲”二字,在兩個(gè)字頻序中均排在800以內(nèi),是特別應(yīng)該注意的。
下面以獨(dú)體字的情況為例,再析應(yīng)考慮進(jìn)入甲級(jí)字的基礎(chǔ)教材用字。
人教社用字前800字不在甲級(jí)字范圍的236字中,有30個(gè)獨(dú)體字;語文社用字前800字不在甲級(jí)字范圍的244字中,有34個(gè)獨(dú)體字。我們將這些字分別按照國家語委平衡語料庫的字頻和《大綱》詞表用字的字頻排序,篩查結(jié)果如下。
人教社用字不在甲級(jí)字范圍內(nèi)的獨(dú)體字30個(gè)字,在平衡語料庫和《大綱詞表》用字兩個(gè)字頻序中均在800以內(nèi)的,共有以下18字:“斗擊及木曲入失石士田土衛(wèi)無鄉(xiāng)象嚴(yán)由于?!?/p>
語文社用字不在甲級(jí)字范圍內(nèi)的獨(dú)體字34個(gè),在平衡語料庫和《大綱詞表》用字兩個(gè)字頻序中均在800以內(nèi)的,共有以下18字:“擊及木曲入失石士田土衛(wèi)無鄉(xiāng)象血嚴(yán)由于”。
以上兩個(gè)資料的交集共有17字,即“擊及木曲入失石士田土衛(wèi)無鄉(xiāng)象嚴(yán)由于”。這17字,以兩社用字字頻衡量,以平衡語料庫和《大綱詞表》字頻衡量,以《獨(dú)體字規(guī)范》衡量,我們認(rèn)為其常用性、基礎(chǔ)性,以及漢語漢字學(xué)習(xí)科學(xué)性都足以證明應(yīng)納入《大綱》甲級(jí)字為妥。
另外,人教社用字不在《大綱》甲級(jí)字范圍的,除以上所舉獨(dú)體字外,還有72字同時(shí)在平衡語料庫字頻序與《大綱詞表》用字頻度前800以內(nèi);語文社用字該項(xiàng)數(shù)據(jù)是76字。二者的交集為70字(保背兵并采沉程沖傳此達(dá)底斷隊(duì)格古官管光害護(hù)華激金盡景居軍類量料列林令落美密命腦皮品奇強(qiáng)沙傷射受似隨臺(tái)鐵微味溫顯線形修煙養(yǎng)引約越造戰(zhàn)爭至制終轉(zhuǎn))。這些字以常用性、基礎(chǔ)性、構(gòu)詞能力來衡量,也是甲級(jí)字收字應(yīng)重點(diǎn)考慮的。
1.教學(xué)用字的選字分級(jí)需要考慮漢字學(xué)習(xí)的科學(xué)規(guī)律。
在綜合考察用字狀況,選擇教學(xué)用字的時(shí)候,現(xiàn)有各類語料用字統(tǒng)計(jì)不可謂不多,如何在漢字應(yīng)用中借鑒使用,仍需要結(jié)合漢字學(xué)的規(guī)律,語言學(xué)習(xí)的規(guī)律,進(jìn)行細(xì)致的研究。不論對(duì)于母語學(xué)習(xí)者還是非母語學(xué)習(xí)者,漢字的學(xué)習(xí)都是一個(gè)長期的過程,尤其是對(duì)非母語學(xué)習(xí)者,一定程度上是終身性的。因此,“從這個(gè)長遠(yuǎn)目標(biāo)出發(fā),識(shí)字教學(xué)不但必須遵循漢字自身的規(guī)律,而且要使學(xué)習(xí)者在潛移默化中感受到漢字的表意特點(diǎn)、漢字的構(gòu)形規(guī)律性和漢字的系統(tǒng)性”,只有這樣,“才能在保證品質(zhì)的前提下提高速度”[4]。
2.需要強(qiáng)調(diào)國家組織研制的漢字規(guī)范標(biāo)準(zhǔn),對(duì)教學(xué)和其他漢字應(yīng)用的指導(dǎo)意義。
漢字規(guī)范標(biāo)準(zhǔn)的研制,通常經(jīng)過較長期的研究醞釀,反映漢字使用的基礎(chǔ)性要求。研制者對(duì)于該方面的漢字使用狀況、研究狀況,通常有較為全面的把握,研制結(jié)果具有較高的可信度。將這些研究成果貫徹到漢字應(yīng)用實(shí)際中,不但是執(zhí)行國家規(guī)范標(biāo)準(zhǔn)的問題,也是尊重相關(guān)科研成果的必然。
3.《大綱》收字的主要依據(jù)仍應(yīng)強(qiáng)調(diào)基礎(chǔ)性、通用性。
以漢語為第二語言的漢字教學(xué)有其自身的特點(diǎn)和學(xué)習(xí)需要,有些研究成果提出了考慮到對(duì)外漢語教材的特殊性,應(yīng)收入教材中常見的部分字。比如教材語料中的“尷、尬、侃、燉、啪、嚏、丫、瀟、忐、忑、褶、粽、醺、蹣、跚、摞”等字,在3 500常用字表和《大綱》中均未收錄,但在實(shí)際生活中卻經(jīng)常用到,因此這部分字似應(yīng)考慮收錄入《大綱》[5]。
我們認(rèn)為,雖然在具體教學(xué)中,并不排除考慮到非母語成人學(xué)習(xí)者的群體特點(diǎn),在部分字的選擇上有所調(diào)整。但《大綱》作為漢語教學(xué)的指導(dǎo)性規(guī)范,其字表收字首先還是應(yīng)強(qiáng)調(diào)基礎(chǔ)性、通用性,通用平衡語料、基礎(chǔ)教育語料的統(tǒng)計(jì)意義仍然應(yīng)優(yōu)于其他語料,在最基礎(chǔ)、最核心的甲級(jí)字的選擇上尤其如此。
補(bǔ) 記
本文是我和同事對(duì)現(xiàn)代漢字應(yīng)用狀況的系列考察之一。成文后,承蒙北京語言大學(xué)萬業(yè)馨教授指教,將《漢語國際教育用音節(jié)漢字詞匯等級(jí)劃分》(以下簡稱《等級(jí)劃分》<The Graded Chinese Syllables Characters and Words for the Application of Teaching Chinese to the Speakers of Other Language>)(2010.10)列為下一步考察的對(duì)象。
“研制《漢語國際教育用音節(jié)和漢字詞匯等級(jí)劃分(國家標(biāo)準(zhǔn))》(以下簡稱《等級(jí)劃分》,擬作”國家標(biāo)準(zhǔn)),不是對(duì)1992年《漢語水平詞匯與漢字等級(jí)大綱》(以下簡稱《等級(jí)大綱》)所作的簡單的、一般性的修訂,而是在相隔17年之后,社會(huì)語言生活發(fā)生了巨大變化、對(duì)外漢語教學(xué)出現(xiàn)了重大轉(zhuǎn)變的時(shí)代背景下進(jìn)行的重大研究(劉英林 馬箭飛,2010)。該項(xiàng)目的成果已作為“面向全球漢語國際教育的國家標(biāo)準(zhǔn)”頒布[6]。
因時(shí)間所限,《等級(jí)劃分》的字表、詞表尚未及數(shù)據(jù)化處理,與原有資料庫的比對(duì)無法全面準(zhǔn)確完成。我們將本文中建議收錄的若干字與《等級(jí)劃分》試作比對(duì),列入一級(jí)字的有“華/擊及木入失石士土衛(wèi)無鄉(xiāng)象由于/保背并采程沖傳此達(dá)底斷隊(duì)格古管光害護(hù)金景軍類量”,列入二級(jí)字的有“奔曲盛/田嚴(yán)/兵沉官激居料列林令”,“盡落”二字是多音字,較為常用的讀音“盡(jìn)”“落(luò)”列在一級(jí),不太常用的“盡(jǐn)”“落(là)”列在二級(jí)。考慮到《等級(jí)劃分》一級(jí)字為“普及化等級(jí)漢字”,共收900字,比原《大綱》多100字,但我們建議應(yīng)在800字級(jí)別的字,仍有部分未收進(jìn)這一范圍,這令我們感到很有進(jìn)一步研究探討的必要。
[1]劉英林,宋紹周.漢語水平詞匯與漢字等級(jí)大綱·論漢語教學(xué)字詞的統(tǒng)計(jì)與分級(jí)(代序)[M].北京:經(jīng)濟(jì)科學(xué)出版社,2001.
[2]姚喜雙.《漢語800字》的思考[J].語言文字應(yīng)用,2008(4):83-92.
[3]郭龍生.《漢語800字》的三點(diǎn)思考[J].語言文字應(yīng)用,2009(3):113-119.
[4]王 寧.漢字構(gòu)形學(xué)講座[M].上海:上海教育出版社,2002.
[5]王衍軍.20世紀(jì)50年代以來對(duì)外漢語精讀教材用字情況調(diào)查——以五套對(duì)外漢語精讀教材為例[J].暨南大學(xué)華文學(xué)院學(xué)報(bào):華文教學(xué)與研究,2009(2):51-59.
[6]劉英林,馬箭飛.研制《音節(jié)和漢字詞匯等級(jí)劃分》探尋漢語國際教育新思維[J].世界漢語教學(xué),2010(1):82-92.
The Analysis for the Classification of Characters in the Table of“Words and Characters for Chinese Ability Outline”
WANG Min,WANG Xiao-ming
(Institute of Applied Linguistics of Ministry of Education,Department of Chinese Characters and Chinese Phonetics,Beijing 100010,China)
This article inspects the situation of the character classification for the Character Table of the“outline”,and a comparative study has been made with the existing State Standardization of Chinese Characters,such as“Modern Chinese characters commonly used in the table,”“Modern popular characters used alone standards,”and the frequency statistics.The article suggests on the main principle of choosing character and classifying the level in the table.①The outline should choose the chinese characters and useful single words,which are helpful to understund the word structure rules of chinese characters,have high ability of word formation,and are in favor of vocabulary learning.②The standards of chinese charaters made by the national organization,usually after a long-term research brewing,have high reliability and significance on the application of chinese characters.③As a guiding standard of teaching chinese,the table of the“Outline”should be emphasized for basic,univers,and wide applicability,and at its most basic and core first-grade chinese characters,the choice should especially do like this.
WordsandCharactersforChineseAbilityOutline;the first grade Characters;state standardization of Chinese characters;the characters in the Syllabus
H195
A
1005-6378(2012)04-0103-05
2012-03-23
王敏(1972.9-),女,河北省故城縣人,教育部語言文字應(yīng)用研究所,副研究員,北京師范大學(xué)文學(xué)博士,主要研究方向:現(xiàn)代漢字學(xué)、辭書研究、普通話語音研究。
[責(zé)任編輯 侯翠環(huán)]