漢語(yǔ)詞匯教學(xué)目標(biāo)能夠量化,已是一個(gè)不爭(zhēng)的事實(shí)。
自1898年德國(guó)語(yǔ)言學(xué)家F.W.凱丁出版第一部根據(jù)統(tǒng)計(jì)材料編成的《德語(yǔ)頻率詞典》以來,各國(guó)語(yǔ)言學(xué)家、教育家都十分重視編寫頻率詞典,從頻率的高低來確定常用詞,推進(jìn)詞匯的教學(xué),提高學(xué)習(xí)效率。如美國(guó)的教育家兼心理學(xué)家E.L.桑代克對(duì)英語(yǔ)詞匯的頻率做了大量的統(tǒng)計(jì)工作,在此基礎(chǔ)上編寫了《教師兩萬(wàn)詞詞書》和《教師三萬(wàn)詞詞書》。后來人們又在此基礎(chǔ)上將常用詞分為最低限度詞匯、常用詞匯、次常用詞匯、一般常用詞匯等幾個(gè)等級(jí),供教學(xué)選用,把詞匯教學(xué)納入科學(xué)的軌道。
漢語(yǔ)常用字詞的研究,要說早則早矣。
周宣王時(shí)的太史籀,為了教學(xué)童,編《史籀篇》。秦朝李斯、趙高和胡毋敬又各自取材于《史籀篇》,改籀文為秦篆,分別編了《倉(cāng)頡篇》《爰?xì)v篇》《博學(xué)篇》。漢代的民間先生又將這三部字書合并,題名為“倉(cāng)頡篇”。此后漢武帝時(shí)司馬相如編《凡將篇》,元帝時(shí)史游編《急就篇》,成帝時(shí)李長(zhǎng)編《元尚篇》。它們開我國(guó)集中識(shí)字學(xué)詞教學(xué)之先河。到后來大量涌現(xiàn)的諸如《千字文》《三字經(jīng)》《百家姓》等蒙童韻語(yǔ)識(shí)字課本,其編寫方法無(wú)不是脫胎于前者。《千字文》選擇了1000個(gè)字,都是古書上常用的,基本上沒有生僻字,只有個(gè)別字重復(fù)。《三字經(jīng)》是1140字,用的都是極常見的字,講的都是極通俗淺顯的名物事理,用字有一定的重復(fù)。《百家姓》是568字,字?jǐn)?shù)少,所列的字大多是兒童很容易理解的普通常見的姓,有個(gè)別復(fù)姓中的用字重復(fù)。三本書合起來,總字?jǐn)?shù)是2708個(gè),除去重復(fù)的字不算,單字是1426個(gè)。從字種比例看,“三、百、千”有73.67%的字是現(xiàn)代漢語(yǔ)常用字,有10.61%是現(xiàn)代漢語(yǔ)次常用字,兩項(xiàng)合起來,有84.27%的字在我們常說的3500個(gè)常用字范圍內(nèi)。單從字種比例看,“三、百、千”即使在今天仍然不失為優(yōu)秀的識(shí)字課本。如果把這些蒙童韻語(yǔ)讀物看成我國(guó)古代語(yǔ)文教育工作者在母語(yǔ)字詞教學(xué)方面的數(shù)量范圍追求的有益嘗試的話,我國(guó)母語(yǔ)詞匯教學(xué)量化實(shí)踐的歷史可謂長(zhǎng)矣。
當(dāng)然,科學(xué)意義的詞匯目標(biāo)量化工作是要建立在詞頻統(tǒng)計(jì)工作基礎(chǔ)上的。
我國(guó)第一部漢語(yǔ)頻率字典是陳鶴琴在1928年編成的《語(yǔ)體文應(yīng)用字匯》,他分析了554478個(gè)詞,得出4261個(gè)常用字。但這還不是嚴(yán)格意義上的頻率詞典。
對(duì)漢語(yǔ)詞匯頻率的統(tǒng)計(jì)研究,最早應(yīng)算《普通話三千常用詞表》。該詞表為鄭林曦先生所編,初稿本出版于1959年,收詞3624個(gè),增訂本出版于1987年,收詞3996個(gè)。這是我國(guó)第一本按漢語(yǔ)語(yǔ)法分詞類排列的常用詞表,原本主要是供學(xué)習(xí)普通話、編寫普通話課本、讀物時(shí)參考的。從學(xué)習(xí)者、使用者的反應(yīng)來看,該詞表確實(shí)收到了較好的社會(huì)效果。不過,該詞表無(wú)論是初稿本還是增訂本,都沒有采取統(tǒng)計(jì)大量材料的方法,而采取選擇和統(tǒng)計(jì)、檢驗(yàn)相結(jié)合的方法。據(jù)編者介紹,詞表編成后,曾利用各種性質(zhì)的書報(bào)文章約130000多字、50000多詞進(jìn)行常用性檢驗(yàn),結(jié)果證明,初稿本的詞匯出現(xiàn)頻率平均約為80%,增訂本的詞匯出現(xiàn)頻率提高到87%。
另一項(xiàng)具有手工性質(zhì)的勞動(dòng),是1980年前婁警予、馬世一等教師,對(duì)當(dāng)時(shí)試行的十冊(cè)統(tǒng)編教材中的中學(xué)生應(yīng)該理解掌握的常用詞,作了比較詳盡的調(diào)查和統(tǒng)計(jì),一共理出6494個(gè)常用詞。他們認(rèn)為這遠(yuǎn)遠(yuǎn)不夠,因此,又按照《現(xiàn)代漢語(yǔ)詞典》的順序,挑出他們認(rèn)為中學(xué)生應(yīng)該學(xué)習(xí)掌握的詞匯6113個(gè)。此外,他們認(rèn)為《現(xiàn)代漢語(yǔ)小詞典》所選的3000條成語(yǔ),絕大多數(shù)都是中學(xué)生應(yīng)該學(xué)習(xí)和掌握的,而那套課本只出現(xiàn)了814個(gè)。據(jù)此,他們提出,中學(xué)語(yǔ)文應(yīng)該教給學(xué)生的詞匯,大約應(yīng)是15000條左右(其中成語(yǔ)約3000條,其他詞語(yǔ)約12000條)。他們因此按音序列成了《中學(xué)生常用詞匯表》,并提出“到底是多少,又應(yīng)該包括哪些詞匯”,需要“大家共同來研究”,他們只是“向全國(guó)熱心于語(yǔ)文教學(xué)改革的同志們提供一個(gè)藍(lán)本”。
這是目前我們所知的新中國(guó)第一項(xiàng)直接面向?qū)W校教育的漢語(yǔ)詞匯目標(biāo)量化研究。這項(xiàng)研究肯定沒有借助計(jì)算機(jī),它的選詞標(biāo)準(zhǔn)也不是建立在詞頻統(tǒng)計(jì)基礎(chǔ)上的,因而就某一具體詞語(yǔ)的當(dāng)選與否來講,其科學(xué)性肯定是差點(diǎn)兒。這項(xiàng)成果也沒有在全國(guó)推廣。但這項(xiàng)研究的巨大意義就在于,它是新中國(guó)語(yǔ)文教育史上第一項(xiàng)明確關(guān)于漢語(yǔ)詞匯教學(xué)量化標(biāo)準(zhǔn)問題的研究。
我國(guó)開展大規(guī)模的不同用途的漢語(yǔ)詞頻統(tǒng)計(jì)工作,是在計(jì)算機(jī)技術(shù)得到廣泛應(yīng)用以后。這些成果中比較具有全局意義的直接面向?qū)W校和用作其他需要的各有數(shù)項(xiàng),下面略作介紹:
(一)直接面向?qū)W校的
1.北京師范大學(xué)現(xiàn)代教育技術(shù)研究所部分研究人員同中文系部分漢語(yǔ)教師合作,利用兩年多的時(shí)間,對(duì)全國(guó)統(tǒng)一使用的1983~1984年度的中小學(xué)語(yǔ)文教材(共24冊(cè))作了大規(guī)模的詞頻統(tǒng)計(jì)與分析。共輸入104萬(wàn)字,約生成4萬(wàn)個(gè)詞條。然后再利用計(jì)算機(jī)把詞頻值和方差值(即詞在各種文體中的覆蓋率)都達(dá)到某一界限的詞全部選出來,確定為常用詞。這項(xiàng)成果于1985年7月通過國(guó)家鑒定,并形成《現(xiàn)代漢語(yǔ)詞表》《三千常用詞表》《八千常用詞表》《一萬(wàn)常用詞表》和《現(xiàn)代漢語(yǔ)構(gòu)詞字典》等具體成果。
這項(xiàng)研究的意義毋庸置疑,但是,它并沒有提出中小學(xué)詞語(yǔ)教學(xué)的量化標(biāo)準(zhǔn),而且,詞頻統(tǒng)計(jì)的取材范圍只局限于當(dāng)時(shí)的一套統(tǒng)編教材,這個(gè)選材面太窄了,明顯不足以證明所選詞語(yǔ)的“常用性”,統(tǒng)計(jì)結(jié)果受該教材的編輯思想和選文標(biāo)準(zhǔn)的局限是自然的。
2.北京語(yǔ)言學(xué)院語(yǔ)言教學(xué)研究所從1979年11月開始至1985年7月止,歷時(shí)5年零8個(gè)月,對(duì)4類(報(bào)刊政論、科普、生活口語(yǔ)、文學(xué)作品)語(yǔ)體179種180萬(wàn)字的語(yǔ)料進(jìn)行統(tǒng)計(jì),共得到詞條31159個(gè),其中出現(xiàn)頻率在10次以上的常用詞,只有8000個(gè)。這8000個(gè)詞累計(jì)出現(xiàn)頻率占全部語(yǔ)料總量的95%強(qiáng),其余23159個(gè)詞的累計(jì)出現(xiàn)頻率僅占全部語(yǔ)料的5%弱。據(jù)此他們編成《現(xiàn)代漢語(yǔ)頻率詞典》。
這項(xiàng)成果還直接生成或影響了另外兩項(xiàng)成果:一是國(guó)家對(duì)外漢語(yǔ)教學(xué)領(lǐng)導(dǎo)小組辦公室漢語(yǔ)水平考試部,據(jù)此確立了《漢語(yǔ)水平詞匯與漢字等級(jí)大綱》(1992)和《漢語(yǔ)水平等級(jí)標(biāo)準(zhǔn)》(1995)里的詞匯量化標(biāo)準(zhǔn)8821個(gè)(亦說8822個(gè))。一是國(guó)家語(yǔ)委據(jù)此編制了《普通話水平測(cè)試大綱(修訂本)》(1994)“普通話(口語(yǔ)和書面語(yǔ))常用詞語(yǔ)”表一里的8454個(gè)常用詞語(yǔ)。
這項(xiàng)成果對(duì)對(duì)外漢語(yǔ)教學(xué)產(chǎn)生了比較大的影響,直到現(xiàn)在它還是人們討論對(duì)外漢語(yǔ)詞匯教學(xué)問題的依據(jù),但是這項(xiàng)成果對(duì)國(guó)內(nèi)中小學(xué)語(yǔ)文教學(xué)并沒有產(chǎn)生直接影響。
(二)用作其他需要的
1.北京航空航天大學(xué)等10個(gè)單位,從1981年到1986年,歷時(shí)6年,前后有數(shù)百人,進(jìn)行了一項(xiàng)據(jù)他們自己稱是“世界上迄今為止規(guī)模最大的”漢語(yǔ)詞頻統(tǒng)計(jì)。這次詞頻統(tǒng)計(jì)選材3億漢字,編碼輸出2000萬(wàn)漢字(含標(biāo)點(diǎn)符號(hào)),統(tǒng)計(jì)出詞條達(dá)7萬(wàn)之多,統(tǒng)計(jì)材料覆蓋1919年至1982年的四個(gè)時(shí)期,涉及社會(huì)科學(xué)和自然科學(xué)的10類學(xué)科。該項(xiàng)研究1986年6月30日通過國(guó)家級(jí)鑒定,主要成果收集在劉源主編的《現(xiàn)代漢語(yǔ)常用詞詞頻詞典》里。
2.國(guó)家語(yǔ)委語(yǔ)用所現(xiàn)代漢語(yǔ)通用詞課題組,在近2億漢字語(yǔ)料的基礎(chǔ)上,吸收國(guó)內(nèi)外主要的詞頻統(tǒng)計(jì)成果,并運(yùn)用新的抽樣語(yǔ)料進(jìn)行覆蓋率檢驗(yàn),采集我國(guó)“社會(huì)生活各個(gè)方面、各行各業(yè)都通用”的現(xiàn)代漢語(yǔ)詞匯。該項(xiàng)研究的首批成果《現(xiàn)代漢語(yǔ)通用詞·基本集》已通過專家審定(1997),它收詞6萬(wàn)多,其中一級(jí)詞5191個(gè),二級(jí)詞8792個(gè),共13893個(gè)。《現(xiàn)代漢語(yǔ)通用詞·基本集》以外還有擴(kuò)充集。擴(kuò)充集以短語(yǔ)為主。
3.許嘉璐、傅永和主持,清華大學(xué)、北京大學(xué)、國(guó)家語(yǔ)委語(yǔ)用所等十多個(gè)單位聯(lián)合攻關(guān)完成的國(guó)家社科研究九五規(guī)劃重大項(xiàng)目“信息處理用現(xiàn)代漢語(yǔ)詞匯研究”,得到一個(gè)包含158000個(gè)字詞的工作初表,然后再將這個(gè)表中的每個(gè)詞置于8億字左右的語(yǔ)料中作詞頻統(tǒng)計(jì),最后采用“定性+定量”的處理策略(即運(yùn)用各類語(yǔ)言學(xué)規(guī)則并參照統(tǒng)計(jì)數(shù)據(jù)),形成這個(gè)課題的核心成果之一——《信息處理用現(xiàn)代漢語(yǔ)分詞詞表》。這個(gè)詞表共收詞92843個(gè),其中一級(jí)常用詞56606個(gè),二級(jí)常用詞36237個(gè)。
這項(xiàng)成果除了給出到目前為止有統(tǒng)計(jì)學(xué)依據(jù)的最大現(xiàn)代漢語(yǔ)常用詞表外,特別值得我們注意的有兩點(diǎn):一是該詞表的詞語(yǔ)分類。整個(gè)詞表分成7大分庫(kù):普通詞庫(kù)、帶字母詞庫(kù)、專名庫(kù)、常用接續(xù)庫(kù)(即語(yǔ)法學(xué)上的短語(yǔ))、成語(yǔ)庫(kù)、俗語(yǔ)庫(kù)以及單字詞庫(kù)。每庫(kù)詞語(yǔ)又根據(jù)頻度分為一級(jí)常用、二級(jí)常用。這些數(shù)據(jù)對(duì)于我們制定語(yǔ)文詞匯教學(xué)量表有重要參考價(jià)值。二是該詞表還采取了一個(gè)技術(shù)性措施,即強(qiáng)制要求該表必須涵蓋《普通話常用三千詞》及《漢語(yǔ)水平詞匯與漢字等級(jí)大綱》給出的漢語(yǔ)常用8000詞,僅僅淘汰了極少量過時(shí)的詞。這使我們更加有理由重視漢語(yǔ)“八千常用詞”,即上文所說“8821”或“8454”。
以上三項(xiàng)成果,雖然都不是直接面向和服務(wù)于學(xué)校教育的,但它對(duì)于我們制定漢語(yǔ)詞匯教學(xué)標(biāo)準(zhǔn),考慮選詞范圍和選詞量,是有重要參考價(jià)值的。
參考文獻(xiàn):
(1)倪寶元《語(yǔ)言學(xué)與語(yǔ)文教育》,上海教育出版社1995年。
(2)徐梓、王雪梅《蒙學(xué)便讀》,山西教育出版社1991年。
(3)張志公《傳統(tǒng)語(yǔ)文教育初探》,上海教育出版社1962年。
(4)鄭國(guó)民等《小學(xué)語(yǔ)文常用讀物的字種與字量研究——“三、百、千”“四書”、古詩(shī)80首等六種讀物的用字》,《語(yǔ)言文字應(yīng)用》2003年第4期。
(5)鄭林曦《普通話三千常用詞表》,文字改革出版社1987年。
(6)張志公《語(yǔ)文教學(xué)研究——中學(xué)語(yǔ)文教學(xué)研究會(huì)會(huì)刊第一輯》,教育科學(xué)出版社1980年。
(7)何克抗、李大魁《現(xiàn)代漢語(yǔ)三千常用詞表》,北京師范大學(xué)出版社1987年。
(8)呂必松《對(duì)外漢語(yǔ)教學(xué)概論(講義)(續(xù)十)》,《世界漢語(yǔ)教學(xué)》1994年第4期。
(9)北京語(yǔ)言學(xué)院語(yǔ)言教學(xué)研究室《現(xiàn)代漢語(yǔ)頻率詞典》,北京語(yǔ)言學(xué)院出版社1986年。
(10)劉照雄《普通話水平測(cè)試大綱(修訂本)》,吉林人民出版社1994年。
(11)劉源《現(xiàn)代漢語(yǔ)常用詞詞頻詞典》,宇航出版社1990年。
(12)國(guó)家語(yǔ)委語(yǔ)用所《現(xiàn)代漢語(yǔ)通用詞》課題組(執(zhí)筆)厲兵《〈現(xiàn)代漢語(yǔ)通用詞〉選詞原則》,《語(yǔ)言文字應(yīng)用》1998年第2期。
(13)孫茂松等《信息處理用現(xiàn)代漢語(yǔ)分詞詞表》,《語(yǔ)言文字應(yīng)用》2001年第4期。