零、引言
本文的工作是對國家語言文字工作委員會語言文字規(guī)范GF3003-1999,即傅永和等編《GB13000.1字符集:漢字字序(筆畫序)規(guī)范》(以下簡稱《筆畫序規(guī)范》)中的20902個(gè)漢字的筆畫及筆畫數(shù)進(jìn)行統(tǒng)計(jì)與分析。
本文的做法是:首先把《筆畫序規(guī)范》中的20902個(gè)漢字的筆畫及筆畫數(shù)逐個(gè)輸入電腦。這項(xiàng)輸入與校對工作前后花了大約半年的時(shí)間,這是本文整個(gè)統(tǒng)計(jì)研究工作中最基礎(chǔ)性的工作,當(dāng)然也是最繁重的工作。然后在此基礎(chǔ)上進(jìn)行了數(shù)據(jù)統(tǒng)計(jì)。
在統(tǒng)計(jì)中,本文首先統(tǒng)計(jì)了20902個(gè)漢字的筆畫及筆畫數(shù)。作為比較,本文還統(tǒng)計(jì)了《現(xiàn)代漢語常用字表》中的3500個(gè)現(xiàn)代漢語常用字的相關(guān)數(shù)據(jù)。本文的統(tǒng)計(jì)包括兩個(gè)方面,一是畫數(shù)(筆畫數(shù))統(tǒng)計(jì),一是筆畫統(tǒng)計(jì)。我們對所有統(tǒng)計(jì)數(shù)據(jù)都進(jìn)行了分析說明,最后對全文的統(tǒng)計(jì)分析進(jìn)行了簡要的小結(jié)。
一、畫數(shù)統(tǒng)計(jì)
首先來看《筆畫序規(guī)范》的總體數(shù)據(jù)。
《筆畫序規(guī)范》中20902個(gè)漢字筆畫總數(shù)為268479,平均每字12.8畫,最少的1畫,有10個(gè)字,最多的48畫,只有1個(gè)字。其中12畫的漢字最多,有1957個(gè),其次是11畫、13畫。這說明筆畫數(shù)超過平均值的要比低于平均值的多。詳見表一。
表一 不同筆畫數(shù)漢字?jǐn)?shù)表(20902字)
《現(xiàn)代漢語常用字表》3500個(gè)現(xiàn)代漢語常用字筆畫總數(shù)為34097,平均每字9.7畫,最少的1畫,有2個(gè)字,最多的24畫,只有1個(gè)字。其中9畫的漢字最多,有415個(gè),其次是8畫、10畫。這里更說明筆畫數(shù)超過平均值的要比低于平均值的多,平均是每字9.7畫,但9畫的漢字最多。詳見表二。
表二 不同筆畫數(shù)漢字?jǐn)?shù)表(3500常用字)
其中2500個(gè)最常用字筆畫總數(shù)為22925,平均每字9.2畫,最少的1畫,有2個(gè)字,最多的23畫,只有1個(gè)字。其中9畫的漢字最多,有316個(gè),其次是8畫、10畫。詳見表三。
表三 不同筆畫數(shù)漢字?jǐn)?shù)表(2500最常用字)
其中1000個(gè)次常用字漢字筆畫總數(shù)為11172,平均每字11.2畫,最少的2畫,有2個(gè)字,最多的24畫,只有1個(gè)漢字。其中11畫的漢字最多,有142個(gè),其次是10畫、12畫。詳見表四。
表四 不同筆畫數(shù)漢字?jǐn)?shù)表(1000次常用字)
二、筆畫統(tǒng)計(jì)
接下來,我們再看一下不同筆畫使用的情況。
還是先來看總體數(shù)據(jù)。20902個(gè)漢字筆畫總數(shù)為268479,其中橫畫最多,82682個(gè),占30.8%,其次是豎畫,51459個(gè),占19.2%。從中可以看出:橫畫和豎畫加起來占一半,剩下的撇畫、點(diǎn)畫和折畫所占比例差不多,它們加起來也占一半。
表五 不同筆畫統(tǒng)計(jì)表(20902字)
下面是3500常用字的筆畫數(shù)據(jù)。不同筆畫的比例與20902個(gè)漢字的有所不同,但是大同小異,總的比例差不多,也是橫畫和豎畫占一半,撇畫、點(diǎn)畫和折畫占一半。
表六 不同筆畫統(tǒng)計(jì)表(3500常用字)
其中2500最常用字的筆畫數(shù)據(jù)是:
表七 不同筆畫統(tǒng)計(jì)表(2500最常用字)
1000次常用字的筆畫數(shù)據(jù)是:
表八 不同筆畫統(tǒng)計(jì)表(1000次常用字)
最常用字的筆畫與次常用字的筆畫比例有一些差別,主要是橫畫和豎畫的比例:最常用字的較低,而次常用字的較高。
三、小結(jié)
(一)畫數(shù)數(shù)據(jù)
現(xiàn)在,我們把漢字的平均筆畫數(shù)據(jù)放在一起來做個(gè)歸納,可以發(fā)現(xiàn)一些比較明顯的變化。
表九 不同筆畫數(shù)漢字?jǐn)?shù)比較表
從這個(gè)比較表中,可以看出:
1、常用漢字的平均筆畫要少,尤其是最常用漢字要少很多,但次常用漢字的平均筆畫卻少得并不多:3500常用字的平均筆畫要比《筆畫序規(guī)范》中20902個(gè)漢字的少3.1,其中最常用的2500個(gè)漢字,平均筆畫比20902個(gè)漢字的少3.6,而次常用的1000個(gè)漢字的平均筆畫卻比20902個(gè)漢字的只少1.6;
2、C行的數(shù)據(jù)普遍低于B行的數(shù)據(jù),這說明筆畫數(shù)多的漢字要比低的漢字多,這也驗(yàn)證了越常用的漢字筆畫越少;
3、從E行的數(shù)據(jù)看,漢字最多的筆畫數(shù)的漢字?jǐn)?shù)(即某一個(gè)筆畫數(shù)的漢字最多,最多的這個(gè)筆畫數(shù)的漢字?jǐn)?shù))占整個(gè)漢字總數(shù)的百分比在9.4%到14.2%之間,平均為12.0%,約為八分之一。一般說總字?jǐn)?shù)越多,最多漢字的筆畫數(shù)也大。這并不奇怪。但有趣的是:隨著總字?jǐn)?shù)的減少,漢字最多的筆畫數(shù)的漢字?jǐn)?shù)占整個(gè)漢字總數(shù)的百分比卻逐步增大。
(二)筆畫數(shù)據(jù)
表十 不同筆畫統(tǒng)計(jì)比較表
從表十的比較看,橫畫最多,其次是豎畫,再次是點(diǎn)畫、折畫和撇畫。這其中,橫畫和豎畫加起來占一半,剩下的撇畫、點(diǎn)畫和折畫差不多,它們加起來也占一半??偟膩碚f,筆畫數(shù)據(jù)的比例變化不大,只有橫畫占有絕對優(yōu)勢,比例總是最高,高達(dá)三成。
本文通過對《筆畫序規(guī)范》20902個(gè)漢字筆畫數(shù)據(jù)的統(tǒng)計(jì)分析,可以對漢字筆畫有個(gè)總體的了解,同時(shí)對常用漢字筆畫數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,更讓我們看到了常用漢字的筆畫數(shù)情況。我們相信這些數(shù)據(jù)可以為漢字的整理、筆形編碼以及漢字教學(xué)提供重要的參考。
參考文獻(xiàn):
[1]傅永和等.GB13000.1字符集:漢字字序(筆畫序)規(guī)范[M].上海教育出版社,2000.
[2]國家語言文字工作委員會漢字處.現(xiàn)代漢語常用字表[M].語文出版社,1988.
[3]周錫衛(wèi)、陳民.對<漢字部件規(guī)范>的若干數(shù)據(jù)統(tǒng)計(jì)[J].計(jì)算機(jī)世界,1998,(15).
(郭曙綸 樸貞姬,上海交通大學(xué)國際教育學(xué)院)