吳莉滕菲
(南京師范大學(xué) 文學(xué)院,江蘇 南京 210097)
通過(guò)統(tǒng)計(jì)、處理42卷本方言詞典中的低頻詞和共有詞,得出42卷本方言詞典低頻詞用字表和共有詞用字表,為課題“漢語(yǔ)方言自然口語(yǔ)有聲基礎(chǔ)語(yǔ)料庫(kù)建設(shè)”采錄字表的設(shè)計(jì)提供一種資料參證,同時(shí)也為日后他人進(jìn)行方言調(diào)查時(shí)制定字表提供參考。
基于以上統(tǒng)計(jì)數(shù)據(jù),以江淮官話(huà)和北部吳語(yǔ)為專(zhuān)題研究對(duì)象,比較兩者“衣、食、住、行”四種義類(lèi)詞匯在用字量上的差別,以考察這兩個(gè)方言區(qū)詞匯用字的特征與差異,以及方言詞匯用字與區(qū)域文化的關(guān)系。
本文統(tǒng)計(jì)研究的基礎(chǔ)材料是“42卷本方言詞匯集”,該詞匯集由南京師范大學(xué)文學(xué)院2006級(jí)碩士研究生張笑芳整理李榮先生主編的42卷本《現(xiàn)代漢語(yǔ)方言大詞典》所得。它按照《現(xiàn)代漢語(yǔ)方言大詞典》劃分詞匯的30個(gè)大義類(lèi),把各方言點(diǎn)義類(lèi)相同的詞集中在同一張excel表格中,共形成30張excel表格:一、天文,二、地理,三、時(shí)令時(shí)間,四、農(nóng)業(yè),五、植物,六、動(dòng)物,七、房舍,八、器具用品,九、稱(chēng)謂,十、親屬,十一、身體,十二、疾病醫(yī)療,十三、衣服穿帶,十四、飲食,十五、紅白大事,十六、日常生活,十七、訟事,十八、交際,十九、商業(yè)交通,二十、文化教育,二十一、文體活動(dòng),二十二、動(dòng)作,二十三、位置,二十四、代詞,二十五、形容詞,二十六、副詞介詞等,二十七、量詞,二十八、附加成分,二十九、數(shù)字等,三十、其他。這30個(gè)義類(lèi)基本涵蓋了人們生活的各方面,不僅反映了當(dāng)?shù)厝嗣竦纳蠲婷?,也利于本文?duì)方言區(qū)各義類(lèi)用字的比較與分析。
“42卷本方言詞典詞匯集”匯集了《現(xiàn)代漢語(yǔ)方言大詞典》的所有詞匯,覆蓋十大方言區(qū)(官話(huà)、贛語(yǔ)、徽語(yǔ)、晉語(yǔ)、客家話(huà)、閩語(yǔ)、平話(huà)、吳語(yǔ)、粵語(yǔ)、湘語(yǔ))的42個(gè)方言點(diǎn),能夠較好地反映我國(guó)方言詞匯的基本面貌,方言分區(qū)與各地域文化也大體對(duì)應(yīng),利于進(jìn)行方言區(qū)之間的比較。
(1)分列法:“分列”是excel中“數(shù)據(jù)”菜單下的子菜單,主要功能是把一列中的數(shù)據(jù)分成兩列或多列,用分列法可提取方言詞匯的用字。
(2)分類(lèi)匯總法:按指定的分類(lèi)變量值對(duì)所有記錄進(jìn)行分組,以便對(duì)每組變量中的各記錄進(jìn)行描述、統(tǒng)計(jì)與分析,便于不同義類(lèi)、詞頻、方言間的用字提取與比較。
(3)算術(shù)統(tǒng)計(jì)法:用簡(jiǎn)單的算術(shù)統(tǒng)計(jì)法提取42卷本方言詞典共有詞用字表、低頻詞用字表,分析低頻詞各義類(lèi)用字百分比,以及江淮官話(huà)區(qū)與吳語(yǔ)區(qū)“衣、食、住、行”四類(lèi)詞用字量。
(4)比較法:將42卷本方言詞典共有詞用字量與低頻詞用字量進(jìn)行比較,得出方言詞頻與用字量間的關(guān)系。同時(shí)以江淮官話(huà)和北部吳語(yǔ)在“衣、食、住、行”四義類(lèi)中的低頻詞用字比較為例,探求不同方言區(qū)詞匯用字特點(diǎn)與差異。
(5)圖表法:本文將用圖表顯示統(tǒng)計(jì)、比較各項(xiàng)數(shù)量關(guān)系,便于直觀觀察與分析,從而得出最終結(jié)論。
(1)詞頻:本文指某個(gè)方言詞在42卷本方言詞匯中出現(xiàn)的頻率。
(2)低頻詞:本文指在42卷本方言詞典中出現(xiàn)頻次在13次以下的詞。
(3)共有詞:本文指在42卷本方言詞典中出現(xiàn)頻次在13次及以上的詞。
(4)義類(lèi):本文指42卷本方言詞匯集中按excel表格整理的天文、地理等30個(gè)分類(lèi)。
(5)共有詞用字:本文指42卷本方言詞典中構(gòu)成共有詞的所有用字。
(6)低頻詞用字:本文指42卷本方言詞典中構(gòu)成低頻詞的所有用字。
(7)總復(fù)現(xiàn)次數(shù):本文指某個(gè)方言詞在42卷本方言詞典中重復(fù)出現(xiàn)的次數(shù)。
以方言詞匯的“總復(fù)現(xiàn)次數(shù)”作為區(qū)分低頻詞和共有詞的參量,根據(jù)張笑芳的研究,以“13”作為低頻詞和共有詞的分界點(diǎn)。筆者首先對(duì)“42卷本方言詞典詞匯集”按義類(lèi)劃分的30張excel表格進(jìn)行相關(guān)處理,篩選出每張表格中總復(fù)現(xiàn)次數(shù)在13次以下的詞。篩選的具體過(guò)程如下:
(1)打開(kāi)“天文”義類(lèi)的excel表格→點(diǎn)擊“數(shù)據(jù)”菜單下的子菜單“排序”按鈕→分別以“總復(fù)現(xiàn)次數(shù)”和“詞條”作為主要關(guān)鍵字和次要關(guān)鍵字,按升序排列→點(diǎn)擊“確定”,使詞條按照由低到高總復(fù)現(xiàn)次數(shù)依次排列。
(2)在“總復(fù)現(xiàn)次數(shù)”這一列找到“13”這一臨界點(diǎn)→刪除該表中總復(fù)現(xiàn)次數(shù)在13次以上的詞條→得到該表的低頻詞。
(3)依次打開(kāi)其余各義類(lèi)的excel表格,重復(fù)上述2個(gè)步驟,篩選出30張excel表中的低頻詞,并保存。
通過(guò)上述操作,得到了各方言點(diǎn)在30個(gè)義類(lèi)表中的低頻詞表。研制低頻詞的用字必須以字為單位,本文用分列法提取低頻詞表的用字:
(1)打開(kāi)經(jīng)篩選過(guò)的“天文”義類(lèi)excel表格→選中“詞條”這一列(此處的詞均為低頻詞)→點(diǎn)擊“數(shù)據(jù)”菜單下的子菜單“分列”,將多字詞條分列為單字。
(2)在彈出的文本框向?qū)е羞x中“固定寬度”,點(diǎn)擊“下一步”→設(shè)置字段寬度(2個(gè)字符)→單擊鼠標(biāo)建立分列線(xiàn)→點(diǎn)擊“完成”,把該表中低頻詞在不同位置上的用字分列提取出來(lái)。
基于上節(jié)的操作,把“天文”義類(lèi)excel表格中低頻詞在不同位置上的用字提取了出來(lái),因只是簡(jiǎn)單的“分列”,其中必然包含大量重復(fù)用字,因此要進(jìn)一步整理,刪除重復(fù)的用字。
(1)打開(kāi)一張新的excel表格,通過(guò)“復(fù)制”與“粘貼”,把剛剛分列所得的各列用字集中于一列。
(2)選中該列用字→點(diǎn)擊“數(shù)據(jù)”菜單下的子菜單“排序”按鈕,選“升序排列”,讓重復(fù)的漢字集中在一起。
(3)選中重新排序的這列用字→點(diǎn)擊“數(shù)據(jù)”菜單下的子菜單“刪除重復(fù)項(xiàng)”,刪節(jié)該列中重復(fù)的字→得到“天文”這一義類(lèi)低頻詞用字表→保存,文件名為“天文類(lèi)低頻詞用字表”。
(4)依次打開(kāi)其他各義類(lèi)excel表格,重復(fù)上述(1)-(3)的操作,得出42卷本方言詞典各義類(lèi)的低頻詞用字表,并分別保存。
(1)建立一張新的excel表格,依次打開(kāi)新保存的各義類(lèi)低頻詞用字表,通過(guò)“復(fù)制”和“粘貼”操作,把各義類(lèi)的低頻詞用字集中到新建的excel表格中的一列。
(2)選中該列用字,點(diǎn)擊“數(shù)據(jù)”菜單下的子菜單“排序”按鈕,使其按升序排列,讓重復(fù)的漢字集中在一起。
(3)選中重新排序的這列用字→點(diǎn)擊“數(shù)據(jù)”菜單下的子菜單“刪除重復(fù)項(xiàng)”→刪節(jié)該列中重復(fù)的字→得到42卷本所有低頻詞的用字→保存,文件名為“42卷本方言詞典低頻詞用字表”。
“42卷本方言詞共有詞用字表”的研制與上節(jié)研制“42卷本方言詞低頻詞用字表”大致相同,只是在最初篩選共有詞時(shí),要選擇“總復(fù)現(xiàn)次數(shù)”在13次以上(含13次)的詞,其余操作步驟相同。
將“42卷本方言詞典低頻詞用字表”和“42卷本方言詞典共有詞用字表”合為一張表,即依照第三節(jié)中(2)(3)步驟排序、刪重,得到“42卷本方言詞典詞匯用字表”。統(tǒng)計(jì)這三張表中方言詞匯的用字量,得到表1的數(shù)據(jù)。
表142 卷本方言詞典低頻詞、共有詞和所有詞用字量
42卷本方言詞典詞匯總的用字量為7628個(gè),總復(fù)現(xiàn)次數(shù)在13次以下的低頻詞的用字量是7625,總復(fù)現(xiàn)次數(shù)在13次以上(含13次)的共有詞的用字量為1662,兩者在總用字量中所占的比重分別為99.9%和22.8%。由此可見(jiàn),方言詞匯低頻詞的總復(fù)現(xiàn)次數(shù)雖然較低,但其用字的涵蓋面卻是相當(dāng)廣,基本囊括了共有詞的用字。
低頻詞的復(fù)現(xiàn)次數(shù)雖然不多,但卻集中顯現(xiàn)了方言點(diǎn)的詞匯特點(diǎn)。在42卷本方言詞典中復(fù)現(xiàn)次數(shù)為1的詞,意味著只在此方言中出現(xiàn),而在其他41個(gè)方言中未見(jiàn),應(yīng)是典型的方言特征詞,是考察方言詞匯特點(diǎn)的好材料。于是,我們統(tǒng)計(jì)“42卷本方言詞典詞匯集”中只出現(xiàn)一次的詞,其數(shù)量為167580,約占方言詞典收詞總數(shù)的47%,可見(jiàn)這些詞的比重之大。
綜合以上兩點(diǎn),筆者認(rèn)為低頻詞用字的涵蓋面廣,詞匯自身體現(xiàn)了所屬方言區(qū)的詞語(yǔ)特色,對(duì)其用字進(jìn)行研究可以在一定程度上反映該方言區(qū)的特色,起到區(qū)別其他方言區(qū)用字的作用,值得研究。
基于上節(jié)的闡述與分析,我們選擇了江淮官話(huà)和北部吳語(yǔ)進(jìn)行專(zhuān)題研究。江淮官話(huà)以南京和揚(yáng)州為代表,北部吳語(yǔ)以丹陽(yáng)和崇明為代表,統(tǒng)計(jì)分析這4個(gè)方言點(diǎn)低頻詞中“衣、食、住、行”四大義類(lèi)詞的用字情況,以比較江淮官話(huà)和北部吳語(yǔ)詞匯用字的差異與特點(diǎn)。
先看直觀柱狀圖:
圖1 江淮官話(huà)和北部吳語(yǔ)“衣食住行”類(lèi)低頻詞用字
圖1顯示,吳語(yǔ)在“衣”類(lèi)低頻詞用字比江淮官話(huà)要多,“住”類(lèi)的用字與江淮官話(huà)基本持平,而“食、行”兩類(lèi)的用字則明顯少于江淮官話(huà)。
再看表2的具體數(shù)據(jù):
表2 江淮官話(huà)和北部吳語(yǔ)“衣食住行”類(lèi)低頻詞用字量比較表
吳語(yǔ)兩個(gè)點(diǎn)在“衣食住行”類(lèi)低頻詞總用字量是1274,江淮官話(huà)為1514,兩者整體差異并非很大。但逐一對(duì)比這四個(gè)義類(lèi)詞匯的用字量可以發(fā)現(xiàn),兩方言區(qū)除“住”類(lèi)詞的用字量基本持平外,其余三義類(lèi)詞的用字量均有較明顯差別。其中,江淮官話(huà)“衣”類(lèi)的用字量少于吳語(yǔ),約為吳語(yǔ)的80%;而“食”類(lèi)用字量江淮官話(huà)又多于吳語(yǔ),約是吳語(yǔ)的1.2倍。差異最大的是“行”類(lèi),江淮官話(huà)用了547字,約為吳語(yǔ)的1.5倍。
江淮官話(huà)與北部吳語(yǔ)雖然地緣接近,但不同義類(lèi)詞匯的用字量并不相同,各有側(cè)重,這與各方言的地域文化有關(guān)。就本文統(tǒng)計(jì)的江淮官話(huà)和北部吳語(yǔ)“行”類(lèi)詞用字量的差異而言,江淮官話(huà)區(qū)大多處于沿江地帶,因而“行”類(lèi)詞中的“船”族詞以及與“船”相關(guān)的詞必然不少,且分類(lèi)較細(xì)。例如,42卷本方言詞典中收錄的江淮官話(huà)詞匯中就有“蓬蓬船”、“涼蓬船”、“汽船”、“輪渡”等水上交通工具詞語(yǔ),而在吳語(yǔ)中則沒(méi)有,因而這類(lèi)江淮官話(huà)的詞匯用字便會(huì)多于吳語(yǔ)。方言詞語(yǔ)用字量的多少以及在不同義類(lèi)上分布的不平衡,在一定程度上反映了各方言區(qū)各具特色的區(qū)域文化。
[1]張笑芳.基于《現(xiàn)代漢語(yǔ)方言大詞典》的詞匯統(tǒng)計(jì)研究[D].南京師范大學(xué)碩士學(xué)位論文,2009.
[2]錢(qián)大香.基于《現(xiàn)代漢語(yǔ)方言語(yǔ)音詞匯庫(kù)》的漢語(yǔ)方言關(guān)系計(jì)量研究[D].南京師范大學(xué)碩士學(xué)位論文,2009.
[3]蘇新春.國(guó)家語(yǔ)委“通用語(yǔ)料庫(kù)·核心庫(kù)”的詞表提取及詞匯構(gòu)成分析[J].江蘇大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2007(1).
[4]陳鵬飛.計(jì)量方法在漢語(yǔ)方言關(guān)系研究中的運(yùn)用[J].天津師范大學(xué)學(xué)報(bào)(社科版),2006(2).
[5]張凱.漢語(yǔ)構(gòu)詞基本字的統(tǒng)計(jì)分析[J].語(yǔ)言教學(xué)與研究,1997(1).
[6]沈榕秋.漢語(yǔ)方言的定量研究[J].語(yǔ)文研究,1994(2).