彭志斌
(四川外語學院研究生部,重慶400031)
基于語料庫的“有”的詞性標注研究及其對漢語詞典編纂的啟示
彭志斌
(四川外語學院研究生部,重慶400031)
“有”是現(xiàn)代漢語高頻使用的一個詞,大中型主流漢語詞典將其詞性處理為唯動詞,這是值得商榷的。以普通漢語語料庫為基礎,對“有”的用法進行深入調查,發(fā)現(xiàn)“有”應是動代助兼類詞。在探討“有”的用法的基礎上,對詞典編纂提出了點滴建議。
有; 兼類; 語法功能; 語料庫; 詞典編纂
自1930年《王云五大辭典》的出版開創(chuàng)漢語詞典編纂標注詞性的先河以來,漢語詞性問題歷經上個世紀三次大討論,被推向了漢語詞典編纂研究的縱深。尤其是近30年來,國內學者取得了很多詞類標注的理論成果[1](P28)和實踐成果,即編纂出版了10多部帶詞類標注的漢語詞典[1](P27)。盡管漢語詞類研究已經取得了長足進步,但由于漢語缺乏形態(tài)標志及形態(tài)變化的自身特征,在詞類的本質以及詞類劃分的標準或依據等問題上至今仍然存在爭議。其中,作為詞類標注重點和難點的兼類詞處理問題特別引起了廣大學者的關注,如胡名揚[2~4]、郭銳[5~6]、蘇寶榮[7]、楊同用[8]、李爾鋼[9]、王仁強[1,10~11]等都多次論述到漢語詞類兼類問題。盡管目前學界已取得一定成果,但在個別詞的處理上有失妥當,主要原因在于判斷詞類時主要采取了內省的辦法而不是使用語料庫進行系統(tǒng)研究。鑒于此,本文擬采用基于語料庫的研究方法,以漢語常用詞“有”的詞性處理為例進行研究,為未來詞典編撰中兼類詞的處理提供新思路。
我們對《現(xiàn)代漢語詞典》(2005)、《現(xiàn)代漢語規(guī)范詞典》(2004)、《應用漢語詞典》(2000)、《中華實用詞典》(1989)和《新編現(xiàn)代漢語多功能詞典》(1988)等5部帶有詞性標注的詞典進行了調查分析,發(fā)現(xiàn)現(xiàn)有漢語詞典對“有”的釋義均設置8個義項,歸納如下:1.表示領有:我有一本《新華字典》。2.表示存在:屋里有5人。3.表示發(fā)生或出現(xiàn):形勢有了發(fā)展。4.表示達到一定的數(shù)量或某種程度:他有他哥哥那么高。5.表示所領有的事物的多或大:有經驗。6.泛指,跟“某”的作用相近:有人、有一天。7.用在“人、地方、時候”前,表示一部分:有人性子急,有人性子慢。8.用在某些動詞的前面組成套語,表示客氣:有請、有勞。對于“有”的釋義,5部詞典基本一致。對其詞性標注情況如下:《現(xiàn)代漢語規(guī)范詞典》(2004)將第8義標注為助詞,其余義項均標注為動詞;其他4部詞典對8個義項均標注為動詞?,F(xiàn)在我們的疑問是:“有”的詞性是否都是動詞?
過去詞典編纂時語言材料的搜集、整理和加工完全是靠手工進行的,這種方法費時費力,效率低下,占有材料有限。計算機出現(xiàn)之后,人們利用計算機的強大功能建立了語料庫,讓語言研究者能夠大量、詳盡地占有語言材料和使用語言材料,使語言研究得出更可靠的理論結論?!皬哪撤N意義上說,語料庫的使用,是語言研究的一次革命性的進步?!保?2]大量漢語語料庫的建立給詞典編纂研究者送來了一股春風,國內很多學者借助語料庫進行詞典編纂的理論研究,取得了可喜成績[1,10~11,13]。語料庫作為自然語言資料的集合,其語料通常反映了某一語言的用法特征及其多樣性。正確合理地使用語料庫可以為詞典編纂提供翔實可靠的依據,從而使所編詞典更好地體現(xiàn)出語言的真實性,提高編纂質量,同時也提高詞典的編纂效率。
我們就國家語委現(xiàn)代漢語語料庫對“有”進行了檢索,共獲得條目53 556條?!坝小笔歉哳l使用的詞語,數(shù)目很大,為了使語料可控,同時考慮其代表性和平衡性,我們隨機抽取1 000條,再排除只是作為語素如“擁有”、“有關”中的“有”而存在的條目,通過人工篩選的方式獲得了827條“有”的有效索引,有效率為82.7%。
我們根據“有”的8個義項對所有827條合格語料進行分類統(tǒng)計,結果如表1。
表1 “有”的8種意義所占比例情況
為了判斷“有”的詞性是否都是動詞,我們擬采用學術界普遍認可的判斷動詞的3項常規(guī)標準:(1)能否單獨作謂語;(2)能否受否定副詞“不/或/沒(有)”的修飾;(3)能否帶“了、著、過”[10]。為討論方便,下文將“有”的8個義項分別稱為“有1”至“有8”。
“有1”到“有5”可以單獨做謂語,“有6”至“有8”不能單獨作謂語,所有語料的例句也未將其用作謂語。例如:
(1)當然,真要理論起來,寫、編、發(fā)這些無聊玩意兒的文人都有一個共同理由:因為大家愛看。
(2)閩江上游的南平地區(qū)有7個縣市,日降雨量超過了100毫米。
(3)哪里有災情,你們就出現(xiàn)在那里。
(4)你那兒雪有多厚呀?
(5)外表上沉默寡言,他其實很有學問。
(6)當他救出10名群眾后,得知有一名要參加高考的女學生還被困在一幢樓上,他立即撐著小船趕去。
(7)現(xiàn)在,有人懷疑和否定黨的領導,有人以共產黨有缺點錯誤作為擺脫黨的領導的理由,甚至還有個別的人認為資本主義國家沒有共產黨的領導,不是也實現(xiàn)了現(xiàn)代化嗎?
(8)他隨即一轉身走進窯洞:“主席,有請!”
例(1)至例(5)的“有”在句中均用作謂語,分別表示“擁有”、“存在”、“發(fā)生或出現(xiàn)”“達到”和“多或大”的語義。而表示“某”的例(6)、表示“有些”的例(7),以及表示客氣的例(8)在句中都未用作謂語。可見,“有6”至“有8”標注為動詞是值得商榷的。
語料顯示,“有1”到“有5”可以受否定副詞“不”和“沒(有)”修飾。例如:
(9)可他們有獨立的人格,他們可以沒有一切,但卻不可沒有藝術相伴。
(10)他的童年里沒有不快樂的時光。
(11)一年來,他們的工作、學習、生活條件沒有新的發(fā)展。
(12)這個園區(qū)耕地面積沒有10萬畝。
(13)小光氣憤地說道:“我是窮人,我沒有錢!”
“有6”,即表示“某”之義,在語料中顯示可以被“沒”修飾,但是,根據我們的觀察,此處的“有”卻用的是“有2”的“存在”之義。如“我決定北上,沒有人為我送行”。這里的“沒有人”即“不存在一個人”的意思,而且很顯然,“沒有人”在該句中也不是謂語動詞。語料顯示,“有7”、“有8”不能被否定副詞“不”和“沒(有)”修飾。
為了檢驗“有”的各個語義是否能帶“了、著、過”,我們在國家語委現(xiàn)代漢語語料庫中對“有了”、“有著”和“有過”進行了檢索。分析語料得出:能帶“了、著、過”的例句中的“有”表示的語義是“有1”到“有5”。“有1”到“有4”可以帶“了、著、過”,但“有4”(特別是表比較時)的詞性問題也有很大的爭議,有的學者認為表比較的“有”是介詞[14~15]?!坝?”可以帶“了、著、過”,但此時的“有”的含義卻是“有1”的“領有”,并不表示“多或大”的含義。“有5”表示“多或大”只用于一些光桿名詞前,這樣的情況在語料中所占比例極小,僅為1.93%,而且它的主要功能是作謂語,表示的主要意義是“領有”,建議將其歸為“有1”之下,當作“有1”的一個次類來處理。
經過以上分析,我們發(fā)現(xiàn)“有”的8個義項并非都是動詞,大中型主流漢語詞典將其詞性處理為唯動詞是值得商榷的。“有”的后3義不應標注為動詞,那么,“有6”、“有7”和“有8”究竟該標注為什么詞性更合理呢?
什么是兼類詞?目前主要有兩種觀點。寬泛一些的觀點認為,讀音相同、詞形相同、意義有聯(lián)系(不一定相同)的具有兩種以上詞性的詞就是兼類詞;嚴格一點的看法認為,讀音相同、詞形一致、意義一致的具有兩種以上詞性的詞才是兼類詞[9]。根據“意義是否一致”這一區(qū)別,郭銳把兼類詞區(qū)分為異型兼類詞和同型兼類詞兩種,異型兼類詞指詞義不同的兼類詞,同型兼類詞指詞義相同的兼類詞[5~6]。王仁強指出:“只要一個詞的表述功能發(fā)生轉化,就應在詞典中確立其義項地位,而不管詞義是否發(fā)生多大的變化;至于處理成兼類詞還是同形詞,則是詞典編纂策略的問題。”[1](P21)因此,我們認為現(xiàn)代漢語中高頻使用的“有”義項較多,盡管不同詞義聯(lián)系很小,也可以當作兼類詞來處理。
詞性標注以什么為依據呢?是詞義還是語法功能?以前很多辭書在判斷詞性時都主要根據詞語意義,然而意義似流沙難以把握,因此問題多多,只有根據詞的語法功能才能更可靠地把握詞性[1,8,16]。我們不能僅僅隨意舉出個別用例來判斷詞性,而是應依靠計算機所建立的語料庫,特別是大型的平衡語料庫來對詞語的用法進行定性定量分析。只有依靠大型的平衡的語料,我們才能更客觀可靠地把握詞的語法功能,從而判斷詞性。
我們對“有6”的63條語料進行了詳細考察,發(fā)現(xiàn)有以下兩種用法:1.用在名詞前,表示泛指,如:有人;2.用在“一或幾+名詞”之前,如:有一天,有一年。功能上,一般是用作狀語和主語。我們所調查的5部詞典,它們都認為“有6”表示“不定指”,與“某”的作用相似。因此,我們可以在此比較一下“有6”與“某”的用法區(qū)別?!冬F(xiàn)代漢語八百詞》認為“某”有兩種用法:1.用在名詞前,指不確定的或不便明確地說出來的人或事物;第一種情況又有三種小類:a)某十名;b)某+甲(乙、丙…);c)某十數(shù)量十名,數(shù)詞限于“一、幾”。2.用在姓氏后,指確定的人或自稱[17]??梢姡坝?”的用法完全包括在作代詞的“某”的用法之中,也就是說,“有”修飾“名詞”或“一/幾+名詞”所表示的意義,已經不是動詞的意義。這一搭配組合有明顯的不定代詞的特點,應該承認其語義改變、語義范疇改變、組合上表現(xiàn)出不定代詞的語義特點,因此,將其處理為代詞為妥。
“有7”在語料中占86條,主要用于“人,地方,時候”前,表示“一部分”。如:
(14)有人在妒火中燒中熬日月,有人于不公平待遇里苦撐持,更有人在“各有各的不幸”生活圈內暗自飲泣,卻鮮為人知。
我們認為,“有7”是“有些”作為代詞時的縮用,所有“有7”的語料均可用“有些”替換,因此,應該與“有些”的詞性標注一致,即代詞。
語料顯示,“有8”用在僅有的少數(shù)幾個動詞的前面,表示客氣,如:有請,有勞。其表義作用和組合特點完全同于助詞的意義和組合特點。因此,我們認為《現(xiàn)代漢語規(guī)范詞典》(2004)將其處理為助詞是恰當?shù)摹?/p>
經過以上基于語料的分析,我們可以得出,目前5部詞典把“有”的詞性簡單處理為“動詞”是不妥當?shù)??!坝?”到“有3”比較明顯地體現(xiàn)為動詞?!坝?”的詞性爭論正體現(xiàn)了原型范疇理論的觀點,我們不能對其詞性做出一刀切的二元分割,語言中普遍存在著這種現(xiàn)象[18]。在詞典編纂時,我們可以根據其占多數(shù)的詞性來確定,根據我們的語料分析,“有4”這個語義不表比較的情況更多,因此處理為動詞。再將“有5”合并到“有1”,“有6”、“有7”、“有8”分別處理為代詞、代詞和助詞。中型漢語詞典可以這樣處理:
有yǒu:? 動 擁有、領有:我 ~《現(xiàn)代漢語詞典》。|他~朝氣。注意:其后接光桿名詞表示“擁有很多xx”:他~錢。?動存在:教室~5個人。?動出現(xiàn)、發(fā)生:形勢~了新進展。?動 達到(某種數(shù)量或程度):水~一丈多深。|他~哥哥那么高。?代某(表泛指):~人這么說。|~一天他來了。?代有些、一些:~人性子急,~人性子慢。?助(無意義,用在少數(shù)動詞前組成套語,表示客氣):~勞。|~請。
語言在漫長的進化過程中為了滿足表義的需要,必然會發(fā)展出各種語法手段,其中最主要的是實詞虛化和曲折變化[19]。在缺乏形態(tài)變化的現(xiàn)代漢語中,很多詞語尤其是高頻使用的實詞,在組合中常常生出新義,語義范疇發(fā)生變化[20~21]。這種情況下對其詞性的標注應該怎樣處理為好?以語料庫為輔助工具,本文以現(xiàn)代漢語常用高頻詞“有”為例,對這類詞的詞性處理做了一個嘗試性探討,從我們的研究結果可以得出以下有關詞典編纂的啟示:第一,一些高頻使用的詞語常常因為其使用范圍廣而有許多不同的詞義和語法功能,我們不能根據其基本義將其詞性簡單地處理為單類詞,將其處理為兼類詞能更真實地反映詞語的實際用法。第二,“一個詞的意義就是它在語言中的使用?!保?2]詞匯的意義并不是一成不變、僵化地存在著,隨著語言環(huán)境的改變,詞語的意義和功能都可能改變。因此,詞性標注必須以“語法功能”為主。第三,漢語詞典編纂必須使用計算機語料庫,必須占有充分的語料,這樣才能保證釋義和詞性處理的準確性。
本文以語料庫為研究工具,對現(xiàn)代漢語高頻使用的“有”的詞性進行了深入調查,從而發(fā)現(xiàn)目前大中型漢語詞典在處理一些常用詞的詞性時存在簡單化的弊病,因此對“有”的詞性處理有失允當。我們在利用語料庫占有充分的語言材料的基礎上,得出現(xiàn)代漢語的“有”是動代助兼類詞。本文由此為詞典編纂得出啟示:詞性標注應以語法功能為主要標準,而且詞性判斷不能單靠內省,而應依靠計算機語料庫占有充分的語言材料才能保證詞性處理的準確性。
(衷心感謝四川外語學院王仁強教授的指導!)
[1]王仁強.認知視角的漢英詞典詞類標注實證研究[M].上海:上海譯文出版社,2006.
[2]胡名揚.兼類問題[A].胡名揚.詞類問題考察[C].北京:北京語言文化大學出版社,1996.
[3]胡名揚.動名兼類的計量考察[A].胡名揚.詞類問題考察[C].北京:北京語言文化大學出版社,1996.
[4]胡名揚.信息處理用現(xiàn)代漢語詞類的兼類問題[A].胡名揚.詞類問題考察續(xù)集[C].北京:北京語言大學出版社,2004.
[5]郭銳.語文詞典的詞性標注問題[J].中國語文,1999,(1):150 ~158.
[6]郭銳.現(xiàn)代漢語詞類研究[M].北京:商務印書館,2002.
[7]蘇寶榮.詞語兼類的功能顯示與深層語義分析[J].語文研究,2005,(1):9 ~12.
[8]楊同用.詞的語法功能與語文辭書中兼類詞的詞性標注[J].漢字文化,2010,(2):23 ~26.
[9]李爾鋼.兼類詞的義項設置和詞性標注問題[J].辭書研究,2006,(3):14 ~24.
[10]王仁強.基于語料庫的“生人”用法調查及其對漢語詞典編纂的啟示[J].四川外語學院學報,2006,(5):94~99.
[11]王仁強.語法隱喻與漢語詞典自指義項的設立——一項基于語料庫的研究[J].外國語文,2009,(2):100~108.
[12]Huston Susan.應用語言學中的語料庫[M].馮志偉,譯.北京:世界圖書出版社,2006.D12.
[13]劉紅蕾.基于語料庫的雙語詞典編纂中的詞性標注方法[J].華北工學院學報(社科版),2002,(3):63~65.
[14]宋玉柱.介詞“有”應該肯定[J].漢語學習,1987,(2):20~21.
[15]徐志敏.論介詞“有”[J].殷都學刊,2000,(1):102~105.
[16]王仁強.現(xiàn)代漢語詞類體系效度研究[J].外語教學與研究,2010,42(5):380 ~386.
[17]呂叔湘.現(xiàn)代漢語八百詞[M].北京:商務印書館,1980/1998.390 ~391.
[18]Taylor J R.Linguistic Categorization-Prototypes in Linguistic Theory[M].Oxford:OUP,1989/1995.
[19]袁眉.語言起源研究綜述[J].重慶交通大學學報(社會科學版),2009,9(5):96 ~100.
[20]符淮青.組合中語素和詞語義范疇的變化[J].江蘇大學學報,2007,(1):70 ~74.
[21]符淮青.詞在組合中語義范疇的變化和詞性標注[J].辭書研究,2010,(5):1 ~7.
[22]Wittgenstein L.Philosophical Investigations[M].Anscombe G E M(Trans).Basil Blackwell Ltd,1953/1958.
A Corpus-based Study of the Parts of Speech of YOU and Its Inspirations on Dictionary Compiling
PENG Zhi-bin
(Graduate School,Sichuan International Studies University,Chongqing 400031,China)
The parts of speech of the modern Chinese word“you”(to have),which is very widely used in modern Chinese,are regarded as verbs only by many main Chinese dictionaries,which is indefensible.Based on the corpus,a thorough research is done on its usage and there forms a conclusion that“you”can be verbs,pronouns and auxiliaries.Furthermore,some constructive suggestions are also presented for dictionary compiling.
“you”;concurrence;grammatical functions;corpus;dictionary compiling
H314.1
A
1674-0297(2011)04-0132-04
2011-04-11
彭志斌(1984-),男,四川營山人,四川外語學院碩士研究生,主要從事認知語言學、語言哲學研究。
(責任編輯:張 璠)