儲(chǔ)小靜
(華中師范大學(xué) 文學(xué)院,湖北 武漢 430079)
復(fù)句作為漢語(yǔ)語(yǔ)法重要的實(shí)體單位,它表達(dá)的語(yǔ)義信息豐富復(fù)雜,因而在信息處理領(lǐng)域有很多方面值得研究。但是,復(fù)句層次和關(guān)系的自動(dòng)分析中,關(guān)系詞語(yǔ)的省略及嵌套是較難處理的問(wèn)題。事實(shí)上,這兩大問(wèn)題都與復(fù)句關(guān)聯(lián)標(biāo)記的離析度有關(guān)[1]。離析度(Separation Degree)本指具有相似性質(zhì)微粒間發(fā)生集聚,進(jìn)而引起物料的相互分離的程度,這一概念被廣泛應(yīng)用于化學(xué)工程學(xué)、土木工程學(xué)、冶金學(xué)、藥學(xué)等領(lǐng)域。本文中復(fù)句關(guān)聯(lián)標(biāo)記離析度是指固定搭配成對(duì)的關(guān)聯(lián)標(biāo)記相互依存、聯(lián)系的緊密程度——相互間依存度高意味著關(guān)聯(lián)標(biāo)記的離析度低,反之則離析度高。
依據(jù)分句間關(guān)系的不同,復(fù)句分為因果類復(fù)句、并列類復(fù)句、轉(zhuǎn)折類復(fù)句三大類[2]。因果復(fù)句屬于因果類復(fù)句的一小類,它由原因分句和結(jié)果分句兩部分構(gòu)成,兩種分句的語(yǔ)序差異則構(gòu)成兩種類型的因果復(fù)句。一類為原因分句在前結(jié)果分句在后,稱作“因一果”復(fù)句,其典型句式為“因?yàn)椤浴保缋?1);另一類為結(jié)果分句在前原因分句在后,稱為“果一因”復(fù)句,其典型句式為“之所以……是因?yàn)椤保缋?2)。
(1)因?yàn)閮缮却箝T敞開(kāi),又向陽(yáng),所以光亮些罷。
(2)作者指出,中國(guó)之所以能夠創(chuàng)造奇跡,是因?yàn)樽裱霜?dú)立自主、熱愛(ài)祖國(guó)、反腐倡廉、遵紀(jì)守法和富民強(qiáng)國(guó)的原則。
從語(yǔ)感上看,兩兩匹配的關(guān)系詞語(yǔ)“因?yàn)椤迸c“所以”、“之所以”與“是因?yàn)椤狈蛛x的能力都較強(qiáng),相互依存度都不高,既可嵌套也可省略。那么,這兩種格式的離析能力完全相同嗎,是否存在差異呢?本文擬在劉云基礎(chǔ)上,對(duì)這兩種典型的有標(biāo)因果句式展開(kāi)關(guān)于關(guān)系詞語(yǔ)離析能力的對(duì)比研究,將從8個(gè)方面分析,以期發(fā)現(xiàn)更多新的語(yǔ)言現(xiàn)象、規(guī)律,運(yùn)用于中文信息處理中。
省略能力指因果句式“因?yàn)椤浴薄爸浴且驗(yàn)椤敝信鋵?duì)使用的關(guān)聯(lián)標(biāo)記是否可以省略的能力。如果能夠省略,省略一個(gè)還是兩個(gè)都可以省略。如果省略能力越強(qiáng),則離析程度越高。
儲(chǔ)澤祥認(rèn)為,復(fù)句中如果只在前分句用了因果關(guān)聯(lián)標(biāo)記,則屬于居端依賴式(簡(jiǎn)稱居端式),如例(3);如果只在后分句用了因果關(guān)聯(lián)標(biāo)記,屬于居中粘接式(簡(jiǎn)稱居中式),如例(4);如果前后分句都用了因果關(guān)聯(lián)標(biāo)記,則屬于前后配套式(簡(jiǎn)稱配套式),如例(5)[3]。據(jù)此,本文將語(yǔ)料中關(guān)聯(lián)標(biāo)記使用情況分為“居端式”“居中式”和“配套式”三種,統(tǒng)計(jì)結(jié)果見(jiàn)表1。
表1 因果句式關(guān)聯(lián)標(biāo)記使用頻數(shù)統(tǒng)計(jì)
(3)他因?yàn)樘?,沒(méi)吃飯便倒在床上睡去了。
(4)捕拿外國(guó)交涉代表最初也是他提議的,所以他也是屬于剿夷派的。
(5)因?yàn)樗咕芨淖?,所以形狀一直不變?/p>
“因?yàn)椤浴焙汀爸浴且驗(yàn)椤眱煞N因果句式中關(guān)系詞語(yǔ)的省略力都很強(qiáng),且居中式和居端式出現(xiàn)的頻次遠(yuǎn)遠(yuǎn)多于配套式。不同的是,“因?yàn)椤浴本涫街?,居端式的頻次明顯多于居中式和配套式,分別是居中式的2.3倍、配套式的41.9倍,即居端式>居中式、配套式?!爸浴且?yàn)椤本涫街?,居中式的頻次略微多于居端式和配套式,分別是居端式的1.06倍、配套式的4.33倍,即居中式>居端式、配套式。
我們引入MI值(mutual information value)這一概念來(lái)計(jì)算因果句式中前后關(guān)系詞語(yǔ)的搭配強(qiáng)度。MI值(又稱“互信息值”)代表共現(xiàn)的兩個(gè)變量中一個(gè)變量對(duì)另一個(gè)變量的影響程度,表現(xiàn)在復(fù)句格式中,即為關(guān)系詞語(yǔ)A在語(yǔ)料庫(kù)中出現(xiàn)包含的關(guān)于關(guān)系詞語(yǔ)B出現(xiàn)的概率信息。互信息值愈大,節(jié)點(diǎn)詞對(duì)其詞匯環(huán)境影響愈大,共現(xiàn)詞由于節(jié)點(diǎn)詞的出現(xiàn)進(jìn)而減少不確定性。其計(jì)算公式為:
(1)
P(a)代表a在語(yǔ)料庫(kù)中各個(gè)位置的平均出現(xiàn)的概率,P(b)代表b在語(yǔ)料庫(kù)中各個(gè)位置的平均出現(xiàn)的概率,P(a,b)代表搭配詞a與節(jié)點(diǎn)詞b的共現(xiàn)概率,統(tǒng)計(jì)中設(shè)定的搭配距離值為18[4]。它們的計(jì)算公式如下:
(2)
(3)
(4)
其中,W代表總詞容,為10 429 653詞次,f(a)代表a在語(yǔ)料庫(kù)中出現(xiàn)的頻次,f(b)代表b在語(yǔ)料庫(kù)中出現(xiàn)的頻次,f(a,b)代表搭配詞a與節(jié)點(diǎn)詞b在設(shè)定的搭配距離內(nèi)共現(xiàn)的頻次。
在“因?yàn)椤浴本涫街校O(shè)定a=“因?yàn)椤?,b=“所以”,其MI值為7.11。在“之所以……是因?yàn)椤本涫街?,設(shè)定a=“之所以”,b=“是因?yàn)椤?,其MI值為12.14。由計(jì)算結(jié)果可知,“因?yàn)椤浴本涫街蠱I值小于“之所以……是因?yàn)椤本涫街蠱I值,即“因?yàn)椤浴钡氖÷阅芰?qiáng)于“之所以……是因?yàn)椤薄?/p>
當(dāng)然,“之所以……是因?yàn)椤钡木佣耸诫m然省略了后面的關(guān)系詞語(yǔ)“是因?yàn)椤保鄶?shù)情況下需要和“主要是”“主要原因是”“是……決定的”“歸因于”等表原因的詞語(yǔ)或構(gòu)式組合搭配成句。這也從側(cè)面證明了“之所以……是因?yàn)椤笔÷阅芰κ鞘芟拗频摹?/p>
擴(kuò)展能力指因果句式“因?yàn)椤浴薄爸浴且驗(yàn)椤敝心芊窦尤胂嗤年P(guān)系詞語(yǔ)的能力,還有如“由于……因而”可以擴(kuò)展為“由于……也由于……因而”,“不是……而是”可以擴(kuò)展為“不是……也不是……而是”。這些關(guān)系詞語(yǔ)的擴(kuò)展能力都較強(qiáng)。而有的關(guān)系詞語(yǔ)卻不能擴(kuò)展,如“與其……不如”不能擴(kuò)展為“與其……不如……不如”,也不能擴(kuò)展為“與其……與其……不如”??梢詳U(kuò)展的復(fù)句關(guān)系詞語(yǔ)的離析能力要強(qiáng)于不能擴(kuò)展的復(fù)句關(guān)系詞語(yǔ)。
對(duì)比“因?yàn)椤浴?、“之所以……是因?yàn)椤眱煞N句式,它們都可以進(jìn)行擴(kuò)展,也都可以和其他類型的關(guān)系詞語(yǔ)連用。前者可以擴(kuò)展為 “(正)因?yàn)椤?正)因?yàn)椤浴⒁驗(yàn)椤惨驗(yàn)椤?、因?yàn)椤浴浴?,后者可以擴(kuò)展為“之所以……之所以……(就是)因?yàn)?、之所以……是因?yàn)椤惨驗(yàn)?、之所以……是因?yàn)椤且驗(yàn)椤钡?。?qǐng)看如下例句:
(6)正因?yàn)槿罕娐肪€是我國(guó)刑法的巨大力量的源泉,正因?yàn)槿罕娐肪€是為了誰(shuí)、依靠誰(shuí)的關(guān)乎革命的根本問(wèn)題,所以在政法工作中要不要群眾路線是社會(huì)主義和資本主義兩條道路的斗爭(zhēng)問(wèn)題。
(7)哦,因?yàn)槭?,所以消極悲觀,所以要自殺么?
(8)在中國(guó),共產(chǎn)黨領(lǐng)導(dǎo)的無(wú)產(chǎn)階級(jí)革命之所以能吸引千千萬(wàn)萬(wàn)的勞動(dòng)人民的參加,之所以有那么多工農(nóng)群眾不怕流血犧牲,堅(jiān)定地跟著共產(chǎn)黨走,就是因?yàn)槿嗣袢罕姸霉伯a(chǎn)黨是為了謀求勞苦大眾的解放,是為勞動(dòng)人民爭(zhēng)民主的。
(9)春天之所以為人喜歡,是因?yàn)殒弊湘碳t的繁花,是因?yàn)榍啻溆蔚木G芽。
我們?cè)O(shè)定搭配距離為18,對(duì)語(yǔ)料庫(kù)窮盡檢索,發(fā)現(xiàn),“因?yàn)椤浴毕蚯皵U(kuò)展130例,向后擴(kuò)展30例;“之所以……是因?yàn)椤毕蚯皵U(kuò)展20例,向后擴(kuò)展100例。當(dāng)“之所以……是因?yàn)椤本涫较蚝髷U(kuò)展時(shí),表原因的后分句多嵌套一個(gè)遞進(jìn)、選擇或并列關(guān)系復(fù)句,原因標(biāo)“因?yàn)椤背R?guī)出現(xiàn)在并列標(biāo)、選擇標(biāo)或遞進(jìn)標(biāo)的后面。當(dāng)“因?yàn)椤浴本涫较蚯皵U(kuò)展時(shí),表原因的前分句多嵌套并列、遞進(jìn)關(guān)系復(fù)句,此時(shí)并列標(biāo)或遞進(jìn)標(biāo)可出現(xiàn),亦可不出現(xiàn)。如若出現(xiàn),原因標(biāo)的位置大多在后面。
總的來(lái)說(shuō),句式“因?yàn)椤浴焙汀爸浴且驗(yàn)椤倍加幸欢ǖ臄U(kuò)展能力,都可以豐富句法結(jié)構(gòu)及語(yǔ)義內(nèi)容。兩種句式擴(kuò)展能力相差不大。
嵌套能力指因果句式“因?yàn)椤浴薄爸浴且驗(yàn)椤敝心芊袂短灼渌P(guān)系詞語(yǔ)的能力。有些配對(duì)使用的復(fù)句關(guān)系詞語(yǔ)結(jié)合很緊密,幾乎不能嵌套其他關(guān)系詞語(yǔ)[5],例如表推斷關(guān)系的“與其說(shuō)……不如說(shuō)”,窮盡語(yǔ)料難以發(fā)現(xiàn)中間嵌套其他關(guān)系詞語(yǔ)的例子。而有些配對(duì)使用的復(fù)句關(guān)系詞語(yǔ)結(jié)合較自由,中間能夠嵌套其他關(guān)系詞語(yǔ)[6],如表轉(zhuǎn)折關(guān)系的“雖然……但是”或表因果關(guān)系的“多虧……因此”。
觀察語(yǔ)料可以將“因?yàn)椤浴薄爸浴且驗(yàn)椤本涫降那短浊闆r歸納如表2所示。①
表2 “因?yàn)椤浴焙汀爸浴且驗(yàn)椤本涫角短浊闆r總結(jié)
(10)因?yàn)樗辉溉ゼ又啬莻€(gè)社會(huì)的黑暗,所以他寧愿去討飯,也不拿那五斗米的薪俸。
(11)因?yàn)閲?guó)家為了鼓勵(lì)擴(kuò)大再生產(chǎn),規(guī)定建筑部門的利潤(rùn)較低、稅負(fù)較少,所以建筑部門職工生產(chǎn)的價(jià)值較低。
(12)你之所以選擇了我,是因?yàn)槲沂俏?,還是因?yàn)槲艺檬沁@個(gè)類型的女人?
(13)黨在漫長(zhǎng)的歲月中,之所以歷經(jīng)磨難而不衰,不管遇到多么大的狂風(fēng)暴雨,都能巍然挺立,就是因?yàn)樯钌钤谌嗣袢罕娭小?/p>
“因?yàn)椤浴笨梢郧短准俎D(zhuǎn)關(guān)系之外的10種關(guān)系,幾乎囊括了所有復(fù)句關(guān)系類型。嵌套方式上既可以由前分句嵌套,也可以由后分句嵌套。相比之下,句式“之所以……是因?yàn)椤敝锌汕短椎年P(guān)系詞語(yǔ)種類數(shù)量較少,并且大多數(shù)是后分句嵌套,可以放在前后分句中間的情況很少。如例(13)是表因果關(guān)系的“之所以……是因?yàn)椤鼻昂蠓志渲g嵌套表讓步關(guān)系的“不管……都”,其他各例多是表原因的后分句嵌套各類關(guān)系詞語(yǔ)。總之,“之所以……是因?yàn)椤本涫角短撞粔蜃杂?,其嵌套能力不如“因?yàn)椤浴薄?/p>
停頓能力是指因果句式“因?yàn)椤浴?、“之所以……是因?yàn)椤敝信鋵?duì)使用的關(guān)系詞語(yǔ)之間能否停頓的能力。停頓越長(zhǎng),離析能力越高;反之,則離析能力較弱。來(lái)看下面的例子:
(14)“瑞表”是一種可大量生產(chǎn)的塑料廉價(jià)石英表,內(nèi)部零件因?yàn)槲⑿图夹g(shù)的充分運(yùn)用,元件使用數(shù)目比傳統(tǒng)石英表減少約44%,也就是由原來(lái)的91個(gè)減為51個(gè),表的厚度也減薄至8毫米,再加上元件是以超音波焊接,沒(méi)有一顆螺絲,表面玻璃也是嵌鑲在表殼里的,所以它是絕對(duì)防水避震的。
(15)當(dāng)時(shí)北平的老百姓,因?yàn)閷?duì)過(guò)去日本搞什么戶口、良民證、身份證,恨透了,所以對(duì)國(guó)民黨又來(lái)搞戶口登記,很反感,都不去上戶口。
例(14)中,“因?yàn)椤浴敝g使用的雖然全是逗號(hào),但停頓距離為88個(gè)字符,停頓長(zhǎng)。例(15)中,“因?yàn)椤浴敝g使用的有停頓能力很弱的頓號(hào),但停頓的距離是23個(gè)字符,停頓較長(zhǎng)。
(16)他之所以能夠捱了多少年,沒(méi)有逃開(kāi)那個(gè)烏煙瘴氣的工廠,是因?yàn)槟抢镉泻脦讉€(gè)他的患難的伙伴。
(17)張某進(jìn)一步透露,他們之所以能一次用一大疊發(fā)票去換購(gòu)物券及用一大疊購(gòu)物券在收銀臺(tái)處與顧客交換等額現(xiàn)金,是因?yàn)榕c店內(nèi)人士“有關(guān)系”、“有分成”。
窮盡語(yǔ)料發(fā)現(xiàn)“之所以……是因?yàn)椤本涫街g不能用句號(hào)、分號(hào)停頓,多數(shù)用逗號(hào),且停頓距離較短,最長(zhǎng)的停頓距離不超過(guò)40字符,如例(16)的22個(gè)字符、例(17)的37個(gè)字符。
由上可知,“因?yàn)椤浴眱?nèi)部不僅可以插入各種獨(dú)立語(yǔ)等語(yǔ)用成分,也可以插入句法成分;不僅可以使用分號(hào)、逗號(hào)等句內(nèi)點(diǎn)號(hào),也可以使用句號(hào)句末點(diǎn)號(hào);果標(biāo)甚至可以成為篇章關(guān)聯(lián)標(biāo)記。與之相比,“之所以……是因?yàn)椤钡耐nD能力較弱。
管控能力是指因果句式“因?yàn)椤浴薄爸浴且驗(yàn)椤敝嘘P(guān)系詞語(yǔ)能否位于主語(yǔ)前面管控整個(gè)小句的能力。置于主語(yǔ)前面的關(guān)系詞語(yǔ)比僅位于主語(yǔ)后面管控述語(yǔ)部分的關(guān)系詞語(yǔ)的離析度高。
例如并列復(fù)句“一面……一面”,當(dāng)主語(yǔ)相同時(shí),關(guān)系詞語(yǔ)“一面”既可以位于主語(yǔ)后;也可以位于主語(yǔ)前;當(dāng)主語(yǔ)不同時(shí),關(guān)系詞語(yǔ)“一面”則位于主語(yǔ)后。像例(18)、(19)這種用法的非常少見(jiàn),搜集到的例句僅幾十例?,F(xiàn)代漢語(yǔ)中“一面……一面”格式連接的兩個(gè)分句主語(yǔ)大多數(shù)是相同的,且關(guān)系詞語(yǔ)“一面”位于主語(yǔ)后。也就是說(shuō)“一面”的管控能力較弱。
(18)一面他不愿和桂秋講什么,一面他切盼樹(shù)人們回來(lái)。
(19)他一面脫上衣和背心,我一面告訴他一切安排都推遲了,等他來(lái)決定。
那么,“因?yàn)椤浴薄爸浴且驗(yàn)椤钡墓芸啬芰θ绾危糠治稣Z(yǔ)料,“因?yàn)椤浴本涫街小耙驗(yàn)椤奔瓤梢晕挥谥髡Z(yǔ)前面也可以位于主語(yǔ)后面,位置較自由,離析能力強(qiáng),如例(20)、(21)?!爸浴且?yàn)椤本涫街小爸浴比嘉挥谥髡Z(yǔ)后,管控后面述語(yǔ)部分,離析能力大為減弱,如例(22)。
(20)因?yàn)樗麤](méi)有文化父親,所以才叫私生子,單憑這一條,就足以使他永生難見(jiàn)天日。
(21)皇帝因?yàn)椴幌嘈潘某甲?,怕他們反他,所以要他們直接向他?fù)責(zé)。
(22)絕對(duì)理念之所以成為絕對(duì)理念,就是因?yàn)樗诰裆现v是發(fā)展到了極點(diǎn)。
由于管控能力強(qiáng)的關(guān)系詞語(yǔ)控制小句能力較強(qiáng),有時(shí)中間可以嵌套其他關(guān)系復(fù)句或關(guān)聯(lián)詞語(yǔ),使用頻率也隨之升高。
對(duì)應(yīng)能力是指因果句式“因?yàn)椤浴薄爸浴且驗(yàn)椤敝嘘P(guān)系詞語(yǔ)是否為一對(duì)一,能否一對(duì)多的能力??梢砸粚?duì)多的關(guān)系詞語(yǔ)的離析能力強(qiáng)于只能一對(duì)一的關(guān)系詞語(yǔ)。
邢福義[7]先生把因果類復(fù)句分為說(shuō)明性因果、推論性因果、目的性因果、假設(shè)性因果和條件性因果五種,是廣義的因果關(guān)系。狹義的因果復(fù)句即說(shuō)明性因果復(fù)句,按照語(yǔ)序的前后可分為由因溯果句——“因—果”復(fù)句和由果溯因句——“果—因”復(fù)句[8]?!耙?yàn)椤浴薄爸浴且驗(yàn)椤狈謩e作為“因—果”復(fù)句和“果—因”復(fù)句的典型形式,各自的對(duì)應(yīng)能力是不同的。
“因?yàn)椤浴敝校胺志潢P(guān)系詞語(yǔ)“因?yàn)椤笨梢愿鄠€(gè)表結(jié)果的關(guān)系詞語(yǔ)配對(duì)(如“因此才、就、因而、便、故此、故而、以至、以致”)而不影響語(yǔ)義表達(dá),同理,后分句關(guān)系詞語(yǔ)“所以”也有多個(gè)表原因的關(guān)系詞語(yǔ)“多虧、鑒于、由于、幸虧、可惜、好在、虧得”與之配對(duì)。
再來(lái)看“之所以……是因?yàn)椤本涫?,與前分句關(guān)系詞語(yǔ)“之所以”配對(duì)的表原因的關(guān)系詞語(yǔ),和與后分句關(guān)系詞語(yǔ)“是因?yàn)椤迸鋵?duì)的表結(jié)果的關(guān)系詞語(yǔ)都各只有一個(gè),分別是“由于”和“所以”。雖非只能一對(duì)一,但對(duì)應(yīng)能力也非常弱。顯然,“因?yàn)椤浴睂?duì)應(yīng)能力強(qiáng)于“之所以……是因?yàn)椤?。這也從側(cè)面驗(yàn)證了相較于“之所以……是因?yàn)椤保蚬健耙驗(yàn)椤浴备鼮槌S?、具有普適應(yīng)。
換位能力是指因果句式“因?yàn)椤浴薄爸浴且驗(yàn)椤敝泻嫌玫年P(guān)系詞語(yǔ)能否互換位置的能力??梢該Q位的復(fù)句關(guān)系詞語(yǔ)的離析度高于不能換位的復(fù)句關(guān)系詞語(yǔ)。
例如“唯有……才”不能換位成“才……唯有”;“是……還是”不能換位成“還是……是”,它們的換位能力弱,離析度低。又如“不是……而是”可以換位成“(而)是……不是”;“盡管……但是”可以換位成“(但是)……盡管”,換位后它們的語(yǔ)義并未發(fā)生變化,離析度高。
復(fù)句作為語(yǔ)法實(shí)體,具有嚴(yán)密的邏輯語(yǔ)義關(guān)系,一般情況下前后分句的句序是相對(duì)固定的。但由于語(yǔ)用因素或上下文銜接原因,“分句句序逆置”現(xiàn)象時(shí)有發(fā)生:
(23)a.一名記者表示,他與同事每天早上都是“閉著眼工作”,因?yàn)樗麄兌纪ㄏ辞颉?/p>
b.一名記者表示,因?yàn)樗麄兌纪ㄏ辞?,所以他與同事每天早上都是“閉著眼工作”。
(24)a.黨的基層組織之所以重要,因?yàn)樗怯?xùn)練、教育黨員的特殊學(xué)校。
b.因?yàn)樗怯?xùn)練、教育黨員的特殊學(xué)校,所以黨的基層組織重要。
從例句(23)和(24)可知,“因?yàn)椤浴薄爸浴且驗(yàn)椤笔莾煞N語(yǔ)序完全相反的因果復(fù)句,毫無(wú)疑問(wèn),它們是可以互換的,互換能力都很強(qiáng)。因此本節(jié)不贅述。
位置因素指同樣的關(guān)系詞語(yǔ)處于不同的位置時(shí)會(huì)影響其離析能力。例如“或者……或者”如果需要省略,一般省略前一個(gè)“或者”保留后一個(gè)“或者”。諸如此類表并列關(guān)系的句式“既……又、既……也、又……又、也……也、一邊……一邊、一面……一面和一方面……另一方面”都可以省略前一個(gè)關(guān)系詞語(yǔ)而不影響理解。這同樣是離析度高的表現(xiàn)。
關(guān)系詞語(yǔ)“因?yàn)椤薄八浴薄爸浴薄笆且驗(yàn)椤弊鳛轱@赫關(guān)系標(biāo)記,幾乎在任何句法語(yǔ)義環(huán)境下都能充當(dāng)關(guān)系標(biāo)記,并且都能明確標(biāo)示其因果復(fù)句關(guān)系類型,它們的位置能力是不容置疑的?!耙?yàn)椤浴辈徽撌乔笆÷赃€是后省略,多數(shù)情況下都不影響理解,復(fù)句自動(dòng)分析時(shí)可以輕松識(shí)別。而“之所以……是因?yàn)椤本涫街小笆且驗(yàn)椤笔÷詴r(shí),多數(shù)情況下“之所以”要和“原因就是、重要的原因是、由……決定、根本原因是、導(dǎo)致、原因在于、在于”等表原因的詞語(yǔ)或構(gòu)式組合搭配成句,復(fù)句信息化處理時(shí)需要考量這些詞語(yǔ)參數(shù)。
綜上,可將上述八個(gè)標(biāo)準(zhǔn)比較結(jié)果列表如下②:
表3 “因?yàn)椤浴焙汀爸浴且驗(yàn)椤彪x析度對(duì)比
相較于“因?yàn)椤浴保爸浴且驗(yàn)椤钡氖÷?、嵌套、停頓、管控、對(duì)應(yīng)和位置都受到極大的制約。同屬因果關(guān)系的“因?yàn)椤浴钡碾x析能力比“之所以……是因?yàn)椤睆?qiáng)得多。我們認(rèn)為,省略和嵌套能力是影響關(guān)聯(lián)標(biāo)記離析度的重要的因素,等級(jí)序列優(yōu)先于換位、停頓、擴(kuò)展、管控、對(duì)應(yīng)和位置因素。當(dāng)然,這八種因素共同作用于復(fù)句關(guān)聯(lián)標(biāo)記,不可或缺。
自中文信息處理研究邁入“句處理”階段以來(lái),短語(yǔ)結(jié)構(gòu)分析及單句的自動(dòng)句法分析都取得了不俗的成績(jī)。然而要進(jìn)一步實(shí)現(xiàn)中文信息處理研究的跨越式發(fā)展,推動(dòng)人工智能的深化,并最終讓計(jì)算機(jī)理解自然語(yǔ)言,依然還有很長(zhǎng)的路要走。不論利用什么樣的研究方法,采用何種研究路數(shù),在這個(gè)過(guò)程中,復(fù)句信息處理都是無(wú)法繞開(kāi)的重要議題[9]。
對(duì)復(fù)句的理解與分析起著重要作用的關(guān)聯(lián)標(biāo)記,其離析度的高低自然影響著復(fù)句信息工程的發(fā)展。首先在復(fù)句自動(dòng)分析方面,關(guān)聯(lián)標(biāo)記的離析度可以為復(fù)句的層次劃分提供參考。例如,一般嵌套能力強(qiáng)的關(guān)聯(lián)標(biāo)記所在分句多為第一層次,包孕著嵌套能力弱的關(guān)聯(lián)標(biāo)記引領(lǐng)的分句。同樣,一般停頓能力強(qiáng)的關(guān)聯(lián)標(biāo)記引領(lǐng)的分句多為第一層次,包孕著停頓能力弱的關(guān)聯(lián)標(biāo)記所在分句。其次在機(jī)器翻譯方面,省略能力弱的關(guān)聯(lián)標(biāo)記若缺少與之配對(duì)的關(guān)系詞,語(yǔ)義表達(dá)的準(zhǔn)確度易受影響。來(lái)看假設(shè)關(guān)系復(fù)句“如果我哭了,你就給我遞紙巾”百度翻譯為“If I cry, you hand me the tissue”;若省略掉假設(shè)標(biāo)“如果”,則翻譯為“When I cry, you hand me the tissue”??梢?jiàn),關(guān)聯(lián)標(biāo)記的省略與否會(huì)影響翻譯的句式及其意義。最后在詞典編纂、漢語(yǔ)教學(xué)、詞性標(biāo)注、信息檢索及自然語(yǔ)言生成方面,關(guān)聯(lián)標(biāo)記離析度的研究都對(duì)此有一定幫助。
“因?yàn)椤浴焙汀爸浴且驗(yàn)椤弊鳛槌S玫谋硪蚬P(guān)系的句式,從離析能力角度將兩種句式的特點(diǎn)加以形式化,供計(jì)算機(jī)使用,有助于精準(zhǔn)、系統(tǒng)化的機(jī)器學(xué)習(xí),相信能夠解決層次關(guān)系自動(dòng)識(shí)別過(guò)程中遇到的一些難題,也能夠?qū)σ酝~典中關(guān)系詞詞條加以更新、補(bǔ)充或糾正。當(dāng)然,關(guān)聯(lián)標(biāo)記即使屬于同一語(yǔ)義類型,但離析能力仍然存在個(gè)體差異,因而在復(fù)句關(guān)聯(lián)標(biāo)記研究過(guò)程中需細(xì)化分析,不可籠統(tǒng)劃類。
注 釋:
①本節(jié)關(guān)于嵌套情況的考察以嚴(yán)格意義上的復(fù)句關(guān)系標(biāo)記為依據(jù),不考慮非充盈態(tài)復(fù)句。所謂非充盈態(tài)是指一定分句數(shù)目的復(fù)句里,各分句中關(guān)系標(biāo)記的隱現(xiàn)形式不能顯式地標(biāo)示復(fù)句層次結(jié)構(gòu)及其語(yǔ)義關(guān)系??蓞⒖糩6]。
②文中語(yǔ)料來(lái)自漢語(yǔ)有標(biāo)復(fù)句語(yǔ)料庫(kù)、國(guó)家語(yǔ)委平衡語(yǔ)料庫(kù)和CCL等,語(yǔ)料規(guī)模為20 716 525字。分析方法采用實(shí)證性研究和規(guī)范性研究相結(jié)合的手法,在進(jìn)行全面描寫的同時(shí)解釋封閉樣本。