梅曉,熊子瑜
(1.中國社會科學(xué)院研究生院 語言系,北京 100102;2.中國社會科學(xué)院語言研究所,北京 100732)
語音合成的自然度與話語的韻律要素密切相關(guān),曹劍芬[1-2]曾提出“恰當(dāng)?shù)捻嵚汕蟹?正確地把握話語的韻律結(jié)構(gòu),是加強(qiáng)合成語音節(jié)奏感,提高其自然度的關(guān)鍵?!倍肮?jié)奏主要通過規(guī)律性的音節(jié)時長伸縮和停延分布來實(shí)施?!币虼?要提高合成語音的自然度,探索普通話節(jié)奏特性和韻律結(jié)構(gòu),需要加強(qiáng)研究與普通話韻律節(jié)奏特性相關(guān)的聲韻母時長變化類型和停頓分布等語音表現(xiàn)。
關(guān)于話語韻律結(jié)構(gòu)與韻律單元內(nèi)各音節(jié)(或音素)的時長關(guān)系,國外學(xué)者很早就開展了研究,并取得了一定的成果,尤其是在英語方面的相關(guān)研究,如O ller[3]發(fā)現(xiàn)英語單詞首的輔音長度比詞中的輔音更長;W ightman[4]等主要考察了短語末尾的時長變化,并提出短語末尾音節(jié)的時長通常被延長;從類型學(xué)的角度出發(fā),Beckman[5]在其他學(xué)者研究的基礎(chǔ)上,指出高層韻律單元末尾的時長被延長的現(xiàn)象在其他語言中大都存在,并推測該現(xiàn)象可能是所有語言都具有的現(xiàn)象,她同時指出,韻律單元起始位置對時長的影響可能會隨著語言類型的不同而發(fā)生變化。
對于普通話中音節(jié)或聲韻母的時長變化與韻律結(jié)構(gòu)之間關(guān)系,當(dāng)前學(xué)界的研究結(jié)果存在一些分歧,主要體現(xiàn)在韻律詞末尾音節(jié)以及語調(diào)短語末尾音節(jié)的時長變化上,而對于韻律短語末尾音節(jié)的時長變化,大家基本上都認(rèn)為韻律短語邊界前一音節(jié)的時長會有顯著延長。曹劍芬[2,6-7]認(rèn)為,韻律詞末尾音節(jié)時長可能會延長,韻律短語末尾音節(jié)時長會顯著延長,而語調(diào)短語末尾音節(jié)一般沒有邊界前延長現(xiàn)象,她同時指出韻律詞末尾音節(jié)時長的延長效果可能會由于語速等原因而被消除掉。而熊子瑜[8]的研究表明,韻律詞末尾音節(jié)的韻母時長并不延長而是傾向于縮短,韻律短語末尾音節(jié)的韻母時長會有顯著延長,此外,語調(diào)短語末尾音節(jié)的韻母時長也會發(fā)生顯著延長,但其延長幅度同韻律短語相比會有所降低。馮勇強(qiáng)[9]也指出韻律詞內(nèi)部以及末尾的音節(jié)時長不發(fā)生延長,甚至?xí)s短,而韻律短語、語調(diào)短語末尾音節(jié)的時長則會顯著延長。此外,倪崇嘉[10]對韻律短語內(nèi)各不同位置音節(jié)及韻母的時長進(jìn)行了研究,其結(jié)論與前人的研究基本一致,即韻律短語(包括主要韻律短語和次要韻律短語,也即本文后來所謂的韻律大短語和韻律小短語)末尾音節(jié)的韻母時長會顯著延長。關(guān)于聲母的時長變化和韻律邊界的關(guān)系,學(xué)界也有一些討論,曹劍芬[11]認(rèn)為韻律邊界后音節(jié)的聲母時長會延長,并且其延長幅度會隨著韻律邊界的等級提高而增大。
以往研究結(jié)果之所以存在某些差異,主要是由于研究者所采用的韻律標(biāo)注系統(tǒng)和所使用的研究材料不同所導(dǎo)致。此外,以往研究大多采用單因素方差分析或均值比較的方法來分析音節(jié)及聲韻母的時長與韻律結(jié)構(gòu)之間的關(guān)系,其結(jié)果容易受韻律邊界位置的聲韻調(diào)分布不均衡等因素的影響而出現(xiàn)偏誤。為了能在一定程度上排除聲韻調(diào)類型等因素對聲韻母時長的固有影響,本研究將基于大規(guī)模語音語料庫,采用R統(tǒng)計計算工具,以音節(jié)的聲韻調(diào)類型等因素為基本分類變量建立普通話聲韻母時長的線性預(yù)測模型,然后對比預(yù)測時長和實(shí)際時長之間的差異來考察韻律邊界類型對聲韻母時長的影響,進(jìn)而分析其時長變化類型與話語韻律結(jié)構(gòu)之間的關(guān)系。
本研究所使用的語料取自中國社會科學(xué)院語言所語音室與東芝(中國)研究中心合作開發(fā)的“普通話多風(fēng)格語音庫”。本文使用的是其中的一個子庫,該庫屬于單人朗讀風(fēng)格,共有 1 538個話段,含35 504個音節(jié)。該子庫的發(fā)音人是一位年輕的女性播音員,能講標(biāo)準(zhǔn)流利的普通話,錄音過程在消音室內(nèi)進(jìn)行,錄音質(zhì)量能滿足語音標(biāo)注和分析的要求。根據(jù)音段和韻律的手工標(biāo)注結(jié)果,本文提取出各音節(jié)及聲韻母的時長數(shù)據(jù),以及音節(jié)的聲韻調(diào)類型、音節(jié)所在的左右韻律邊界類型①韻律邊界分為四個等級,從小到大依次是韻律詞邊界、韻律小短語邊界、韻律大短語邊界和語調(diào)短語邊界,下文分別使用 B1、B2、B3和B4來表示,另外使用B0來表示韻律詞內(nèi)的音節(jié)邊界。等信息。
在這一部分中,本文將系統(tǒng)地分析普通話聲韻母時長在語流中的表現(xiàn),并采用R統(tǒng)計計算工具,通過建立普通話聲韻母時長的多因素線性預(yù)測模型,來考察影響聲韻母時長的因素,然后在此基礎(chǔ)上探討普通話韻律結(jié)構(gòu)對聲韻母時長的影響。
圖1是基于各類聲母的時長均值與其標(biāo)準(zhǔn)差所作的散點(diǎn)圖,其中橫坐標(biāo)是語流中各類聲母的時長均值,縱坐標(biāo)是各類聲母的時長標(biāo)準(zhǔn)差。單位為:秒。
圖1 各類聲母的時長均值與標(biāo)準(zhǔn)差的散點(diǎn)圖
從圖1中所有聲母時長均值的分布情況可以大體看出,語流中聲母時長與其發(fā)音方法密切相關(guān):時長較短的,主要屬于不送氣塞音;時長中等的,主要屬于不送氣塞擦音和濁輔音;時長較長的,主要屬于送氣的塞音、塞擦音以及擦音。由此可以推斷,語流中的聲母時長應(yīng)該具有相對較強(qiáng)的穩(wěn)定性,受其他因素影響而發(fā)生較大變化的可能性較小,以保持各類聲母在時長上的區(qū)分度。表1給出了各預(yù)測模型對聲母時長分析的預(yù)測能力數(shù)據(jù),從中可以進(jìn)一步看出語流中的聲母時長幾乎不受韻律結(jié)構(gòu)因素的影響。
表1 各預(yù)測模型對聲母時長的預(yù)測能力
在表1中,我們采用R統(tǒng)計工具分析了幾種可能會影響聲母時長的控制因素:以聲母時長為因變量,分別以音節(jié)的聲母類型、韻母類型、聲調(diào)類型和話語的韻律結(jié)構(gòu)等因素為自變量,構(gòu)建聲母時長的線性預(yù)測模型,然后比較了各個時長模型的預(yù)測能力②本文采用 R統(tǒng)計軟件中的線性模型(Linearm odel)工具構(gòu)建聲韻母時長的線性預(yù)測模型,其模型可以大致描述為:(j,k,…)=di+(f j+fk+…),其中i表示當(dāng)前的聲韻母類型,j、k等表示各類影響因素,如聲調(diào)類型、前接聲母類型、后接韻母類型等,d i表示當(dāng)前聲韻母的基本時長,fj、fk等表示其他因素對基本時長的影響作用。本研究主要關(guān)注2個反映預(yù)測模型效度的指標(biāo),其中Residual standard error指的是標(biāo)準(zhǔn)殘差,其值越小,表明模型的預(yù)測值與實(shí)際值之間的差異越小,模型的預(yù)測能力就越強(qiáng);Multiple R-squared為模型預(yù)測值和實(shí)際值之間的相關(guān)性系數(shù) R的平方值,其值越大,表明模型的預(yù)測值與實(shí)際值之間的一致性越高,模型的預(yù)測能力就越強(qiáng)。我們主要根據(jù)這兩個指標(biāo)來衡量時長模型的預(yù)測能力,時長模型的預(yù)測能力越強(qiáng),則表明預(yù)測模型所采用的控制性因素(自變量)與預(yù)測對象(因變量)之間的關(guān)聯(lián)性越密切,自變量對因變量的控制力就越強(qiáng),對因變量總體變異的解釋力就會越高。。模型的預(yù)測能力越強(qiáng),則說明預(yù)測模型中所采用的控制因素與聲母時長之間的關(guān)聯(lián)性就越強(qiáng),反之則表明,預(yù)測模型中所采用的控制因素與聲母時長之間的關(guān)聯(lián)性越弱。
基于表1數(shù)據(jù)可以看出,聲母類型這一控制因素對語流中的聲母時長具有較強(qiáng)的預(yù)測能力:僅用聲母類型作為預(yù)測模型的控制因素,其預(yù)測值和實(shí)際值之間的相關(guān)性指標(biāo)M ultip le R-squared就可以達(dá)到80%左右。在增加了音節(jié)的韻母類型以及聲調(diào)類型作為聲母時長預(yù)測模型的控制因素之后,綜合預(yù)測能力略有提高,M ultip le R-squared值達(dá)到了82%左右。這說明,僅基于音節(jié)自身的聲韻調(diào)信息,特別是聲母類型信息,就可以比較精確地預(yù)測出語流中的聲母時長,剩余殘差約為15毫秒。這也說明,在聲母時長的總變異中,留給韻律因素進(jìn)行解釋的空間比較小。據(jù)此可以預(yù)計,韻律因素(如韻律邊界類型和重音指數(shù)等)對語流中聲母時長變化的控制能力相對較弱。這正如表1數(shù)據(jù)所示,在聲母時長預(yù)測模型中分別增加音節(jié)的左、右韻律邊界類型作為控制因素之后,預(yù)測模型對聲母時長的預(yù)測能力提高甚微。因此本文認(rèn)為,韻律邊界對語流中聲母時長變化的影響力相對較弱,與聲母類型的控制作用相比,其影響幾乎可以忽略不計。
表2給出了各韻律邊界后一音節(jié)的聲母時長均值和標(biāo)準(zhǔn)差,從中可以進(jìn)一步比較韻律邊界類型是否會對其后音節(jié)的聲母時長產(chǎn)生顯著影響。
表2 聲母時長與其左側(cè)韻律邊界類型的關(guān)系③
從表2的數(shù)據(jù)不難看出,韻律邊界后一音節(jié)的聲母平均時長基本不存在“隨著韻律邊界等級的提高而顯著拉長”[11]的傾向性。在B0邊界的后邊,音節(jié)的聲母平均時長相對較短;而在B1邊界到B4邊界的后邊,音節(jié)的聲母平均時長則相對而言較為一致,并沒有隨邊界等級的提高而逐漸延長。這與曹劍芬[11]的觀察結(jié)果有所不同,出現(xiàn)這種差異可能與語料的性質(zhì)等因素有關(guān)。
總之,本文研究數(shù)據(jù)表明,語流中的聲母時長與聲母類型之間的相關(guān)性較強(qiáng),而與韻律邊界的相關(guān)性較弱,因此,僅基于音節(jié)內(nèi)部的聲韻調(diào)信息就可以比較精確地預(yù)測語流中的聲母時長。研究結(jié)果還表明,聲母時長不具有隨著韻律邊界等級的提高而顯著延長的傾向性。
接下來考察韻律結(jié)構(gòu)對語流中音節(jié)韻母時長的影響,圖2是基于各韻母的時長均值與其標(biāo)準(zhǔn)差所作的散點(diǎn)圖,其橫坐標(biāo)是語流中各類韻母的時長均值,縱坐標(biāo)是語流中各類韻母的時長標(biāo)準(zhǔn)差。單位為:秒。
圖2 韻母時長均值與標(biāo)準(zhǔn)差的散點(diǎn)圖
從圖中韻母時長均值可以看出,大多數(shù)韻母的時長均值聚集在一起,沒有顯著的區(qū)分性,處于外圍的只有“io[io] 、iii[?] 、ii[?]”等少數(shù)幾個韻母。其中,韻母“io[io]”由于只出現(xiàn)在較大的韻律邊界類型之前,韻母往往會被延長,所以其韻母相對較長而且比較穩(wěn)定 ;韻母“iii[?]”和“ii[?]”的時長均值較短,與其他類型的韻母有一定的區(qū)分性,但其標(biāo)準(zhǔn)差卻相對過大,這表明它們在語流中的表現(xiàn)不夠穩(wěn)定,可長可短。據(jù)此本文認(rèn)為,韻母類型與韻母時長之間的相關(guān)性不強(qiáng),韻母類型這一因素難以控制韻母在語流中的時長表現(xiàn)。實(shí)際上,這也為韻母時長變化實(shí)現(xiàn)其他韻律上的功能提供了基礎(chǔ)和可能。
從韻母時長的標(biāo)準(zhǔn)差來看,韻母時長在語流中可以有較大幅度的變化,而這種變化又是韻母類型難以控制的,由此可以預(yù)知,語流中的韻母時長會受到其他因素的影響而發(fā)生顯著地變化。除了音節(jié)的基本信息之外,還有哪些因素會對語流中的韻母時長產(chǎn)生顯著影響,特別是韻律結(jié)構(gòu)會對韻母時長產(chǎn)生多大的影響,是本研究所關(guān)注的問題。找出這些影響韻母時長的控制因素,將有助于提高語流中音節(jié)的韻母時長的預(yù)測精度。
采用前文提到的時長建模方法,我們以語流中的韻母時長為因變量,分別以音節(jié)的聲母類型、韻母類型、聲調(diào)類型以及韻律邊界等因素為自變量對韻母時長構(gòu)建線性預(yù)測模型,然后比較各預(yù)測模型對韻母時長的預(yù)測能力。時長預(yù)測模型的預(yù)測能力越高,則說明預(yù)測模型中所采用的控制因素與韻母時長之間的相關(guān)性就越強(qiáng),反之則表明預(yù)測模型中所采用的控制因素與韻母時長之間的相關(guān)性就越弱。具體數(shù)據(jù)見表3。
表3 各預(yù)測模型對韻母時長的預(yù)測能力
從表3數(shù)據(jù)可以看出,僅根據(jù)韻母類型這一因素建立的韻母時長預(yù)測模型,其預(yù)測能力相對較弱,預(yù)測時長和實(shí)際時長之間的相關(guān)性指標(biāo)M ultip le R-squared僅為25%左右,這與圖2的數(shù)據(jù)是基本吻合的。即使將音節(jié)的聲母類型、韻母類型和聲調(diào)類型這三類因素綜合起來,預(yù)測時長和實(shí)際時長之間的相關(guān)性指標(biāo) Multiple R-squared也只能達(dá)到34%左右,標(biāo)準(zhǔn)殘差約為42毫秒,這表明僅依據(jù)聲韻調(diào)這三個因素很難精確預(yù)測出語流中的韻母時長。而在增加音節(jié)的右韻律邊界類型作為一項(xiàng)控制因素之后,韻母時長模型對語流中韻母時長變化的預(yù)測能力有了顯著提高,Multiple R-squared值提升到62%左右,約提高了28個百分點(diǎn),剩余殘差也同步下降了10毫秒左右,這說明音節(jié)的右韻律邊界類型會對語流中的韻母時長產(chǎn)生較為顯著的影響和控制作用。
表3的數(shù)據(jù)還顯示,聲調(diào)類型對韻母時長控制力較弱,僅根據(jù)聲調(diào)類型這一因素建立的韻母時長預(yù)測模型,其預(yù)測時長和實(shí)際時長之間的相關(guān)性指標(biāo)Multiple R-squared還不到0.5%,這不符合語音學(xué)界的已有認(rèn)識。曹劍芬[12]曾指出,輕聲對韻母時長有很大的影響。通過考察輕聲音節(jié)在語流中的分布位置,可以發(fā)現(xiàn),大多數(shù)輕聲音節(jié)分布在較大的韻律單元末尾位置,由于其所在音節(jié)的韻母時長往往會被顯著延長,使得輕聲對韻母時長的減縮作用被部分抵消,因此導(dǎo)致輕聲音節(jié)的韻母時長與其他非輕聲音節(jié)的韻母時長在整體上沒有顯現(xiàn)出較大差異。為了還原輕聲對語流中韻母時長的影響,圖3給出了輕聲音節(jié)和非輕聲音節(jié)處于不同類型韻律邊界之前的韻母時長均值對比數(shù)據(jù),其中橫坐標(biāo)表示音節(jié)后的韻律邊界,縱坐標(biāo)表示音節(jié)的韻母時長,單位為:秒。
圖3 處于不同韻律邊界之前的輕聲音節(jié)(右柱)和非輕聲音節(jié)(左柱)的韻母時長對比數(shù)據(jù)
從圖3中的“合計”列數(shù)據(jù)可以看出,輕聲音節(jié)和非輕聲音節(jié)的韻母時長均值在總體上并無太大差異,其中輕聲音節(jié)的韻母時長均值為138毫秒,非輕聲音節(jié)的韻母時長均值為147毫秒,二者僅相差9毫秒。而基于音節(jié)的右側(cè)韻律邊界類型進(jìn)行分類之后,輕聲音節(jié)和非輕聲音節(jié)的韻母時長差異才被真正顯現(xiàn)出來,都相差了40毫秒左右,這表明輕聲的確會對音節(jié)的韻母時長產(chǎn)生明顯的減縮作用。
另外,圖3數(shù)據(jù)還表明,輕聲音節(jié)并非總是讀的短。這與以前的認(rèn)識略有不同,過去通常認(rèn)為輕聲音節(jié)就應(yīng)該讀的短而弱。而本文觀察到,在實(shí)際語流里,某些輕聲音節(jié)的韻母時長也可以被大幅延長,當(dāng)輕聲音節(jié)處于B0和B1類的韻律邊界之前時,其韻母時長均值只有85毫秒左右,而當(dāng)它處于B3或B4類的韻律邊界之前時,其韻母時長均值可以達(dá)到190毫秒左右,延長了一倍多,延長幅度甚至超過了非輕聲音節(jié)。這表明,處于較大韻律邊界之前的輕聲音節(jié)①據(jù)觀察,被大幅延長的輕聲音節(jié)往往屬于那些能夠獨(dú)立成詞的輕聲音節(jié),如"的、了、嗎、啊"之類,而這類輕聲音節(jié)占所出現(xiàn)的輕聲音節(jié)總數(shù)的絕大部分,而類似于“東?西”這類詞語中的輕聲音節(jié)即便處于較大韻律單元邊界位置也很少被拉長。,其韻母時長仍然可以被大幅延長。
基于圖3所提供的數(shù)據(jù),也可以觀察到音節(jié)的右側(cè)韻律邊界類型會對其韻母時長產(chǎn)生顯著的影響,簡要總結(jié)如下:(1)與B0和B1這兩級韻律邊界之前的音節(jié)韻母時長相比,B2、B3和B4這三級韻律邊界會對其前一音節(jié)的韻母時長產(chǎn)生一定的延長作用,即使前一音節(jié)屬于輕聲,其延長作用也依然存在。但比較而言,B2對其前一韻母的延長作用相對較弱,而B3和B4的延長作用相對較強(qiáng)。(2)從韻母時長的均值來看,B0和B1之前的韻母時長比較接近,都比較短,似乎可以合并為一類,其中非輕聲音節(jié)的韻母時長均值在130毫秒左右,輕聲音節(jié)的韻母時長均值在85毫秒左右;而B3和B4之前的韻母時長比較接近,都比較長,似乎也可以合并為一類,其中非輕聲音節(jié)的韻母時長均值在230毫秒左右,輕聲音節(jié)的韻母時長均值在190毫秒左右。這一短一長,不管是輕聲音節(jié)還是非輕聲音節(jié),在均值上都相差100毫秒左右,具有很強(qiáng)的區(qū)分性。
以上研究表明,聲母時長與聲母類型密切相關(guān),在連續(xù)語流中具有較強(qiáng)的穩(wěn)定性,幾乎不受韻律結(jié)構(gòu)的影響;而韻母時長與韻母類型之間的相關(guān)性不強(qiáng),在語流中可以有較大的變化空間。語流中的韻母時長與音節(jié)的右韻律邊界類型之間的相關(guān)性較為密切,當(dāng)音節(jié)的右韻律邊界類型為B0或B1時,一般不會出現(xiàn)顯著的韻母延長現(xiàn)象,因此其韻母時長通常較短,而當(dāng)音節(jié)的右韻律邊界類型為B3或B4時,不管其是否屬于輕聲音節(jié),往往都會出現(xiàn)顯著的韻母延長現(xiàn)象,因此其韻母時長通常都會比較長。從時長均值上看,B2級韻律邊界也會對其前一音節(jié)的韻母時長產(chǎn)生一定的延長作用,但其延長作用相對較弱,介于延長和非延長之間,而且沒有明顯的規(guī)律性。
通過以上分析,我們觀察到韻母時長與韻律邊界類型之間存在較強(qiáng)的關(guān)聯(lián)性,這一認(rèn)識與曹劍芬、熊子瑜、馮勇強(qiáng)等相關(guān)研究的觀察結(jié)果是基本一致的。但本文認(rèn)為,韻母時長與韻律結(jié)構(gòu)之間的關(guān)系研究不應(yīng)到此為止,如僅從韻母時長的平均值上看,處于B2級韻律邊界之前的音節(jié),其韻母時長總體上會有一定程度的延長,但同時其中有很多音節(jié)并沒有發(fā)生顯著地韻母延長現(xiàn)象,即使在B3和B4這兩級韻律邊界之前,也并非所有音節(jié)都發(fā)生了韻母延長,而在B0和B1這兩級韻律邊界之前,也存在部分音節(jié)發(fā)生了韻母延長。因此,還需要進(jìn)一步去區(qū)分和檢測哪些音節(jié)真正發(fā)生了顯著地韻母延長,而哪些音節(jié)并沒有發(fā)生顯著的韻母延長。如果能進(jìn)一步找到韻母[+延長]和[-延長]之間的分界線,建立起韻母時長變化類型的區(qū)分函數(shù),無疑會有助于加深了解韻母時長變化類型和韻律結(jié)構(gòu)之間的關(guān)系,有助于建立[+延長]的區(qū)別特征,以用于韻律結(jié)構(gòu)的分析和描寫,也可以用于建立更為精準(zhǔn)的韻母時長預(yù)測模型以及作為改進(jìn)韻律自動切分的分類依據(jù)。下面將探討韻母時長變化類型的自動檢測和分類的方法,并將在此基礎(chǔ)上進(jìn)一步考察韻母時長變化類型與韻律結(jié)構(gòu)的關(guān)系。
由于韻母時長是諸多因素綜合作用的結(jié)果,直接考察韻母時長和韻律結(jié)構(gòu)的關(guān)系,很容易受其他因素的影響而導(dǎo)致結(jié)果偏誤。因此,要考察韻母時長與韻律結(jié)構(gòu)之間的關(guān)系,理論上需要把其他非韻律結(jié)構(gòu)因素對韻母時長的影響一一排除。但由于很多因素對韻母時長的影響作用實(shí)際上是綜合在一起的,很難完全分割開來進(jìn)行分析,如輕聲對韻母時長的減縮作用往往會與韻律邊界對韻母時長的延長作用疊加在一起,有時甚至?xí)嗷サ窒?因此,只根據(jù)韻母時長數(shù)據(jù),可能既看不出韻律邊界的延長作用,也看不出輕聲的減縮作用。為了盡可能地消除其他非韻律性因素對韻母時長的影響,以充分揭示韻律結(jié)構(gòu)對韻母時長的影響,本研究先采用非韻律性因素(如音節(jié)的聲韻調(diào)類型)作為自變量,構(gòu)建韻母時長的基礎(chǔ)預(yù)測模型①為了使預(yù)測時長和實(shí)際時長之間的差異能更好地體現(xiàn)韻律結(jié)構(gòu)對韻母時長的影響,在構(gòu)建基礎(chǔ)預(yù)測模型時,應(yīng)盡可能排除韻律結(jié)構(gòu)信息對預(yù)測時長的影響。因此我們在訓(xùn)練基礎(chǔ)預(yù)測模型時,僅把右韻律邊界類型為B0的音節(jié)數(shù)據(jù)納入訓(xùn)練集,約有1萬8千多個音節(jié)。另外,在構(gòu)建基礎(chǔ)預(yù)測模型時,僅考慮音節(jié)的聲韻調(diào)類型等作為控制因素,從而把韻律因素盡可能排除在基礎(chǔ)預(yù)測模型之外。,并以此模型對語流中每個音節(jié)的韻母時長進(jìn)行預(yù)測,得到各個韻母的基準(zhǔn)時長,再計算出各個韻母的實(shí)際時長相對于其基準(zhǔn)時長的變化量(可以用二者的差值或比值等指標(biāo)來表示),然后考察韻母時長變化量與韻律結(jié)構(gòu)之間的關(guān)系。
圖4以“你好,請問是北京國際飯店嗎?”這句話的數(shù)據(jù)為例,根據(jù)各個音節(jié)韻母的實(shí)際時長、預(yù)測時長,及其韻母時長變化量②韻母時長變化量=(實(shí)際韻母時長-預(yù)測韻母時長)/預(yù)測韻母時長。進(jìn)行作圖,從中可以大致看出韻律結(jié)構(gòu)和韻母時長變化量之間的關(guān)系。其中,上圖的縱坐標(biāo)表示音節(jié)的韻母時長,單位為秒,下圖的縱坐標(biāo)表示韻母時長變化量。
圖4 韻母的實(shí)際時長、預(yù)測時長和變化量示意圖
從圖4可以看出,大部分韻母的實(shí)際時長與預(yù)測時長比較一致,只有少數(shù)韻母的實(shí)際時長比預(yù)測時長要顯著長一些,如“好、問、京、嗎”等音節(jié)。對比手工標(biāo)注的韻律邊界后發(fā)現(xiàn),在這幾個音節(jié)之后都出現(xiàn)了較大的韻律邊界,“好”后為韻律大短語邊界B3,“問”和“京”后為韻律小短語邊界 B2,“嗎”后為語調(diào)短語邊界B4,而其余音節(jié)之后的韻律邊界都相對較小,為B0或者B1。從圖 4可以看出,與韻母的實(shí)際時長相比,韻母時長變化量與右側(cè)韻律邊界類型之間的相關(guān)性更為密切。采用上文的方法,我們以韻母時長變化量為因變量,以音節(jié)的右側(cè)韻律邊 界類型為自變量,建立預(yù)測模型,具體數(shù)據(jù)見表4。
表4 右側(cè)韻律邊界類型對韻母時長變化量的預(yù)測能力
表4的數(shù)據(jù)表明,右側(cè)韻律邊界的層級能夠更好地預(yù)測出語流中的韻母時長變化量,預(yù)測值與實(shí)際值之間的相關(guān)性指標(biāo)達(dá)到了46%,而表3中的數(shù)據(jù)顯示,右側(cè)韻律邊界的層級對語流中韻母時長的預(yù)測能力相對較弱,預(yù)測值與實(shí)際值之間的相關(guān)性指標(biāo)只有30%左右,二者相比,前者的預(yù)測能力高出了16%。這一數(shù)據(jù)表明,與韻母的實(shí)際時長相比,音節(jié)的右側(cè)韻律邊界類型與韻母時長變化量之間的關(guān)系更為密切。這也說明,在剔除了音節(jié)基本信息的影響之后,韻律邊界對語流中韻母時長的影響更加凸顯。因此,接下來我們將通過“韻母時長變化量”這一指標(biāo)來進(jìn)一步考察韻律邊界的時域特性。
為了考察語流中的韻母時長變化類型與韻律結(jié)構(gòu)之間的關(guān)系,我們需要把韻母時長變化區(qū)分為[+延長]和[-延長]等類型。如何根據(jù)韻母時長變化量,從數(shù)據(jù)上對韻母時長的變化類型加以區(qū)分,以判別一個韻母是否發(fā)生了顯著延長?關(guān)鍵是選定合適的臨界值,韻母變化量大于該臨界值的音節(jié)賦予[+延長]特征,反之則賦予[-延長]特征。本研究在選定分類臨界值時采用以下方法進(jìn)行操作:將每次分類的結(jié)果作為預(yù)測模型的一項(xiàng)控制因素,使得增加分類后的預(yù)測模型能夠獲得最大的預(yù)測精度。分類臨界值的選定過程如下:(1)計算出每個韻母的時長變化量;(2)設(shè)定一個初始臨界值,當(dāng)變化量大于此臨界值時,設(shè)定該韻母具有[+延長]屬性,否則認(rèn)為該韻母具有[-延長]屬性,并將分類結(jié)果作為韻母時長預(yù)測模型的一項(xiàng)新的控制因素,以考察預(yù)測模型的綜合預(yù)測能力;(3)通過向上或向下調(diào)節(jié)臨界值,使得增加[+延長]分類后的預(yù)測模型能夠?qū)嵞笗r長獲得最大的預(yù)測精度;(4)取預(yù)測精度最高時的臨界值,對韻母時長變化類型進(jìn)行分類和賦值。臨界值的選定過程如圖5的數(shù)據(jù)顯示。其中,橫坐標(biāo)表示韻母時長變化量,縱坐標(biāo)表示設(shè)定不同臨界值時,各模型對實(shí)際韻母時長的預(yù)測能力。
圖5 [±延長]特征臨界值的設(shè)定
從圖5的數(shù)據(jù)可以看出,當(dāng)臨界值被設(shè)定為0.22時,根據(jù)“聲、韻、調(diào)+韻母是否延長”這四個因素所建立的韻母時長預(yù)測模型能夠獲得最大的預(yù)測精度,預(yù)測時長與實(shí)際時長之間的相關(guān)性指標(biāo)M ultiple R-squared值可以達(dá)到75.82%。將所有韻母時長賦值為[+延長]或[-延長]兩種類型之后,對比這兩類韻母的時長均值,結(jié)果表明,二者差異非常顯著,均值相差近70毫秒。這表明,[+延長]和[-延長]的區(qū)分具有一定的數(shù)據(jù)統(tǒng)計意義。具體數(shù)據(jù)見表5。
表5 [+延長]和[-延長]的韻母時長比較
表5的數(shù)據(jù)還表明,具有[+延長]屬性韻母的音節(jié)約占音節(jié)總數(shù)的30%左右。接下來,本文將考察這些具有[+延長]屬性韻母的音節(jié)在語流中的分布位置,及其與韻律結(jié)構(gòu)之間的關(guān)系,探討能否基于韻律結(jié)構(gòu)來預(yù)測各音節(jié)韻母的[+延長]屬性。表6給出了具有[+延長]屬性的音節(jié)出現(xiàn)在各類韻律邊界之前的出現(xiàn)頻數(shù)和比例的數(shù)據(jù):
基于表6數(shù)據(jù)可以看出,處于B3和B4邊界前的韻母往往具有[+延長]屬性,而處于B0和B1邊界前的韻母則往往具有[-延長]屬性。這說明,韻母的[+延長]屬性與其所處的韻律邊界類型之間存在較強(qiáng)的對應(yīng)關(guān)系。但處于B2邊界前的韻母有一半具有[+延長]特征,另一半具有[-延長]特征,這說明B2級韻律邊界前的韻母時長變化類型不太一致。究其原因,可能包括兩個方面:(1)絕大部分B2級韻律邊界處于小句內(nèi)部,文本上沒有對應(yīng)的標(biāo)點(diǎn)符號,語音上又缺少明顯的停頓,因其缺乏形式上的明確標(biāo)志而容易導(dǎo)致標(biāo)注上的不統(tǒng)一;(2)B2級韻律邊界有可能不是通過韻母時長上的延長這一手段來體現(xiàn)的,而是采取其他類型的語音線索(如音高躍變)來標(biāo)明的。如果是第一種原因?qū)е碌?則需要我們重新去認(rèn)識和界定B2級韻律邊界;如果是第二種原因?qū)е碌?也需要我們從其他語音線索方面為B2級韻律邊界找到可靠依據(jù)。限于篇幅,這方面的研究工作留待以后進(jìn)行。
表6 韻母具有[+延長]屬性的音節(jié)在各類韻律邊界之前的出現(xiàn)頻數(shù)和比例
基于表6數(shù)據(jù),本文認(rèn)為,B0和B1這兩級韻律邊界具有[-延長]特性,B3和B4這兩級韻律邊界具有[+延長]特性,這一結(jié)果與前文圖3的結(jié)果是吻合的。而對于B2,本文基于B2邊界前一韻母是否延長,暫時將其區(qū)分為兩種類型:“B2+”和“B2-”,并將在以后的研究中進(jìn)一步考察它們的分布規(guī)律和出現(xiàn)條件。
基于大規(guī)模語音數(shù)據(jù)的統(tǒng)計分析,本文得到以下結(jié)論:(1)韻律結(jié)構(gòu)對語流中的聲母時長影響較小,聲母時長主要受控于其聲母類型。(2)韻律結(jié)構(gòu)對語流中的韻母時長影響較大:B0和B1這兩級韻律邊界具有[-延長]特征,其邊界前的韻母時長通常不會被顯著延長,因此通常較短;B3和B4這兩級韻律邊界具有[+延長]特征,其邊界前的韻母時長通常會被顯著延長,因此通常較長;另外,數(shù)據(jù)還表明,B2級韻律邊界對韻母時長的影響不具有明顯的傾向性,因此,難以根據(jù)韻母時長變化特征來界定B2級韻律邊界,尚需要從其他方面對B2級韻律邊界的語音特征開展研究。(3)韻律邊界對韻母時長的影響作用可以與其他因素的影響作用同步出現(xiàn),疊加在一起,如較大韻律邊界對前一韻母時長的延長作用會在一定程度上抵消輕聲對韻母時長的減縮作用。
[1] 曹劍芬.漢語韻律切分的語音學(xué)和語言學(xué)線索[M].曹劍芬.現(xiàn)代語音研究與探索.北京:商務(wù)印書館,2007,219-230.
[2] 曹劍芬.語言的節(jié)奏——賀王均先生八十華誕[M].曹劍芬.現(xiàn)代語音研究與探索.北京:商務(wù)印書館,2007,p231-243.
[3] O ller,D.K..The effect of position in utterance on speech segment duration in English[J].Journa l o f the Acoustical Society o f America,1973,54:1235-1247.
[4] Wightman,C.W.,Shattuck-Hufnagel,S.,Ostendorf,M.,&Price,P..Segmental durations in the vicinity of p rosodic phrase boundaries[J].Journal o f the A coustical Society of America,1992,91,1707-1717.
[5] Beckerman,Beckman,M.E..Evidence for speech rhythms across languages[C]//Y.Tohkura,E.Vatikiotis-Bateson&Y.Sagisaka(Eds.).Speech Perception,Production and Linguistic Structure.Oxford:IOS Press,1992:457-463.
[6] 曹劍芬.漢語普通話語音節(jié)奏的初步研究[R].中國社會科學(xué)院語言所語音室.語音研究報告,1998,28-37.
[7] 曹劍芬.普通話節(jié)奏的聲學(xué)語音學(xué)特性[M].曹劍芬.現(xiàn)代語音研究與探索.北京:商務(wù)印書館,2007,210-218.
[8] 熊子瑜.韻律單元邊界特征的聲學(xué)語音學(xué)研究[J].語言文字應(yīng)用,2003,(2):116-121.
[9] 馮勇強(qiáng),初敏,賀琳,呂士楠.漢語話語音節(jié)時長統(tǒng)計分析[C]//新世界的現(xiàn)代語音學(xué)——第五屆全國現(xiàn)代語音學(xué)學(xué)術(shù)會議論文集.北京:清華大學(xué)出版社,2001:66-69.
[10] 倪崇嘉,劉文舉,徐波.漢語韻律短語的時長與音高研究[J].《中文信息學(xué)報》,2009年第4期,p82-p87.
[11] 曹劍芬.音段延長的不同類型及其韻律價值[J].南京師范大學(xué)文學(xué)院學(xué)報,2005年12月第4期,p160-167.
[12] 曹劍芬.普通話輕聲音節(jié)特性分析[J].應(yīng)用聲學(xué),1986,5(4):1-6.