李甍娜,郭進(jìn)利,卞 聞,常寧戈,肖 瀟,陸睿敏
(上海理工大學(xué)管理學(xué)院,上海 200093)
從Watts發(fā)表的關(guān)于小世界網(wǎng)絡(luò)的文章[1]以及Barabási發(fā)表的關(guān)于隨機(jī)網(wǎng)絡(luò)中標(biāo)度涌現(xiàn)的文章[2]開始,人們對于復(fù)雜網(wǎng)絡(luò)的研究日漸深入。目前,復(fù)雜網(wǎng)絡(luò)已經(jīng)應(yīng)用到如交通網(wǎng)絡(luò)、生物網(wǎng)絡(luò)、社會(huì)網(wǎng)絡(luò)等各種現(xiàn)實(shí)網(wǎng)絡(luò)的研究中[3-5]。隨著復(fù)雜網(wǎng)絡(luò)的發(fā)展,人們也在尋求對網(wǎng)絡(luò)更為合適和準(zhǔn)確的描述方法,如超網(wǎng)絡(luò)。2002年Nagurney[6]開始明確超網(wǎng)絡(luò)的定義。王眾托[7]對基于超圖的超網(wǎng)絡(luò)進(jìn)行了描述。Liu等[8]根據(jù)知識(shí)傳播的特點(diǎn)提出了知識(shí)傳播超網(wǎng)絡(luò)模型。Wang等[9]提出了基于微信用戶不同的超網(wǎng)絡(luò)演化模型。倪子建等[10]基于維基百科超網(wǎng)絡(luò)構(gòu)建了維基內(nèi)容本體超網(wǎng)絡(luò),并對其拓?fù)浣Y(jié)構(gòu)和演化模式進(jìn)行了研究。
近年來,許多有趣的問題也通過網(wǎng)絡(luò)的視角進(jìn)行研究,如語言、文字等問題。Motter A E等[11]研究發(fā)現(xiàn)英語語言概念網(wǎng)具有小世界特性。Ferrer i Cancho R等[12]基于規(guī)模為107個(gè)詞次的英語國家語料庫,構(gòu)造了一個(gè)英語詞同現(xiàn)網(wǎng)絡(luò),并發(fā)現(xiàn)該網(wǎng)絡(luò)表現(xiàn)出小世界效應(yīng)和無標(biāo)度特性。馬宏煒,陸蓓等[13]基于大規(guī)模微博語料庫,構(gòu)建了3個(gè)詞同現(xiàn)語言網(wǎng)絡(luò);劉海濤[14]構(gòu)造出兩種不同語體的漢語真實(shí)文本句法網(wǎng)絡(luò),并采用復(fù)雜網(wǎng)絡(luò)理論對各自的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了分析。Yu等[15]基于真實(shí)文本和詞典,發(fā)現(xiàn)音素網(wǎng)絡(luò)具有連通度高,平均距離短的特點(diǎn),其節(jié)點(diǎn)度服從正態(tài)分布,加權(quán)度服從冪率分布。并且定量分析了語音系統(tǒng)在通訊交流中的高效性和可靠性。唐詩在中國文化中具有重要意義。無論是五言唐詩和七言唐詩,還是絕句和律詩都要服從一定的押韻規(guī)則。如果以漢語拼音中的韻母為基礎(chǔ)對唐詩的押韻情況進(jìn)行統(tǒng)計(jì),以此探求唐詩之間的關(guān)系或者在押韻過程中不同韻母之間的關(guān)系將是一個(gè)有趣的問題。本文給定了一套唐詩韻腳韻母在押韻過程中的統(tǒng)計(jì)規(guī)則,并建立了唐詩超網(wǎng)絡(luò)和韻母復(fù)雜網(wǎng)絡(luò)。根據(jù)對網(wǎng)絡(luò)特征的分析,發(fā)現(xiàn)唐詩在押韻規(guī)則下的規(guī)律與聯(lián)系。
押韻是詩詞等韻文的語言特點(diǎn)之一。它是指在韻文的創(chuàng)作中,在某些句子的最后一個(gè)字都使用韻母相同或相近的字或者平仄統(tǒng)一。這些使用了同一韻母字的地方,稱為韻腳。普通話相對于古代漢語在讀音上發(fā)生了變化,但是完全用古音讀古詩是不可能實(shí)現(xiàn)的[16-17]。以普通話誦讀唐詩,大部分仍然具有押韻的規(guī)律,這主要與構(gòu)成韻腳的韻母有關(guān)。為簡化網(wǎng)絡(luò)模型,對于語音變化而變得不押韻的韻腳以及韻腳韻母不同的情況都視為轉(zhuǎn)韻。本文對《唐詩精華注譯評》[18]收錄的762首唐詩進(jìn)行統(tǒng)計(jì),記錄了每首詩韻腳的韻母信息,通過該信息對762首唐詩建立聯(lián)系,并以此作為根據(jù)構(gòu)建唐詩超網(wǎng)絡(luò)。在進(jìn)行信息數(shù)據(jù)收集之前,首先對24個(gè)韻母進(jìn)行了編號(hào),韻母編號(hào)信息如表1所示。
本文對每首唐詩韻腳的韻母信息給定了統(tǒng)一的統(tǒng)計(jì)規(guī)則,規(guī)則如下:
1)如果偶數(shù)句詩句韻腳韻母相同則將該四句詩句(包括以逗號(hào)結(jié)尾的兩句詩)歸為同一段,否則分為兩段。以此類推,將整首詩分段。
2)記錄。統(tǒng)計(jì)時(shí)只記錄每個(gè)詩段偶數(shù)句詩句韻腳出現(xiàn)的韻母編號(hào)。
3)整合。當(dāng)一首詩較長時(shí)可能出現(xiàn)兩個(gè)詩段所記錄的韻母編號(hào)相同的情況,所以統(tǒng)計(jì)完每個(gè)詩段的韻母編號(hào)后,對相同的韻母信息進(jìn)行合并。
將每首詩作為節(jié)點(diǎn),每個(gè)韻母作為超邊。根據(jù)每首詩的韻母統(tǒng)計(jì)信息,如果第i首詩出現(xiàn)了第j個(gè)韻母,那么超邊j就包含節(jié)點(diǎn)i。這樣就構(gòu)成了762個(gè)節(jié)點(diǎn),24條超邊的超網(wǎng)絡(luò)。其中唐詩是按在《唐詩精華注譯評》中的編排順序來進(jìn)行編號(hào)的。如第1首詩是虞世南的《蟬》,根據(jù)1.1節(jié)的統(tǒng)計(jì)規(guī)則記錄的韻母是“ong”和“eng”;
第2首詩記錄的韻母是“i”、“ui”、“ei”;第3首詩記錄的韻母是“ui”和“ei”,則該超網(wǎng)絡(luò)圖如圖1所示。
表1 韻母編號(hào)信息Tab.1 vowel code list
圖1 唐詩超網(wǎng)絡(luò)的構(gòu)建Fig.1 Supernetwork for Tang poetry
1.3.1 超度與超度分布
超度指節(jié)點(diǎn)所在的超邊數(shù)量[19]。節(jié)點(diǎn)超度在唐詩超網(wǎng)絡(luò)的意義是,每首唐詩的韻腳所出現(xiàn)不同韻母的種類數(shù)目。超度的大小能在一定程度上衡量一首唐詩轉(zhuǎn)韻的頻繁程度。
所有節(jié)點(diǎn)超度的平均值稱為超網(wǎng)絡(luò)的平均超度,用于描述整個(gè)網(wǎng)絡(luò)的性質(zhì),記為〈k〉,即
(1)
其中,k(i)為節(jié)點(diǎn)i的點(diǎn)超度,N為超網(wǎng)絡(luò)中節(jié)點(diǎn)的總數(shù)。
節(jié)點(diǎn)超度分布P(k)為超度為k的節(jié)點(diǎn)占整個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)的比例,即:
(2)
其中,Nk表示超度為k的節(jié)點(diǎn)個(gè)數(shù)。
圖2所示為唐詩超網(wǎng)絡(luò)的超度分布,其中圖2a和2b分別使用線性坐標(biāo)和雙對數(shù)坐標(biāo)顯示結(jié)果。
由圖2可知,大部分唐詩韻腳都只出現(xiàn)一種或者兩種韻母,而只有少部分唐詩韻腳會(huì)出現(xiàn)多種韻母。這與唐詩的字?jǐn)?shù)有一定關(guān)系,大部分的唐詩只有4句,這類詩轉(zhuǎn)韻的情況相對更少,而字?jǐn)?shù)多的唐詩卻很少,這類詩轉(zhuǎn)韻的情況也相對更多。另外,這也與唐詩本身的成詩規(guī)律有關(guān),即在轉(zhuǎn)韻和不轉(zhuǎn)韻中詩人們更傾向于后者。唐詩超網(wǎng)絡(luò)的節(jié)點(diǎn)超度在雙對數(shù)坐標(biāo)下呈現(xiàn)出一條直線,即服從冪律分布,冪律指數(shù)為-2.19。該超網(wǎng)絡(luò)中平均超度〈k〉為2.15,這說明平均每首唐詩韻腳會(huì)出現(xiàn)兩種不同的韻母。
1.3.2 余平均度
為刻畫節(jié)點(diǎn)之間的聯(lián)系,本文引入余平均度指標(biāo)。節(jié)點(diǎn)i的余平均度定義為節(jié)點(diǎn)i的所有鄰居節(jié)點(diǎn)的平均超度[20],即:
(3)
其中,Γ(i)表示鄰居節(jié)點(diǎn)集合。
假設(shè)網(wǎng)絡(luò)中超度為k的節(jié)點(diǎn)為v1,v2,…,vi,那么超度為k的節(jié)點(diǎn)的余平均度可計(jì)算如下:
(4)
圖3所示為唐詩超網(wǎng)絡(luò)的余平均度與超度的關(guān)系圖,可以看出隨著超度k的增大,余平均度呈下降趨勢,即〈knn〉(k)是k的減函數(shù)。這意味著平均而言,超度大的節(jié)點(diǎn)傾向于與超度小的節(jié)點(diǎn)連接,唐詩超網(wǎng)絡(luò)為異配網(wǎng)絡(luò)。也就是說如果兩首唐詩韻腳出現(xiàn)的韻母種類的數(shù)目相同,它們所出現(xiàn)的韻母種類卻往往不同。對于擁有高超度的節(jié)點(diǎn)來說,高超度意味著它的韻腳的韻母種類數(shù)目多,從而更容易與低超度節(jié)點(diǎn)韻腳的韻母種類重合。
圖2 唐詩超網(wǎng)絡(luò)的超度分布Fig.2 Super-degree distribution for Tang poetry
圖3 唐詩超網(wǎng)絡(luò)超度與余平均度的關(guān)系Fig.3 Degree and complement-degree for Tang poetry
1.3.3 聚集系數(shù)
節(jié)點(diǎn)之間聯(lián)系的緊密程度通常用聚集系數(shù)[1]來表述。節(jié)點(diǎn)i與Di個(gè)節(jié)點(diǎn)通過超邊直接相連,Di個(gè)節(jié)點(diǎn)間實(shí)際存在的超邊數(shù)為Mi,這Di個(gè)節(jié)點(diǎn)間可能存在的最大超邊數(shù)為Di(Di-1)/2,由此定義節(jié)點(diǎn)i的聚集系數(shù)Ci為
(5)
假設(shè)網(wǎng)絡(luò)中超度為k的節(jié)點(diǎn)為v1,v2,…,vi,那么超度為k的節(jié)點(diǎn)的平均聚集系數(shù)為
(6)
圖4所示為唐詩超網(wǎng)絡(luò)的聚集系數(shù)與超度的關(guān)系圖,由子圖4b可以看出C(k)具有冪律形式,這一形式反映了網(wǎng)絡(luò)具有層次結(jié)構(gòu)。另外,該網(wǎng)絡(luò)的平均聚集系數(shù)為0.87,說明唐詩超網(wǎng)絡(luò)具有很高的聚集特性。這與押韻規(guī)律有關(guān),在762首唐詩中89.24%的唐詩在統(tǒng)計(jì)時(shí)韻母種類都小于等于3種,即不出現(xiàn)轉(zhuǎn)韻或者轉(zhuǎn)韻次數(shù)少。在唐詩超網(wǎng)絡(luò)中這一部分節(jié)點(diǎn)與其鄰居節(jié)點(diǎn)組成的團(tuán)體連接得也更加緊密,聚集系數(shù)均在0.5以上,從而導(dǎo)致了網(wǎng)絡(luò)的平均聚集系數(shù)很高。
本文在對762首唐詩進(jìn)行統(tǒng)計(jì)時(shí)發(fā)現(xiàn),按照統(tǒng)計(jì)規(guī)則,韻腳只出現(xiàn)一種韻母、兩種韻母和3種韻母的唐詩所占的比例分別為45%、36%和8%,這3種情況占到了所有唐詩的89%。為進(jìn)一步了解不同情形下韻腳韻母出現(xiàn)的規(guī)律情況,本文將其分類統(tǒng)計(jì)。圖5展示了唐詩在以上3種情形下不同韻母出現(xiàn)的比例情況,并與總體情形進(jìn)行比較。
圖4 聚集系數(shù)與超度的關(guān)系Fig.4 Clustering coefficient and super-degree
圖5 不同情形下唐詩韻腳韻母的分布情況Fig.5 The vowels distribution of Tang Poetry in different situations
由圖6可以得出以下結(jié)論:
1)總體而言,對于所有的唐詩,韻腳很少出現(xiàn)編號(hào)為13、14、15、20的韻母“ie”、“üe”、“er”、“ün”。
2)盡管編號(hào)為4的韻母“i”在所有唐詩中出現(xiàn)的比例最高,但是對于韻腳只有一種韻母的唐詩來說,更可能出現(xiàn)的韻母是編號(hào)為16的韻母“an”。也就是當(dāng)一首唐詩一韻到底時(shí),通常韻腳會(huì)使用韻母是“an”而不是“i”的字。
3)如果一首唐詩韻腳出現(xiàn)兩種韻母,那么出現(xiàn)的韻母中很有可能包含編號(hào)為22的韻母“eng”。
4)韻腳出現(xiàn)3種韻母的唐詩并不多,只占總詩數(shù)的8%,但這些韻母卻集中出現(xiàn)在了編號(hào)為4、8、9、17的韻母“i”、“ei”、“ui”、“en”上。
為進(jìn)一步分析唐詩在押韻規(guī)則下韻腳不同韻母之間的關(guān)系,本文對韻腳出現(xiàn)兩種韻母的情形通過復(fù)雜網(wǎng)絡(luò)的思想進(jìn)行了分析研究。
圖6 韻腳出現(xiàn)兩種韻母情形下的韻母網(wǎng)絡(luò)Fig.6 Vowels network for two vowels in rhyme
對于韻腳出現(xiàn)兩種韻母的唐詩,將每一種韻母作為一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)編號(hào)為韻母編號(hào)。如果同一首詩韻腳出現(xiàn)兩種不同的韻母,那么就在這兩種韻母之間連一條邊,并將出現(xiàn)這兩種韻母的唐詩數(shù)量作為該邊的權(quán)重。
對于韻腳出現(xiàn)兩種韻母的唐詩,說構(gòu)造的復(fù)雜網(wǎng)絡(luò)有24個(gè)節(jié)點(diǎn)、44條邊。圖6所示為該網(wǎng)絡(luò)的網(wǎng)絡(luò)圖,圖中給出了節(jié)點(diǎn)編號(hào)信息與邊的權(quán)重信息,權(quán)重越大邊的寬度就越寬。
表2 韻腳出現(xiàn)兩種韻母情形下的韻母網(wǎng)絡(luò)特征Tab.2 The characteristics of vowels network in the case of appearing two vowels in rhyme
由圖6可知,權(quán)重最大的3條邊分別為節(jié)點(diǎn)22與節(jié)點(diǎn)23之間的邊、節(jié)點(diǎn)11與節(jié)點(diǎn)12之間的邊、節(jié)點(diǎn)22與節(jié)點(diǎn)24之間的邊。這說明當(dāng)一首詩韻腳有兩種韻母,這兩種韻母最有可能是編號(hào)為22和23的兩個(gè)韻母“eng”和“ing”,其次是編號(hào)為11和12的兩個(gè)韻母“ou”和“iu”。也就是當(dāng)一首詩需要從韻腳韻母為“eng”進(jìn)行轉(zhuǎn)韻時(shí),最有可能轉(zhuǎn)到韻母為“ing”的字上。正因?yàn)轫嵞_韻母成對出現(xiàn)的頻率較高,導(dǎo)致了在唐詩超網(wǎng)絡(luò)中韻腳出現(xiàn)兩種韻母的唐詩節(jié)點(diǎn)更容易落在同一個(gè)超邊中,這也促使了唐詩超網(wǎng)絡(luò)具有更高的聚集系數(shù)。
表2展示了該網(wǎng)絡(luò)中節(jié)點(diǎn)度、介數(shù)、點(diǎn)強(qiáng)度的信息。
由表2可知,節(jié)點(diǎn)4的度值和介數(shù)是24個(gè)節(jié)點(diǎn)中最大的,這說明韻母為編號(hào)4的韻母“i”的漢字在詩的轉(zhuǎn)韻規(guī)則中有著重要的作用,盡管在轉(zhuǎn)韻中不是最容易用到的字,但是卻能使詩從多數(shù)不同的韻母成功轉(zhuǎn)韻。編號(hào)為22的韻母“eng”點(diǎn)強(qiáng)度最大,這意味著對于韻腳出現(xiàn)兩種韻母的唐詩,韻母為“eng”的漢字最容易出現(xiàn)在韻腳,但是該節(jié)點(diǎn)的度值只有2,介數(shù)為0,說明當(dāng)詩要從以其它韻母的漢字轉(zhuǎn)韻時(shí)很難轉(zhuǎn)到以韻母“eng”構(gòu)成的漢字上。
本文以唐詩韻腳的韻母作為橋梁研究了押韻規(guī)則下唐詩之間的關(guān)系。以唐詩為節(jié)點(diǎn),24個(gè)韻母為超邊建立了唐詩超網(wǎng)絡(luò)。研究發(fā)現(xiàn)唐詩超網(wǎng)絡(luò)的超度分布服從冪律分布,即P(k)~k-2.19。而且該網(wǎng)絡(luò)為異配網(wǎng)絡(luò)。
總體而言,對于所有的唐詩,韻腳韻母很少出現(xiàn)“ie”、“üe”、“er”、“ün”,最容易出現(xiàn)的是“i”。但是對于韻腳只有一種韻母(不轉(zhuǎn)韻)的唐詩來說,韻腳韻母最容易出現(xiàn)“an”,而不是“i”。
對于韻腳只出現(xiàn)兩種韻母的唐詩,建立了以韻母為節(jié)點(diǎn)的韻母加權(quán)復(fù)雜網(wǎng)絡(luò)。對該網(wǎng)絡(luò)進(jìn)行研究,發(fā)現(xiàn)該網(wǎng)絡(luò)存在某兩種韻母關(guān)系較其他韻母來說更為密切的情況,即兩種韻母往往同時(shí)出現(xiàn)在同一首詩的韻腳中,如“eng”和“ing”,“ou”和“iu”。另外,該網(wǎng)絡(luò)中度值和介數(shù)最大的是韻母“i”,點(diǎn)強(qiáng)度最大的是韻母“eng”,這說明了這兩種韻母在唐詩轉(zhuǎn)韻中所起到的重要作用。對于韻腳只出現(xiàn)兩種韻母的唐詩,“eng”是最容易用到的韻母,“i”是最能使詩從多數(shù)不同的韻母成功轉(zhuǎn)韻的韻母。
[1]Watts D J, Strogarz S H. Collective dynamics of ‘small-world’ networks[J]. Nature, 1998, 393(6684): 440-442.
[2]Barabasi A L, Alabert R. Emergence of caling inrandom networks[J]. Science, 1999, 286(5439): 509-512.
[3]Orosz G, Wilson R E, Stepan G. Traffic jams: dynamics and control[J]. Phil Trans Royal Society A, 2010, 368(1928):4455-4479.
[4]Barabasi A L, Gulbahce N, Loscalzo J. Network medicine: a network-based approach to human disease[J]. Nature Review Genetics, 2011, 12(1):56-68.
[5]Pickard G, Pan W, Rahwan I, et al. Time-critical social mobilization[J]. Science, 2011, 334(28): 509-512.
[6]Nagurney A, Dong J. Supernetworks: Decision-Making for the Information Age[M]. Cheltenham: Edward Elgar Publishing, 2002.
[7]王眾托. 關(guān)于超網(wǎng)絡(luò)的一點(diǎn)思考[J]. 上海理工大學(xué)學(xué)報(bào), 2011, 33(3): 229-237.
Wang Zhongtuo. Reflection on supernetwork[J]. Journal of University of Shanghai for Science and Technology, 2011, 33(3): 229-237.
[8]Liu J G, Yang G Y, Hu Z L. A knowledge generation model via the hypernetwork[J]. Plos One, 2014, 9(3): e89746.
[9]Wang F H, Guo J L, Shen A Z, et al. Evolving hypernetwork model based on We Chat user relations[J]. Computer Science, 2015.
[10] 倪子建, 榮莉莉, 劉泉. 基于超網(wǎng)絡(luò)的維基百科內(nèi)容知識(shí)本體演化研究[J]. 管理科學(xué)學(xué)報(bào), 2013, 16(12): 68-78.
Ni Zijian, Rong Lili, Liu Quan. Study on evolving hypernetwork model of Wiki ontology[J]. Journal of Management Sciences in China, 2013, 16(12): 68-78.
[11] Motter A E, Moura A P, Lai Y C, et al. Topology of the conceptual network of language[J]. Physical Review E, 2002 , 65 (2): 065102.
[12] Ferrer i, Cancho R, Solé R V. The small world of human language[J]. Proceedings Biological Sciences , 2001 , 268 (1482) :2261.
[13] 馬宏煒, 陸蓓, 諶志群,等. 微博語言的復(fù)雜網(wǎng)絡(luò)特征研究[J]. 計(jì)算機(jī)工程與應(yīng)用, 2015, 51(19): 119-124+193.
Ma Hongwei, Lu Bei, Chen Zhiqun, et al. Research on micro Blog language characteristics based on complex network[J]. Computer Engineering and Applications, 2015, 51(19): 119-124.
[14] 劉海濤. 漢語句法網(wǎng)絡(luò)的復(fù)雜性研究[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2007, 4(4): 38-44.
Liu Haitao. The complexity of chinese syntactic network[J]. Complex Systems and Science, 2007, 4(4): 38-44.
[15] Yu S Y, Liu H T, Xu C S. Statistical properties of Chinese phonemic networks[J]. Physica A, 2011, 390(7): 1370-1380.
[16] 程亞恒. 再談為押韻而以古音誦讀古詩不可取[J]. 語文建設(shè),2011,(10):46-47.
Cheng Yaheng. Talk about the irrationality of reciting ancient poems with ancient sounds for rhyming[J]. Language Construction, 2011, 4(10): 46-47.
[17] 尹喜清. 也談“斜”字在古詩中的讀音[J]. 銅仁學(xué)院學(xué)報(bào),2016,18(5):124-126.
Yin Xiqing. A talk of the pronunciation ofXiein ancient poems[J]. Journal of Tongren University, 2016, 18(05): 124-126.
[18] 張國舉. 唐詩精華注譯評[M].吉林:長春出版社, 2010.
[19] Wang J W, Rong L L, Deng Q H, et al. Evolving hypernetwork model[J]. The European Physical Journal B-condensed Matter and Complex Systems, 2010, 77(4): 493-498.
[20] Pan X L, He S L, Zhu X Y, et al. How users employ various popular tags to annotate resources in social tagging: an empirical study[J]. Journal of the Association for Information Science and Technology, 2016, 67(5): 1121-1137.