王奕人 張緣緣
一、引言
《說文解字》是我國歷史上第一部系統(tǒng)分析漢字字形和字源的漢語字典,也是我國第一部文字學(xué)專書。但由于漢字部首數(shù)量多、關(guān)系雜,純?nèi)斯そy(tǒng)計(jì)整理漢字部首間的關(guān)系非常困難,所以到目前為止都沒有形成一個(gè)全面系統(tǒng)的部首間關(guān)系整體框架。因此,本研究在數(shù)字化時(shí)代大背景下,基于Pajek社會(huì)網(wǎng)絡(luò)分析技術(shù),從可視化和計(jì)量性兩個(gè)方面對(duì)漢字部首關(guān)系進(jìn)行深入研究,旨在探索社會(huì)網(wǎng)絡(luò)分析技術(shù)與傳統(tǒng)文字學(xué)科結(jié)合的最優(yōu)模式,挖掘新興信息科學(xué)技術(shù)在傳統(tǒng)人文學(xué)科中的應(yīng)用價(jià)值與學(xué)術(shù)價(jià)值。
二、相關(guān)研究現(xiàn)狀
數(shù)字人文是將計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)與傳統(tǒng)人文學(xué)科結(jié)合起來,進(jìn)行交叉研究而形成的新興跨領(lǐng)域?qū)W科。在數(shù)字化時(shí)代的大背景下,社會(huì)網(wǎng)絡(luò)分析技術(shù)與傳統(tǒng)人文學(xué)科結(jié)合的研究領(lǐng)域有著廣闊的應(yīng)用空間。比較具有代表性的是南京師范大學(xué)陳小荷和許超(2014)等人以網(wǎng)絡(luò)科學(xué)為視角研究《左傳》的文章,其構(gòu)建了春秋時(shí)期人物關(guān)系網(wǎng)絡(luò),以此來探查《左傳》中反映的春秋社會(huì)歷史;趙薇(2018)運(yùn)用社會(huì)網(wǎng)絡(luò)分析技術(shù)對(duì)小說《大波》“三部曲”中的人物關(guān)系和社會(huì)網(wǎng)絡(luò)進(jìn)行了可使用性分析等。
本研究以許慎的《說文解字》540部漢字部首為研究對(duì)象,在此領(lǐng)域中的研究成果數(shù)不勝數(shù),歷代學(xué)者從不同角度對(duì)其進(jìn)行了深入的研究。經(jīng)查閱文獻(xiàn)資料,可大致將以往對(duì)《說文解字》的研究概括為兩方面內(nèi)容:一方面,是對(duì)部首分類方面的研究,另一方面,是以某部為切入點(diǎn)的部首字形義方面的研究。前者在部首分類方面進(jìn)行了著重考察研究,后者針對(duì)具體的某一個(gè)部首進(jìn)行深入全面研究,包括發(fā)展歷史、研究現(xiàn)狀、研究思想與方法等。
前人對(duì)《說文解字》的研究涉及方方面面,取得的成果也十分顯著。但目前學(xué)界還沒有學(xué)者對(duì)漢字部首間的關(guān)系進(jìn)行可視化和計(jì)量性研究,不能很好地滿足部首關(guān)系研究、漢字研究等方面的學(xué)術(shù)需求。不僅如此,由于社會(huì)網(wǎng)絡(luò)分析技術(shù)與傳統(tǒng)人文學(xué)科結(jié)合的應(yīng)用在國內(nèi)起步較晚,仍在探索和發(fā)展階段,對(duì)于人文性更強(qiáng)的項(xiàng)目研究還處于相對(duì)起步階段,尚未形成系統(tǒng)的研究方法理論。綜上所述,本研究借助Pajek社會(huì)網(wǎng)絡(luò)分析技術(shù),旨在為傳統(tǒng)人文學(xué)科知識(shí)的呈現(xiàn)與傳播提供新的方法與形態(tài)。面對(duì)目前傳統(tǒng)人文學(xué)科所面臨的挑戰(zhàn),借助新興數(shù)字化技術(shù),從不同角度對(duì)傳統(tǒng)人文學(xué)科進(jìn)行再挖掘和進(jìn)一步整合,使傳統(tǒng)人文學(xué)科伴隨著科技的發(fā)展而更加完善。
三、《說文解字》部首關(guān)系的可視化研究
(一)網(wǎng)絡(luò)文件
在Pajek社會(huì)網(wǎng)絡(luò)分析技術(shù)中,一張圖和附加在圖的點(diǎn)線之上的信息可以構(gòu)成一個(gè)網(wǎng)絡(luò)。利用Pajek研究《說文解字》部首關(guān)系時(shí),可以借頂點(diǎn)表示部首,連線表示部首間關(guān)系,并改變顏色加以區(qū)分,通過新建網(wǎng)絡(luò)文件,把540個(gè)部首之間錯(cuò)綜復(fù)雜的關(guān)系以網(wǎng)絡(luò)圖的形式進(jìn)行可視化展示,更加清晰直觀,為部首關(guān)系的全面研究提供了便利。通過系統(tǒng)地收集和整理資料,本文將《說文解字》部首間的關(guān)系分為五類。
1.意義相近
意義相近指在形符互換的異體字中,充當(dāng)形符的兩個(gè)或多個(gè)部首承擔(dān)角度和內(nèi)容相同或相近的表義功能。
例如《說文解字》中提到:“蔦,寄生也。從艸,鳥聲?!对姟吩唬骸\與女蘿。樢,蔦或從木?!薄笆\”與“樢”即為一組形符互換的異體字,“蔦”的形符為“艸”,“樢”的形符為“木”,而“艸”與“木”的本義又同屬植物,屬性相近,故判斷艸部和木部的關(guān)系為意義相近。
2.意義相關(guān)
意義相關(guān)指在形符互換的異體字中,充當(dāng)形符的兩個(gè)或多個(gè)部首承擔(dān)角度和內(nèi)容相關(guān)的表義功能。
例如《說文解字》:“祝,祭主贊詞者。從示,從人、口?!倍都崱分杏痔岬健白#驈氖场?,這說明“?!边€有一個(gè)異體字,即把示部替換為食部?!白!钡男畏静勘硎尽白!钡囊饬x與祭祀有關(guān),而異體字的形符食部則表示祭祀之禮起源于飲食。雖然示部和食部在這組異體字中可以互換,但二者承擔(dān)的表義功能并不完全相同,只是在內(nèi)容上有一定的相關(guān)性,故判斷示部和食部的關(guān)系為意義相關(guān)。
3.同源分化
同源分化指取形對(duì)象相同,但由于字形分化,演變?yōu)榱瞬煌渴椎姆只F(xiàn)象。
例如很多部首在造字之初都選取人的圖形,但取形的角度則不盡相同。人部、尸部是依據(jù)人的側(cè)面圖形而造,其中,人部源于人的側(cè)面站立之形,尸部在《說文解字》中的釋義為“尸,陳也。象臥之形”。說明尸部源于人的側(cè)面屈臥之形。大部、子部是依據(jù)人的正面圖形而造,其中,大部源于成人的正面圖形,子部源于幼兒的正面圖形,《漢語大字典》中也提到子部的金文“象小兒頭上有發(fā)及兩脛之形”。故判斷這些取人之形造字的部首之間存在同源分化的關(guān)系。
4.異體部首
異體部首指部首及其異體字分別作部首,并且各有其從屬字。
根據(jù)朱強(qiáng)的《<說文解字>異體部首探析》一文,可以了解到《說文解字》的540部中共有五組異體部首,出現(xiàn)這種情況是由于五個(gè)異體字單獨(dú)立部,并沒有像通常情況那樣歸入與其對(duì)應(yīng)的五個(gè)正體部首中。例如《說文解字》中明確提出了“亣,籀文大,改古文”,認(rèn)為“大”是古文,“亣”是對(duì)應(yīng)的籀文。然而,亣部并沒有合并進(jìn)大部,而是單獨(dú)立部,有自己的從屬字,并且二者的從屬字在結(jié)構(gòu)上呈現(xiàn)出了不同的特點(diǎn)。故判斷大部和亣部之間存在異體部首的關(guān)系。
5.訛變
訛變指在漢字的演變和使用過程中,由于使用者出現(xiàn)失誤,導(dǎo)致漢字形體的突變。
漢字的訛變?cè)谄渎L的演變過程中并不少見,但部首的訛變則沒有那么豐富。《說文解字》540部中較為典型的訛變出現(xiàn)在月部和肉部之間。觀察“月”和“肉”的字形演變可以發(fā)現(xiàn),二者甲骨文和西周金文的字形都有著非常明顯的區(qū)別,但從戰(zhàn)國時(shí)期開始,字形趨于相同,到了篆文,已經(jīng)十分接近,很難區(qū)分,人們?cè)趯懽鲿r(shí)將二者混淆也是情理之中。
(二)分區(qū)文件
分區(qū)文件主要用于保存網(wǎng)絡(luò)頂點(diǎn)的分類或聚類信息,使每個(gè)頂點(diǎn)都能被確切地劃分到某個(gè)分區(qū)類別中。在研究漢字部首關(guān)系時(shí),可以利用分區(qū)文件的特點(diǎn)對(duì)540個(gè)部首進(jìn)行意義和功能方面的分類,從而更有針對(duì)性地進(jìn)行討論。
關(guān)于部首的意義分區(qū)文件,鄒曉麗的《基礎(chǔ)漢字形義釋源》將540部分為七個(gè)意義類別,分別是:以人體為內(nèi)容的部首、以器用為內(nèi)容的部首、以動(dòng)物為內(nèi)容的部首、以植物為內(nèi)容的部首、以自然界為內(nèi)容的部首、以數(shù)字為內(nèi)容的部首和以干支字為內(nèi)容的部首。用不同顏色的頂點(diǎn)表示歸屬于不同意義類別的部首,并給予它們不同的分類號(hào),最終呈現(xiàn)在網(wǎng)絡(luò)圖上會(huì)更加清晰直觀,也方便研究者分析相同和不同意義類別部首的分布情況。
部首的功能分區(qū)文件參考了王晴的《<說文解字>五百四十部首研究》對(duì)部首進(jìn)行的分類,根據(jù)部首從屬字的數(shù)量及其造字能力,分為高能部首、中能部首、低能部首和無能部首,并同意義分區(qū)文件一樣,用不同顏色的頂點(diǎn)和不同的分類號(hào)加以區(qū)分。
(三)矢量文件
矢量文件負(fù)責(zé)保存頂點(diǎn)的連續(xù)特征,可以為網(wǎng)絡(luò)中的每一個(gè)頂點(diǎn)賦予一個(gè)實(shí)數(shù)值,并最終反映在頂點(diǎn)面積的大小上。在研究《說文解字》部首關(guān)系時(shí),矢量文件的應(yīng)用主要體現(xiàn)在計(jì)量化研究中。
四、《說文解字》部首關(guān)系的計(jì)量化研究
(一)計(jì)量化方法
如何對(duì)《說文解字》540部進(jìn)行計(jì)量化分析,也是一個(gè)非常重要的問題。根據(jù)上述的可視化操作,這樣部首之間的關(guān)系通過網(wǎng)絡(luò)圖能夠直觀地展示出來,然而網(wǎng)絡(luò)圖同樣需要數(shù)據(jù)支撐,這樣部首間關(guān)系才會(huì)更加明確。對(duì)此,可以選擇兩種計(jì)量化方法進(jìn)行研究。
點(diǎn)度,即一個(gè)頂點(diǎn)所擁有的連線數(shù)量。一個(gè)頂點(diǎn)所擁有的連線越多,它的點(diǎn)度越大,在能化排列時(shí)更靠近部首網(wǎng)絡(luò)的中心,在部首網(wǎng)絡(luò)關(guān)系圖中占據(jù)更重要的位置,在矢量文件中,該頂點(diǎn)的面積也相對(duì)較大。點(diǎn)度較小的部首在能化排列時(shí)則較為邊緣化,它所對(duì)應(yīng)的頂點(diǎn)也較小。一般高點(diǎn)度頂點(diǎn)也更容易出現(xiàn)在網(wǎng)絡(luò)中的高密度區(qū)。
斯皮爾曼等級(jí)相關(guān)系數(shù)用于分析頂點(diǎn)某種特征的秩次與頂點(diǎn)另一種特征秩次是否相符。在統(tǒng)計(jì)學(xué)中,兩種現(xiàn)象的關(guān)系往往用相關(guān)系數(shù)來衡量。相關(guān)系數(shù)的取值范圍為-1到1。相關(guān)系數(shù)為正,意味著一種特征的高得分與另一種特征的高得分相關(guān);相關(guān)系數(shù)為負(fù),意味著一種特征的高得分與另一種特征的低得分相關(guān)。如果相關(guān)系數(shù)的絕對(duì)值小于0.05,意味著不相關(guān),絕對(duì)值為0.05-0.25為弱相關(guān),絕對(duì)值為0.25-0.60為中度相關(guān),絕對(duì)值為0.60-1.00為強(qiáng)相關(guān)。
(二)實(shí)驗(yàn)和分析
為了驗(yàn)證上述的計(jì)量化方法,本文選取《說文解字》540部中與口部相關(guān)的28個(gè)部首進(jìn)行可視化展現(xiàn),并對(duì)此進(jìn)行點(diǎn)度和斯皮爾曼相關(guān)系數(shù)的計(jì)量化分析。
1.點(diǎn)度
計(jì)算點(diǎn)度需要用到分區(qū)矢量文件。需要先得到與口部有關(guān)部首的點(diǎn)度分區(qū)文件(Net>Partitions>Degree>All),執(zhí)行此指令后,便可以得到點(diǎn)度分區(qū)文件。接著,需要得到矢量文件(Partition>Make vector),最后進(jìn)行可視化展現(xiàn)。
根據(jù)分區(qū)矢量網(wǎng)絡(luò)圖可知:口部的連線數(shù)量為12,即口部的點(diǎn)度為12。口部在網(wǎng)絡(luò)圖中占據(jù)中心位置,且口部對(duì)應(yīng)頂點(diǎn)的面積也最大,根據(jù)可視化分析,同樣可以知道亣部在部首網(wǎng)絡(luò)圖中與其他部首的連線數(shù)量為1,即亣部的點(diǎn)度為1,亣部在部首網(wǎng)絡(luò)圖中也就處于邊緣位置,所對(duì)應(yīng)頂點(diǎn)的面積也最小。
2.斯皮爾曼等級(jí)相關(guān)系數(shù)
為了驗(yàn)證部首點(diǎn)度和其功能的相關(guān)性,本文運(yùn)用Pajek軟件進(jìn)行了斯皮爾曼等級(jí)相關(guān)系數(shù)的計(jì)算。
計(jì)算斯皮爾曼等級(jí)相關(guān)系數(shù)需要用到的是兩個(gè)分區(qū)文件,即點(diǎn)度分區(qū)文件和功能分區(qū)文件。前文均有提及,此處就不過多贅述。
下面將對(duì)其操作步驟進(jìn)行簡述:在分區(qū)列表框的第一欄和第二欄中分別選擇點(diǎn)度分區(qū)文件(由Net>Partitions>Degree>All指令生成)和功能分區(qū)文件,二者先后順序并不重要。在指定兩個(gè)分區(qū)文件后,執(zhí)行Partitions>Info>Spearman Rank指令便可計(jì)算斯皮爾曼等級(jí)相關(guān)系數(shù)。
根據(jù)上述操作所得出的數(shù)據(jù)進(jìn)行分析:斯皮爾曼等級(jí)相關(guān)系數(shù)所得出的結(jié)果約為0.15,也就是說,以口部為中心的部首網(wǎng)絡(luò)圖的點(diǎn)度和以口部為中心的部首的功能的相關(guān)系數(shù)為0.15。根據(jù)上述相關(guān)系數(shù)的取值范圍可知,斯皮爾曼等級(jí)相關(guān)系數(shù)位于0.05-0.25之間時(shí),表明兩種關(guān)系呈現(xiàn)弱相關(guān),即部首在網(wǎng)絡(luò)圖中的點(diǎn)度與其功能呈現(xiàn)弱相關(guān)。
五、結(jié)語
本文分析了《說文解字》540部部分部首之間的關(guān)系,并將Pajek社會(huì)網(wǎng)絡(luò)分析技術(shù)融入其中,通過可視化和計(jì)量化方法,旨在更加準(zhǔn)確地展示漢字部首間關(guān)系。實(shí)驗(yàn)證明,本文所提出的將社會(huì)網(wǎng)絡(luò)分析技術(shù)與傳統(tǒng)語言學(xué)結(jié)合研究的方法是切實(shí)可行的。本文選取的方法,除了用于研究漢字部首關(guān)系外,還可以為辭書編纂、對(duì)外漢語教學(xué)、古代漢語教學(xué)等領(lǐng)域提供參考。由于知識(shí)結(jié)構(gòu)的限制,本文只對(duì)目前的研究結(jié)果進(jìn)行闡述,不敢隨意妄下定論。但這也說明社會(huì)網(wǎng)絡(luò)分析技術(shù)與傳統(tǒng)語言學(xué)結(jié)合的研究是大有可為的。工作目前偏向技術(shù)性嘗試,今后仍有許多工作需要完善。
參考文獻(xiàn):
[1][荷蘭]沃特·德·諾伊,[斯洛文尼亞]安德烈·姆爾瓦,[斯洛文尼亞]弗拉迪米爾·巴塔蓋爾吉,著.蜘蛛:社會(huì)網(wǎng)絡(luò)分析技術(shù)[M].林楓,譯.北京:世界圖書出版公司,2012.
[2]鄒曉麗.基礎(chǔ)漢字形義釋源——《說文》部首今讀本義[M].北京:中華書局,2007.
[3]王玉新.漢字部首認(rèn)知研究[M].濟(jì)南:山東大學(xué)出版社,2009.
[4]王晴.《說文解字》五百四十部首研究[D].江西師范大學(xué),2009.
★基金項(xiàng)目:本文系西南民族大學(xué)省級(jí)大學(xué)生創(chuàng)新訓(xùn)練項(xiàng)目“《說文解字》部首關(guān)系的可視化與計(jì)量性研究”(項(xiàng)目編號(hào):S202210656147)的階段性成果。
(作者簡介:王奕人,女,本科在讀,西南民族大學(xué)中國語言文學(xué)學(xué)院,研究方向:漢語國際教育;張緣緣,女,本科在讀,西南民族大學(xué)中國語言文學(xué)學(xué)院,研究方向:漢語國際教育;<通訊作者:李涵宇>)
(責(zé)任編輯 王瑞鋒)