王弘睿,于 東
(1. 中央民族大學(xué) 國(guó)際教育學(xué)院,北京 100081;2. 北京語(yǔ)言大學(xué) 信息科學(xué)學(xué)院,北京 100083)
做出道德判斷的能力是人類(lèi)智力的一個(gè)獨(dú)特元素。例如,對(duì)于“惡意謀殺”這一行為,人們普遍認(rèn)為其是不道德的,因?yàn)樗:α怂说纳?。在?jì)算機(jī)技術(shù)迅速發(fā)展的今天,人工智能不斷模糊著物理世界與個(gè)人生活的界限,延伸出復(fù)雜的倫理和安全問(wèn)題,如歧視、隱私侵權(quán)、造謠傳播等。如何將人類(lèi)的價(jià)值觀(guān)和道德規(guī)范嵌入人工智能系統(tǒng),讓機(jī)器學(xué)會(huì)人類(lèi)的道德知識(shí),具備做出道德判斷的能力,成為機(jī)器倫理領(lǐng)域的重要研究問(wèn)題[1]。
現(xiàn)有的研究工作多集中于粗粒度的道德判斷[2-8],如Jentzsch等[6]通過(guò)劃分道德和不道德兩種極性,對(duì)道德行為進(jìn)行傾向性判斷;Araque等[7]突破道德判斷的二元屬性,增加了中性的概念。Yan等[8]則在判斷方法上進(jìn)行了優(yōu)化,先判斷動(dòng)作行為與道德行為相關(guān)或無(wú)關(guān),再進(jìn)一步判斷相關(guān)事件的道德傾向性。中文道德詞典[9]在進(jìn)行傾向性判斷的基礎(chǔ)上,引入了詞性特征,除了道德行為動(dòng)作,還增加了道德行為對(duì)象、地點(diǎn)、媒介等概念,對(duì)道德事件有了更為全面的描述。除了簡(jiǎn)單的傾向性判斷,道德基礎(chǔ)理論(moral foundations theory, MFT)[10-12]提出了五種美德類(lèi)型,對(duì)道德行為進(jìn)行細(xì)粒度的理解和歸類(lèi),并構(gòu)造了對(duì)應(yīng)的詞典資源,成為西方較為主流的道德分類(lèi)系統(tǒng)。但是,道德作為一種獨(dú)特的文化現(xiàn)象,在不同的社會(huì)背景下會(huì)有不同的表現(xiàn)。人類(lèi)的道德觀(guān)念是復(fù)雜的,難以形成為絕大多數(shù)國(guó)家地區(qū)所公認(rèn)的道德規(guī)則。盡管道德基礎(chǔ)理論宣稱(chēng)其具有不同群體、不同地區(qū)的廣泛適應(yīng)性,但事實(shí)上, Haidt選用的幾乎全部是美國(guó)案例,并沒(méi)有意識(shí)到他們的地區(qū)狹隘性,所以由此得出的道德基礎(chǔ)理論主要體現(xiàn)的還是美國(guó)的價(jià)值觀(guān)與話(huà)語(yǔ)方式,其道德分類(lèi)不完全適用于強(qiáng)調(diào)集體主義的漢語(yǔ)環(huán)境[13]。鑒于道德觀(guān)念在不同地區(qū)和社會(huì)政治制度中解釋各不相同的復(fù)雜現(xiàn)實(shí),不同社會(huì)設(shè)計(jì)和采用細(xì)粒度道德判斷的方式也會(huì)相應(yīng)有所差異。因此,如何能夠基于地域群體特征,對(duì)不同社會(huì)、文化和政治環(huán)境進(jìn)行有針對(duì)性的道德判斷問(wèn)題進(jìn)行研究,有著更為重要的現(xiàn)實(shí)意義。
目前,中文方面缺少適用于中國(guó)社會(huì)環(huán)境的、對(duì)道德行為進(jìn)行細(xì)粒度語(yǔ)義劃分的相關(guān)研究??紤]到道德判斷的復(fù)雜性,我們?cè)凇缎聲r(shí)代公民道德建設(shè)實(shí)施綱要》(以下簡(jiǎn)稱(chēng)《新綱要》)的啟發(fā)下,將重點(diǎn)放在《新綱要》所體現(xiàn)的當(dāng)下時(shí)期中國(guó)社會(huì)的道德行為類(lèi)型研究。盡管中國(guó)社會(huì)本身由多種民族文化和傳統(tǒng)組成,但中國(guó)作為一個(gè)統(tǒng)一的社會(huì)政治、法律結(jié)構(gòu),《新綱要》作為中共中央、國(guó)務(wù)院印發(fā)的全面、系統(tǒng)、完整的道德建設(shè)綱領(lǐng)性文件,能夠反映當(dāng)下中國(guó)社會(huì)內(nèi)部最廣泛適用和制度化的共識(shí)道德觀(guān)及道德原則。
綜上,針對(duì)目前缺乏適用于中國(guó)社會(huì)環(huán)境的、細(xì)粒度語(yǔ)義劃分的中文道德知識(shí)資源這一問(wèn)題,本文提出了面向機(jī)器道德判斷任務(wù)的細(xì)粒度中文道德語(yǔ)義知識(shí)庫(kù)構(gòu)建任務(wù)。本研究的主要貢獻(xiàn)包括以下4個(gè)方面:
(1) 設(shè)計(jì)了道德行為歸類(lèi)體系,深入分析詞的語(yǔ)義特征,對(duì)道德行為進(jìn)行多維度、多層面的審查和拆分。
(2) 設(shè)計(jì)了道德框架表示體系,依據(jù)道德行為發(fā)生的場(chǎng)景環(huán)境,選取以框架的方式進(jìn)行表示。每個(gè)框架包括框架名、定義、框架元素、框架關(guān)系和框架詞元五部分。
(3) 探索同一框架詞元的內(nèi)部特征,設(shè)計(jì)了道德強(qiáng)度衡量體系,進(jìn)一步標(biāo)注和區(qū)分詞元強(qiáng)度。
(4) 構(gòu)建了中文道德語(yǔ)義知識(shí)庫(kù)數(shù)據(jù)資源,共15 371詞,并驗(yàn)證了理論體系的合理性和可行性。
本節(jié)對(duì)道德判斷的相關(guān)理論研究進(jìn)行梳理,包括普世價(jià)值觀(guān)念下的道德內(nèi)容二元論與道德內(nèi)容多元論,以及基于地域文化背景下的歐盟文化道德體系與中國(guó)文化道德體系。
1.1.1 認(rèn)知道德發(fā)展理論
基于個(gè)人主義文化下的道德體系,主張道德基礎(chǔ)二元論,其所使用的情境集中于公正與幸福兩方面道德內(nèi)容上。這一理論涉及的道德問(wèn)題局限于個(gè)體間的關(guān)系與規(guī)則方面,然而在社會(huì)生活中,道德判斷更多地處于關(guān)系情境中,人際層面的道德內(nèi)容不能充分解決社會(huì)關(guān)系中的實(shí)際沖突。因此,這一理論解釋范圍有限,在現(xiàn)實(shí)中難以準(zhǔn)確地描述道德行為。
1.1.2 道德基礎(chǔ)理論
在認(rèn)知道德發(fā)展理論的基礎(chǔ)上進(jìn)行了進(jìn)一步探索,認(rèn)為人類(lèi)的道德內(nèi)容遠(yuǎn)不止公正與幸福的這二元基礎(chǔ),而是具有包含“關(guān)愛(ài)/傷害”“公平/欺騙”“忠誠(chéng)/背叛”“權(quán)威/顛覆”“圣潔/墮落”等在內(nèi)的多元基礎(chǔ)。五元道德內(nèi)容可以被劃分為兩個(gè)層面: 關(guān)愛(ài)、公平從個(gè)體層面強(qiáng)調(diào)了應(yīng)該如何與他人相處、如何保護(hù)和尊重他人,屬于個(gè)體化的道德基礎(chǔ);忠誠(chéng)、權(quán)威和圣潔則著重解決將個(gè)體聯(lián)結(jié)到群體或道德共同體之內(nèi)的問(wèn)題,屬于聯(lián)結(jié)性的道德基礎(chǔ)。
已有研究表明,不同文化之間存在道德狹隘主義[14-16]。長(zhǎng)期進(jìn)化雖然使人類(lèi)形成了共享的道德基礎(chǔ),但不同的社會(huì)主要依據(jù)的道德基礎(chǔ)卻有所不同,有的社會(huì)僅選取一種或兩種道德基礎(chǔ)來(lái)建立自己的道德秩序,而有的社會(huì)卻五種都用到。例如,游牧民族比耕種民族的組織結(jié)構(gòu)更為松散,流動(dòng)性也更大,對(duì)于群體忠誠(chéng)和權(quán)威性層級(jí)關(guān)系的要求也就相對(duì)較低[17]。因此,根據(jù)不同社會(huì)、文化和政治環(huán)境進(jìn)行有針對(duì)性的道德判斷研究,有著重要的應(yīng)用價(jià)值。
幾千年來(lái),人類(lèi)一直在思考道德問(wèn)題。蘇格拉底、柏拉圖和亞里士多德注重幸福、正義和勇氣,而孔子則強(qiáng)調(diào)仁、義、禮的重要性。馬克思主義倫理學(xué)在歷史唯物主義基礎(chǔ)上,將道德作為社會(huì)歷史現(xiàn)象加以研究,認(rèn)為沒(méi)有任何一種道德是永恒不變的,不同的時(shí)代、不同的國(guó)家有不同的道德觀(guān)念[18]。
Evgeni等[19]認(rèn)識(shí)到,不同文化和社會(huì)政治制度中可能存在不同的價(jià)值選擇,因此,他們選取《歐洲聯(lián)盟基本權(quán)利憲章》作為理論指導(dǎo),認(rèn)為其代表了歐盟成員國(guó)之間最廣泛共享和制度化的一套共識(shí)價(jià)值觀(guān)和倫理原則,并基于該憲章提出了適用于歐盟文化背景的道德分類(lèi)體系,分為尊嚴(yán)、自由、平等和團(tuán)結(jié)四類(lèi),用以解釋歐盟社會(huì)內(nèi)部的核心價(jià)值觀(guān)。
我國(guó)歷來(lái)重視倫理道德觀(guān)的建設(shè)。繼2001年頒布《公民道德建設(shè)實(shí)施綱要》(以下簡(jiǎn)稱(chēng)《綱要》)后,又于2019頒布《新時(shí)代公民道德建設(shè)實(shí)施綱要》(以下簡(jiǎn)稱(chēng)《新綱要》),對(duì)《綱要》中提出的社會(huì)主義公民道德建設(shè)內(nèi)容體系進(jìn)行完善,是馬克思主義倫理學(xué)在中國(guó)當(dāng)代發(fā)展的一大成果,標(biāo)志著社會(huì)主義公民道德建設(shè)內(nèi)容體系在新時(shí)代的新升華[20]。
《新綱要》中劃分的社會(huì)公德、職業(yè)道德、家庭美德和個(gè)人品德覆蓋了道德活動(dòng)的主要領(lǐng)域,一個(gè)社會(huì)的文明進(jìn)步和風(fēng)氣好壞,都集中體現(xiàn)在這四個(gè)社會(huì)生活領(lǐng)域中?!缎戮V要》中的道德內(nèi)容部分的探索則經(jīng)過(guò)了一個(gè)不斷深化的過(guò)程,通過(guò)總結(jié)18年來(lái)我國(guó)加強(qiáng)公民道德建設(shè)的經(jīng)驗(yàn),汲取理論界、學(xué)術(shù)界已有的研究成果,對(duì)《綱要》中倡導(dǎo)的“20字”基本道德規(guī)范加以調(diào)整、提煉和凝結(jié),設(shè)定了具體明確的美德行為,為四大領(lǐng)域的道德建設(shè)提供了權(quán)威依據(jù)[21]。
《新綱要》中覆蓋的道德內(nèi)容類(lèi)型既代表了道德建設(shè)中最重要和最基本的道德內(nèi)容,也是每一個(gè)公民進(jìn)德、修業(yè)、立人之本。一方面,《新綱要》基于我國(guó)的文化背景,體現(xiàn)了傳統(tǒng)道德和時(shí)代精神的統(tǒng)一: 愛(ài)國(guó)、誠(chéng)信、勤勞等中國(guó)人古已有之,自強(qiáng)、敬業(yè)、奉獻(xiàn),則更多地體現(xiàn)出當(dāng)下社會(huì)對(duì)個(gè)體行為的要求。另一方面,《新綱要》具有道德實(shí)踐的普適性: 《新綱要》簡(jiǎn)約、現(xiàn)實(shí)、易行,適宜于各個(gè)階層、各種身份、各種黨派的社會(huì)公民,是每個(gè)公民的道德實(shí)踐和道德生活都適用的行為規(guī)范。
因此,本文選取《新綱要》作為本文分類(lèi)的重要理論參考,使用其研究當(dāng)下時(shí)期中國(guó)社會(huì)重點(diǎn)領(lǐng)域的重要道德行為內(nèi)容。
目前,中文方面缺少在中國(guó)社會(huì)文化背景下對(duì)道德事件進(jìn)行細(xì)粒度語(yǔ)義歸類(lèi)的相關(guān)研究。在此背景下,我們?cè)谥形牡赖略~典資源的基礎(chǔ)上,提出了中文道德語(yǔ)義知識(shí)庫(kù)的構(gòu)建任務(wù)。通過(guò)綜合道德判斷的理論研究、我國(guó)的文化背景及當(dāng)下的時(shí)代特征,選取《新綱要》作為理論指導(dǎo),嘗試對(duì)道德行為進(jìn)行細(xì)粒度的語(yǔ)義歸類(lèi)和特征研究。
本節(jié)首先對(duì)道德行為進(jìn)行個(gè)體與聯(lián)結(jié)層面的審查和拆分,然后,依據(jù)道德行為發(fā)生的場(chǎng)景環(huán)境進(jìn)行選取和歸類(lèi),并使用框架的方式進(jìn)行表示,每個(gè)框架包括框架名、定義、框架元素、框架關(guān)系和框架詞元五個(gè)部分。最后,對(duì)同一框架中詞元的內(nèi)部特征進(jìn)行探索分析,進(jìn)一步標(biāo)注和區(qū)分詞元的強(qiáng)度差異。
首先從個(gè)體和聯(lián)結(jié)層面對(duì)《新綱要》中的道德分類(lèi)進(jìn)行了分析和審查,然后從場(chǎng)景環(huán)境維度將道德行為概括劃分為四大場(chǎng)景類(lèi)型,最后對(duì)每個(gè)場(chǎng)景內(nèi)部的具體美德行為進(jìn)行了拆分和篩選,構(gòu)建起道德行為歸類(lèi)體系。
道德判斷相關(guān)理論研究表明,道德行為包括個(gè)體化的道德行為和聯(lián)結(jié)性的道德行為兩部分,既要從個(gè)體層面理解學(xué)習(xí)如何與他人相處,又要解決將個(gè)體聯(lián)結(jié)到群體或道德共同體之內(nèi)的問(wèn)題。這一劃分方式不僅在測(cè)量方面有一定合理性,也存在多種的神經(jīng)生理基礎(chǔ)[22-23]。
《新綱要》從中國(guó)社會(huì)文化環(huán)境出發(fā),總結(jié)描述社會(huì)環(huán)境中多種層面的道德行為,分類(lèi)和內(nèi)容全面總結(jié)了個(gè)體與聯(lián)結(jié)兩個(gè)層面的道德內(nèi)容?!皞€(gè)人品德”列舉了包括勤勞、善良、自強(qiáng)等個(gè)體化的道德行為,“社會(huì)公德”“職業(yè)道德”“家庭美德”三類(lèi)則分類(lèi)解釋了個(gè)體與特定群體或道德共同體之間的道德關(guān)系,描述了聯(lián)結(jié)性的道德行為。
通過(guò)對(duì)中文道德詞典中的語(yǔ)料分析發(fā)現(xiàn),實(shí)際現(xiàn)實(shí)環(huán)境中的道德行為更為復(fù)雜多樣。在不同的場(chǎng)景環(huán)境下,人類(lèi)往往需要遵循特定的道德規(guī)則[24]。例如,一位工作的已婚男性除了需要遵循作為公司員工的職業(yè)道德,還需要承擔(dān)作為丈夫的家庭責(zé)任。
基于此,本文對(duì)道德行為進(jìn)行了場(chǎng)景環(huán)境層面的劃分,劃分為社會(huì)公德、職業(yè)道德、家庭美德和個(gè)人品德四種道德場(chǎng)景,每種場(chǎng)景與其對(duì)應(yīng)的描述場(chǎng)景范圍如表1所示。
表1 道德場(chǎng)景及其描述范圍
道德行為的形成和選擇經(jīng)歷了長(zhǎng)期的文化積累和歷史傳承,人類(lèi)對(duì)符合社會(huì)發(fā)展需要的行為進(jìn)行總結(jié)和概括,提煉出提倡人們?nèi)プ龅拿赖滦袨?。因此,具體到每個(gè)道德場(chǎng)景內(nèi)部,每個(gè)場(chǎng)景中又都覆蓋了大量具體的道德行為。
本文基于中國(guó)的文化背景和時(shí)代特征,對(duì)《新綱要》中列舉的具體美德行為進(jìn)行了拆分,每種道德場(chǎng)景的具體道德行為示例如表2所示。其中,社會(huì)公德場(chǎng)景包括文明禮貌、助人為樂(lè)、愛(ài)護(hù)公物、保護(hù)環(huán)境和遵紀(jì)守法;職業(yè)道德場(chǎng)景包括愛(ài)崗敬業(yè)、誠(chéng)實(shí)守信、辦事公正、熱情服務(wù)和奉獻(xiàn)社會(huì);家庭美德場(chǎng)景包括尊老、愛(ài)幼、男女平等、家庭和睦、勤儉持家和鄰里互助。個(gè)人品德場(chǎng)景包括愛(ài)國(guó)、奉獻(xiàn)、勤勞、善良、寬厚、正直、自強(qiáng)和自律。
表2 具體道德行為示例
為了驗(yàn)證道德歸類(lèi)體系對(duì)現(xiàn)實(shí)道德行為的覆蓋程度,本文選取人民網(wǎng)社會(huì)板塊(1)http://society.people.com.cn/中的“社會(huì)萬(wàn)象”和“民生報(bào)道”兩個(gè)欄目從2020年8月到2020年11月共4個(gè)月的新聞報(bào)道進(jìn)行道德場(chǎng)景及道德行為歸類(lèi)的匹配驗(yàn)證。本文將新聞報(bào)道的標(biāo)題及內(nèi)容進(jìn)行了匯總,并通過(guò)人工標(biāo)注的方式對(duì)新聞逐篇進(jìn)行分類(lèi)判斷。首先,標(biāo)注人員需要判斷該新聞是否與道德相關(guān),與道德無(wú)關(guān)的新聞將不被標(biāo)注,然后,標(biāo)注人員按照道德行為歸類(lèi)體系對(duì)帶有道德極性的新聞報(bào)道進(jìn)行道德行為歸類(lèi),最后,本文對(duì)新聞報(bào)道的歸類(lèi)情況進(jìn)行了統(tǒng)計(jì)。最終標(biāo)注結(jié)果顯示,道德歸類(lèi)體系可以覆蓋97.6%的道德相關(guān)新聞事件,如“防汛工作常備不懈 他把雨聲當(dāng)‘鬧鈴’”可以歸類(lèi)為職業(yè)道德中的愛(ài)崗敬業(yè)。這表明了道德歸類(lèi)體系能夠較好地覆蓋真實(shí)道德文本語(yǔ)料,能夠?qū)Ξ?dāng)下中國(guó)社會(huì)環(huán)境中的道德行為進(jìn)行合理的描述和歸類(lèi)。
道德事件往往發(fā)生在一個(gè)綜合化的情境中,除了道德行為本身,還有著復(fù)雜的背景信息,比如道德事件的參與者、道德事件發(fā)生的場(chǎng)所等。Flame將“框架”定義為跟激活性語(yǔ)境相一致的結(jié)構(gòu)化的范疇系統(tǒng),是儲(chǔ)存在人類(lèi)認(rèn)知經(jīng)驗(yàn)中的圖式化情境[25]。使用框架來(lái)表示道德事件,能夠描述儲(chǔ)存在人類(lèi)認(rèn)知經(jīng)驗(yàn)中,與道德行為、道德事件相關(guān)的圖示化情境。因此,本文使用框架的方法來(lái)表示道德事件復(fù)雜的情景概念。
道德框架庫(kù)中的每個(gè)框架都按以下五個(gè)方面進(jìn)行描述: ①框架名; ②框架定義; ③框架元素; ④框架關(guān)系; ⑤框架詞元。完整道德框架內(nèi)容示例如表3所示。
表3 完整道德框架內(nèi)容示例
框架名框架的名稱(chēng)。根據(jù)道德行為歸類(lèi)體系劃分為一級(jí)框架和二級(jí)框架。
一級(jí)框架包括社會(huì)公德、職業(yè)道德、家庭美德和個(gè)人品德四大道德場(chǎng)景,二級(jí)框架為其場(chǎng)景下對(duì)應(yīng)的具體道德行為。
框架定義參考《新綱要》及相關(guān)文件,對(duì)每一個(gè)框架進(jìn)行概念區(qū)分,給出詳細(xì)的定義。
框架元素框架中的參與者稱(chēng)為框架元素,框架元素再分為核心框架元素和非核心框架元素。
核心框架元素是理解框架的必有成分,非核心框架元素則表達(dá)空間、環(huán)境條件等外圍語(yǔ)義成分。
框架關(guān)系不同框架間的關(guān)聯(lián)關(guān)系。目前框架間的關(guān)系主要包括繼承關(guān)系(父框架與子框架)和總分關(guān)系(總框架與分框架)兩種關(guān)系。
其中,繼承關(guān)系體現(xiàn)了道德場(chǎng)景與道德行為類(lèi)型之間的包含關(guān)系,總分關(guān)系則體現(xiàn)了個(gè)體道德行為與聯(lián)結(jié)道德行為的交叉性。
框架詞元該框架所覆蓋的中文道德詞典資源中的具體詞元。
通過(guò)框架的表示方法,可以將不同的道德場(chǎng)景和道德類(lèi)型進(jìn)行串聯(lián),形成完整的道德場(chǎng)景及其行為的描述體系,能夠更為系統(tǒng)地對(duì)道德行為進(jìn)行歸類(lèi)和描述。
本節(jié)通過(guò)道德框架的標(biāo)注,對(duì)道德行為進(jìn)行了進(jìn)一步的分析觀(guān)察,發(fā)現(xiàn)在同一框架內(nèi)部,詞元的道德強(qiáng)度也是道德行為非常重要的一個(gè)特征。例如,“殺人”和“亂扔垃圾”都是不道德的,且同屬于“社會(huì)公德”這一道德場(chǎng)景,但人們會(huì)覺(jué)得“殺人”的不道德程度更高。該現(xiàn)象廣泛存在,我們將其定義為道德行為的強(qiáng)度,并從道德強(qiáng)度衡量指標(biāo)和衡量方法兩個(gè)維度設(shè)計(jì)了道德強(qiáng)度的衡量體系。
2.3.1 衡量指標(biāo)
Jones提出了道德強(qiáng)度(moral intensity)的概念以及衡量道德強(qiáng)度的幾個(gè)維度,包括結(jié)果嚴(yán)重度、社會(huì)輿論、效應(yīng)可能性、時(shí)間即刻性、接近性和效應(yīng)集中性[26]。
社會(huì)輿論討論的是同一行為在不同社會(huì)的共識(shí)程度,由于本文討論的環(huán)境是新時(shí)代中國(guó)社會(huì)的道德行為現(xiàn)象,故不涉及社會(huì)輿論問(wèn)題。效應(yīng)可能性是指行為引起損害的可能性,如把槍賣(mài)給一個(gè)搶劫犯比把槍賣(mài)給一個(gè)守法公民所引起損害結(jié)果的可能性更大;時(shí)間即刻性是指行為造成損害結(jié)果何時(shí)產(chǎn)生,是立即產(chǎn)生還是經(jīng)過(guò)一段時(shí)間才會(huì)顯現(xiàn);接近性是指行為受害對(duì)象與行為人的遠(yuǎn)近程度,如解雇總公司的員工給人的感覺(jué)比解雇分公司的員工更不道德;效應(yīng)集中性是指行為損害結(jié)果的聚集程度,損害結(jié)果是集中在幾個(gè)人身上還是分散在很多人身上。然而,詞級(jí)別語(yǔ)料覆蓋信息量往往比較有限,以“殺人”為例,未能包含行為的具體結(jié)果及聚集程度、對(duì)象關(guān)系、發(fā)生時(shí)間等信息。結(jié)果嚴(yán)重度指不符合道德規(guī)范行為導(dǎo)致?lián)p害結(jié)果的程度,例如,“致人死亡”比“致人受傷”的結(jié)果嚴(yán)重度更高。因此,我們選取結(jié)果嚴(yán)重度作為道德強(qiáng)度的衡量指標(biāo),根據(jù)常識(shí)對(duì)道德詞匯可能發(fā)生的嚴(yán)重結(jié)果進(jìn)行可能性推斷。
我們將詞歸屬到社會(huì)公德、職業(yè)道德、家庭美德和個(gè)人品德四個(gè)場(chǎng)景框架中。在每個(gè)場(chǎng)景內(nèi)部區(qū)分道德強(qiáng)度,從而更好地衡量同一類(lèi)別詞的道德行為。比如我們很難直接比較社會(huì)公德中的“連環(huán)殺人”和職業(yè)道德中的“巨額腐敗”哪個(gè)行為的道德強(qiáng)度更高。但對(duì)同樣是“社會(huì)公德-遵紀(jì)守法”框架中的“偷錢(qián)包”和“連環(huán)殺人”則能很好做出強(qiáng)度判斷,這一點(diǎn)也體現(xiàn)了類(lèi)別框架內(nèi)部的語(yǔ)義特征對(duì)于道德強(qiáng)度的影響。
2.3.2 衡量方法
我們將道德強(qiáng)度放在一個(gè)7級(jí)的量表中。如圖1所示,每個(gè)詞對(duì)應(yīng)[-3,3]區(qū)間內(nèi)的一個(gè)強(qiáng)度值,越靠近-3的詞,越接近非常不道德,越接近3的詞,越接近非常道德,中間值0代表中性。
圖1 道德強(qiáng)度示例
本節(jié)首先介紹中文道德語(yǔ)義知識(shí)庫(kù)數(shù)據(jù)資源的標(biāo)注方法及標(biāo)注流程安排,然后分析標(biāo)注過(guò)程的一致性情況和覆蓋道德文本語(yǔ)料情況,最后對(duì)最終標(biāo)注結(jié)果的分布進(jìn)行了統(tǒng)計(jì)和分析。
中文道德語(yǔ)義知識(shí)庫(kù)資源構(gòu)建語(yǔ)料來(lái)自中文道德詞典[9],該詞典共包含25 012個(gè)詞,其中正向道德詞7 912個(gè),負(fù)向道德詞7 647個(gè),中性詞8 963個(gè),被動(dòng)詞490個(gè)。標(biāo)注工作再分為兩個(gè)任務(wù),任務(wù)一是按照道德行為歸類(lèi)體系,為每個(gè)框架標(biāo)注其框架詞元,任務(wù)二是在框架標(biāo)注的基礎(chǔ)上,在同一框架內(nèi)部標(biāo)注詞元的道德強(qiáng)度,具體標(biāo)注流程如圖2所示。
圖2 標(biāo)注流程
3.1.1 道德行為歸類(lèi)
本任務(wù)選取中文道德詞典[9]中帶有道德極性標(biāo)簽的詞,共15 559詞。通過(guò)人工標(biāo)注的方法對(duì)其進(jìn)行道德行為歸類(lèi)并填充進(jìn)所屬框架。
標(biāo)注人員4名培養(yǎng)層次為碩士的在校學(xué)生。
標(biāo)注內(nèi)容根據(jù)道德行為歸類(lèi)體系和框架內(nèi)容對(duì)詞進(jìn)行道德判斷,選取其所屬的道德框架,進(jìn)行細(xì)粒度語(yǔ)義歸類(lèi)。
標(biāo)注流程首先對(duì)標(biāo)注人員進(jìn)行培訓(xùn)和試標(biāo)注,保留試標(biāo)注正確率在85%以上的標(biāo)注人員,進(jìn)行正式標(biāo)注。正式標(biāo)注過(guò)程中,首先,標(biāo)注四種道德場(chǎng)景,即社會(huì)公德、職業(yè)道德、家庭美德和個(gè)人品德。然后標(biāo)注每個(gè)道德場(chǎng)景對(duì)應(yīng)的具體道德行為類(lèi)型。檢查無(wú)誤后提交標(biāo)注結(jié)果。
3.1.2 道德強(qiáng)度標(biāo)注
本任務(wù)選取已標(biāo)注框架標(biāo)簽的15 371個(gè)詞,按照道德強(qiáng)度衡量體系進(jìn)行二次標(biāo)注。
標(biāo)注人員3名培養(yǎng)層次為碩士的在校學(xué)生。
標(biāo)注內(nèi)容根據(jù)道德強(qiáng)度衡量體系對(duì)詞進(jìn)行道德強(qiáng)度標(biāo)注,標(biāo)值為-3、-2、-1、0、1、2、3。
標(biāo)注流程經(jīng)過(guò)培訓(xùn)和試標(biāo)注后,每個(gè)詞由三個(gè)人進(jìn)行標(biāo)注。檢查無(wú)誤后提交標(biāo)注結(jié)果。
在試標(biāo)注和正式標(biāo)注環(huán)節(jié)中,對(duì)標(biāo)注人員的具體標(biāo)注情況進(jìn)行了一致性檢測(cè),并對(duì)最終標(biāo)注結(jié)果與原詞典資源進(jìn)行了覆蓋度分析。通過(guò)分析發(fā)現(xiàn),該理論體系具有良好的內(nèi)部一致性,能夠覆蓋絕大部分的道德行為,從而在一定程度上支持了道德歸類(lèi)體系理論的合理性。
3.2.1 標(biāo)注一致性情況
在道德框架詞元的標(biāo)注中,每個(gè)詞由兩人同時(shí)進(jìn)行標(biāo)注,不一致的詞將交由第三個(gè)人進(jìn)行檢查,有爭(zhēng)議的標(biāo)注結(jié)果將被剔除。標(biāo)注人員通過(guò)培訓(xùn)答疑,熟悉標(biāo)注流程后,正式標(biāo)注的一致性為85.3%,其中,框架大類(lèi)的一致性為83%,框架小類(lèi)的一致性為87.3%。這一結(jié)果顯示出道德歸類(lèi)體系和框架表示體系定義較為明確,能夠幫助標(biāo)注人員做出合適的決定。
在不一致的情況中,框架大類(lèi)的不一致情況主要集中在“社會(huì)公德”和“個(gè)人品德”之間,這是因?yàn)椴糠衷~所描述的場(chǎng)景不夠具體,導(dǎo)致標(biāo)注人員對(duì)其發(fā)生場(chǎng)景的判斷不一致,例如,“弄虛作假”一詞,有標(biāo)注人員判斷為“社會(huì)公德-遵紀(jì)守法”框架,另一標(biāo)注人員判斷為“個(gè)人品德-正直”框架??蚣苄☆?lèi)的不一致情況則主要集中在個(gè)人品德內(nèi)部,自強(qiáng)和自律、寬厚和正直等的界限區(qū)分。例如,“反思”,有標(biāo)注人員判斷為“自強(qiáng)”框架,另一標(biāo)注人員判斷為“自律”框架。這也是因?yàn)樵~級(jí)別的知識(shí)所覆蓋的信息量有限所造成的。
3.2.2 標(biāo)注覆蓋道德詞典語(yǔ)料情況
經(jīng)過(guò)兩輪標(biāo)注,最終獲得有效標(biāo)注結(jié)果共15 371個(gè)詞,占全部標(biāo)注詞的98.8%,只有1.2%的詞被剔除。被剔除的詞中,一部分是較為抽象的詞,比如“仁義道德”,雖然被判斷為道德,但難以確定其所歸屬的框架。另一部分是超過(guò)公民能力層面的道德行為,如“軍事援助”,屬于國(guó)家層面的道德行為,因此難以歸入框架。
中文道德語(yǔ)義知識(shí)庫(kù)數(shù)據(jù)資源構(gòu)建任務(wù)的最終標(biāo)注結(jié)果共15 371個(gè)詞,本節(jié)對(duì)兩個(gè)標(biāo)注任務(wù)分別進(jìn)行了標(biāo)注結(jié)果的統(tǒng)計(jì)和分析。
3.3.1 道德行為歸類(lèi)
道德行為歸類(lèi)任務(wù)最終標(biāo)注結(jié)果的分布情況如圖3所示。通過(guò)分析標(biāo)注結(jié)果可以看出,道德場(chǎng)景方面,道德詞典語(yǔ)料中發(fā)生在社會(huì)公德場(chǎng)景的事件占比最多,發(fā)生在家庭美德場(chǎng)景的事件占比最少。這體現(xiàn)出道德事件發(fā)生的場(chǎng)景環(huán)境: 大多數(shù)道德相關(guān)行為還是發(fā)生在公共環(huán)境中,發(fā)生在社會(huì)生活和交往的各個(gè)環(huán)節(jié)當(dāng)中。而家庭美德由于所涉及的道德類(lèi)型相對(duì)較為單一,因此數(shù)量較少。
圖3 道德場(chǎng)景分布情況
具體到每個(gè)道德場(chǎng)景內(nèi)部,如圖4~圖6所示,社會(huì)公德一類(lèi)里,遵紀(jì)守法所占比例最高,這是由于相當(dāng)一部分不道德行為本身又是違法行為所造成的,如殺人、拐賣(mài)人口等。職業(yè)道德一類(lèi)里,愛(ài)崗敬業(yè)所占比例最高,這是因?yàn)樵谶@一場(chǎng)景下,許多道德行為即為對(duì)自身工作職責(zé)的履行,如教書(shū)育人、救死扶傷等。
圖4 道德行為類(lèi)型熱力圖
圖5 道德行為類(lèi)型分布情況
圖6 道德極性分布情況
家庭美德一類(lèi)里,各分類(lèi)比例相對(duì)均衡,家庭和睦類(lèi)不道德詞相對(duì)較多,這是因?yàn)榧冶⒊鲕壪嚓P(guān)的詞較多所造成的。個(gè)人品德方面,幾種道德行為在語(yǔ)料中分布較為分散,這體現(xiàn)出在詞匯使用中,社會(huì)對(duì)各類(lèi)道德行為的描述較為均勻,詞匯使用沒(méi)有過(guò)于明顯的數(shù)量差異。其中自強(qiáng)類(lèi)道德詞相對(duì)較多,這是因?yàn)樵S多跟個(gè)人品德相關(guān)的行為屬于對(duì)個(gè)人自身的修養(yǎng)提升所造成的。
另外,通過(guò)詞云可視化分析可以看出,不同道德場(chǎng)景詞云有較明顯的區(qū)別和差異。如圖7所示,道德極性均為正向道德的詞中,不同場(chǎng)景道德框架下的詞具有比較明顯的語(yǔ)義差別。如職業(yè)道德中的“敬業(yè)”“服務(wù)”和家庭美德中的“敬老”“贍養(yǎng)”等,體現(xiàn)出框架對(duì)道德詞的區(qū)分和歸類(lèi)作用。
圖7 道德場(chǎng)景可視化示例
3.3.2 道德強(qiáng)度標(biāo)注
道德強(qiáng)度標(biāo)注結(jié)果如圖8所示??梢钥闯觯赖略~的道德強(qiáng)度大部分集中在[1,2]的區(qū)間內(nèi),強(qiáng)度大于2的詞較少。這是因?yàn)槿祟?lèi)進(jìn)行道德判斷的時(shí)候,除了“為國(guó)犧牲”等美德行為,其他行為較難達(dá)成一致的強(qiáng)度值3造成的。
圖8 道德強(qiáng)度區(qū)間分布情況
不道德詞方面,社會(huì)公德場(chǎng)景類(lèi)詞在[-2,-1.667]區(qū)間聚集明顯,這是因?yàn)檫@部分詞大多是有一定嚴(yán)重后果、違反法律的行為,因此較多人判斷為2。而其他幾類(lèi)場(chǎng)景中,大部分詞在[-1.667,-1]之間,這是因?yàn)檫@幾類(lèi)涉及的道德行為往往程度較輕,造成嚴(yán)重后果的行為相對(duì)較少。
各類(lèi)道德場(chǎng)景及其道德行為類(lèi)型的平均強(qiáng)度值如圖9所示??傮w來(lái)看,道德方面的平均強(qiáng)度值排序?yàn)閭€(gè)人品德>社會(huì)公德>職業(yè)道德>家庭美德,不道德方面的平均強(qiáng)度值排序?yàn)樯鐣?huì)公德>職業(yè)道德>個(gè)人品德>家庭美德。涉及愛(ài)國(guó)、奉獻(xiàn)的個(gè)人品德類(lèi)平均道德強(qiáng)度值最高,涉及違法行為的社會(huì)公德類(lèi)平均不道德強(qiáng)度值最高,涉及親密關(guān)系的家庭美德類(lèi)平均強(qiáng)度值均較低,從中可以看出,人們對(duì)道德場(chǎng)景是有不同程度要求的,對(duì)作用于家庭成員之間的行為準(zhǔn)則道德程度要求較低,這也體現(xiàn)出家庭美德通常被劃分為“私德”的原因,其作用范圍往往是比較親密的家庭環(huán)境,各分類(lèi)下屬行為較明確,涉及違法的嚴(yán)重不道德行為和對(duì)社會(huì)能造成重大道德貢獻(xiàn)的行為都相對(duì)較少所造成的。
圖9 道德平均強(qiáng)度值熱力圖
具體到各類(lèi)道德行為類(lèi)型內(nèi)部,在道德行為方面,個(gè)人品德中的愛(ài)國(guó)類(lèi)平均強(qiáng)度值是最高的,個(gè)人品德中的奉獻(xiàn)、職業(yè)道德中的奉獻(xiàn)社會(huì)兩類(lèi)平均強(qiáng)度值也較高,體現(xiàn)出我國(guó)集體主義的道德觀(guān)和精忠報(bào)國(guó)的文化傳統(tǒng)。
另一方面,家庭美德中男女平等、社會(huì)公德中的保護(hù)環(huán)境兩類(lèi)的平均強(qiáng)度值也較高,體現(xiàn)出當(dāng)下中國(guó)社會(huì)的群體特征和時(shí)代要求。
在不道德行為方面,不愛(ài)國(guó)的強(qiáng)度值最接近于非常不道德,其次是違背奉獻(xiàn)社會(huì)、保護(hù)環(huán)境和遵紀(jì)守法,這體現(xiàn)出對(duì)目前道德原則的理解和認(rèn)同,而勤勞、自強(qiáng)類(lèi)的強(qiáng)度值最接近-1,體現(xiàn)出人們對(duì)懶惰、不努力等行為的寬容。
現(xiàn)有道德知識(shí)庫(kù)的對(duì)比情況如表4所示。從表中可以看出,中文道德知識(shí)庫(kù)基于中國(guó)社會(huì)的道德理論,不僅包含極性特征和強(qiáng)度特征,而且將道德種類(lèi)細(xì)化為24種,可以幫助更好地解釋不同場(chǎng)景的道德行為。
表4 道德知識(shí)庫(kù)對(duì)比
本文提出了中文道德語(yǔ)義知識(shí)庫(kù)構(gòu)建任務(wù),深入分析詞的語(yǔ)義特征,設(shè)計(jì)了包括道德行為歸類(lèi)體系、道德框架表示體系和道德強(qiáng)度衡量體系三部分內(nèi)容的理論體系,并構(gòu)建了包含15 371詞的中文道德語(yǔ)義知識(shí)庫(kù)。其中,道德行為歸類(lèi)體系對(duì)道德事件進(jìn)行了劃分,歸類(lèi)為4種道德場(chǎng)景和24種道德行為類(lèi)型。在道德框架表示體系中,每個(gè)框架由框架名、框架定義、框架元素、框架關(guān)系和框架詞元五個(gè)部分組成。在道德強(qiáng)度衡量體系中,每個(gè)詞擁有[-3,3]區(qū)間內(nèi)的一個(gè)強(qiáng)度值。
由于不同社會(huì)環(huán)境中人們的道德觀(guān)念是不同的、多樣的。因此,我們無(wú)意將《新綱要》的道德觀(guān)強(qiáng)加給其他地區(qū),而是希望這項(xiàng)工作能夠成為具有包容性的模式范例,這種模式可以應(yīng)用于其他文化環(huán)境,從而支持不同社會(huì)觀(guān)點(diǎn)下的道德判斷設(shè)計(jì)。
另外,人類(lèi)的道德判斷是一個(gè)復(fù)雜的動(dòng)態(tài)的推理過(guò)程,除了靜態(tài)的道德知識(shí)之外,還有很多更加復(fù)雜的、有條件成立的道德行為。如何結(jié)合目前的命名實(shí)體、關(guān)系抽取技術(shù)對(duì)其進(jìn)行識(shí)別和分析,未來(lái)我們會(huì)進(jìn)行進(jìn)一步的深入研究。