楊仁杰
美德倫理學(xué)(virtue ethics)①Van Zyl,L.Virtue Ethics:A Contemporary Introduction.Routledge,2018,12.通常被看作規(guī)范倫理學(xué)的三種主要理論中之一。與結(jié)果主義(consequentialism)和義務(wù)論倫理學(xué)(deontology)相比,美德倫理學(xué)的不同之處在于,它將道德判斷的概念基礎(chǔ)建立在各種美德(virtue)與罪惡(vice)之上。這些美德和罪惡常常被定義為人們的道德行為和感受的某種傾向。盡管其他的倫理學(xué)理論也會(huì)對(duì)美德與罪惡的概念進(jìn)行分析,但那些分析常常建立在其他的倫理學(xué)原則之上,例如要求評(píng)估行為可能產(chǎn)生的后果的效用原則等。自從安斯康姆著名的《現(xiàn)代道德哲學(xué)》②Anscombe,G.E.M.“Modern Moral Philosophy”.Philosophy,1958,33(124):1-19.發(fā)表以來,美德倫理學(xué)在當(dāng)代的道德哲學(xué)領(lǐng)域受到了越來越多的關(guān)注。人們逐漸認(rèn)識(shí)到,美德倫理學(xué)的獨(dú)特思路有助于揭示被其他規(guī)范倫理學(xué)理論所忽略的重要論題,例如幸福(happiness)的觀念和實(shí)踐智慧(practicalwisdom)等。然而,美德倫理學(xué)的內(nèi)部也發(fā)展出了不同的版本,美德倫理學(xué)家對(duì)于一些基礎(chǔ)問題的爭(zhēng)論也遠(yuǎn)遠(yuǎn)沒有結(jié)束。美德的本質(zhì)是什么?分為多少個(gè)種類?美德是與生俱來的還是通過后天的努力逐步習(xí)得的?美德與現(xiàn)實(shí)利益有怎樣的關(guān)系?是否可以在美德和罪惡的概念基礎(chǔ)上建立起一個(gè)完整的規(guī)范倫理學(xué)理論?這些問題都是美德倫理學(xué)亟待解決的理論問題。
境遇主義批評(píng)(situationist critique)是近年來對(duì)于美德倫理學(xué)的主要批評(píng)之一。這一批評(píng)的思想資源主要來自于社會(huì)心理學(xué)領(lǐng)域從20世紀(jì)開始所做的一系列心理學(xué)實(shí)驗(yàn)。例如在著名的米爾格拉姆的“服從”(obedience)實(shí)驗(yàn)中,實(shí)驗(yàn)者以權(quán)威的身份要求被試對(duì)教學(xué)過程中回答問題出錯(cuò)的學(xué)習(xí)者施加模擬的電擊懲罰,這些懲罰的嚴(yán)重程度足以致命。實(shí)驗(yàn)結(jié)果顯示超過65%的普通人沒有堅(jiān)持反抗這種明顯違背道德的行為要求①M(fèi)ilgram,S.Obedience to Authority:An Experimental View.New York:Harper&Row,1974.。一些“哲學(xué)境遇主義者”(philosophical situationists),例如哈曼和梅里特等,認(rèn)為這些心理學(xué)實(shí)驗(yàn)不但質(zhì)疑了美德作為一種穩(wěn)定的性格特征的存在,也從根本上質(zhì)疑了人們根據(jù)美德的規(guī)范來指導(dǎo)道德行為的現(xiàn)實(shí)可能性。②Harman,G.“The Nonexistence of Character Traits”,Proceedings of the Aristotelian Society,100(1):223-226.③Merritt,M.“Virtue Ethics and Situationist Personality Psychology”.Ethical Theory and Moral Practice,2000,3(4):365-383.
對(duì)于美德倫理學(xué)的境遇主義批評(píng)可以根據(jù)批評(píng)的對(duì)象分為兩類。第一類批評(píng)者認(rèn)為,類似米爾格拉姆實(shí)驗(yàn)的經(jīng)驗(yàn)研究結(jié)果說明,人們的道德行為會(huì)隨著不同環(huán)境或境遇的影響而變化。而美德倫理學(xué)假定人們擁有跨越境遇的穩(wěn)定的性格特征,這一基本假定與經(jīng)驗(yàn)研究結(jié)果不符,因此美德倫理學(xué)的理論基礎(chǔ)存在根本缺陷。第二類批評(píng)者認(rèn)為,上述實(shí)驗(yàn)說明人們的道德行為并不完全由人的有意識(shí)的理性思維來決定,而是理性思維和無意識(shí)(non-conscious)的心理過程共同作用的結(jié)果,而且兩者常常是相互沖突的。這意味著人們無法通過理性的教化來習(xí)得特定的性格特征,因此美德倫理學(xué)所設(shè)定的有意識(shí)地培養(yǎng)個(gè)人的美德這一道德理想在本質(zhì)上不可能實(shí)現(xiàn)。如果上述兩類批評(píng)最終被判定是正確的,美德倫理學(xué)的理論基礎(chǔ)將受到嚴(yán)重的挑戰(zhàn)。
美德倫理學(xué)的支持者們對(duì)境遇主義批評(píng)的回應(yīng)有很多種,例如“罕見回應(yīng)”(rarity response)④Miller,C.“The Real Challenge to Virtue Ethics from Psychology”,Snow,E.N.,Trivigno,V.F.(Ed)The Philosophy and Psychology of Character and Happiness.New York:Routledge,2014,15-34.和CAPS性格特征的存在⑤Snow,E.N.Virtue as Social Intelligence:An Empirically Grounded Theory.New York:Routledge,2010,31.等。本文討論與這些傳統(tǒng)哲學(xué)方法不同的基于人工智能的另一種回應(yīng)方法。這種方法運(yùn)用基于智能體的建模技術(shù)(agent-based modeling)對(duì)一種特殊的美德進(jìn)行建模,并在此基礎(chǔ)上設(shè)計(jì)實(shí)現(xiàn)兩組計(jì)算實(shí)驗(yàn),通過對(duì)實(shí)驗(yàn)結(jié)果的分析來澄清境遇主義的批評(píng),并探討可能的回應(yīng)。
美德倫理學(xué)是一個(gè)典型的人文學(xué)科研究領(lǐng)域,擁有十分悠久的歷史。對(duì)美德倫理學(xué)的傳統(tǒng)研究方法與其他的人文學(xué)科類似,包括經(jīng)典解釋、概念分析,以及蘇格拉底式的論證等。在過去的幾十年里,人工智能的方法與技術(shù)被廣泛應(yīng)用于社會(huì)科學(xué)與人文學(xué)科的研究中。其中特別值得關(guān)注的是基于智能體的建模方法。盡管這一研究方法在經(jīng)濟(jì)學(xué)、社會(huì)學(xué)等社會(huì)科學(xué)中有大量的應(yīng)用,但它在規(guī)范倫理學(xué),特別是美德倫理學(xué)研究中的應(yīng)用仍然很少。本節(jié)首先簡(jiǎn)要介紹基于智能體建模方法的基本思想,然后介紹第三節(jié)的計(jì)算實(shí)驗(yàn)所采用的美德倫理學(xué)模型,并給出本文回應(yīng)境遇主義批評(píng)的核心論證。
基于智能體的模型是一種表征社會(huì)復(fù)雜系統(tǒng)的有效工具。復(fù)雜系統(tǒng)的基本特征在于,它們是由大量更小的部分或單元組成,這些小單元的行為可以有很大的變化,并且每個(gè)單元的行為都受到其他單元的影響⑥Shalizi,C.R.“Methods and Techniques of Complex Systems Science:An Overview”,Deisboeck.S.T.(Ed)Complex Systems Science in Biomedicine,New York:Springer.2004,33-114.。人類社會(huì)的許多方面都滿足這一復(fù)雜系統(tǒng)的基本特征。社會(huì)現(xiàn)象常??梢钥醋骱芏嗒?dú)立決策的個(gè)體相互作用得到的共同結(jié)果。例如,如果一個(gè)自由市場(chǎng)中的每個(gè)參與者都大致遵循理性決策的規(guī)則,那么這個(gè)市場(chǎng)在宏觀層面將產(chǎn)生供需平衡的現(xiàn)象。這一社會(huì)總體的現(xiàn)象是由大量個(gè)體各自的決策過程共同造成的。由于很多社會(huì)現(xiàn)象都擁有類似復(fù)雜系統(tǒng)的結(jié)構(gòu),因此可以用復(fù)雜系統(tǒng)科學(xué)所提供的模型對(duì)這些社會(huì)現(xiàn)象進(jìn)行描述、解釋和預(yù)測(cè)?;谥悄荏w的模型是復(fù)雜系統(tǒng)科學(xué)常用的一種模型,它直接模擬復(fù)雜系統(tǒng)中的每個(gè)小單元及其相互作用,因此可以作為社會(huì)復(fù)雜系統(tǒng)的直接表征。例如在上例中,可以將每個(gè)個(gè)體決策者用一個(gè)智能體來模擬,在每個(gè)智能體內(nèi)部建立個(gè)體決策機(jī)制的計(jì)算模型,并用算法實(shí)現(xiàn)智能體之間交互作用的計(jì)算機(jī)模擬。
美德倫理學(xué)所考慮的美德有很多種。本文選擇古希臘四元德中的“公正”(justice)作為建模對(duì)象。為了避免不必要的重復(fù)設(shè)計(jì),本文采用著名的厄爾法羅(El Farol)模型作為基本模型,并按照美德倫理學(xué)的特征加以改造。在阿瑟①Arthur,B.W.“Inductive Reasoning and Bounded Rationality”.American Economic Review,1994,82(2),406-411.對(duì)厄爾法羅模型的原初描述中,厄爾法羅是指美國(guó)新墨西哥州圣塔菲的一個(gè)小酒館。每個(gè)周四都有100位酒館的??蜁?huì)考慮去酒館聽愛爾蘭音樂。但這個(gè)酒館的面積有限,如果去酒館的顧客超過60人,那么酒館就會(huì)變得非常擁擠,使得每個(gè)人都無法舒適地享受音樂。當(dāng)?shù)氐膱?bào)紙會(huì)在每周四之前刊登上一周光臨酒館的人數(shù),每位顧客都可以記錄下這些數(shù)據(jù),并根據(jù)前幾周的酒館人數(shù)來獨(dú)立判斷本周四是否應(yīng)該去酒館。圖1(見129頁)是厄爾法羅模型的圖示,其中右上角圍起來的部分代表酒館內(nèi)部,位置在酒館外部的人代表本周四不去酒館的人。
如果我們將上述模型中的小酒館看作一個(gè)公共資源,那么厄爾法羅模型所描述的社會(huì)現(xiàn)象就是這一公共資源如何在由100個(gè)人所組成的群體中分配的問題。分配的公正性取決于每個(gè)人各自的決策行為。如果每位顧客都僅僅依照自己的喜好去光臨酒館,那么酒館將有100個(gè)人,環(huán)境會(huì)變得很糟糕,每個(gè)個(gè)體的利益都會(huì)受到損失。如果每位顧客都不去酒館,酒館作為一種公共資源便被浪費(fèi)了。因此,理想的狀態(tài)是剛好有60位顧客光臨酒館。但是由于模型設(shè)定每個(gè)個(gè)體獨(dú)立做決策,不允許個(gè)體之間進(jìn)行商議后再行動(dòng),因此每個(gè)人只能通過觀察他人過去的行為來調(diào)整自己當(dāng)下的策略,努力達(dá)成只有60個(gè)人去酒館的理想狀態(tài)。
在模型中剛好有60位顧客光臨酒館的理想狀態(tài)是一種公正的資源分配。然而由于美德是個(gè)體的穩(wěn)定的性格特征或行為傾向,因此群體層面的公正分配不能作為個(gè)體層面的美德。本文用個(gè)體的下述行為傾向作為模型中“公正”這一美德的具體實(shí)現(xiàn):“當(dāng)酒館的人數(shù)預(yù)期(包括本人)超過60人時(shí),不去光臨酒館?!边@一行為傾向的界定符合美德倫理學(xué)對(duì)于美德的諸多要求。第一,由于每個(gè)人都希望自己能去酒館欣賞音樂,并且每個(gè)人都知道,如果大家同時(shí)都去酒館,就沒有人能夠安心享受音樂,因此可以認(rèn)為那些選擇在適當(dāng)?shù)臅r(shí)候不去酒館的人擁有一種公正的美德。第二,美德不等同于個(gè)體利益的最大化。如果對(duì)于個(gè)體來說,擁擠的酒館和不去酒館的損失是同樣的,那么個(gè)體利益最大化的選擇是無論如何都去光臨酒館,因?yàn)闊o論酒館是擁擠的還是有空位的,去酒館的利益都不小于不去酒館的利益。這種行為與公正美德的要求是不一致的。第三,美德也不等同于群體利益的最大化。如果在100個(gè)人的群體中存在超過60個(gè)人始終去酒館,那么無論這60個(gè)人之外的個(gè)體是否遵循公正的美德,都無法改變酒館始終擁擠的現(xiàn)實(shí)。因此是否擁有美德與群體利益的大小并沒有嚴(yán)格的對(duì)應(yīng)關(guān)系。第四,存在與美德相對(duì)的罪惡。例如,如果一個(gè)個(gè)體不顧他人的感受,每周都堅(jiān)持去酒館,無論酒館是否擁擠,那么這個(gè)人的行為近于無賴,可以認(rèn)為他擁有一種與公正相對(duì)的罪惡。第五,美德與實(shí)踐智慧是相關(guān)的。這里所定義的公正只是一種行為傾向,這一傾向最終所產(chǎn)生的行為還取決于個(gè)體對(duì)于酒館人數(shù)的預(yù)期是否足夠準(zhǔn)確。如果一個(gè)個(gè)體不具備足夠的智慧,每次對(duì)酒館是否擁擠的預(yù)期都與真實(shí)情況相反,那么他每次的行動(dòng)對(duì)公正的資源分配都沒有幫助,無法在行為中體現(xiàn)出公正的美德。第六,美德不僅與個(gè)體的行為相關(guān),也與主觀的動(dòng)機(jī)相關(guān)。如果一個(gè)遵循公正的行為準(zhǔn)則的個(gè)體每次對(duì)酒館是否擁擠的預(yù)期都少于60人,那么他每周都會(huì)光臨酒館,其行為與無賴無異,盡管他的主觀動(dòng)機(jī)完全是公正的行為傾向。因此,從一個(gè)人的無賴行為并不能判定這個(gè)人的動(dòng)機(jī)一定是罪惡的,或許他仍然擁有美德,只是沒有機(jī)會(huì)在行為結(jié)果中體現(xiàn)出來。綜上所述,以上對(duì)于個(gè)體的“公正”這一美德的定義符合美德倫理學(xué)的基本要求。
圖1只給出了厄爾法羅模型的環(huán)境?;谥悄荏w的建模方法還要求我們對(duì)模型的環(huán)境內(nèi)每個(gè)智能體的行為策略給出精確定義。由于境遇主義的第二類批評(píng)區(qū)分了有意識(shí)的和無意識(shí)的心理過程,因此本文對(duì)智能體的認(rèn)知模型也做同樣的設(shè)計(jì)。模型的有意識(shí)的理性決策部分采用阿瑟的有限理性決策模型。在這個(gè)模型中,假定人們的行為決策并不遵循從第一原則出發(fā)的演繹方法,而是采用從經(jīng)驗(yàn)出發(fā)的歸納方法。每個(gè)智能體都事先被賦予一個(gè)有限的行為策略集合,智能體通過選擇這個(gè)集合中的最佳策略來預(yù)測(cè)每一周的酒館人數(shù),并根據(jù)這一預(yù)測(cè)來決定在那一周是否光臨酒館。將過去每一周光臨酒館的實(shí)際人數(shù)記錄為酒館人數(shù)的歷史,每個(gè)智能體都保留過去幾周的酒館人數(shù)歷史作為智能體的記憶,這一記憶的內(nèi)容隨著時(shí)間不斷更新。智能體的每個(gè)事先賦予的行為策略都是一組數(shù)字,它們是通過記憶中的過去幾周的人數(shù)來預(yù)測(cè)本周的人數(shù)的線性模型的參數(shù)。在智能體的決策過程中,這些參數(shù)保持不變。智能體在每一周都選擇在策略集合中能夠最好地預(yù)測(cè)前幾周酒館人數(shù)的那個(gè)策略。智能體根據(jù)這一最佳策略來預(yù)測(cè)本周的酒館人數(shù),并依此決定是否光臨酒館。
模型的無意識(shí)決策部分采用厄夫和羅思的強(qiáng)化學(xué)習(xí)方法①Erev,I.,and Roth,E.A.“Predicting How People Play Games:Reinforcement Learning in ExperimentalGameswith Unique,Mixed Strategy Equilibria”.American Economic Review,1998,88(4),848-881.。其基本思想是為每個(gè)智能體設(shè)定一個(gè)無意識(shí)地產(chǎn)生某個(gè)行為的傾向。在厄爾法羅模型中,每個(gè)智能體只有兩種行為,光臨酒館和不去酒館。每個(gè)智能體都為這兩種行為各自設(shè)置一個(gè)傾向值,這兩個(gè)值隨時(shí)間不斷更新,智能體依據(jù)它們兩者的相對(duì)大小相應(yīng)地設(shè)定選擇某個(gè)行為的概率。如果某個(gè)行為的傾向值相對(duì)較大,則選擇該行為的概率也較大,反之亦然。傾向值的更新方法是,智能體在進(jìn)行每次行為之后,都在這次行為對(duì)應(yīng)的傾向值之上增加等同于這次行為回報(bào)(reward)的值。模型的行為回報(bào)設(shè)定為,如果智能體選擇光臨酒館并且酒館人數(shù)不足60人,那么回報(bào)為1;所有其他的情況回報(bào)都為0.1。從上文中對(duì)公正定義的分析可以看出,這樣的回報(bào)設(shè)定能夠?qū)⒐拿赖屡c個(gè)體或群體利益最大化區(qū)別開來。有意識(shí)和無意識(shí)的決策過程對(duì)智能體的行為分別給出建議,最終的真實(shí)行為從兩個(gè)建議中隨機(jī)抽取,抽取概率事先分別賦予每個(gè)智能體。這一模型設(shè)定反映的基本假設(shè)是,每個(gè)人的理性決策受到無意識(shí)過程的干擾程度是穩(wěn)定不變的,并且不同的人在決定具體的行動(dòng)時(shí),理性部分所占的比重各自不同。
基于上述模型設(shè)計(jì),本文的核心論證敘述如下:
1.境遇主義認(rèn)為,類似米爾格拉姆實(shí)驗(yàn)的經(jīng)驗(yàn)研究結(jié)果說明,人們的道德行為受到不同環(huán)境或境遇的影響而變化,不存在美德倫理學(xué)所假定的跨越境遇的穩(wěn)定性格特征。
2.境遇主義還認(rèn)為,類似米爾格拉姆實(shí)驗(yàn)的經(jīng)驗(yàn)研究結(jié)果說明,人們的道德行為并不完全由人的有意識(shí)的理性思維來決定,而是理性思維和無意識(shí)的心理過程共同作用的結(jié)果。因此通過理性的道德教育所發(fā)展出來的美德的觀念無法對(duì)人的道德行為產(chǎn)生影響。
3.“公正”美德的智能體模型揭示出,即使是通過理性認(rèn)知過程憑空定義的美德概念,也可以對(duì)個(gè)人或群體的行為后果產(chǎn)生影響。
4.“公正”美德的智能體模型還揭示出,如果人們可以通過理性認(rèn)知過程習(xí)得憑空定義的美德概念,那么這一美德教育的結(jié)果可以對(duì)個(gè)人或群體的行為后果產(chǎn)生影響。
5.我們無法徹底排除理性的道德思維對(duì)行為產(chǎn)生影響的可能性。
6.根據(jù)3—5,人們可以習(xí)得憑空定義的美德概念,并且習(xí)得的美德概念對(duì)人們的道德行為及其后果會(huì)產(chǎn)生影響。
7.境遇主義的結(jié)論1和2無法對(duì)美德倫理學(xué)構(gòu)成反駁。
圖1 厄爾法羅模型
圖2 酒館人數(shù)隨時(shí)間的變化
基于上一節(jié)所建構(gòu)的公正美德的智能體模型,本文設(shè)計(jì)了兩組計(jì)算實(shí)驗(yàn),分別驗(yàn)證核心論證的第3點(diǎn)和第4點(diǎn)。本節(jié)簡(jiǎn)要描述兩組實(shí)驗(yàn)的設(shè)定和結(jié)果,并分析實(shí)驗(yàn)結(jié)果如何支持本文的核心論證。
在上文所敘述的公正美德的智能體模型中,智能體的認(rèn)知模型包括有意識(shí)的理性決策和無意識(shí)的行為傾向兩個(gè)部分。在模型設(shè)定中,無意識(shí)決策的部分采用完全基于行為收益的強(qiáng)化學(xué)習(xí)方法,與公正的美德不相關(guān)。有意識(shí)的理性決策部分根據(jù)預(yù)期酒館人數(shù)是否小于60人來選擇行為,選擇的過程遵循公正美德的要求:當(dāng)預(yù)期人數(shù)超過60人時(shí)不去酒館。由上一節(jié)的分析可知,這一決策準(zhǔn)則與個(gè)體利益最大化的準(zhǔn)則并不一致,它反映的是我們?nèi)藶槎x的美德標(biāo)準(zhǔn)的特殊要求。實(shí)驗(yàn)設(shè)定每個(gè)智能體保留過去5周的酒館人數(shù),其策略集合包含10個(gè)隨機(jī)分配的不同策略。每個(gè)智能體有兩個(gè)行為,光臨酒館和不去酒館,每個(gè)行為的初始行為傾向設(shè)定為1,并按實(shí)際實(shí)現(xiàn)的行為回報(bào)值進(jìn)行行為傾向的更新。實(shí)驗(yàn)分別考察智能體只遵循無意識(shí)機(jī)制決策、只遵循有意識(shí)機(jī)制決策、隨機(jī)分配有意識(shí)和無意識(shí)決策比例三種情況下,每種情況的酒館擁擠比率、平均回報(bào)及公正行為。實(shí)驗(yàn)對(duì)每種情況各自模擬10次,每次做1000次行為決策,取所得結(jié)果的平均值。實(shí)驗(yàn)結(jié)果分析如下:
1.無論智能體采用哪種決策機(jī)制,酒館的人數(shù)始終在某個(gè)數(shù)值附近上下波動(dòng),見圖二。這意味著即使智能體的決策是各自獨(dú)立的,整個(gè)系統(tǒng)在群體層面仍然突現(xiàn)出相互合作并共享資源的現(xiàn)象。由于有意識(shí)決策的部分采用的是阿瑟的模型假設(shè),這與阿瑟的結(jié)論是一致的。
2.當(dāng)智能體都采用無意識(shí)的強(qiáng)化學(xué)習(xí)機(jī)制時(shí),酒館人數(shù)在超過60人的數(shù)字附近波動(dòng),酒館的擁擠率為98.7%。根據(jù)強(qiáng)化學(xué)習(xí)的模型假設(shè),這反映了回報(bào)最大化的后果主義決策準(zhǔn)則。當(dāng)智能體都采用有意識(shí)的有限理性決策機(jī)制時(shí),酒館的擁擠率降低到38.6%,這同樣符合阿瑟的結(jié)論。當(dāng)智能體采用隨機(jī)分配有意識(shí)和無意識(shí)決策比例的混合策略時(shí),酒館的擁擠率為71.9%,處于以上兩者之間。比較三種情況可以看到,模型所定義的公正美德能夠顯著影響群體在資源分配方面的行為后果。此外,模型所定義的公正美德是根據(jù)理性認(rèn)知中的公正觀念憑空定義的,其中包含一個(gè)可以任意選取的數(shù)字60。這一美德概念在模型中僅僅體現(xiàn)在有意識(shí)的理性決策機(jī)制中,與基于回報(bào)最大化的無意識(shí)過程并不相關(guān)。由此可見,即使是通過理性認(rèn)知過程憑空定義的美德概念,也可以對(duì)個(gè)人或群體的行為后果產(chǎn)生影響。這種影響并不要求主體是完全理性的。事實(shí)上,在混合策略的情況下,每個(gè)智能體都只是依一定的比例采用理性決策,保留了無意識(shí)沖動(dòng)的行為可能。但即使是在這種部分理性的情況下,仍然能夠看到公正美德對(duì)群體行為后果產(chǎn)生的顯著影響。
3.圖3展示的是每種情況下的個(gè)體平均回報(bào)在10次實(shí)驗(yàn)中的分布。當(dāng)智能體都采用無意識(shí)的強(qiáng)化學(xué)習(xí)機(jī)制時(shí),個(gè)體獲得的平均回報(bào)只有7.6。當(dāng)智能體都采用有意識(shí)的有限理性決策機(jī)制時(shí),個(gè)體的平均回報(bào)為334.4。在混合策略的情況下,個(gè)體的平均回報(bào)為162.4。后兩種情況的平均回報(bào)都大大提高。由此可見,憑空定義的美德概念對(duì)個(gè)體的行為后果也有影響。這種影響是通過酒館擁擠的不同程度造成的。
4.在實(shí)驗(yàn)中還可以看到一種現(xiàn)象,個(gè)體的回報(bào)與其公正美德的程度有時(shí)是相反的,其中公正美德的程度由個(gè)體在酒館擁擠的情況下不去酒館的次數(shù)決定。這意味著在群體中獲得回報(bào)最多的人常常是那些沒有美德的人,他們無論酒館是否擁擠都霸占著酒館的位置,因此能夠在酒館不擁擠的時(shí)候留在酒館,從而獲得更大的收益。但美德與個(gè)體的回報(bào)并不完全沖突,因?yàn)橐泊嬖谟忻赖碌娜双@取大量回報(bào),他們對(duì)于酒館人數(shù)的判斷常常是對(duì)的。
為了驗(yàn)證核心論證的命題4,需要建立智能體對(duì)公正美德的學(xué)習(xí)模型。根據(jù)境遇主義的反駁,智能體之間的美德學(xué)習(xí)只能通過理性決策過程完成。美德倫理學(xué)通常認(rèn)為美德的目的在于美好的生活方式,而不局限于實(shí)現(xiàn)特定的行為,因此在模型中設(shè)定智能體之間能夠互相習(xí)得對(duì)方的某個(gè)預(yù)測(cè)酒館人數(shù)的策略,而不是簡(jiǎn)單復(fù)制被學(xué)習(xí)者每個(gè)時(shí)刻的行為。具體的學(xué)習(xí)方法是,學(xué)習(xí)者從自己的策略集中隨機(jī)刪除一個(gè),并將被學(xué)習(xí)者在本次行動(dòng)時(shí)刻的最佳策略復(fù)制到自己的策略集中。實(shí)驗(yàn)2在實(shí)驗(yàn)1的隨機(jī)分配有意識(shí)和無意識(shí)決策的情況中加入美德的學(xué)習(xí)過程。實(shí)驗(yàn)對(duì)有學(xué)習(xí)過程的情況模擬10次,每次做1000次行為決策,每次決策有10%比例的最無賴的個(gè)體向最公正的個(gè)體學(xué)習(xí)美德。其中無賴是指在主觀上不遵循公正美德,即當(dāng)預(yù)測(cè)人數(shù)超過60仍然光臨酒館。無賴的程度由無賴行為的次數(shù)來度量。最公正的個(gè)體由行為公正的程度來決定,其中行為公正與主觀公正不同,它是指當(dāng)實(shí)際人數(shù)超過60時(shí)不去酒館。行為公正體現(xiàn)了主體的實(shí)踐智慧,因?yàn)槿绻A(yù)測(cè)酒館人數(shù)的策略不準(zhǔn)確,只有主觀公正的意愿并不必然導(dǎo)致公正的行為。實(shí)驗(yàn)設(shè)定的學(xué)習(xí)過程是,在最無賴的智能體和最公正的智能體中分別隨機(jī)選取1個(gè)人,令無賴者依照學(xué)習(xí)模型設(shè)定的方法向公正者學(xué)習(xí)一次策略,整個(gè)過程在一次決策行為中重復(fù)10次。與實(shí)驗(yàn)1類似,實(shí)驗(yàn)2考察在加入學(xué)習(xí)過程的混合策略情況下,酒館的擁擠比率、平均回報(bào)及公正行為。
從圖4中可以看到,在加入美德的學(xué)習(xí)過程之后,酒館的擁擠率從71.9%降低到了32.4%,甚至超過了只遵循有意識(shí)機(jī)制決策的情況。而個(gè)體的平均回報(bào)也增長(zhǎng)到了283.1。不僅如此,回報(bào)在100個(gè)人中的分布也更加集中,獲得最高回報(bào)的人公正美德的程度也得到了提高。實(shí)驗(yàn)結(jié)果說明,通過理性認(rèn)知過程習(xí)得憑空定義的美德概念可以對(duì)個(gè)人或群體的行為后果產(chǎn)生顯著影響。
圖3 不同策略下的平均回報(bào)
圖4 不同策略下的酒館擁擠率
總結(jié)以上兩個(gè)實(shí)驗(yàn)的結(jié)果,可以得到以下結(jié)論:只要理性的思維過程能夠?qū)€(gè)體的行為產(chǎn)生影響,那么人們就可以通過理性地學(xué)習(xí)憑空定義的美德概念,在某些情況下改善道德行為及其后果。這一結(jié)論并不要求美德是跨境遇穩(wěn)定的性格特征,也不要求美德的習(xí)得在所有情況都能夠改善行為后果。如果上述結(jié)論成立,那么美德倫理學(xué)仍然是一個(gè)有價(jià)值的規(guī)范倫理學(xué)理論。使得這一結(jié)論不成立的條件是,理性思維在任何情況下都無法對(duì)個(gè)體行為產(chǎn)生任何影響。而這明顯是與事實(shí)不符的。例如,當(dāng)一個(gè)人經(jīng)過理性的深思熟慮決定學(xué)習(xí)一門外語時(shí),這個(gè)決定會(huì)影響其未來的一系列行為和后果,如職業(yè)選擇或生活目標(biāo)等。只要還存在著理性影響行為的可能性,就無法排除美德倫理學(xué)的價(jià)值。因此,即使美德既不是跨境遇穩(wěn)定的性格特征,也不是決定行為的唯一因素,對(duì)個(gè)體的美德培養(yǎng)仍然可以改善道德行為及其后果。境遇主義無法對(duì)美德倫理學(xué)構(gòu)成反駁。
對(duì)于本文提出的為美德倫理學(xué)辯護(hù)的核心論證,境遇主義者可以給出很多回應(yīng)。例如,境遇主義者或許會(huì)指出,本文所選擇的公正美德與資源的分配直接相關(guān),因此也可以用后果主義的方式來理解。而類似謙虛這種與后果不直接相關(guān)的美德則難以直接用智能體模型來模擬。然而這樣的反駁已經(jīng)進(jìn)入了人工智能研究方法的語境中了。本文的目的是以公正美德的智能體模型為案例,展示人工智能方法在美德倫理學(xué)或其他哲學(xué)問題中的具體應(yīng)用。因此,本節(jié)不對(duì)境遇主義者的可能反駁逐一回應(yīng),而是簡(jiǎn)要總結(jié)人工智能方法和傳統(tǒng)哲學(xué)方法之間的關(guān)系,并指出進(jìn)一步研究的方向及建議。
首先,人工智能的方法和技術(shù)可以用來澄清哲學(xué)的概念和理論,輔助建構(gòu)哲學(xué)論證。傳統(tǒng)的哲學(xué)研究方法如概念分析、思想實(shí)驗(yàn)等,在解決哲學(xué)爭(zhēng)論時(shí)需要依賴哲學(xué)家們的理論直覺。而直覺的依據(jù)常常是不明確的或相互矛盾的,因此很難得到可靠的結(jié)論。例如在實(shí)驗(yàn)2中,公正美德的學(xué)習(xí)對(duì)行為后果至少產(chǎn)生兩種影響:一種是更加公正的個(gè)體數(shù)量可以降低酒館的擁擠率;另一種是學(xué)習(xí)會(huì)降低無賴們的個(gè)體回報(bào)。這兩種影響對(duì)于總體回報(bào)的效果是相反的,單靠直覺很難辨識(shí)出美德學(xué)習(xí)最終造成的后果。實(shí)驗(yàn)2的結(jié)果說明,運(yùn)用人工智能方法設(shè)計(jì)的計(jì)算實(shí)驗(yàn)可以在這種模棱兩可的情況下給出直覺無法確定的判斷。這些判斷可以用來建構(gòu)新的哲學(xué)論證,或者澄清哲學(xué)理論和概念的精確含義。
其次,人工智能方法無法代替?zhèn)鹘y(tǒng)的哲學(xué)方法。盡管人工智能研究提供了各種新的計(jì)算方法,如機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、社會(huì)模擬等,但它們?cè)谔幚碚軐W(xué)問題時(shí)起到的仍然只是工具的作用,是哲學(xué)工作的一部分而不是全部。例如在本文的研究中,人工智能方法只是核心論證的建構(gòu)過程中的一個(gè)環(huán)節(jié)。無論是論題的分析、概念的界定還是論證的有效性都屬于規(guī)范倫理學(xué)的研究范圍,是運(yùn)用傳統(tǒng)的哲學(xué)方法得到的。人工智能方法與傳統(tǒng)哲學(xué)方法之間是相互補(bǔ)充的關(guān)系,不是相互代替的關(guān)系。
再次,哲學(xué)不能將自己限定在傳統(tǒng)哲學(xué)方法的范圍內(nèi)。由于智能體模型、計(jì)算認(rèn)知模型以及數(shù)值模擬技術(shù)等人工智能相關(guān)領(lǐng)域的快速發(fā)展,過去很多只存在于想象中的思想實(shí)驗(yàn)如今可以運(yùn)用數(shù)值方法實(shí)現(xiàn)模擬實(shí)驗(yàn)。傳統(tǒng)的哲學(xué)領(lǐng)域需要考慮這些新的進(jìn)展,并借此推動(dòng)哲學(xué)研究的進(jìn)一步發(fā)展。同樣的情況不僅適用于人工智能方法,也適用于其他科學(xué)領(lǐng)域的研究方法與成果。例如認(rèn)知科學(xué)的研究提供了一些新的認(rèn)知架構(gòu)和認(rèn)知模型,這些認(rèn)知模型可以用來模擬虛擬社會(huì)中的個(gè)體認(rèn)知過程,從而使得模擬社會(huì)更加接近真實(shí)社會(huì),反映出更多真實(shí)社會(huì)中的復(fù)雜結(jié)構(gòu)。這意味著哲學(xué)需要進(jìn)行更多的跨學(xué)科研究,也要求哲學(xué)家們跳出哲學(xué)學(xué)科自身的視野,更加深入到其他科學(xué)領(lǐng)域中汲取必要的知識(shí)和方法。
最后,本文指出在運(yùn)用人工智能方法研究規(guī)范倫理學(xué)時(shí)仍然需要繼續(xù)深入研究的三個(gè)課題:
第一,更為復(fù)雜的認(rèn)知模型對(duì)美德模型的建立是否有幫助?本文的研究所采用的有意識(shí)和無意識(shí)的認(rèn)知模型比較簡(jiǎn)單,它們與人們真實(shí)的認(rèn)知機(jī)制相差較大。如果采用更加真實(shí)的認(rèn)知模型,如LIDA①Franklin,S.,Patterson Jr,F(xiàn).G.“The LIDA Architecture:Adding New Modes of Learning to An Intelligent,Autonomous,Software Agent”,Integrated Design and Process Technology,New York:Springer.2006,703:764-1004.或SOAR②Laird,E.J.The Soar Cognitive Architecture.The MIT Press,2012.,能否揭示出美德倫理學(xué)的更多細(xì)節(jié)?
第二,將本文的研究方法拓展到其他的美德。公正只是亞里士多德四元德的其中之一。是否可以對(duì)其它種類的美德,如勇氣、節(jié)制,乃至中國(guó)哲學(xué)中的仁、義等概念建立計(jì)算模型?能否依此建立一個(gè)完整的美德倫理學(xué)的智能體模型?
第三,將本文的研究方法拓展到其他的規(guī)范倫理學(xué)。除美德倫理學(xué)之外,規(guī)范倫理學(xué)的主要理論還包括后果主義與義務(wù)論。是否可以將人工智能方法拓展到這些理論,并與美德倫理學(xué)一起形成一個(gè)規(guī)范倫理學(xué)的一般理論?
本文認(rèn)為,在人工智能與規(guī)范倫理學(xué)的交叉領(lǐng)域,上述三個(gè)課題是比較重要并且有很好發(fā)展前景的研究方向。上述分析與論證進(jìn)一步說明,我們可以運(yùn)用當(dāng)代的計(jì)算方法來回應(yīng)古老的哲學(xué)問題。本文將這類方法統(tǒng)稱為計(jì)算哲學(xué)方法。哲學(xué)的任務(wù)不僅僅是提出問題,更為重要的是對(duì)這些問題的解決。人工智能方法為重要的哲學(xué)問題的解決提供了新的思路與研究方向。
首都師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2020年6期