林 穎,張曉君
(1.寧德師范學(xué)院經(jīng)濟管理系,福建 寧德352100;2.四川師范大學(xué)政治教育學(xué)院,成都610066)
信念-愿望-意圖理論及其形式化研究
林 穎1,張曉君2
(1.寧德師范學(xué)院經(jīng)濟管理系,福建 寧德352100;2.四川師范大學(xué)政治教育學(xué)院,成都610066)
從Bratman(1987)的信念-愿望-意圖理論出發(fā),考察了該理論在邏輯中的形式化,比如Cohen和Levesque(1990)的BDI邏輯。Bratman認為:信念、愿望和意圖在人的行為中扮演著重要的作用;意圖不僅僅是一個愿望,而且是主體不會輕易放棄的承諾;意圖具有慣性,而且是進一步實際推理的一個輸入;為了對信念、愿望和意圖加以區(qū)分,他引入了“前態(tài)度”的概念。Cohen和Levesque(1990)的BDI邏輯給出了Bratman(1987)的信念-愿望-意圖理論的形式語義,行動、時間、信念和偏好在此邏輯中占據(jù)著重要地位。
信念;愿望;意圖;偏好;BDI邏輯
做知識級分析的系統(tǒng)稱為主體(Agent),比如:人、具有智能的高級動物和仿人機器人均可視為A-gent)[1]。主體強調(diào)理性作用,是描述人類智能、動物智能和機器智能的統(tǒng)一模型[2]。在理性主體的設(shè)計過程中,信念(Belief)、愿望(Desire,或目標(biāo))和意圖(Intention①)所扮演的作用,哲學(xué)界和人工智能界的學(xué)者已經(jīng)有了深刻的認識。大多數(shù)哲學(xué)理論認為,意圖可以化歸成信念和愿望。而 Bratman(1987)堅信,在實際推理的過程中,意圖扮演著重要而不同的作用,并提出了意圖規(guī)劃理論(planning theory of intention),把意圖看作是行為的部分規(guī)劃;認為在社會生產(chǎn)實際中,這些規(guī)劃支持我們的日常活動隨著時間的推移進行動態(tài)推理[3]。這為BDI(Belief-Desire-Intention,簡稱BDI)邏輯的形成和發(fā)展奠定了堅實的哲學(xué)基礎(chǔ),并對人工智能產(chǎn)生了廣泛的影響。在經(jīng)濟學(xué)方法論領(lǐng)域,與信念-愿望-意圖(BDI)理論十分相似的有A.羅森伯格提出的信念-行動-愿望(簡稱BAD)理論。該理論認為:經(jīng)濟預(yù)測與主體的信念、行動和愿望的意向性解釋有關(guān)[4]。如果任一主體x的愿望是d,并且x相信“在當(dāng)時情況下,如果采取行動a就能夠?qū)崿F(xiàn)愿望d”,那么x就會采取行動a。
Bratman(1987)從民俗心理學(xué)理論的角度,解釋了信念、愿望和意圖是如何影響人類的行為決策和推理。當(dāng)人工智能領(lǐng)域的學(xué)者把他的理論實際應(yīng)用到人工主體時,就導(dǎo)致了面向主體的新的計算范例的程序設(shè)計技術(shù)的誕生。
信念和愿望在影響人類行為決策和推理的過程中起著重要的作用。Dennett(1987)[5]認為,作為理性主體的實體的行為選擇,似乎受其信念和愿望的操控。為了更為全面地理解人類實際行為推理,Bratman認為有必要引入意圖這一概念。意圖不僅僅是一個單純的愿望,而且還包含了主體不會很快放棄的承諾(commitment)。例如,一個主體的愿望是:能夠在北京大學(xué)做報告,這僅僅是一個單純的愿望,她不一定為了這個愿望而采取實際的措施,可能她受限于自身的條件(比如她連大學(xué)都沒有上過)。但如果一個主體有了明天要在北京大學(xué)做報告的意圖,這就不僅僅是個單純的愿望,她會采取實際的措施,并制定計劃來實現(xiàn)這個意圖(比如:取消其他計劃,或者確保筆記本已經(jīng)裝在包里),除非特殊或意外情況發(fā)生,導(dǎo)致她取消這個意圖,不然她明天將在北京大學(xué)做報告。
Bratman把注意力集中在面向未來的意圖,這類意圖有別于面向當(dāng)前的意圖。面向未來的意圖伴隨著主體的行動,更確切地說,伴隨主體的意圖行動(intentional actions)。為了對信念、愿望和意圖加以區(qū)分,Bratman引入了前態(tài)度(pre-attitude)的概念。前態(tài)度就是對主體行動起激勵作用的心智態(tài)度。愿望和意圖都是前態(tài)度,而信念則常常不是。意圖是對行為進行控制的前態(tài)度,而通常的愿望僅僅對行動有著潛在的影響。涉及未來導(dǎo)向意圖的承諾意愿大小,則是由意圖的行為控制特性決定的,作為行為控制的一個前態(tài)度,意圖常常涉及到對行動的一個特別承諾,而通常的愿望則沒有[6]。
除了把意圖等同于行為控制的前態(tài)度外,Bratman認為意圖還具有別的性質(zhì):意圖具有慣性(inertia),而且是進一步實際推理的一個輸入。意圖的慣性是指,意圖抵制對其進行再思考,一旦一個意圖形成(而且對行動的承諾也已經(jīng)形成),意圖通常會保持其完整性直到行動時間到來。即:意圖具有穩(wěn)定性或慣性。意圖會對進一步的行動決策和推理產(chǎn)生影響,意圖的精煉(對更具體行動的意圖)也會起作用[6]。例如,一個主體有了明天到北京大學(xué)做報告的意圖后,可以形成開車去北京大學(xué)做報告這樣更為具體的意圖。有了這第二個意圖后,考慮去北京大學(xué)的火車時刻表就不再合理,但在第一個意圖之后,這么考慮則是合理的。這就導(dǎo)致我們把意圖看成是,不同于信念和愿望的獨特的心智狀態(tài)。先前的意圖和計劃決定了待選項是否通過。意圖的這一特性就要求意圖和信念具有一致性:意圖是相對主體相信為真的世界而言的。
Bratman認為,意圖與計劃(plans)具有內(nèi)在聯(lián)系:計劃就是意圖。它們都具有意圖的特性:它們抵制對其進行再思考、具有慣性;它們都是行為的操控者,而不僅僅是行為的影響者;它們都為進一步的實際推理和規(guī)劃(planning)提供關(guān)鍵輸入。但與簡單意圖相比,它們顯得更為復(fù)雜:從不完全的意義看,簡單意圖僅僅是意圖和計劃的典型部分。典型情況是,主體有做某件事情的部分計劃,之后再考慮計劃的細節(jié)。意圖和計劃具有等級結(jié)構(gòu):關(guān)于目的的計劃嵌套了關(guān)于手段的計劃和初始步驟,更一般的意圖則嵌套了更具體的意圖[6]。
總之,Bratman認為,面向未來的意圖具有如下特點:(1)意圖是更高級別的計劃;(2)意圖引起深思并激發(fā)計劃,意圖常常會導(dǎo)致對更高級別的計劃的精煉,從而得到更加具體的計劃;(3)意圖伴隨著為實現(xiàn)該意圖的承諾;(4)僅僅在如下幾種情況下,主體才會放棄其意圖:意圖已經(jīng)實現(xiàn),她相信該意圖不可能實現(xiàn),為了有利于另一個意圖[5]41-43。
Bratman的信念-愿望-意圖理論僅僅是個半形式化系統(tǒng),此理論給出了信念、愿望和意圖這些基本概念,并說明了它們之間的關(guān)系,但并沒有給出它們的形式語義。之后有多位學(xué)者在對其進行形式化的基礎(chǔ)上,得到了相應(yīng)的信念-愿望-意圖邏輯。其中,代表性的主要有:基于線性時態(tài)邏輯的Cohen和Levesque(1990)[7]的BDI邏輯、基于分支時間時態(tài)邏輯的Rao和 Georgeff(1991)[8]473-484的 BDI邏輯、基于動態(tài)邏輯的KARO邏輯框架[9]103-146以及基于務(wù)必做到(seeing to it that)邏輯的 BDI邏輯[10][11]。Cohen和Levesque以及Rao和Georgeff這兩篇論文因為其極高的引用率,分別于2006年和2007年獲得了IPAAMAS獎——自主(autonomous)主體和多主體系統(tǒng)的影響文章獎。限于篇幅,本文只討論Cohen和Levesque(1990)的BDI邏輯,并重點論述其對時間和行動的處理。
Cohen和 Levesque(1990)試圖實現(xiàn) Bratman(1987)的哲學(xué)分析模型,他們以線性時態(tài)邏輯和可能世界語義學(xué)為基礎(chǔ),研究了信念、目標(biāo)、持續(xù)目標(biāo)、意圖以及理性的邏輯表達和演算。
在Bratman的意圖理論中,信念、愿望、時間和行動都扮演著重要的作用,因此,該理論的邏輯分析就會涉及到對信念邏輯、愿望邏輯、時間邏輯和行動邏輯的融合。信念、時間和行動在 Cohen和Levesque(1990)的邏輯中占據(jù)著基礎(chǔ)地位,但對愿望的概念有所忽視[6]:他們的邏輯是基于現(xiàn)實偏好(realistic preference)這一概念之上的?,F(xiàn)實偏好是指,主體根據(jù)其信念對其可實現(xiàn)性進行了過濾的愿望。因此,信念蘊涵現(xiàn)實偏好:如果主體相信φ為真,那么她也必須偏好φ為真。雖然在未來某個時刻,主體可能偏好φ為假。這樣,就使得意圖的概念可以化歸成信念、現(xiàn)實偏好、時間和行動的概念。即,可以根據(jù)后面四個概念來定義意圖的概念[6]。
Cohen和Levesque(1990)的邏輯是命題動態(tài)邏輯(Propositional Dynamic Logic)的線性版本。線性命題動態(tài)邏輯的語義允許解釋線性時態(tài)邏輯(Linear-time Temporal Logic)。
1.標(biāo)準(zhǔn)的命題動態(tài)邏輯
標(biāo)準(zhǔn)的命題動態(tài)邏輯不是關(guān)于行動而是關(guān)于事件(event)的邏輯,它有一個原子事件名稱的集合E。Cohen和Levesque把主體添加其中,并提供了Agent版本的命題動態(tài)邏輯。令T是主體的集合,i、j等表示主體,且i、j∈T。那么,原子行動就是E×T的元素。原子行動記作:i:e,其中,原子事件e∈E,且i∈T。通過使用模態(tài)算子Possα(其中α是一個行動)、原子公式、原子行動,就可以表示命題動態(tài)邏輯語言中的公式。Possαφ的意思是“存在行動α的一個可能執(zhí)行,且執(zhí)行行動α之后φ為真”。這一意思的確立,就允許標(biāo)準(zhǔn)的命題動態(tài)邏輯存在行動α的幾個可能執(zhí)行,從而可對不確定性行動進行表示和推理[6]。
而存在量詞Possα是作用在行動α的執(zhí)行上,其對偶模態(tài)算子是全稱量詞Afterα。而且Afterαφ≡def?Possɑ?φ。當(dāng)φ為真(用“┬”表示)時,Possα的意思是“α是可以執(zhí)行的”;而當(dāng)φ為假(用“⊥”表示)時,Afterα⊥的意思是“α是不可以執(zhí)行的”。
命題動態(tài)邏輯的語義是建立在轉(zhuǎn)換系統(tǒng)(transition systems)之上的,其中原子行動i:e被解釋成“邊(edges)”的集合[6]。這種轉(zhuǎn)換系統(tǒng)是一個偶對(couple)〈W,R〉,其中W是一個非空的可能世界的集合,R把每個行動α映射到相對于可能世界的一個可及關(guān)系Rα?W×W上。從可能世界w到被行動α標(biāo)記的可能世界u的“邊”的意思是:在w中執(zhí)行行動α,u是當(dāng)行動α被執(zhí)行后的一個可能輸出結(jié)果的世界。所有這些α“邊”組成的集合就是解釋行動α的可及關(guān)系Rα。
把命題變元的集合Φ中的原子公式p,映射到它們的執(zhí)行V(p)?W(即映射到p在其中為真的世界V(p)的集合中)的一個賦值V,與一個轉(zhuǎn)換系統(tǒng)一起,就構(gòu)成了一個命題動態(tài)邏輯模型〈W,R,V〉。此模型可以對公式指派真值。特別地,如果存在Rα中的一個偶對〈w,w′〉,使得φ在世界w′中為真:
M,w?Possαφ,當(dāng)且僅當(dāng)存在 u∈W,使得wRαu且M,u?φ
那么我們就說,Possα在世界w中為真。因此,公式Possαφ是表示能力(ability)的弱概念,即:行動α可能出現(xiàn),之后φ可以為真。
2.線性的命題動態(tài)邏輯
或許是Cohen和Levesque(1990)首次采用命題動態(tài)邏輯,對實際主體進行建模,其模態(tài)詞是在線性(linear)命題動態(tài)邏輯中解釋的。在這種模型中,對每個可能世界w而言,最多存在一個與w時間相關(guān)的后繼世界u。連接w與u的可及關(guān)系可能被幾個原子行動標(biāo)記。更形式化地說,如果對每個可能世界w∈W而言,〈w,u1〉∈Rα1且〈w,u2〉∈Rα2,而且有u1=u2,那么我們就說,轉(zhuǎn)換系統(tǒng)〈W,R,V〉是線性的。從可能世界w到被行動α標(biāo)記的可能世界u的“邊”的意思是:在w中執(zhí)行行動α,u是當(dāng)行動α被執(zhí)行后的輸出結(jié)果的世界。這就允許我們可以同時執(zhí)行兩個不同的行動,但它們必須導(dǎo)致相同的結(jié)果世界。線性命題動態(tài)邏輯的模型屬于線性轉(zhuǎn)換系統(tǒng)類[6]。
我們用Happαφ表示實際行動模態(tài)算子,意思是:行動α將要被執(zhí)行,之后φ為真。而前面的弱概念Possαφ則是表示可能行動的模態(tài)算子。正如Afterα是Possα的對偶一樣,我們把IfHappα定義成模態(tài)算子 Happα的對偶,并規(guī)定:IfHappαφ≡def ?Happα?φ。Happαφ表示行動α是可執(zhí)行的,之后φ為真;IfHappαφ表示,如果行動α是可執(zhí)行的,那么之后φ為真,因此,前者蘊涵后者。Happα的真值條件是:
M,w?Happαφ,當(dāng)且僅當(dāng)存在 u∈W,使得wRαu且M,u?φ。
這與Possα的真值條件幾乎一樣。只不過為了更好地適應(yīng)這種模型的線性,我們改變了模態(tài)算子的名稱而已。線性命題動態(tài)邏輯模型具有這樣的公理模式:
(Happi:e┬∧Happj:e′φ)→Happi:eφ
除了原子事件,命題也有諸如序列和非確定性復(fù)合(sequential and nondeterministic composition)、測試和迭代等復(fù)合事件。
Cohen和Levesque邏輯有時間算子:“eventually”(最終、終于,用◇表示)、“henceforth”(從今以后,用▽表示)、“until”(直到……才,用∪表示)。這些算子可以在線性命題動態(tài)邏輯的模型中作各種解釋[6]5。例如,我們可以給出算子“eventually”這樣的真值條件:
M,w?◇φ,當(dāng)且僅當(dāng)存在一個整數(shù)n,并存在w1,…,wn∈W,使得w1=w,對某個αk,〈wk,wk+1〉∈Rαk且M,wn?φ。
把事件e上的算子存在?與動態(tài)算子Happi:e進行融合,可以表示行動上的存在量詞,其真值條件為:
M,w??eHappi:eφ,當(dāng)且僅當(dāng)存在 e∈E,u∈W,使得〈w,u〉∈ Ri:e且M,u?φ。
Cohen和Levesque(1990)對信念的定義的論述遵循了通常的標(biāo)準(zhǔn),而對偏好的論述則利用了強現(xiàn)實偏好這一有些特別的概念。
1.信念
對每個主體i而言,可以用B表示信念模態(tài)算子;這些算子的邏輯就是標(biāo)準(zhǔn)的信念KD45模態(tài)邏輯。如果把可及關(guān)系Beli添加到線性命題動態(tài)邏輯中,就可以解釋這些算子[6]。 世界Beli(w)={u:〈w,u〉∈Beli}的集合是指,在世界w中對主體i而言可能的世界集合,這些世界與主體在w中的信念一致。
KD45中的可及關(guān)系滿足持續(xù)性(seriality)、傳遞性和歐幾里得性(Euclideanity):
(1)持續(xù)性:對每個w∈W,至少存在一個u∈W,使得〈w,u〉∈Beli。
(2)傳遞性:如果〈w,u〉∈Beli且〈u,v〉∈Beli,那么〈w,v〉∈Beli。
(3)歐幾里得性:如果〈w,u〉∈Beli且〈w,v〉∈Beli,那么〈u,v〉∈Beli。
這些約束條件使得公理D、公理4和公理5有效:
(4)信念的一致性公理D:Bφ→?B?φ
(5)正內(nèi)?。╬ositive introspection)公理4:Bφ→BBφ
(6)負內(nèi)?。╪egative introspection)公理5:?Bφ→B?Bφ
2.偏好
Cohen和Levesque認為,意圖就是特別強烈的現(xiàn)實偏好。強現(xiàn)實偏好是指,對一個主體而言的可能的世界中,存在主體偏好的一個子集。對每個主體i而言,可以用Pi表示偏好模態(tài)算子,公式Piφ的意思是主體i選擇φ為真。從信念邏輯蘊涵偏好這一意義來看,這一偏好概念具有強現(xiàn)實性。從語義上講,可以用可及關(guān)系Prefi使得Prefi?Beli來表示強現(xiàn)實偏好。即:一個與主體i的偏好一致的世界,不能夠與主體的信念相沖突[6]。換句話說,在世界w中,主體只能夠在其可能認知到的世界中選擇其偏好世界。
行動、時間、信念和偏好邏輯語義框架是一個四元組M=〈W,R,Bel,Pref〉,其中:W是一個非空的可能世界的集合;R:(T×E)→W×W把行動α映射到可及關(guān)系Rα上;Bel:T→W×W把主體i映射到可及關(guān)系Beli上;Pref:T→W×W把主體i映射到可及關(guān)系Prefi上。這一框架滿足這樣的約束條件:Beli具有持續(xù)性、傳遞性和歐幾里得性;對每個i∈T而言,Prefi?Beli。與通常一樣,在框架中添加把原子公式p映射到它們的執(zhí)行V(p)?W中的賦值V:Φ→2w,就得到框架 M=〈W,R,Bel,Pref〉對應(yīng)的模型,此框架的有效性和可滿足性的定義如常[6]。
1.意圖的定義
Cohen和 Levesque(1990)通過定義級聯(lián)(cascade)的方式定義了一個意圖模態(tài)算子[6]:
(1)如果主體i偏好φ將最終為真,并相信 φ目前為假,那么 φ就是主體 i的達成性目標(biāo)(achievement goal),記作 AGi,即有定義:AGiφ≡defPiFφ∧B?α。
(2)如果主體i有一個要達成的目標(biāo)φ,并且將堅持這一目標(biāo)直到φ要么被實現(xiàn),要么被相信成不能實現(xiàn),那么φ就是主體i的持續(xù)性目標(biāo)(persistent goal),記作 PGi,即有定義:PGiφ≡defAGiφ∧(AGiφ)∪(Bφ∨B(▽(?φ)))。
(3)如果主體i有一個持續(xù)性目標(biāo)φ,并且相信通過她的行動能夠達到φ,那么我們就說,主體i有意圖φ(記作Iφ)。這就要求通過融合算子(fused operator)對事件進行量化的方式對i的行動進行量化,即:Iφ≡defPGiφ∧B◇?eHappi:eφ。
2.意圖的一些有效原則和無效原則
Cohen和Levesque(1990)的結(jié)果保證了幾個我們想要的性質(zhì),并避免了不想要的性質(zhì)[6]。比如:(1)主體i意圖φ,邏輯蘊涵主體i相信φ,即:Iφ→Bφ;(2)公式模式 B(φ→ψ)→(Iφ→ Iψ)無效,即:主體i意圖φ,并且i相信φ蘊涵ψ,并不能邏輯蘊涵i意圖ψ。這一性質(zhì)很重要。例如:主體i想去拔牙,并相信拔牙會引起牙疼,但主體i肯定不想去挨疼。
3.持續(xù)性目標(biāo)的簡化定義
Cohen和Levesque最初的定義,允許主體為了某些更重要的目標(biāo),而放棄一個持續(xù)性目標(biāo)。其簡化定義[6]是:PGiφ=defAGiφ∧(AGiφ)∪(Bφ∨BG ?φ∨ψ)。其中ψ表示其他原因的未指定條件。
綜上所述,BDI邏輯的基本概念來源于Bratman的信念-意圖-愿望理論。該理論認為信念、愿望和意圖在影響人類行為決策和推理的過程中起著重要的作用;并把注意力集中在伴隨著主體行動的面向未來的意圖。其特點是:意圖是更高級別的計劃;意圖引起深思并激發(fā)規(guī)劃;意圖伴隨著為實現(xiàn)該意圖的承諾;引入對主體行動起激勵作用的前態(tài)度,可以對信念、愿望和意圖加以區(qū)分;意圖具有慣性,而且是進一步實際推理的一個輸入。Cohen和Levesque(1990)試圖實現(xiàn)Bratman(1987)的哲學(xué)分析模型:以線性時序邏輯和可能世界語義學(xué)為基礎(chǔ),使用信念、現(xiàn)實偏好、時間和行動的概念,通過定義級聯(lián)的方式定義了意圖模態(tài)算子,研究了信念、目標(biāo)、持續(xù)目標(biāo)、意圖以及理性的邏輯表達和演算;其邏輯是命題動態(tài)邏輯的線性版本。他們的工作為后續(xù)BDI邏輯及其擴展邏輯的發(fā)展奠定了堅實的基礎(chǔ)。
注釋:
①這里需要說明的是:雖然在心靈哲學(xué)和語言哲學(xué)等領(lǐng)域中,intention多譯為“意向”,但在人工智能領(lǐng)域,intention多譯為“意圖”。
[1]張曉君,郝一江.基于行動邏輯的智能主體行為表征研究[J].重慶理工大學(xué)學(xué)報(社會科學(xué)版),2013,(1):13-18.
[2]張曉君.等級BDI邏輯:關(guān)于行為表征的柔性邏輯[J].哲學(xué)動態(tài),2013,(1):102-107.
[3]BRATMAN M E.Intentions,Plans,and Practical Reason[M].Harvard University Press,1987.
[4]陳群,桂起權(quán).經(jīng)濟學(xué)究竟是嚴(yán)密自然科學(xué)還是行為科學(xué)——A.羅森伯格經(jīng)濟學(xué)哲學(xué)思想解讀[J].經(jīng)濟評論,2011,(5):5-11.
[5]DENNETT D C.The Intentional Stance[M].Cambridge,Mass.:MIT Press,1987.
[6]MEYER J J.Ch et al.BDI logics[EB/OL].[2013-02-18].http://www.cs.uu.nl/docs/vakken/iag/jj.BDI.
[7]COHEN P R,LEVESQUE H.Intention is choice with commitment[J].Artificial Intelligence,1990,(3):213-261.
[8]RAO A S,GEORGEFF M P.Modeling rational agents within a BDI-architecture[C]//Proceedings of the2nd International Conference on Principles of Knowledge Representation and Reasoning.1991.
[9]VAN LINDER B,et al.Actions that make you change your mind[C]//LAUX A,WANSING H(eds.).Knowledge and Belief in Philosophy and Artificial Intelligence.1995.
[10]CHELLAS B F.On bring it about[J].Journal of Philosophical Logic,1995,24:563-571.
[11]HORTY J F.Agency and Deontic Logic[M].Oxford University Press,2001.
[責(zé)任編輯:張 卉 ]
B815.3
A
1000-5315(2015)01-0005-05
2014-10-08
教育部人文社會科學(xué)研究規(guī)劃項目“基于 BDI(信念、愿望和意圖)邏輯的慎思 Agent的行為決策研究”(13YJA72040001)。
林穎(1963—),女,福建福清人,寧德師范學(xué)院經(jīng)濟管理系教授,主要研究現(xiàn)代邏輯等;
張曉君(1970—),女,四川南充人,邏輯學(xué)博士,四川師范大學(xué)政治教育學(xué)院副研究員,主要研究現(xiàn)代邏輯。