何華燦
(西北工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,陜西 西安 710072)
近十年來(lái)在大數(shù)據(jù)處理、云計(jì)算和深度神經(jīng)網(wǎng)絡(luò)的推動(dòng)下,人工智能從低谷走向了第三次發(fā)展高潮期,以AlphaGo為代表的研究成果創(chuàng)造了許多驚世駭俗的奇跡!不同于以往的兩次高潮,這次世界各主要大國(guó)都紛紛制定國(guó)家戰(zhàn)略,把AI列為未來(lái)爭(zhēng)霸世界的國(guó)之重器:2017年7月20日國(guó)務(wù)院發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,計(jì)劃到2030年我國(guó)AI理論、技術(shù)和應(yīng)用要處于國(guó)際領(lǐng)先地位;緊接著2017年9月1日俄羅斯總統(tǒng)普京強(qiáng)調(diào)“未來(lái)誰(shuí)率先掌握了AI,誰(shuí)就能稱(chēng)霸世界”;2018年4月16日英國(guó)議會(huì)AI特別委員會(huì)發(fā)布報(bào)告認(rèn)為,英國(guó)在A(yíng)I方面有能力成為世界領(lǐng)導(dǎo)者和AI創(chuàng)新中心;2018年4月25日歐盟委員會(huì)計(jì)劃2018—2020年在A(yíng)I領(lǐng)域投資240億美元,確保其世界領(lǐng)先地位;2018年5月10日美國(guó)白宮為在未來(lái)的AI領(lǐng)域“確保美國(guó)第一”成立了AI專(zhuān)門(mén)委員會(huì)。與此形成鮮明對(duì)照的是不少著名的AI學(xué)者紛紛指出,當(dāng)今AI已陷入概率關(guān)聯(lián)的泥潭,所謂深度學(xué)習(xí)的一切成就都不過(guò)是曲線(xiàn)擬合而已,它是在用機(jī)器擅長(zhǎng)的關(guān)聯(lián)推理代替人類(lèi)擅長(zhǎng)的因果推理,這種“大數(shù)據(jù)小任務(wù)”的智能模式并不能體現(xiàn)人類(lèi)智能的真正含義,具有普適性的智能模式應(yīng)該是“小數(shù)據(jù)大任務(wù)”。他們認(rèn)為基于深度神經(jīng)網(wǎng)絡(luò)的AI是不能解釋因而無(wú)法理解的AI,如果人類(lèi)過(guò)度依賴(lài)它并無(wú)條件地相信它,那將是十分危險(xiǎn)的。特別是,在司法、法律、醫(yī)療、金融、自動(dòng)駕駛、自主武器等人命關(guān)天的領(lǐng)域,更是要慎之又慎,千萬(wàn)不能放任自流?;谶@個(gè)大的認(rèn)識(shí)和反思背景,本文擬集中討論為什么深度神經(jīng)網(wǎng)絡(luò)會(huì)讓人工智能研究喪失可解釋性?我們?nèi)绾尾拍苤匦抡一厝斯ぶ悄苎芯康目山忉屝??文中所涉及的“可解釋性”滿(mǎn)足一種強(qiáng)定義:它要求從前提到結(jié)論的推理全過(guò)程都能用理論上成熟可靠的邏輯語(yǔ)言描述清楚。
人工智能學(xué)科和產(chǎn)業(yè)已走過(guò)整整一個(gè)甲子的成長(zhǎng)之路,圖1是這60年AI發(fā)展的整體態(tài)勢(shì)示意圖,其中:曲線(xiàn)①是主波,它說(shuō)明人類(lèi)社會(huì)已不可逆轉(zhuǎn)地進(jìn)入到信息社會(huì),智能化是當(dāng)今時(shí)代的主旋律,它必然會(huì)扶搖直上九重天,勢(shì)不可擋;曲線(xiàn)②是疊加在主波上的次波,它說(shuō)明各個(gè)時(shí)期推動(dòng)AI走向發(fā)展高潮的基本原理和關(guān)鍵技術(shù),雖然在一定范圍內(nèi)能夠解決某些智能模擬問(wèn)題,效果突出,但是一旦把它推廣到更大范圍使用時(shí),因缺乏人類(lèi)智能活動(dòng)的某些重要屬性,效果會(huì)立馬下降,甚至鬧出大笑話(huà)。這說(shuō)明,人的智能活動(dòng)并不是由幾個(gè)確定性因素決定的簡(jiǎn)單信息處理過(guò)程,而是由眾多不確定性因素參與的復(fù)雜信息處理過(guò)程,廣泛存在非線(xiàn)性涌現(xiàn)效應(yīng)。所以研究AI是一個(gè)由點(diǎn)到面、由淺入深、長(zhǎng)期試錯(cuò)、不斷發(fā)現(xiàn)、不斷完善的演化過(guò)程,任何AI產(chǎn)品都需要在其生命周期內(nèi)反復(fù)學(xué)習(xí)提高、不斷演化發(fā)展,不會(huì)一成不變[1]。
圖 1 人工智能學(xué)科和產(chǎn)業(yè)60年發(fā)展態(tài)勢(shì)圖Fig. 1 Development tr end of the AI discipline and in- dustry in 60 years
具體來(lái)看,AI學(xué)科的孕育和早期發(fā)展都是在布爾信息處理級(jí)別上完成的,當(dāng)時(shí)出現(xiàn)了兩個(gè)不同但是相互等價(jià)的視角[2]:從邏輯角度看,人類(lèi)智能活動(dòng)過(guò)程可用剛性邏輯(即數(shù)理形式邏輯、標(biāo)準(zhǔn)邏輯)的布爾算子組描述;從神經(jīng)元角度看,人腦的智能活動(dòng)過(guò)程可用二值神經(jīng)元的MP模型描述。布爾邏輯算子組由英國(guó)數(shù)學(xué)家G.Boole于1854年在《思維規(guī)律》中提出:任意x, y, z∈{0,1}, 非算子¬x=1-x, 與算子x∧y=Γ[x+y-1], 或算子x∨y=Γ[x+y], 蘊(yùn)涵算子x→y=Γ[-x+y-1]。其中z=Γ[v]是0,1限幅函數(shù),當(dāng)v<0時(shí)z=0,當(dāng)v>1時(shí)z=1; 否則z=v。二值神經(jīng)元模型MP(又稱(chēng)感知機(jī),閾元)由心理學(xué)家Mc Culloch和數(shù)學(xué)家W.Pitts于1943年共同提出,是一種最簡(jiǎn)單的神經(jīng)元模型(見(jiàn)圖2),依靠帶閾值的0,1限幅運(yùn)算z=Γ[ax+bye]可以完成各種二值信息變換過(guò)程,其中x, y∈{0,1}是輸入變量,z∈{0, 1}是輸出變量,a是輸入x的連接權(quán)系數(shù),b是輸入y的連接權(quán)系數(shù),e是神經(jīng)元的激活閾值,Δt是神經(jīng)元的處理延遲時(shí)間。
圖 2 二值神經(jīng)元的MP模型Fig. 2 MP model of two valued neurons
對(duì)只有1個(gè)輸入和1個(gè)輸出的神經(jīng)元z=f(x),x, z∈{0, 1}來(lái)說(shuō),只有4個(gè)可能的排列組合狀態(tài)(稱(chēng)為信息處理模式):z=f0(x)≡0; z=f1(x)=x;z=f2(x)=1-x; z=f3(x)≡1。這4種神經(jīng)元信息處理模式都有對(duì)應(yīng)的剛性邏輯表達(dá)式:z≡0=x∧¬x;z=x; z=¬x;z≡1=x∨¬x。
在研究一個(gè)神經(jīng)元內(nèi)部信息處理模式時(shí),沒(méi)有必要考慮神經(jīng)元的多輸出問(wèn)題,因?yàn)樗魂P(guān)系到一個(gè)神經(jīng)元的輸出z將被多少個(gè)別的神經(jīng)元共享,與本神經(jīng)元內(nèi)部的信息處理模式毫無(wú)關(guān)系。
有2個(gè)輸入和1個(gè)輸出的神經(jīng)元z=fi(x, y), x,y, z∈{0, 1}比較典型,是我們研究的重點(diǎn),因?yàn)槠渌噍斎氲纳窠?jīng)元,都可以轉(zhuǎn)化為2個(gè)輸入神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò),如:z=f(x1, x2, x3)=fj(fi(x1, x2),
x3), x1, x2, x3, z∈{0, 1}; z=f(x1, x2, x3, x4)=fk(fi(x1, x2),fj(x3, x4)), x1, x2, x3, x4, z∈{0, 1}。其他以此類(lèi)推,所以證明了兩輸入布爾信息處理的完備性就等于證明了任意多輸入布爾信息處理的完備性。對(duì)2輸入神經(jīng)元z=fi(x, y), x, y, z∈{0, 1}來(lái)說(shuō),總共只有16種不同的信息處理模式i=0, 1, 2, 3, ···, 15,這16種信息處理模式的0,1限幅運(yùn)算表達(dá)式z=Γ[ax+by-e],不論對(duì)于布爾邏輯算子還是二值神經(jīng)元來(lái)說(shuō),都是完全相同的(傳統(tǒng)的真值表表示法掩蓋了這個(gè)等價(jià)關(guān)系),誰(shuí)也沒(méi)比對(duì)方多提供更多的信息處理能力。所以不難得出:剛性邏輯的布爾算子組和二值神經(jīng)元MP模型具有相同的計(jì)算公式,兩者完全等價(jià),詳細(xì)細(xì)節(jié)見(jiàn)圖3。以后將把模式狀態(tài)參數(shù)作為區(qū)分不同信息處理模式的標(biāo)志性參數(shù)使用,通過(guò)計(jì)算z=Γ[ax+by-e]可唯一確定一個(gè)二值神經(jīng)元或者布爾算子組。
圖3 剛性邏輯算子和MP神經(jīng)元模型等價(jià)Fig.3 Equivalence of the rigid logic operator and MP neuron model
顯然,上述的等價(jià)關(guān)系可推廣到由任意基本單元組成的復(fù)雜網(wǎng)絡(luò)之中,下面通過(guò)一個(gè)實(shí)例來(lái)說(shuō)明:如果有一個(gè)復(fù)雜的剛性命題邏輯表達(dá)式F=((p∨q)∧(¬q∨r))∧(¬p∨¬r),它可用一些邏輯算子組成的邏輯網(wǎng)絡(luò)來(lái)描述(見(jiàn)圖4(a)), 一定存在一個(gè)由二值神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)與之對(duì)應(yīng)(見(jiàn)圖4(b)),兩者使用的0,1限幅運(yùn)算公式z=Γ[ax+by-e]完全對(duì)應(yīng)相同。
圖4 邏輯網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)等價(jià)的一個(gè)實(shí)例Fig.4 An example of the equivalence between logical and neural networks
數(shù)學(xué)理論和計(jì)算機(jī)的軟硬件設(shè)計(jì)原理都是嚴(yán)格按照剛性邏輯建立的,不曾有半點(diǎn)逾越??墒侨斯ぶ悄軐W(xué)科的誕生卻是因?yàn)橛?jì)算機(jī)科學(xué)中出現(xiàn)了“算法危機(jī)”[3]而促成的!傳統(tǒng)計(jì)算機(jī)應(yīng)用都遵循“數(shù)學(xué)+計(jì)算機(jī)程序”的信息處理模式,要解決任何一個(gè)問(wèn)題都必須滿(mǎn)足3個(gè)先決條件:1)能找到該問(wèn)題中輸入和輸出之間的數(shù)量關(guān)系,建立數(shù)學(xué)模型;2)能找到該數(shù)學(xué)模型的算法解;3)根據(jù)算法解能編制出在計(jì)算機(jī)上可實(shí)際運(yùn)行的程序。上述3點(diǎn)都沒(méi)有逾越剛性邏輯的約束,但是理論計(jì)算機(jī)科學(xué)家研究發(fā)現(xiàn):1)人腦思維中的大部分智能活動(dòng)無(wú)法建立數(shù)學(xué)模型;2)能找到的數(shù)學(xué)模型大部分都不存在算法解;3)能找到的算法解大部分都是指數(shù)型的,實(shí)際不可計(jì)算。為什么人腦智能可以解決的問(wèn)題,數(shù)學(xué)+計(jì)算機(jī)程序的模式卻解決不了?這說(shuō)明計(jì)算機(jī)僅僅依靠“數(shù)學(xué)+計(jì)算機(jī)程序”的模式還不夠聰明和有用,人工智能學(xué)科的創(chuàng)始人希望通過(guò)對(duì)人腦智能活動(dòng)規(guī)律的研究和模擬,來(lái)克服上述“算法危機(jī)”,使計(jì)算機(jī)更聰明和有用。這就是狹義人工智能學(xué)科誕生的原由。由此可見(jiàn),當(dāng)時(shí)的科學(xué)家已經(jīng)發(fā)現(xiàn),僅僅依靠數(shù)學(xué)+程序是無(wú)法模擬人腦智能的。人工智能工作者最早發(fā)現(xiàn)的智能因素就是帶有經(jīng)驗(yàn)色彩的“啟發(fā)式搜索原理”,它對(duì)剛性邏輯的有效使用具有必不可少的輔助作用。進(jìn)而人們又通過(guò)專(zhuān)家系統(tǒng)的成功發(fā)現(xiàn),各專(zhuān)門(mén)領(lǐng)域中通過(guò)經(jīng)驗(yàn)歸納形成的專(zhuān)家知識(shí),它們雖然不滿(mǎn)足剛性邏輯的約束,卻是“人更聰明”的重要因素,驗(yàn)證了“知識(shí)就是力量”的真理。
20世紀(jì)80年中期代爆發(fā)的人工智能“理論危機(jī)”無(wú)情地揭露了剛性邏輯、啟發(fā)式搜索原理和經(jīng)驗(yàn)知識(shí)推理的應(yīng)用局限性:首先,剛性邏輯本身的推理效率十分低下,如果沒(méi)有啟發(fā)式知識(shí)的引導(dǎo),單純機(jī)械式地按照剛性邏輯的規(guī)則進(jìn)行推理,算法的指數(shù)復(fù)雜度必然帶來(lái)組合爆炸,計(jì)算機(jī)的時(shí)空資源迅速被吞噬殆盡;其次,在啟發(fā)式搜索和經(jīng)驗(yàn)知識(shí)推理中,客觀(guān)存在的各種不確定性和演化過(guò)程都超出了剛性邏輯的有效適用范圍,盡管出現(xiàn)了一些非標(biāo)準(zhǔn)邏輯(如模糊邏輯、概率邏輯和有界邏輯等)能解決某些實(shí)際問(wèn)題,但有時(shí)會(huì)出現(xiàn)違反常識(shí)的異常結(jié)果,這說(shuō)明非標(biāo)準(zhǔn)邏輯在理論上并不成熟可靠,無(wú)法在人工智能中安全可靠地使用。要有效解決包含各種不確定性和演化的現(xiàn)實(shí)問(wèn)題,只能寄希望于盡快建立數(shù)理辯證邏輯理論體系,可是在當(dāng)時(shí)的情況下,學(xué)術(shù)界的思想和理論準(zhǔn)備都嚴(yán)重不足,建立數(shù)理辯證邏輯談何容易!
在這種數(shù)理辯證邏輯嚴(yán)重缺位的背景下,人工智能研究的主流不得不偏離剛性邏輯和經(jīng)驗(yàn)性知識(shí)推理的老方向,轉(zhuǎn)入到完全不依賴(lài)邏輯和經(jīng)驗(yàn)知識(shí)支撐,僅僅依靠數(shù)據(jù)統(tǒng)計(jì)的神經(jīng)網(wǎng)絡(luò)、計(jì)算智能、多Agent和統(tǒng)計(jì)機(jī)器學(xué)習(xí)的新方向。應(yīng)該說(shuō)這個(gè)研究新方向的出現(xiàn)也是具有積極意義的,它體現(xiàn)了人類(lèi)智能另外的某些特征,能夠有效地解決一些智能模擬問(wèn)題,所以曾經(jīng)推動(dòng)人工智能的發(fā)展進(jìn)入第二次高潮。后來(lái)人們?yōu)榱丝朔窠?jīng)網(wǎng)絡(luò)、計(jì)算智能、多Agent和統(tǒng)計(jì)機(jī)器學(xué)習(xí)中的“局部極值”瓶頸,又在深度學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)中,依靠大數(shù)據(jù)和云計(jì)算,不惜耗費(fèi)巨大的計(jì)算資源,義無(wú)反顧地連續(xù)使用數(shù)據(jù)統(tǒng)計(jì)法來(lái)增加神經(jīng)網(wǎng)絡(luò)的中間層次,從幾層、幾十層增加到幾百層甚至幾千層來(lái)擬合海量數(shù)據(jù),根本忘記了二值神經(jīng)元和布爾邏輯算子原本具有等價(jià)關(guān)系的基本屬性。深度神經(jīng)網(wǎng)絡(luò)這種不惜一切代價(jià)取得的成功,反過(guò)來(lái)鼓勵(lì)一些學(xué)者產(chǎn)生臆想:“深度神經(jīng)網(wǎng)絡(luò)的中間層次越多,獲得的結(jié)果會(huì)越精準(zhǔn)!”,而且“神經(jīng)網(wǎng)絡(luò)是無(wú)需邏輯和知識(shí)的智能,沒(méi)有發(fā)展瓶頸”。這種盲目樂(lè)觀(guān)的思潮彌漫在當(dāng)今的人工智能學(xué)界,似乎現(xiàn)在的深度神經(jīng)網(wǎng)絡(luò)能夠把第三次浪潮一直推動(dòng)下去,它是人工智能學(xué)科發(fā)展的最終方向!
“物極必反”是自然的一條重要發(fā)展規(guī)律,在盲目樂(lè)觀(guān)思潮彌漫的今天,已有一些著名的人工智能學(xué)者在討論現(xiàn)有人工智能面臨的局限性[4]:1)有智能沒(méi)有智慧,無(wú)意識(shí)和悟性,缺乏綜合決策能力;2)有智商沒(méi)有情商,機(jī)器對(duì)人的情感理解與交流還處于起步階段;3)會(huì)計(jì)算不會(huì)“算計(jì)”,人工智能可謂有智無(wú)心,更無(wú)人類(lèi)的謀略;4)有專(zhuān)才無(wú)通才,會(huì)下圍棋的不會(huì)下象棋。歸納起來(lái)說(shuō),目前人工智能發(fā)展正面臨著六大發(fā)展瓶頸:1)數(shù)據(jù)瓶頸,需要海量的有效數(shù)據(jù)支撐;2)泛化瓶頸,深度學(xué)習(xí)的結(jié)果難于推廣到一般情況;3)能耗瓶頸,大數(shù)據(jù)處理和云計(jì)算的能耗巨大;4)語(yǔ)義鴻溝瓶頸,在自然語(yǔ)言處理中存在語(yǔ)義理解鴻溝;5)可解釋性瓶頸,人類(lèi)無(wú)法知道深度神經(jīng)網(wǎng)絡(luò)結(jié)果中的因果關(guān)系;6)可靠性瓶頸,無(wú)法確認(rèn)人工智能結(jié)果的可靠性。由此可知,人工智能的發(fā)展正面臨又一次的發(fā)展瓶頸,本文統(tǒng)稱(chēng)為“可解釋性瓶頸”。這些應(yīng)用局限性和發(fā)展瓶頸對(duì)于人類(lèi)智能來(lái)說(shuō)并不明顯存在,為什么卻在當(dāng)今的人工智能研究中成了難以逾越的巨大困難?筆者認(rèn)為這些困難是由無(wú)視邏輯和知識(shí)在智能中的重要價(jià)值,過(guò)度依賴(lài)數(shù)據(jù)統(tǒng)計(jì)和深度神經(jīng)網(wǎng)絡(luò)引起的。
2011年圖靈獎(jiǎng)得主Judea Pearl是曾在20世紀(jì)80年代推動(dòng)機(jī)器以概率(貝葉斯網(wǎng)絡(luò))方式進(jìn)行推理的領(lǐng)頭人,現(xiàn)在他卻指出:深度學(xué)習(xí)所取得的所有成就都只是根據(jù)(有效)數(shù)據(jù)進(jìn)行的曲線(xiàn)擬合,AI已陷入概率關(guān)聯(lián)泥潭,它不能完全體現(xiàn)智能的真正含義。跳出泥潭的關(guān)鍵措施是用因果推理來(lái)代替關(guān)聯(lián)推理,在A(yíng)I中一旦因果關(guān)系就位,機(jī)器就有可能提出反事實(shí)問(wèn)題,詢(xún)問(wèn)因果關(guān)系在某些干預(yù)下會(huì)如何變化,這才是科學(xué)思考的基礎(chǔ)。所以只有因果推理才能使機(jī)器具有類(lèi)人智能,有效地與人類(lèi)交流互動(dòng)。也只有這樣,機(jī)器才能獲得道德實(shí)體的地位,具有自由意志和運(yùn)用人類(lèi)謀略的能力。
人類(lèi)智能的第一個(gè)重要特征是:在智能活動(dòng)中需要機(jī)動(dòng)靈活且恰如其分地使用各種行之有效的方法,相互配合起來(lái)才能取得事半功倍的效果。例如:人在識(shí)別漢字的過(guò)程中,會(huì)合理使用數(shù)據(jù)統(tǒng)計(jì)法和結(jié)構(gòu)分析法(邏輯關(guān)系)于不同場(chǎng)合,以便獲得最佳識(shí)別效果。又如:在認(rèn)識(shí)漢字的基本筆劃(如丶、ー、〡、ノ、ヽ)階段,最有效的方法是圖像數(shù)據(jù)統(tǒng)計(jì)法,而在此基礎(chǔ)上進(jìn)一步有效區(qū)分不同的漢字(如一、二、三、十、土、王、玉、五、八、人、入、大、太、天、夫等)階段,最有效的方法則是結(jié)構(gòu)分析法(邏輯關(guān)系),如果一味使用圖像數(shù)據(jù)統(tǒng)計(jì)法一竿子插到底,在區(qū)分復(fù)雜結(jié)構(gòu)的漢字(如逼、逋、迥、遒)時(shí),速度和識(shí)別率會(huì)嚴(yán)重下降,事倍功半。
圖5 村落地圖和與/或決策樹(shù)Fig.5 Village map and AND/OR decision tree
人類(lèi)智能的第二個(gè)重要特征是:為有效管理和使用已知的各種知識(shí),必須把它們分門(mén)別類(lèi)地一層一層向上分類(lèi)、歸納、抽象,形成由不同粒度知識(shí)組成的多層次網(wǎng)狀結(jié)構(gòu)。比如大家熟悉的地圖知識(shí),在范圍最小的村落里,每戶(hù)人家可是一個(gè)原子結(jié)點(diǎn),它們通過(guò)原子道路相互連通。圖5是一個(gè)高度簡(jiǎn)化了的村落級(jí)地圖,圖中用5個(gè)原子結(jié)點(diǎn)代表有限n戶(hù)人家,用全互連圖代表原子道路的分布狀況(wi=1表示此路通暢,wi=0表示此路不通),形成了一個(gè)村落內(nèi)部的剛性關(guān)系網(wǎng)絡(luò)。利用這個(gè)關(guān)系網(wǎng)絡(luò)可以解決村落內(nèi)部的各種交通路徑規(guī)劃問(wèn)題,圖5中畫(huà)出來(lái)的因果決策樹(shù)就是為規(guī)劃“從d家到a家”去做客的最佳路徑規(guī)劃,它可根據(jù)任務(wù)從剛性關(guān)系網(wǎng)絡(luò)中誘導(dǎo)出來(lái),并按照道路的實(shí)時(shí)通暢情況,選擇完成任務(wù)的最佳路徑。
這個(gè)決策過(guò)程可用剛性邏輯或二值神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn): 1)決策樹(shù)中有16條不同的路徑可供選擇,彼此之間是“或”的關(guān)系,即只要有一條路徑暢通這個(gè)問(wèn)題就有解;2)如果一條路徑經(jīng)過(guò)的所有邊都是暢通的,則這條路徑是暢通的,即同一個(gè)路徑中經(jīng)過(guò)的不同邊之間是“與”的關(guān)系;3)在多條路徑都暢通時(shí),選擇經(jīng)過(guò)邊數(shù)最少的路徑為“最佳解”。
在一個(gè)自然村落范圍內(nèi),上述用原子級(jí)關(guān)系網(wǎng)絡(luò)誘導(dǎo)出與/或決策樹(shù)來(lái)尋找最佳路徑的過(guò)程是絕對(duì)有效的,并在理論上有剛性邏輯和二值神經(jīng)網(wǎng)絡(luò)的支撐。那么,是否能夠無(wú)限制擴(kuò)大這種絕對(duì)有效方法的應(yīng)用范圍呢?人類(lèi)的社會(huì)實(shí)踐早已做出了否定的回答,因?yàn)殡S著決策范圍的不斷擴(kuò)大,涉及的原子信息(結(jié)點(diǎn)和邊)會(huì)成幾何級(jí)數(shù)地增多,其中絕大部分是與待解問(wèn)題毫無(wú)關(guān)系的因素,如果把它們?nèi)繝砍哆M(jìn)來(lái),不僅于事無(wú)補(bǔ),反而使問(wèn)題的復(fù)雜度成幾何級(jí)數(shù)快速增大,成為一個(gè)實(shí)際難解、解了也無(wú)法說(shuō)清楚的笨方法。人類(lèi)使用的有效方法是:在有關(guān)村落級(jí)地圖的基礎(chǔ)上,進(jìn)一步利用粒度更大的鄉(xiāng)鎮(zhèn)級(jí)地圖(其中的觀(guān)察粒度增大到一個(gè)村落)和地市級(jí)地圖(其中的觀(guān)察粒度增大到一個(gè)鄉(xiāng)鎮(zhèn))來(lái)分層次地逐步解決“從d″鎮(zhèn)d′村d家到a″鎮(zhèn)a′村a家”的最佳路徑規(guī)劃問(wèn)題(見(jiàn)圖6)。
圖6 鄉(xiāng)鎮(zhèn)地圖和地市地圖的簡(jiǎn)化表示Fig.6 Simplified representation of district map and municipal map
圖6是一個(gè)高度簡(jiǎn)化了的鄉(xiāng)鎮(zhèn)級(jí)地圖和地市級(jí)地圖,圖中仍然用5個(gè)結(jié)點(diǎn)代表有限n個(gè)觀(guān)察結(jié)點(diǎn),不同的是它們都是有內(nèi)部結(jié)構(gòu)的分子結(jié)點(diǎn),仍然用全互連圖代表分子結(jié)點(diǎn)之間的連通狀況,不同的是wi內(nèi)部可能存在復(fù)雜的分子結(jié)構(gòu),不是簡(jiǎn)單的通或不通關(guān)系。這樣就把一個(gè)在原子層面十分復(fù)雜的最佳路徑規(guī)劃問(wèn)題,轉(zhuǎn)化成幾個(gè)相對(duì)簡(jiǎn)單得多的3個(gè)不同層面內(nèi)部和層面之間的最佳路徑規(guī)劃子問(wèn)題進(jìn)行求解,整體的復(fù)雜度可以大大降低。請(qǐng)讀者注意:圖6里的分子結(jié)點(diǎn)“d′村”有兩層含義,對(duì)內(nèi)講它包含村落里的全部?jī)?nèi)容,對(duì)外講它是一個(gè)代表本村落與其他村落的聯(lián)通結(jié)點(diǎn)(如村政府、公交車(chē)站、水運(yùn)碼頭等),d″鎮(zhèn)的含義也與此類(lèi)似。利用圖6來(lái)分層求解最佳路徑的過(guò)程:首先在地市級(jí)地圖上解決“從d″鎮(zhèn)到a″鎮(zhèn)”的最佳路徑規(guī)劃問(wèn)題,然后分別去到兩個(gè)鄉(xiāng)鎮(zhèn)級(jí)地圖上解決“從d′村到d″鎮(zhèn)”的最佳路徑規(guī)劃問(wèn)題和“從a″鎮(zhèn)到a′村”的最佳路徑規(guī)劃問(wèn)題,最后再分別到兩個(gè)村落級(jí)地圖上解決“從d家離開(kāi)d′村”的最佳路徑規(guī)劃問(wèn)題和“從a′村進(jìn)入a家”的最佳路徑規(guī)劃問(wèn)題。
當(dāng)今社會(huì)每天都在成億次地產(chǎn)生制定國(guó)際國(guó)內(nèi)旅游路徑規(guī)劃問(wèn)題,對(duì)人類(lèi)社會(huì)來(lái)講這個(gè)過(guò)程已經(jīng)十分輕松,沒(méi)有太大的困難。這是如何做到的呢?首先是因?yàn)楦鲊?guó)已經(jīng)事先準(zhǔn)備好了各個(gè)地區(qū)不同層面的交通路線(xiàn)圖備客戶(hù)使用,其次是因?yàn)楦鱾€(gè)業(yè)務(wù)部門(mén)都有實(shí)時(shí)更新的交通工具運(yùn)行時(shí)間和價(jià)格等信息發(fā)布。有這些背景知識(shí)和信息的存在,即可快速支持任意范圍內(nèi)任意兩點(diǎn)之間的旅游路徑規(guī)劃問(wèn)題。例如:有人要從中國(guó)西安市西北工業(yè)大學(xué)去美國(guó)匹茲堡市匹茲堡大學(xué)講學(xué),其旅游路徑規(guī)劃不必從包含每家每戶(hù)的世界地圖上(當(dāng)今世界每一個(gè)自然村落都有詳細(xì)的地圖,只要你不計(jì)成本和時(shí)空開(kāi)銷(xiāo),一定可把它們?nèi)科唇釉谝粡埵澜绲貓D上)去尋找,因?yàn)檫@個(gè)“最佳解”即使你用深度神經(jīng)網(wǎng)絡(luò)和云計(jì)算不計(jì)成本地找到了,它肯定是人類(lèi)難以理解和解釋清楚的“黑箱解”,在這個(gè)“黑箱解”的某個(gè)小環(huán)節(jié)突然出現(xiàn)異常時(shí),更無(wú)法知道如何調(diào)整這個(gè)最佳路徑規(guī)劃。人類(lèi)的做法不會(huì)如此愚鈍,首先,他會(huì)根據(jù)頂層子任務(wù)“從中國(guó)到美國(guó)”在世界級(jí)地圖和國(guó)際航空信息網(wǎng)站上找到從中國(guó)到美國(guó)的最佳航線(xiàn)和最佳航班信息,比如選擇了某日某某航班從北京市的首都國(guó)際機(jī)場(chǎng)飛美國(guó)紐約市的紐瓦克機(jī)場(chǎng);其次,根據(jù)兩個(gè)中層子任務(wù)“從西安市到北京市首都國(guó)際機(jī)場(chǎng)”和“從紐瓦克機(jī)場(chǎng)到匹茲堡市”,分別在兩個(gè)國(guó)家級(jí)地圖和國(guó)內(nèi)航空信息網(wǎng)站上找到最佳航線(xiàn)和最佳航班信息;最后,根據(jù)兩個(gè)底層子任務(wù)“從西北工業(yè)大學(xué)到西安市咸陽(yáng)機(jī)場(chǎng)”和“從匹茲堡機(jī)場(chǎng)到匹茲堡大學(xué)”,分別在兩個(gè)城市級(jí)地圖上根據(jù)當(dāng)?shù)貙?shí)時(shí)發(fā)布的道路交通狀況找到最佳的開(kāi)車(chē)路線(xiàn)。
這種通過(guò)多層規(guī)劃來(lái)解決復(fù)雜問(wèn)題的聰明做法本質(zhì)上是一種主動(dòng)引入和合理利用不確定性的方法,它突破了傳統(tǒng)問(wèn)題求解觀(guān)念的約束。傳統(tǒng)問(wèn)題求解觀(guān)念認(rèn)為,在解決問(wèn)題時(shí)應(yīng)努力消除各種不確定性,實(shí)在不能消除也要盡可能地避免不確定性推理,以便使用有可靠數(shù)學(xué)基礎(chǔ)的剛性邏輯或二值神經(jīng)網(wǎng)絡(luò)解決。但是隨著問(wèn)題復(fù)雜度的不斷增長(zhǎng),其時(shí)空開(kāi)銷(xiāo)會(huì)迅速達(dá)到無(wú)法實(shí)際操作的程度,人們不得不適時(shí)地進(jìn)行分類(lèi)、歸納和抽象,主動(dòng)離開(kāi)具有最細(xì)粒度和確定性的原子信息狀態(tài),果斷進(jìn)入具有較粗粒度和不確定性的分子信息狀態(tài)。圖7從時(shí)空開(kāi)銷(xiāo)(即易操作性)的角度給出了詳細(xì)解釋。通過(guò)歸納不難發(fā)現(xiàn),n原子信息系統(tǒng)會(huì)形成由N=2n個(gè)不同狀態(tài)組成的偏序空間,其復(fù)雜度會(huì)迅速增加到天文數(shù)字。如果忽略這些精確的偏序關(guān)系,用統(tǒng)計(jì)原子信息出現(xiàn)數(shù)目的方法把它映射到全序空間,其狀態(tài)數(shù)可立即降低為N=1+n的線(xiàn)性復(fù)雜度(信息壓縮了2n/(1+n)倍)。所以,在眾多原子信息組成的系統(tǒng)中,除了特殊需要外,人們會(huì)主動(dòng)離開(kāi)過(guò)度精細(xì)的偏序空間,大膽進(jìn)入到比較實(shí)用的全序空間,而不在乎它帶來(lái)的不確定性, 這是人類(lèi)智慧的高度體現(xiàn),深度神經(jīng)網(wǎng)絡(luò)忽略了這個(gè)重要的人類(lèi)智慧。
為讓讀者增強(qiáng)對(duì)主動(dòng)引入和合理利用不確定性意義的認(rèn)識(shí),圖8給出了學(xué)生們十分熟悉的“理想試卷模型”。設(shè)卷中有100道原子狀態(tài)的是/非題(答對(duì)一道題得1分,否則得0分,沒(méi)有中間過(guò)渡分?jǐn)?shù)存在),用具有確定性的剛性邏輯來(lái)描述這個(gè)試卷,它是一個(gè)100維的二值邏輯,可精確描述到每一道題的得分情況,排列組合共有2100=126 7650 6002 2822 9401 4967 0320 5376≈1.267 65×1030種不同的答題狀態(tài),它們組成了一個(gè)100維的偏序空間。在現(xiàn)實(shí)生活中需要知道如此精準(zhǔn)狀態(tài)描述的只有閱卷老師和學(xué)生本人,其他人只需要知道他在101種不同狀態(tài)組成的全序空間中的某個(gè)分?jǐn)?shù)狀態(tài)(圖中是90分)即可,信息壓縮比是(1.267 65×1030)/101=1.255 099×1028倍。而且就是這個(gè)90分本身也包含不確定性,因?yàn)楸M管你確切知道他有10道題答錯(cuò)了,但仍然不知道錯(cuò)的是哪10道題,只知道它是210=1 024種不同錯(cuò)誤狀態(tài)中的一種??梢?jiàn),在人類(lèi)智能活動(dòng)中,不僅客觀(guān)上無(wú)法避免不確定性,而且為了提高決策效率需要忽略大量無(wú)關(guān)信息,主動(dòng)引入不確定性。不難理解:決策的抽象層次越高,涉及的知識(shí)粒度越大,其中忽略的無(wú)關(guān)信息就越多,引入的不確定性就越大。由此可見(jiàn),在深度神經(jīng)網(wǎng)絡(luò)中,有意無(wú)視邏輯和知識(shí)的作用是一種方向性錯(cuò)誤。
圖7 從確定的原子狀態(tài)進(jìn)入不確定性的分子狀態(tài)Fig.7 From the determined atomic state to the molecular state of uncertainty
圖8 從試卷模型看確定性和不確定性的關(guān)系Fig.8 A test paper model is used to illustrate the relation- ship between certainty and uncertainty
從更廣泛的應(yīng)用背景看,圖8給出的“理想試卷模型”還可以嵌套升級(jí)成為“超級(jí)試卷模型”,即試卷中的每一道題可不是是/非題(原子題),而是具有中間過(guò)渡分?jǐn)?shù)的復(fù)雜題(分子題),相當(dāng)于每一道1分的題都是一個(gè)像圖8一樣的“理想試卷模型”,由100個(gè)原子題目組成,其得分可在0,0.01, 0.02, ···, 0.99, 1分之間變化。這種“超級(jí)試卷模型”有什么用?用處太廣泛著呢,它幾乎無(wú)處不在!如我國(guó)教育部正在考慮從幼升小到高考都要全面改革,把綜合素質(zhì)教育和評(píng)價(jià)納入其中。在高考錄取中對(duì)學(xué)生綜合素質(zhì)評(píng)價(jià)的規(guī)定如下:1)學(xué)業(yè)水平。重點(diǎn)是學(xué)業(yè)水平考試成績(jī)、選修課程內(nèi)容和學(xué)習(xí)成績(jī)、研究性學(xué)習(xí)與創(chuàng)新成果等,特別是具有優(yōu)勢(shì)的學(xué)科學(xué)習(xí)情況。2)藝術(shù)素養(yǎng)。重點(diǎn)是在音樂(lè)、美術(shù)、舞蹈、戲劇、戲曲、影視、書(shū)法等方面表現(xiàn)出來(lái)的興趣特長(zhǎng),參加藝術(shù)活動(dòng)的成果等。3)思想品德。重點(diǎn)是學(xué)生參與黨團(tuán)活動(dòng)、有關(guān)社團(tuán)活動(dòng)、公益勞動(dòng)、志愿服務(wù)等的次數(shù)、持續(xù)時(shí)間。4)身心健康。重點(diǎn)是《國(guó)家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》測(cè)試主要結(jié)果,體育運(yùn)動(dòng)特長(zhǎng)項(xiàng)目,參加體育運(yùn)動(dòng)的效果,應(yīng)對(duì)困難和挫折的表現(xiàn)等。5)社會(huì)實(shí)踐。重點(diǎn)是學(xué)生參加實(shí)踐活動(dòng)的次數(shù)、持續(xù)時(shí)間,形成的作品、調(diào)查報(bào)告等。這個(gè)評(píng)價(jià)模型就是“超級(jí)試卷模型”,它需要考察學(xué)生的5個(gè)關(guān)鍵信息,如果每個(gè)關(guān)鍵信息又分20方面,一共是100個(gè)方面(相當(dāng)于100個(gè)1分題)。而這100個(gè)方面又是根據(jù)學(xué)生過(guò)去在學(xué)校學(xué)習(xí)各種課程的歷次成績(jī)、在社會(huì)實(shí)踐和公益活動(dòng)中的歷次表現(xiàn)、在科研活動(dòng)中的創(chuàng)新性表現(xiàn)、本人的團(tuán)隊(duì)精神、在經(jīng)受挫折時(shí)表現(xiàn)出堅(jiān)韌性、面試中獲得的各種印象等組成(其中的每一個(gè)原子事件都相當(dāng)于0.01分題)。所以這個(gè)“超級(jí)試卷模型”也是從原子信息開(kāi)始評(píng)分的,不同的是評(píng)分者不是一個(gè)人,而是由不同時(shí)期的負(fù)責(zé)人或任課老師一級(jí)一級(jí)不斷抽象上來(lái)的,大部分的中間分?jǐn)?shù)已經(jīng)反映在學(xué)生的檔案材料之中,招生錄取老師只是完成最后的分?jǐn)?shù)匯總,一般不需要深入到原子信息層面去了解詳細(xì)細(xì)節(jié)。
當(dāng)然,要解決比原子信息處理層次更高的分子信息處理問(wèn)題,就需要抽象層次更高的柔性邏輯和柔性神經(jīng)元的參與,這是重新找回人工智能可解釋性的理論關(guān)鍵。
要妥善解決好不確定性的描述和信息處理過(guò)程,首先需要把建立在剛性集合(即分明集合、經(jīng)典集合)基礎(chǔ)上的剛性命題的真值x∈{0, 1},擴(kuò)張到建立在柔性集合(即不分明集合、模糊集合)基礎(chǔ)上的柔性命題的真度x∈[0, 1]。在邏輯上應(yīng)該如何來(lái)實(shí)現(xiàn)這種擴(kuò)張呢?本文使用的方法就是從“理想試卷模型”中抽象出來(lái)的(見(jiàn)圖9)。
圖 9 柔性命題真度的邏輯意義Fig. 9 Logical meaning of the truth degree of the flexible proposition
在對(duì)象空間U內(nèi), ?是邊界不清晰的柔性集合(類(lèi)似于一個(gè)班級(jí)的數(shù)學(xué)成績(jī)單),任意元素(類(lèi)似于一個(gè)學(xué)生)u∈?的隸屬度(類(lèi)似于這個(gè)學(xué)生的數(shù)學(xué)成績(jī),可在0%~100%之間變化)μ(u),需要在因素空間(類(lèi)似于“理想試卷模型”)E中去找到與對(duì)象u對(duì)應(yīng)的剛性集合(即學(xué)生u的數(shù)學(xué)答卷)X,求出X的概率測(cè)度m(X)來(lái)(類(lèi)似于評(píng)出學(xué)生u答對(duì)試題所占的百分比)。用邏輯語(yǔ)言描述是:U中柔性命題的真度為
即E中謂詞公式 ? xP(x)的滿(mǎn)足度。
回過(guò)頭來(lái)總結(jié)我們團(tuán)隊(duì)20余年來(lái)的探索經(jīng)歷,完成剛性邏輯到柔性邏輯擴(kuò)張的總路線(xiàn)圖(見(jiàn)圖10),其起點(diǎn)是完全承認(rèn)剛性信息處理理論在柔性信息處理理論中基礎(chǔ)平臺(tái)的核心地位,根本不需另起爐灶,推倒重來(lái)。
擴(kuò)張的第一步是把剛性命題的真值x∈{0,1}擴(kuò)張為柔性命題的真度x∈[0, 1],而各種算子的計(jì)算公式z=Γ[ax+by-e]仍然保持不變。這樣就把剛性信息處理的16種模式(見(jiàn)圖3)直接擴(kuò)張為柔性信息處理基模型中的16種信息處理模式(見(jiàn)圖11)。在圖11中另外增加了4種新的信息處理模式,它們都是由于中間過(guò)渡值的參與而形成的,其中包括平均運(yùn)算z=Γ[0.5x+0.5y]和非平均運(yùn)算 z=1-Γ[0.5x+0.5y],組合運(yùn)算 z=Γ[x+y-e]和非組合運(yùn)算z=1-Γ[x+y-e],這里的決策閾值可連續(xù)變化e∈[0, 1],不再是固定的整數(shù)。這20種基模型的信息處理模式在圖11中有詳細(xì)描述,以后還會(huì)重點(diǎn)講解。
圖 10 從剛性邏輯到柔性邏輯的擴(kuò)張總路線(xiàn)圖Fig. 10 General line map from rigid logic to flexible logic
圖 11 柔性信息處理中的20種基本模式Fig. 11 The 20 basic modes in flexible information processing
后面的3步是在這20種基模型信息處理模式基礎(chǔ)上,逐步引入誤差系數(shù)k∈[0, 1], 廣義相關(guān)系數(shù)h∈[0, 1]和權(quán)系數(shù)β∈[0, 1]的影響,利用三角范數(shù)理論和有關(guān)的公理,證明這些不確定性參數(shù)對(duì)基模型的調(diào)整程度和方式(見(jiàn)圖12),它們是[5-7]:
1)命題真度的誤差系數(shù)k∈[0, 1],其中k=1表示最大正誤差,k=0.5表示無(wú)誤差,k=0表示最大負(fù)誤差。k對(duì)基模型的影響完全反映在N性生成元完整簇 Φ(x, k)=xn,n∈(0, ∞)上,其中 n=-1/log2k。當(dāng) n→0 時(shí),Φ(x, 0)=ite{0|x=0; 1}; 當(dāng)n=1時(shí),Φ(x, 0.5)=x; 當(dāng) n→∞時(shí),Φ(x, 1)=ite{1|x=1;0}。Φ(x, k)對(duì)一元運(yùn)算基模型N(x)的作用方式是N(x, k)=Φ-1(N(Φ(x, k)), k),對(duì)二元運(yùn)算基模型 L(x, y)的作用方式是 L(x, y, k)=Φ-1(L(Φ(x, k), Φ(y, k)), k)。
圖 12 3種不確定性參數(shù)及其調(diào)整函數(shù)Fig. 12 Three kinds of uncertainty parameters and their adjustment functions
2)廣義相關(guān)系數(shù)h∈[0, 1],其中:h=1是最大的相吸關(guān)系或者最大的相容關(guān)系;h=0.75是獨(dú)立相關(guān)關(guān)系;h=0.5是最大的相斥關(guān)系或者最小的相容關(guān)系,也就是最弱的敵我關(guān)系或者最小相克關(guān)系;h=0.25是敵我僵持關(guān)系;h=0是最強(qiáng)的敵我關(guān)系或者最大的相克關(guān)系。廣義相關(guān)系數(shù)h對(duì)基模型的影響全部反映在T性生成元完整簇F(x, h)=xm, m∈(-∞, ∞)上,其中:m=(3-4h)/(4h(1-h))。當(dāng)m→-∞時(shí),F(xiàn)(x, 1)=ite{1|x=1; ±∞}; 當(dāng) m→0-時(shí),F(xiàn)(x,0.75-)=1+lg x; 當(dāng) m→0+時(shí),F(xiàn)(x, 0.75+)=ite{0|x=0; 1};當(dāng) m=1時(shí),F(xiàn)(x, 0.5)=x; 當(dāng) m→∞時(shí),F(xiàn)(x, 0)=ite{1|x=1; 0}。
F(x, h)對(duì)6種二元運(yùn)算基模型L(x, y)的影響是
3)權(quán)系數(shù) β∈[0, 1],其中:β=1表示最大偏x;β=0.5表示等權(quán);β=0表示最小偏x。權(quán)系數(shù)β對(duì)基模型的影響完全反映在二元運(yùn)算模型上,其對(duì)基模型L(x, y)的作用方式是:
k, h, β三者對(duì)二元運(yùn)算模型L(x, y)共同的影響方式是:
如此就獲得了20種柔性信息處理算子的完整簇,它包含了柔性信息處理所需要的全部算子,可根據(jù)應(yīng)用需要(反映在模式參數(shù)和模式內(nèi)部的調(diào)整參數(shù)
圖13~22是這20種柔性信息處理模式的擴(kuò)張過(guò)程和結(jié)果圖,下面重點(diǎn)介紹幾個(gè)模式。
圖 13 恒0模式和恒1模式Fig. 13 Constant 0 pattern and constant 1 pattern
圖 14 非或模式和或模式Fig. 14 N-OR pattern and OR pattern
圖 15 非蘊(yùn)涵2模式和蘊(yùn)涵2模式Fig. 15 N-IMP-2 pattern and IMP-2 pattern
圖 16 非x模式和指x模式Fig. 16 NOT -x pattern and IND -x pattern
圖 17 非蘊(yùn)涵1模式和蘊(yùn)涵1模式Fig. 17 N-IMP-1 pattern and IMP-1 pattern
圖 18 非y模式和指y模式Fig. 18 NOT-y pattern and IND-y pattern
圖 20 非與模式和與模式Fig. 20 N-AND pattern and AND pattern
圖 21 非平均模式和平均模式Fig. 21 N-AVE pattern and AVE pattern
圖13中的2種模式的共同特點(diǎn)是不管輸入如何變化,輸出是恒定不變的,也就是平常理解的“輸出的結(jié)果與輸入的變化沒(méi)有關(guān)系”。
圖14中的或運(yùn)算是最常用的邏輯運(yùn)算之一,可受k、h、β的聯(lián)合影響,是一個(gè)運(yùn)算模型完整簇:
當(dāng)β=0.5時(shí)權(quán)系數(shù)的影響消失,S(x, y, k, h)=(1-(max(0, (1-xn)m+(1-yn)m-1))1/m)1/n;
當(dāng)k=0.5時(shí)誤差系數(shù)的影響消失,S(x, y, h)=(1-(max(0, (1-x)m+(1-y)m-1))1/m。
S(x, y, h)有4個(gè)特殊算子: Zadeh或算子S(x,y, 1)=max(x, y) ;概率或算子S(x, y, 0.75)=x+yxy;有界或算子S(x, y, 0.5)=min(1, x+y);突變或算子 S(x, y, 0)=ite{max(x, y)|min(x, y)=0;1}。
圖15中的非運(yùn)算是常用的邏輯運(yùn)算之一,它只受誤差系數(shù)k的影響,是一個(gè)N范數(shù)完整簇:
其中:N(x, 1)=ite{0|x=1; 1}是最大非算子,N(x,0.5)=1-x是中心非算子, N(x, 0)=ite{1|x=0; 0}是最小非算子。
圖17中的蘊(yùn)涵運(yùn)算是常用邏輯運(yùn)算之一,它可受k、h、β的聯(lián)合影響,是一個(gè)運(yùn)算模型完整簇:
當(dāng)β=0.5時(shí)權(quán)系數(shù)的影響消失,I(x, y, k, h)=(min(1, 1-xnm+ynm))1/mn;
當(dāng)k=0.5時(shí)誤差系數(shù)的影響消失,I(x, y, h)=(min(1, 1-xm+ym))1/m。
從表3可以看出,比較了所有的模型之后,peleg模型在整個(gè)水活度范圍內(nèi)對(duì)金銀花的吸濕數(shù)據(jù)擬合的最好,Peleg模型的E值4.59%~6.33%,吸濕的平均值為5.66%。Ferro-Fontan模型、GAB模型、Mod-BET模型、Halsey模型、Oswin模Henderson模型不能很好地?cái)M合金銀花的吸濕等溫線(xiàn)。GAB模型對(duì)試驗(yàn)數(shù)據(jù)擬合的最差,Smith模型無(wú)法擬合金銀花的吸附等溫線(xiàn)。
I(x, y, h)有4個(gè)特殊算子: Zadeh蘊(yùn)涵I(x, y,1)=ite{1|x≤y; y};概率蘊(yùn)涵 I(x, y, 0.75)=min(1, y/x) ;有界蘊(yùn)涵I(x, y, 0.5)=min(1, 1-x+y);突變蘊(yùn)涵I(x,y, 0)=ite{y|x=1; 1}。
圖19中的等價(jià)運(yùn)算是常用的邏輯運(yùn)算之一,它可受k、h、β的聯(lián)合影響,是一個(gè)運(yùn)算模型完整簇:
當(dāng)β=0.5時(shí)權(quán)系數(shù)的影響消失,Q(x, y, k, h)=ite{(1+|xnm-ynm|)1/mn|m≤0; (1-|xnm-ynm|)1/mn};
當(dāng)k=0.5時(shí)誤差系數(shù)的影響消失,Q(x, y, h)=ite{(1+|xm-ym|)1/m|m≤0; (1-|xm-ym|)1/m}。
Q(x, y, h)有4個(gè)特殊算子: Zadeh等價(jià)Q(x, y, 1)=ite{1|x=y;min(x, y)};概率等價(jià)Q(x, y, 0.75)=min(x/y, y/x);有界等價(jià) Q(x, y, 0.5)=1-|x-y|;突變等價(jià)Q(x, y, 0)=ite{x|y=1;y|x=1;1}。
圖20中的與運(yùn)算是常用的邏輯運(yùn)算之一,它可受k、h、β的聯(lián)合影響,是一個(gè)運(yùn)算模型完整簇:
當(dāng)β=0.5時(shí)權(quán)系數(shù)的影響消失,T(x, y, k, h)=(max(0, xnm+ynm-1))1/mn;
當(dāng)k=0.5時(shí)誤差系數(shù)的影響消失,T(x, y, h)=(max(0, xm+ym-1))1/m。
圖21中的平均運(yùn)算是常用的邏輯運(yùn)算之一,它可受k、h、β的聯(lián)合影響,是一個(gè)運(yùn)算模型完整簇:
當(dāng)β=0.5時(shí)權(quán)系數(shù)的影響消失,M(x, y, k, h) =(1-((1-xn)m+(1-yn)m)1/m)1/n;
當(dāng) k=0.5 時(shí)誤差系數(shù)的影響消失,M(x, y, ···,h)=1-((1-x)m+(1-y)m)1/m。
M(x, y, h)有4個(gè)特殊算子: Zadeh平均M(x, y,1) =max(x, y);概率平均 M(x, y, 0.75)=1-((1-x)(1-y))1/2;有界平均 M(x, y, 0.5)=(x+y)/2;突變平均M(x, y, 0)=min(x, y)。
常見(jiàn)的平均算子還有:幾何平均1-M(1-x,1-y, 0.75)=(xy)1/2;調(diào)和平均1-M(1-x, 1-y,0.866)=2xy/(x+y)??梢?jiàn)柔性命題邏輯的平均運(yùn)算完整簇能夠包容各種平均算子。
圖22中的組合運(yùn)算是常用的邏輯運(yùn)算之一,它可受k、h、β的聯(lián)合影響,是一個(gè)運(yùn)算模型完整簇:
當(dāng)β=0.5時(shí)權(quán)系數(shù)的影響消失,Ce(x, y, k, h)=ite{min(e, (max(0, xnm+ynm-enm))1/mn|x+y<2e; (1-(min (1-en, (max(0, (1-xn)m+(1-yn)m-(1-en)m))1/m))1/n))|x+y>2e; e};
當(dāng)k=0.5時(shí)誤差系數(shù)的影響消失,Ce(x, y, h)=ite{min(e, (max(0, xm+ym-em))1/m|x+y<2e; (1-(min(1-e,(max(0, (1-x)m+(1-y)m-(1-e)m))1/m)|x+y>2e; e}。
Ce(x, y, h)有4個(gè)特殊算子: Zadeh組合Ce(x, y,1)=ite{min(x, y)|x+y<2e; max(x, y)|x+y>2e;e};概率組合Ce(x, y, 0.75)=ite{xy/e|x+y<2e;(x+y-xy-e)/(1-e)|x+y>2e;e};有界組合 Ce(x, y, 0.5)=Γ[x+y-e];突變組合Ce(x, y, 0)=ite{0|x, y
圖23是閾值參數(shù)e∈[0, 1]對(duì)有界組合Ce(x, y,0.5)=Γ[x+y-e]的影響圖。
圖 23 在組合運(yùn)算中決策閾值e的影響Fig. 23 Influence of decision threshold e on the combinatorial operation
由于上述擴(kuò)張過(guò)程都是在邏輯算子和神經(jīng)元共同的0,1限幅函數(shù)z=Γ[ax+by-e]基礎(chǔ)上完成的,所以它不僅是對(duì)剛性邏輯算子的柔性擴(kuò)張,而且是對(duì)二值神經(jīng)元的柔性擴(kuò)張,兩者完全一一對(duì)應(yīng),具有等價(jià)關(guān)系,詳見(jiàn)圖24。
圖 24 柔性神經(jīng)元的信息處理全過(guò)程Fig. 24 Entire process of information processing of flexible neurons
下面通過(guò)兩個(gè)典型的柔性命題邏輯譜來(lái)了解其包容性:在一維命題邏輯譜L(x, y, h)中(見(jiàn)圖25),不僅包含了已知的非標(biāo)準(zhǔn)邏輯模糊邏輯、概率邏輯、有界邏輯、僵持邏輯和突變邏輯,而且還包含了分布在這些邏輯之間的無(wú)窮多個(gè)未知的非標(biāo)準(zhǔn)邏輯(在概率論中它們只能用條件概率描述,不能構(gòu)成邏輯形態(tài))。整個(gè)邏輯譜按照基本屬性分成兩大類(lèi):朋友之間的相生相關(guān)(1≥h≥0.5),它滿(mǎn)足相容律,即T(x, y, h)+S(x, y, h)=x+y;敵我之間的相克相關(guān)(0.5≥h≥0), 它滿(mǎn)足相克律,即在x+y>1時(shí),因?yàn)橛邢嗷?,推遲出現(xiàn)下飽和效應(yīng),T(x, y, h)=0;在x+y<1時(shí),因?yàn)閿U(kuò)軍備戰(zhàn),提前出現(xiàn)上飽和效應(yīng)S(x, y, h)=1。再細(xì)分有4小類(lèi):相吸關(guān)系(1≥h>0.75), 它滿(mǎn)足T(x, y, h)>xy;相斥關(guān)系 (0.75>h≥0.5), 它滿(mǎn)足 T(x, y, h)
圖 25 一維命題邏輯譜L(x, y, h)的包容性Fig. 25 Inclusiveness of the one-dimensional propositional logic spectrum L(x, y, h)
在二維命題邏輯譜L(x, y, k, h)中(見(jiàn)圖26),不僅包含了一維命題邏輯譜L(x, y, h)中的全部邏輯算子簇L(x, y, 0.5, h),而且進(jìn)一步包含了分布于k∈[0, 1]范圍內(nèi)其他的無(wú)窮多個(gè)已知和未知的各種非標(biāo)準(zhǔn)邏輯,如圖26左邊已知的可能推理邏輯、似然推理邏輯、信任推理邏輯和必然推理邏輯等[8],而圖右邊尚未開(kāi)墾的處女地是相克邏輯群,它在研究對(duì)抗性行為中將大有可為。子簇具有完備性,它包含了所有命題級(jí)的柔性信息處理算子,理由有3條(見(jiàn)圖27)。
圖 27 使用柔性邏輯算子如同查三角函數(shù)表一樣方便Fig. 27 Using flexible logic operators is as convenient as looking at trigonometric functions
圖 26 二維命題邏輯譜L(x, y, k, h)的包容性Fig. 26 Inclusiveness of the two-dimensional propositional logic spectrum L(x, y, k, h)
2.4.1 柔性命題邏輯算子簇的完備性
從上述擴(kuò)張全過(guò)程不難證明柔性命題邏輯算
1)二元布爾信息處理只有16種信息處理模式,二元柔性基模型信息處理只有20種信息處理模式,三元以上的信息處理可以用多個(gè)二元信息處理來(lái)表示,所以這20種模式是完備的,它們由信息處理模式的狀態(tài)參數(shù)唯一確定。
2)在基模型中已經(jīng)包含了命題真度的不確定性x∈[0, 1],它可以從最大值1連續(xù)變化到最小值0,中間沒(méi)有遺漏,具有完備性。
3)能夠?qū)Ω鞣N基模型產(chǎn)生調(diào)控作用的不確定性參數(shù)只有 3個(gè),它們是 k∈[0, 1],h∈[0, 1],β∈[0, 1],另外能對(duì)組合運(yùn)算基模型產(chǎn)生調(diào)控作用的不確定性還有一個(gè)e∈[0, 1],它們形成的算子完整簇都能夠從最大可能的算子連續(xù)變化到最小可能的算子,中間沒(méi)有遺漏,具有完備性,它們可由模式內(nèi)的不確定性調(diào)整參數(shù)
所以,這個(gè)完備的命題級(jí)柔性信息處理算子庫(kù)可以事先由軟件或者硬件實(shí)現(xiàn)后,封閉起來(lái)放在后臺(tái)讓?xiě)?yīng)用程序直接調(diào)用計(jì)算結(jié)果,如同查三角函數(shù)表一樣方便(見(jiàn)圖27)。
請(qǐng)讀者注意:為了幫助有興趣深入理解命題泛邏輯各個(gè)算子完整簇的變化細(xì)節(jié),包括20種柔性信息處理模式(常用的7種柔性邏輯算子完整簇)、各種算子完整簇內(nèi)部受不確定性調(diào)整參數(shù)
2.4.2 柔性命題邏輯算子的應(yīng)用針對(duì)性
在剛性邏輯中,只有16種信息處理模式,用不同的模式特征參數(shù)區(qū)分,分別對(duì)應(yīng)16種不同的邏輯算子,它們共同組成了二元?jiǎng)傂赃壿嫷乃阕咏M來(lái)完成邏輯推理的職能,在一個(gè)信息處理模式內(nèi)是“一把鑰匙開(kāi)所有鎖”的關(guān)系。在柔性邏輯中由于包含了5種命題級(jí)不確定性,情況完全變了,它不僅有20種信息處理模式,用不同的模式特征參數(shù)區(qū)分,分別對(duì)應(yīng)20種不同的邏輯算子完整簇,其中包含無(wú)窮多個(gè)算子,用不確定性調(diào)整參數(shù)
圖28是一個(gè)示意圖,它用“鑰匙”來(lái)比喻算子,用“鎖孔型”來(lái)比喻算子要完成的信息變換模式。在剛性邏輯中只有16種不同的“鎖孔型”,對(duì)應(yīng)有16種不同的“鑰匙”,沒(méi)有進(jìn)一步的齒形變化。所以,只要知道了“鎖孔型”的(信息處理模式),就可以根據(jù)選擇合適的“鑰匙”去完成信息變換過(guò)程。這是古代老式鎖的設(shè)計(jì)原理,一種“鎖孔型”只用一種“鑰匙”即可打開(kāi),“一把鑰匙開(kāi)萬(wàn)把鎖”。在現(xiàn)代鎖的設(shè)計(jì)原理中,不僅保留了“鎖孔型”的變化(信息處理模式),還進(jìn)一步增加了“鑰匙齒形”的變化
圖 28 在柔性邏輯中需要一把鑰匙開(kāi)一把鎖Fig. 28 A key needed to open a lock in the flexible logic
在人工智能研究中這個(gè)問(wèn)題很重要,可從必要性和可能性?xún)煞矫鎭?lái)論述。
必要性可從客觀(guān)規(guī)律和主觀(guān)需要兩方面來(lái)認(rèn)識(shí)。在幾千年漫長(zhǎng)的機(jī)械工具時(shí)代和最近幾百年的動(dòng)力工具時(shí)代,人們面對(duì)的工具都是簡(jiǎn)單的機(jī)械系統(tǒng),這類(lèi)系統(tǒng)的共同特征是它的確定性:在工具的生命周期內(nèi),它面對(duì)的應(yīng)用需求和工作職能都是確定不變的,其工作原理、內(nèi)部結(jié)構(gòu)和行為方式也是確定不變的。所以在設(shè)計(jì)、生產(chǎn)、使用和維護(hù)工具的過(guò)程中,可用決定論的科學(xué)觀(guān)去完全把握它,用還原論的方法論去有效處理它,整個(gè)過(guò)程都可用“非真即假”的語(yǔ)言來(lái)嚴(yán)格地描述,用剛性邏輯予以求解,不會(huì)出現(xiàn)例外。這種形而上學(xué)的思維方式與數(shù)學(xué)思維高度一致,以至于這種決定論科學(xué)觀(guān)和還原論方法論已完全與所謂“現(xiàn)代科學(xué)理念”和“標(biāo)準(zhǔn)邏輯思維”緊密融合在一起,滲透到科研活動(dòng)的方方面面成為鐵律。
現(xiàn)在,人類(lèi)已進(jìn)入信息時(shí)代,智能機(jī)器已成為推動(dòng)時(shí)代發(fā)展的主要工具形式。由于“智能”是人類(lèi)認(rèn)識(shí)世界和改造世界的核心能力,它本質(zhì)上不可能是終生確定不變的東西,隨著人類(lèi)對(duì)客觀(guān)世界規(guī)律的認(rèn)識(shí)越來(lái)越廣泛和深入,人類(lèi)的智能也會(huì)變得越來(lái)越強(qiáng)大,不會(huì)永遠(yuǎn)停留在原始狀態(tài)而一成不變。所以,演化必然是智能工具的核心特征,如同宇宙的演化、生物的演化、人類(lèi)社會(huì)的演化、語(yǔ)言的演化、市場(chǎng)的演化、氣候的演化等一樣的自然而然,這是智能工具不同于機(jī)械工具和動(dòng)力工具的基本特征。按照現(xiàn)代復(fù)雜性系統(tǒng)的研究,各種復(fù)雜性系統(tǒng)之所以能夠不斷演化發(fā)展,是因?yàn)槠渲邪吮姸嗟霓q證矛盾,系統(tǒng)中每個(gè)基本事物的內(nèi)部都是一個(gè)“亦真亦假”的矛盾對(duì)立統(tǒng)一體,無(wú)處不在的各種不確定性是這種矛盾對(duì)立統(tǒng)一關(guān)系的外在表現(xiàn)。成千上萬(wàn)種辯證矛盾集中在一個(gè)系統(tǒng)內(nèi)相互作用、此消彼長(zhǎng),必然會(huì)涌現(xiàn)出某些原來(lái)沒(méi)有的新事物(如恒星系的形成、生命的誕生、人類(lèi)的誕生、市場(chǎng)的形成、互聯(lián)網(wǎng)的形成等都是非線(xiàn)性系統(tǒng)涌現(xiàn)效應(yīng)的結(jié)果,它們?cè)谠邢到y(tǒng)中都是“非真非假”的新事物),通過(guò)優(yōu)勝劣汰的環(huán)境選擇就能保留或淘汰一些新、老事物,不斷推動(dòng)復(fù)雜性系統(tǒng)的演化發(fā)展。
圖29對(duì)比分析了兩種不同科學(xué)觀(guān)和方法論對(duì)邏輯推理范式的內(nèi)在需求。
圖 29 不同世界有不同的邏輯環(huán)境Fig. 29 Different worlds have different logical environments
在確定性世界假設(shè)中,構(gòu)造的是一個(gè)單一封閉的邏輯環(huán)境,其中只存在理想化的“非真即假性問(wèn)題”,其他的問(wèn)題都屬于“非邏輯問(wèn)題”或者“無(wú)定義(⊥)問(wèn)題”被排斥在環(huán)境外。所以,在這個(gè)世界中只有真命題和假命題兩種研究對(duì)象,可用論域U中的分明集合A來(lái)刻畫(huà),U中任意元素u∈A是真命題,當(dāng)且僅當(dāng)u是A的元素,否則u∈A是假命題,可見(jiàn)在確定性世界中有剛性推理范式即可解決全部問(wèn)題。如數(shù)學(xué)之所以能用剛性推理范式求解問(wèn)題,是因?yàn)樗孪纫褜F(xiàn)實(shí)問(wèn)題中所有不確定性全部忽略,抽象為規(guī)律確定不變、狀態(tài)真假分明、已知條件齊全的理想化問(wèn)題,可機(jī)械式求解。又如在科學(xué)問(wèn)題中,可假設(shè)在太陽(yáng)系的范圍內(nèi),在上下一萬(wàn)年的時(shí)期中,系統(tǒng)的各個(gè)組成部分(太陽(yáng)、地球等各大行星、月亮等各個(gè)衛(wèi)星)的質(zhì)量、體積、運(yùn)動(dòng)軌道、物體的客觀(guān)運(yùn)動(dòng)規(guī)律等都是確定不變的,于是萬(wàn)年歷、潮汐表、一年四季的交替循環(huán)、二十四節(jié)氣等結(jié)果都可以計(jì)算出來(lái),它們?nèi)缤姳磉\(yùn)動(dòng)一樣準(zhǔn)確無(wú)誤,利用它們可以精準(zhǔn)地追溯過(guò)去,預(yù)測(cè)未來(lái)。人們之所以相信決定論科學(xué)觀(guān)和還原論方法論,其更深層的哲學(xué)信念是:人們相信世間萬(wàn)物都受確定不變的客觀(guān)規(guī)律控制,時(shí)間是標(biāo)量,不確定性是人對(duì)客觀(guān)規(guī)律和問(wèn)題的狀態(tài)掌握不完全引起的近似性。所以人類(lèi)認(rèn)知的前進(jìn)方向是不斷消除這些認(rèn)知不確定性,實(shí)現(xiàn)對(duì)客觀(guān)規(guī)律和狀態(tài)參數(shù)的全部掌握,最后實(shí)現(xiàn)絕對(duì)的確定性。這種信念的終極結(jié)果就是讓人們堅(jiān)信,依靠剛性邏輯推理范式一定可實(shí)現(xiàn)所謂“數(shù)學(xué)的終結(jié)”和“科學(xué)的終結(jié)”。
然而,耗散結(jié)構(gòu)理論創(chuàng)立者伊利亞·普里戈金的《確定性的終結(jié)》(1996年問(wèn)世,1998年出中文版)宣告了確定論哲學(xué)信念的終結(jié)[9],因?yàn)樗环峡陀^(guān)實(shí)際情況,犯了認(rèn)知的方向性誤判。如現(xiàn)代人都知道,上述的萬(wàn)年歷、潮汐表、一年四季的交替循環(huán),二十四節(jié)氣等所謂精準(zhǔn)結(jié)果,僅僅是在太陽(yáng)系范圍內(nèi)、在上下一萬(wàn)年的時(shí)間內(nèi)有效的近似結(jié)果,因?yàn)橹挥性谌绱硕虝旱臅r(shí)空范圍內(nèi),各種變化才十分微小,可忽略不計(jì)。而在更大的時(shí)空范圍內(nèi)看,所有天體都處在持續(xù)不斷地演化發(fā)展過(guò)程之中,太陽(yáng)系從“無(wú)”到今天的“有”也只不過(guò)150億年左右,在未來(lái)100多億年之后,它一定會(huì)塌陷到黑洞之中而回歸于“無(wú)”,如同“人生一世,草木一秋”一樣有發(fā)生、發(fā)展和消亡的過(guò)程,來(lái)去匆匆,沒(méi)有永恒。
其實(shí),人類(lèi)之所以有智能,也是因?yàn)樗皇怯霉潭ǖ难酃庖怀刹蛔兊乜创車(chē)囊磺?,他可根?jù)眼前問(wèn)題的真實(shí)狀況和變化趨勢(shì),在已有經(jīng)驗(yàn)啟發(fā)下選擇辨證施治對(duì)癥下藥的方式解決問(wèn)題。如失敗可從頭再來(lái)反復(fù)試探下去,并能通過(guò)歷史的經(jīng)驗(yàn)教訓(xùn)進(jìn)行學(xué)習(xí),不斷完善自身發(fā)現(xiàn)問(wèn)題和解決問(wèn)題的能力(這就是演化)。人們之所以會(huì)相信演化論科學(xué)觀(guān)和涌現(xiàn)論方法論,其更深層哲學(xué)信念是:相信世間萬(wàn)事萬(wàn)物都處在由辯證矛盾不斷推動(dòng)的演化發(fā)展過(guò)程中,時(shí)間是矢量,過(guò)去、現(xiàn)在和未來(lái)扮演著不同的角色,不確定性是客觀(guān)世界的本質(zhì)屬性,確定性是人在局部時(shí)空環(huán)境內(nèi)產(chǎn)生的近似性認(rèn)知。人類(lèi)認(rèn)知的前進(jìn)方向是不斷消除這些近似性認(rèn)知,精準(zhǔn)把握各種不確定性(辯證矛盾)在生態(tài)平衡中的演化發(fā)展規(guī)律和各種影響,理想化只是權(quán)宜之計(jì)。
所以,人工智能面對(duì)的邏輯環(huán)境是一個(gè)現(xiàn)實(shí)開(kāi)放的復(fù)雜邏輯環(huán)境,其中除了具有“非真即假性”的確定性問(wèn)題,可用剛性邏輯描述外;更多的是具有“亦真亦假性”的不確定性問(wèn)題,需要用柔性邏輯描述;特別是具有“非真非假性”的演化問(wèn)題,需要用S-型超協(xié)調(diào)邏輯描述[10-12]。圖30給出了智能信息處理需要的完整邏輯譜,其中:左極限是剛性邏輯(數(shù)理形式邏輯),它針對(duì)的是全部邏輯要素都受“非真即假性”約束的確定性問(wèn)題;右極限是完整的數(shù)理辯證邏輯,它針對(duì)的是全部邏輯要素都具有不確定性的問(wèn)題。在一般情況下,只有部分邏輯要素具有“亦真亦假性”或者“非真非假性”(涌現(xiàn)出新的對(duì)象),需要用柔性邏輯或者S-型超協(xié)調(diào)邏輯描述。
圖 30 智能信息處理需要的完整邏輯譜Fig. 30 Complete logic spectrum required for intelligent information processing
下面再?gòu)娜祟?lèi)認(rèn)識(shí)世界和改造世界的主觀(guān)需求來(lái)論述主動(dòng)引入不確定性的重要意義。眾所周知,人類(lèi)認(rèn)識(shí)世界通常有兩個(gè)不同的前進(jìn)方向:一個(gè)方向是自頂向下地逐步深入,逐步具象化;另一個(gè)方向是自底向上地逐步擴(kuò)大,逐步抽象化。這兩種研究方向相互結(jié)合交替進(jìn)行,當(dāng)獲得的各種有效知識(shí)足夠豐富完整之后,自然就形成了一幅完整的多層次、多粒度的知識(shí)結(jié)構(gòu)圖(見(jiàn)圖31):選擇其中任意大中小3層來(lái)看,中粒度知識(shí)子空間中的一個(gè)結(jié)點(diǎn),必然對(duì)應(yīng)著一個(gè)小粒度知識(shí)子空間;若干中粒度知識(shí)結(jié)點(diǎn)組成的子空間,必然對(duì)應(yīng)著大粒度知識(shí)子空間中的一個(gè)結(jié)點(diǎn);如此層層累加,就組成了整個(gè)知識(shí)空間的n層樹(shù)形子空間結(jié)構(gòu)。由于每一個(gè)知識(shí)子空間的結(jié)點(diǎn)數(shù)目都比較合適,屬于易操作的知識(shí)子空間,所以在利用知識(shí)空間來(lái)解決問(wèn)題時(shí),這種知識(shí)結(jié)構(gòu)十分有利于快速有效地進(jìn)行求解(如前面討論的制定國(guó)際國(guó)內(nèi)旅游路徑規(guī)劃問(wèn)題)。
圖 31 多層次多粒度的知識(shí)結(jié)構(gòu)圖Fig. 31 Multilevel and multigranularity knowledge structure diagrams
一般來(lái)說(shuō),最底層知識(shí)子空間包含的是原子級(jí)的知識(shí),它受“非真即假性”約束,只有真、假兩種可能的狀態(tài),不可能再進(jìn)一步向下分割成為更小粒度的知識(shí)了,其中的因果關(guān)系可以用剛性邏輯進(jìn)行描述,求解起來(lái)比較簡(jiǎn)單快捷。但是這個(gè)最底層知識(shí)子空間能有效管轄的范圍不應(yīng)該太大,否則,它包含的原子級(jí)的知識(shí)太多,會(huì)出現(xiàn)因果關(guān)系復(fù)雜度的幾何級(jí)數(shù)增長(zhǎng),影響問(wèn)題求解的效率(如在理想試卷模型中,100個(gè)原子信息組成的系統(tǒng)就有2100≈1.267 65×1030種不同的狀態(tài)組合,絕大多數(shù)情況下不需要知道這些細(xì)節(jié))。在這個(gè)問(wèn)題上“人更聰明”表現(xiàn)在他能夠適時(shí)地利用聚類(lèi)、歸納和抽象等手段,把數(shù)目恰當(dāng)?shù)娜舾稍有畔⒆儞Q成粒度更大的分子信息(知識(shí)),在這些分子級(jí)信息(知識(shí))基礎(chǔ)上建立新的相對(duì)抽象的因果關(guān)系。一般來(lái)講,分子級(jí)信息(知識(shí))已是具有“亦真亦假性”的不確定性知識(shí),需要用柔性邏輯描述。所以,在許多基于二值信息處理的復(fù)雜問(wèn)題中,為了減少問(wèn)題的復(fù)雜度,提高處理效率,人們需要適時(shí)地主動(dòng)引入不確定性,這是人類(lèi)智能的一種重要屬性。同樣,當(dāng)由分子級(jí)知識(shí)組成的知識(shí)空間管轄的范圍太大,包含的分子級(jí)知識(shí)結(jié)點(diǎn)數(shù)目太多,影響到問(wèn)題求解效率時(shí),還可以進(jìn)一步適時(shí)地利用聚類(lèi)、歸納和抽象等手段,把數(shù)目恰當(dāng)?shù)娜舾闪6容^小的分子級(jí)知識(shí)變換成粒度較大的分子級(jí)知識(shí),在這些較大分子級(jí)知識(shí)基礎(chǔ)上建立新的更加抽象的因果關(guān)系,仍然可用柔性邏輯描述。這種逐級(jí)抽象的過(guò)程可以不斷進(jìn)行下去,沒(méi)有最高層限制。
下面具體討論本文的核心論題:如何實(shí)現(xiàn)智能信息處理過(guò)程和結(jié)果的強(qiáng)可解釋性?這個(gè)問(wèn)題的本質(zhì)就是我們?cè)谟蒙窠?jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)時(shí),如何適時(shí)地把神經(jīng)網(wǎng)絡(luò)參數(shù)準(zhǔn)確翻譯成可靠的邏輯表達(dá)式,這里的所謂可靠邏輯就是指有可靠數(shù)學(xué)基礎(chǔ)理論證明的剛性邏輯(數(shù)理形式邏輯)及其擴(kuò)張——柔性邏輯(命題級(jí)數(shù)理辯證邏輯)。
先來(lái)討論最簡(jiǎn)單的情況——二值信息處理。假設(shè)我們需要處理的數(shù)據(jù)都是“非真即假”的原子信息,且正好是二元信息處理的情況,其中x, y∈{0,1}是輸入信息,z∈{0, 1}是輸出信息。根據(jù)圖3它只有16種不同的信息處理模式,通過(guò)統(tǒng)計(jì)識(shí)別具體的函數(shù)關(guān)系 z=fi(x, y), i∈{0, 1, 2, 3, ···, 15}可把它們準(zhǔn)確無(wú)誤地用模式狀態(tài)參數(shù)區(qū)分開(kāi)來(lái),利用z=Γ[ax+by-e]公式計(jì)算出輸出和輸入的關(guān)系,也就是說(shuō),可直接獲得每種模式的神經(jīng)元參數(shù)和邏輯表達(dá)式,實(shí)現(xiàn)強(qiáng)可解釋性。由于圖3已經(jīng)十分詳盡,這里不再重述。
如果出現(xiàn)多元信息處理的情況,可以參照z=
的方式進(jìn)行處理(由于在柔性信息處理中也只有20種模式,所以也與只有16種模式的二值信息處理類(lèi)同)。
在多數(shù)情況下,原始數(shù)據(jù)庫(kù)K0中需要處理的數(shù)據(jù)量非常巨大,如果全部都停留在原子級(jí)粒度上進(jìn)行處理,其復(fù)雜度會(huì)快速上升到需要消耗計(jì)算機(jī)的巨大時(shí)空資源的程度,得不償失,更會(huì)對(duì)信息處理過(guò)程和結(jié)果的可解釋性提出嚴(yán)重挑戰(zhàn)。所以人工智能需要學(xué)習(xí)人類(lèi)的聰明做法,適時(shí)通過(guò)聚類(lèi)、歸納和抽象,把屬于一類(lèi)原子信息抽象成一個(gè)分子結(jié)點(diǎn),把幾個(gè)類(lèi)之間的因果關(guān)系抽象為幾個(gè)分子結(jié)點(diǎn)之間的柔性因果關(guān)系,重新建立粒度較大的抽象知識(shí)庫(kù)K1,在K1中就可以應(yīng)用柔性邏輯來(lái)描述和求解這類(lèi)柔性的因果關(guān)系。
設(shè)在K0中我們已經(jīng)通過(guò)某種數(shù)據(jù)處理手段獲得了一個(gè)完整的類(lèi)E, 它是決定K1中某個(gè)柔性命題x真度的因素空間,令柔性命題x在E中的投影是集合X,當(dāng)X=E時(shí)真度x=1;X=Φ時(shí)真度x=0;否則真度x=mzd(e P(e)), 其中mzd(*)是謂詞公式*的滿(mǎn)足度,元素e∈E, 謂詞公式P(e)代表e∈X。
有了柔性命題x真度的因素空間定義,就可以根據(jù)X在E中的實(shí)際變化情況,計(jì)算出x真度的變化軌跡,一般用離散點(diǎn)刻畫(huà),如x=0, 0.1, 0.2,0.3, ···, 0.9, 1 的 11 點(diǎn)方案,或者 x=0, 0.05, 0.1,0.15, ···, 0.9, 0.95, 1 的 21 點(diǎn)方案等。當(dāng)有因果關(guān)系的各個(gè)柔性命題的真度都在K1中刻畫(huà)好后,就可以像二值信息處理一樣,首先按照端點(diǎn)值x, y,z∈{0, 1}之間的關(guān)系,確定柔性因果關(guān)系的信息處理模式是否屬于16種共有的模式之一,如果它不在16種模式之中,再根據(jù)中間過(guò)渡值的變化情況來(lái)確定,是4種柔性信息處理專(zhuān)有的模式中哪一個(gè),具體的確定方法是:當(dāng)0=(0, 0), 1>(0, 1)>0,1>(1, 0)>0, 1=(1, 1)時(shí),是平均模式或組合模式中的一個(gè);當(dāng)1=(0, 0), 1>(0, 1)>0, 1>(1, 0)>0, 0=(1,1)時(shí),是非平均模式或非組合模式中的一個(gè)。進(jìn)一步區(qū)分是平均模式還是組合模式的基本特征是:組合模式有一定程度的上下平臺(tái)0=(0+Δ,0+Δ), 1=(1-Δ, 1-Δ)出現(xiàn),而平均模式根本沒(méi)有上下平臺(tái) 0<(0+Δ, 0+Δ), 1>(1-Δ, 1-Δ)存在。完成上述柔性信息處理模式的識(shí)別非常重要,它可以把柔性信息處理的基本模式嚴(yán)格確定下來(lái),準(zhǔn)確獲得它的模式狀態(tài)參數(shù)和基模型計(jì)算公式:
接下來(lái)就可以在模式之內(nèi)根據(jù)在K1中的數(shù)據(jù)確定可能存在的不確定性調(diào)整參數(shù)
1)誤差系數(shù)k的確定。在柔性非運(yùn)算N(x,k)中,k是不動(dòng)點(diǎn)N(k, k)=k,所以在K1中非模式的因果關(guān)系數(shù)據(jù)中,如果發(fā)現(xiàn)有輸入和輸出相等的情況x=z=k,這個(gè)k就是誤差系數(shù),k=0.5表示沒(méi)有誤差。如果沒(méi)有發(fā)現(xiàn)完全相等的數(shù)據(jù),可以尋找盡可能接近的數(shù)據(jù)對(duì)
2)廣義相關(guān)系數(shù)h的確定。根據(jù)K1中柔性與運(yùn)算T(x, y, h)的因果關(guān)系數(shù)據(jù),確定廣義相關(guān)系數(shù)h的方法主要有兩種:與算子體積法和x=y主平面上的標(biāo)準(zhǔn)尺測(cè)量法。
①與算子體積法:
一般m =n=11或者21。只要統(tǒng)計(jì)計(jì)算出與算子的體積來(lái),乘上3倍,就是h。
② x=y主平面上的標(biāo)準(zhǔn)尺測(cè)量法:
在x=y平面上繪制z=T(x, x, h)曲線(xiàn),這個(gè)曲線(xiàn)與x=0.5的垂直線(xiàn)或者z=0的水平線(xiàn)的交點(diǎn)位置(相對(duì)于圖32中垂直分布的h標(biāo)準(zhǔn)尺來(lái)說(shuō)),就是這個(gè)與算子的廣義相關(guān)系數(shù)h。
圖 32 h的標(biāo)準(zhǔn)尺測(cè)量法Fig. 32 The standard measurement of h
3)相對(duì)權(quán)重系數(shù)β的確定。根據(jù)K1中柔性平均運(yùn)算M(x, y, h, β)的因果關(guān)系數(shù)據(jù),確定相對(duì)權(quán)重系數(shù)β的方法在M(x, y, 0.5, β)時(shí)比較方便,因?yàn)檫@時(shí)的 M(1, 0, 0.5, β)=β(見(jiàn)圖 33),而在 K1中尋找這樣的特殊數(shù)據(jù)是不困難的。
圖 33 相對(duì)權(quán)重系數(shù)β的確定Fig. 33 Determination of coefficient β of the relative weight
4)組合運(yùn)算中決策閾值系數(shù)e的確定。根據(jù)K1中柔性組合運(yùn)算Ce(x, y, h)的因果關(guān)系數(shù)據(jù),確定決策閾值系數(shù)e的方法在Ce(x, y, 0.5)中比較方便,因?yàn)檫@時(shí)組合運(yùn)算的下平臺(tái)區(qū)最大邊界線(xiàn)L正好是滿(mǎn)足x+y=e的一條直線(xiàn)(見(jiàn)圖34),這樣的數(shù)據(jù)在K1中很容易找到。
圖 34 組合運(yùn)算中決策閾值系數(shù)e的確定Fig. 34 Determination of decision threshold coefficient e in the combinatorial operation
最后應(yīng)該指出,上述不確定性參數(shù)確定的方法都是在孤立的理想情況下給出的,它們之所以基本可用,是因?yàn)樵谕ǔG闆r下各個(gè)不確定性參數(shù)都偏離0.5不遠(yuǎn),而且同時(shí)出現(xiàn)的概率不大。但是,嚴(yán)格地說(shuō)不確定性參數(shù)接近上下極限的可能性還是存在,特別是廣義相關(guān)系數(shù)h,它除了在基模型中h=0.5外,還經(jīng)常出現(xiàn)在上極限h=1和中極限h=0.75處。而且其他的不確定性參數(shù)k、β、e等一旦同時(shí)出現(xiàn),會(huì)對(duì)上述不確定性參數(shù)確定的結(jié)果帶來(lái)誤差。所以,在實(shí)際系統(tǒng)中,上述確定的不確定性參數(shù)只是一個(gè)近似值,需要利用某種誤差消除算法來(lái)不斷地逼近客觀(guān)數(shù)據(jù),獲得精確結(jié)果。
當(dāng)然,邏輯和知識(shí)信息處理只是智能機(jī)制中的一個(gè)環(huán)節(jié),他只有與鐘義信的機(jī)制主義人工智能通用理論[13]和汪培莊的因素空間理論[14]深度融合,才能共同建立人工智能的通用基礎(chǔ)理論,這是未來(lái)人工智能發(fā)展的重中之重。
數(shù)學(xué)面對(duì)的是“非真即假”的理想環(huán)境,可依靠數(shù)理形式邏輯(標(biāo)準(zhǔn)邏輯、剛性邏輯)來(lái)解決所有的問(wèn)題。人工智能研究面對(duì)的現(xiàn)實(shí)環(huán)境要復(fù)雜得多,不僅有“非真即假”的理想問(wèn)題,更多的是具有“亦真亦假性”的不確定性問(wèn)題,在發(fā)生涌現(xiàn)效應(yīng)的場(chǎng)合還會(huì)出現(xiàn)“非真非假”的域外項(xiàng)問(wèn)題。依靠柔性邏輯(命題級(jí)數(shù)理辯證邏輯)可有效解決“亦真亦假”的不確定性問(wèn)題,依靠S型超協(xié)調(diào)邏輯(另有專(zhuān)文介紹),可有效解決“非真非假”的演化問(wèn)題。人工智能研究的強(qiáng)可解釋性需要上述3種邏輯來(lái)保證。進(jìn)一步的研究方向是建立廣義概率論和全方位的數(shù)理辯證邏輯。