李 琴, 韓永進
(天津大學 a.馬克思主義學院; b.科學技術與社會研究中心, 天津 300072)
香農(nóng)(Claude Shannon)[1]最早提出了信號傳輸博弈系統(tǒng)的概念. 學者對于信號傳輸博弈系統(tǒng)的研究較多集中在信號傳輸系統(tǒng)原理[2]、 意義的演化[3]以及復制動力學模型[4]等方面, 信號傳輸效率的研究相對較少. 劉易斯(David Lewis)的進化理論選擇模型、 信號博弈模型、 強化學習模型[5]以及后期發(fā)展而來的演化動力學模型, 為信號傳輸博弈系統(tǒng)中信息破缺的存在, 提供了理論基礎.
隨著技術革命的發(fā)展, 信息傳輸方式發(fā)生了巨大變革. 互聯(lián)網(wǎng)技術和人工智能的快速發(fā)展, 為人類提供更為穩(wěn)定高效的信息傳輸方式. 然而, 信號傳輸博弈中仍存在信息破缺. 探討信號傳輸博弈中, 信息破缺存在及減少的根本原因, 有利于進一步提高傳輸效率. 本文嘗試以貝葉斯定理為基礎, 對信號傳輸博弈系統(tǒng)進行研究, 為這一問題的解決尋找新思路.
信號是信號傳輸博弈系統(tǒng)必不可少的構成要素. 根據(jù)斯吉爾姆斯(Brian Skyrms)“信號攜帶信息”的推斷, 信號是流動著的能量, 通過自然選擇和信號博弈的作用, 逐步形成穩(wěn)定的信號傳輸博弈系統(tǒng)[6]. 簡單的信號傳輸系統(tǒng)包括狀態(tài)、 信號、 行動、 信號發(fā)送者和信號接收者. 當信號發(fā)送者認知到自然界存在的狀態(tài), 發(fā)送攜帶信息的信號給接收者, 在信號博弈作用下, 接收者選擇信號予以接收并且采取行動, 從而形成了簡單的信號傳輸博弈系統(tǒng). 隨著生命體進化和信號博弈的演化, 發(fā)送者通過觀察自然界存在的狀態(tài), 發(fā)出合適的信號并且進行編碼操作, 形成約定形式. 然后, 接收者通過解碼獲得需要的信息, 進而采取合適的行動, 形成了包括狀態(tài)、 信號、 編碼、 解碼、 行動、 信號發(fā)送者和信號接收者要素的復雜信號傳輸博弈系統(tǒng). 簡單信號傳輸博弈系統(tǒng)流程是狀態(tài)—發(fā)送者—接收者—行動, 復雜信號傳輸博弈系統(tǒng)流程是狀態(tài)—發(fā)送者—信號—編碼—解碼—接收者—行動.
信號傳輸博弈系統(tǒng)的傳輸效率可以按如下方式表示: 若一種行動對于一種狀態(tài)是“完全適當?shù)摹保?則信號發(fā)送者和信號接收者得到報償為1, “完全不適當”則為0, 不完全的情況在0~1之間游動. 當信號發(fā)送者將空間中存在的信號, 由一點傳送到另一點, 兩點之間信號的信息量、 內(nèi)容量都按照一一對應的關系設計, 但在實踐中不可能實現(xiàn)一對一的理想化目標. 因為兩點間傳播的信號, 不論技術系統(tǒng)如何完美, 也不可能將信號攜帶的信息的量和內(nèi)容, 進行絕對一對一的傳輸. 即使是很先進的傳輸系統(tǒng), 也不可能將信號攜帶信息的精度達到1. 而效率低下的傳輸系統(tǒng), 其傳輸內(nèi)容的精度也很難為0, 狀態(tài)和行動的偏差被稱為信息破缺. 據(jù)此, 信號傳輸系統(tǒng)存在著信息破缺, 其信號傳輸系統(tǒng)的效率是0~1的概率分布. 可靠性達到1的傳輸精度就像永動機一樣, 是不可能完成的任務, 但嘗試提高信號傳輸效率, 減少信息破缺的程度, 仍然是研究所追求的目標.
以往的研究發(fā)現(xiàn), 動物種群在遇到不同捕食者時, 發(fā)送不同的報警信號, 其行為形成復雜信號傳輸博弈系統(tǒng). 切尼(Dorothy Cheney)和塞法斯(Richard Seyfarth)[7]對安博塞利森林中的長尾黑額猴群的研究表明, 長尾黑額猴群面對不同類別的捕食者有不同的報警信號, 當其發(fā)現(xiàn)捕食者是鷹時, 發(fā)出一種“咳嗽”聲; 當發(fā)現(xiàn)捕食者是豹時, 發(fā)出一種“咆哮”聲; 當發(fā)現(xiàn)捕食者是蛇時, 發(fā)出一種“咔嚓”聲. 而對于不同的捕食者會選擇最佳的逃跑路線: 對于一只鷹, 他們會離開樹, 隱藏在灌木叢中; 對于一只豹, 會選擇上樹, 躲到豹子追不到的地方; 對于一只蛇, 則站在高處, 掃視地面確定的蛇的位置, 以找到最佳的逃跑路線. 其策略組成內(nèi)含發(fā)送者編碼和接受者解碼的過程, 非常接近復雜信號傳輸博弈模型, 如表1所示.
表1 策略組合
接下來, 通過控制變量法, 可以改變長尾黑額猴群所處的環(huán)境, 進而探究信息破缺所處的階段和解決方案. 通過研究信息的選擇、 傳送和處理三個階段, 分析信息破缺的存在性及信號傳輸效率提高的可能性. 第一個環(huán)節(jié), 設置為信息的選擇, 選取幼年的長尾黑額猴, 當出現(xiàn)報警警報時, 觀察其所采取的行動; 第二個環(huán)節(jié), 在信號傳輸系統(tǒng)的過程中, 研究信號博弈前提下信號傳輸系統(tǒng)形成的均衡狀態(tài); 第三個環(huán)節(jié), 多次觀察長尾黑額猴的行動措施, 觀察信息破缺是否逐漸減少; 最后研究強化學習對信號傳輸效率的提高.
另一方面, 通過對長尾黑額猴群信號傳輸系統(tǒng)的研究, 可歸納出信號為咳嗽時, 信號接收者采取的行動是隱藏在灌木叢中. 但休謨指出, 歸納推理不能由歸納本身來辯護. 比如, 第一次長尾黑額猴群發(fā)送咳嗽信號給同伴時, 同伴采取隱藏到灌木叢中的習慣, 第二次仍是如此, 推理出所有時間長尾黑額猴群發(fā)送咳嗽聲時, 信號接收者采取隱藏在灌木叢的行動, 其實只不過是一種心理認知, 歸納推理只不過是一切動物都具有的條件反射. 休謨認為, 研究不能從過去的成功來論證以后其還會成功, 因為這樣的論證依據(jù)正是歸納本身. 盡管, 歸納推理的前提和結論不具有必然性, 但邏輯學家認識到他的前提和結論之間具有一定的概率. 當長尾黑額猴群采取正確的逃跑路線時, 逆推信息破缺程度對傳輸效率的影響, 符合以概率研究為中心的歸納邏輯分析思路. 其中, 貝葉斯定理分析方法, 是典型的由結果推原因的分析手段.
德雷斯科和斯吉爾姆斯均強調(diào)認識論應著重研究信息的流動問題. 斯吉爾姆斯研究發(fā)現(xiàn), 信號攜帶信息的內(nèi)容由自然選擇和強化學習獲得. 已有研究證明, 進化導致了信號傳輸博弈系統(tǒng)的形成. 通常, 在標準的動態(tài)進化下, 傳輸狀態(tài)應以正概率形式進行演化. 但是, 通過自動力模型發(fā)現(xiàn), 信號傳輸?shù)臓顟B(tài)是不完美的, 傳輸狀態(tài)是一種區(qū)別于正態(tài)分布的不穩(wěn)定隨機事件.
劉易斯通過一個例子說明信號系統(tǒng)的建立: 假設你遇到了一片流沙, 你想要警告在你之后到來的那些人, 一個突出的信號就是放一個稻草人, 將稻草人的胸部插入到流沙中. 斯吉爾姆斯認為劉易斯關于穩(wěn)定的信號傳輸系統(tǒng)的說法是不完全的, 并沒有說明穩(wěn)定的信號傳輸系統(tǒng)是如何形成的. 當我們說信號傳輸系統(tǒng)的信號時, 已經(jīng)知道了他的意義, 因為比如稻草人的例子, 其已經(jīng)暗示稻草人是我, 稻草人的下沉是潛在的我的下沉. 相反, 采用進化觀點意味著, 我們不會調(diào)用任何常識、 知識來進行定義. 我們既不假設群體中的個體通過明確的協(xié)議達成約定, 也不假設他們具有預先存在的語言或博弈的常識. 實際上, 他們可能根本沒有太多的知識. 自然界中無處不在的信號表明, 生命體的進化可能是造成信號傳輸系統(tǒng)形成的原因[8]. 進一步講, 生命的進化和自然選擇的過程, 其蘊含著信號的突變, 在動態(tài)選擇的前提下, 信號傳輸博弈系統(tǒng)幾乎很難形成完美的傳輸狀態(tài). 并且動力學研究也證明, 通信狀態(tài)是不穩(wěn)定的, 信號傳輸過程中信息破缺是信號傳輸系統(tǒng)中的持久缺陷. 因此, 在長尾黑額猴研究的信息選擇的環(huán)節(jié), 當出現(xiàn)報警警報時, 猴群起初是很難輸出恰當?shù)男盘枺?在進化和自然選擇的過程中, 長尾黑額猴群逐漸形成信號, 通過信號流動進而形成信號傳輸系統(tǒng).
信號博弈的過程, 是形成穩(wěn)定信號傳輸博弈系統(tǒng)的必要環(huán)節(jié). 信號傳輸博弈系統(tǒng)呈現(xiàn)映射現(xiàn)象. 假設信號1、 信號2映射行動1、 行動2, 當信號發(fā)送者發(fā)送信號1時, 信號接受者采取行動 1, 此時達到均衡狀態(tài)(1, 1); 反之, 則為(0, 0). 信號發(fā)送者和信號接收者間存在信號博弈, 會出現(xiàn)信號多余, 信息破缺等情況, 其打破了信號和行動的映射狀態(tài)[9]. 當信號多余的情況出現(xiàn)時, 一種行動可能對應多種信號, 假設多余的信號3對應行動1, 那么發(fā)送信號3時, 接收者采取行動1為最優(yōu)策略選擇.
當信號傳輸系統(tǒng)形成后, 信息在傳輸過程中, 信息破缺的問題又是如何減少?拉斐爾·阿吉諾托(Raffaele Argiento)指出了強化學習的作用. 羅斯(Alvin Roth)和埃里夫(Ido Erev)采用一種強化學習形式來解釋受驗者在實驗中的實際行為[10]. 其思想可以追溯到心理學家赫爾斯坦(Richard Herrnstein), 基本模型的內(nèi)容是, 選擇一種行動的概率正比于從過去選擇它所得到的累積總獎賞. 但同時也得出, 隨著強化的累積, 個體試驗能使概率發(fā)生的變化越來越小, 學習速度越來越放慢. 羅斯—埃里夫在信號傳輸系統(tǒng)中得到應用, 以雙態(tài)、 雙信號、 雙行動為例, 100次實驗后, 個體的成功率達到80%; 300次實驗, 成功率達到90%. 學者對強化學習模型的研究集中在學習速度隨迭代的增加, 但是在速度變化方面卻忽略了, 盡管學習速度放緩, 其仍存在上升趨勢的變化規(guī)律. 因此, 信號傳輸博弈系統(tǒng)在強化學習的作用下, 信息破缺問題逐漸降低, 傳輸效率逐漸由0趨近于1, 呈現(xiàn)出速度趨緩的上升趨勢.
指數(shù)響應法則是改進的羅斯—埃里夫強化, 選擇概率不再簡單地正比于權數(shù), 而是正比于Exp [λ*weight]. 其中常數(shù)λ控制響應概率中的噪聲, 當λ接近0時, 噪聲排除全部其他因素, 所有可能都是等概率的, 系統(tǒng)趨向于確定性選擇的隨機嘗試; 當λ變大時, 指數(shù)響應法則傾向于挑選具有最大權數(shù)的選擇; 當λ足夠小時, 信號傳輸系統(tǒng)受噪聲影響小, 容易形成穩(wěn)定的信號傳輸系統(tǒng). 對于這類型強化學習形式, 允許個體避免次最優(yōu)均衡并獲得高效的信息傳遞. 因此, 在信息傳遞過程中, 例如長尾黑額猴進行強化學習的過程, 能逐步提升行動的準確性, 有助于降低信息傳遞過程中存在的信息破缺, 從而提升信號傳輸效率.
在信號傳輸系統(tǒng)理論中, 現(xiàn)象是知覺的基礎. 例如: 當?shù)谝淮慰吹揭粋€蘋果, 首先認識到了這個蘋果, 這是一種現(xiàn)象的展現(xiàn). 當?shù)诙卧俅慰吹教O果時, 動物以及人類對其有一定的印象, 感覺見過它, 這就是知覺. 然后, 將第二次的蘋果與大腦中留存的蘋果現(xiàn)象進行對比還原, 將其認定為蘋果. 這便是在感覺和知覺的基礎上形成的心智能力, 這也是信號傳輸系統(tǒng)形成的必然前提, 此時, 發(fā)送者以及接收者都對狀態(tài)以及信號有一定的記憶、 判斷能力. 信號傳輸系統(tǒng)的傳輸效率在0~1之間波動, 信號傳輸系統(tǒng)中信息的選擇、 傳送、 處理存在著信息破缺, 進化理論、 信號博弈理論、 強化學習模型, 為信號傳輸系統(tǒng)中不同階段的信息破缺提供理論基礎. 考慮到發(fā)送者與接收者選擇信號與行動的概率具有一定的先驗性, 以貝葉斯定理為代表的歸納邏輯分析方法, 利用先驗信息分析信息破缺問題, 可以由結果推出原因, 即用逆推方式探究信息破缺對信號傳輸系統(tǒng)傳輸效率的影響.
貝葉斯推斷統(tǒng)計與經(jīng)典推斷統(tǒng)計幾乎同時誕生, 但貝葉斯推斷統(tǒng)計是直到近100年才逐步發(fā)展起來. 貝葉斯推理問題是條件概率推理問題, 是關于條件概率的逆概率規(guī)則, 其中, 貝葉斯定理是貝葉斯推理的重要內(nèi)容, 貝葉斯公式是貝葉斯定理的表現(xiàn)形式. 用貝葉斯定理研究信息破缺問題, 是一種由結果到原因的概率問題, 其可以分析信息破缺程度對信號傳輸博弈系統(tǒng)傳輸效率的影響.
貝葉斯派認為概率是認識主體對事件出現(xiàn)可能性大小的相信度, 反映了個體對某一事件出現(xiàn)的某種信念, 對任何事件的觀察因為各自的先驗知識而有各自先驗概率. 因為信號傳輸系統(tǒng)涉及到信息的選擇、 傳送和處理, 如果結合生命演化過程中存在具有記憶與判斷功能的心智能力, 對信號傳輸系統(tǒng)的傳輸效率分析引入貝葉斯定理, 那么增加了生命選擇的合理性, 為形成穩(wěn)定均衡、 經(jīng)濟高效信號傳輸系統(tǒng)的形成提供科學依據(jù). 貝葉斯定理主要包含先驗性概率和后驗性概率, 側重研究已有條件對未知結果的影響. 而經(jīng)典概率分析傳輸效率問題忽略了動物以及人類存在的心智和記憶能力.
信號傳輸系統(tǒng)中, 利用貝葉斯定理進行分析的過程為: 在不考慮其他情況前提下, 假設信號傳輸博弈結果的效率均為99%. 也就是說, 當信號發(fā)送者發(fā)送正確信號, 信號接收者采取對應正確的行動的概率為99%. 而信號發(fā)送者發(fā)送錯誤的信號, 信號接收者采取錯誤的行為的概率為99%. 從博弈結果看, 信號傳輸博弈的最終結果是比較準確的, 但是貝葉斯定理的應用卻可以揭示一個潛在的問題: 已有先驗信息對信號傳輸博弈效率是否有必要影響?假設最初信號發(fā)送者發(fā)送正確信號的概率為1%, 那么, 采取正確行動的信號接收者, 接收到信號發(fā)送者發(fā)出的正確信號的概率又有多高呢. 信號發(fā)送者發(fā)送正確信號的概率, 對信號傳輸博弈效率的影響又如何呢?換句話說, 當穩(wěn)定信號傳輸系統(tǒng)形成時, 信息破缺對傳輸效率影響如何?
此次研究只以信號與行動的關系研究為例, 令“D”為信號發(fā)送者發(fā)送正確信號事件, “N”為信號發(fā)送者發(fā)送錯誤信號事件, “+”為采取正確行動事件. 假設P(D)代表信號發(fā)送者發(fā)送正確信號的概率, 不考慮其他情況, 則該值為0.01. 因為預計信號發(fā)送者發(fā)送正確信號的概率為1%, 所以這個值就是D的先驗概率. 假設P(N)代表信號發(fā)送者發(fā)送錯誤信號的概率, 顯然, 該值為0.99, 也就是1-P(D). P(+/D)代表信號發(fā)送者發(fā)送正確信號, 信號接收者采取正確行動的概率, 這是一個條件概率, 由于信號發(fā)送者發(fā)送正確信號, 信號接收者采取正確行動的準確性為99%, 因此該值為0.99. P(+/N)代表信號發(fā)送者發(fā)送錯誤信號, 信號接收者采取正確行動, 也就是信號博弈過程中出錯的概率, 該值為0.01. 因為對于信號發(fā)送者發(fā)送錯誤信號, 其信號接收者采取錯誤行動的概率為99%, 其信號接收者采取正確行動的概率為1%. P(+)代表不考慮其他因素影響的信號接收者采取正確行動的概率, 該值為1.98%. 推理過程如下:
(1)全概率公式:
P(+)=P(信號發(fā)送者發(fā)送正確信號時信號接收者采取正確行動)(1%×99%)+P(信號發(fā)送者發(fā)送錯誤信號時信號接收者采取正確行動)(99%×1%)=0.0198,
(2)信號接收者采取正確行動的先驗概率:
P(+)=0.0198
(3)數(shù)學公式表示為:
P(+)=P(+/D)P(D)+P(+/N)P(N)
(4)根據(jù)上述描述, 我們可以計算信號接收者采取正確行動時, 信號發(fā)送者發(fā)送正確信號的條件概率:
P(D/+)=
盡管信號發(fā)送者發(fā)送正確信號, 接收者采取正確行動的概率很高, 但是我們只可以得出以下結論: 如果信號接收者采取正確行動, 那么此時信號發(fā)送者發(fā)送正確信號的概率只有50%, 也就是說信號發(fā)送者發(fā)送錯誤信號的可能性也比較大. 我們考察的條件(研究中指D, 信號發(fā)送者發(fā)送正確信號)越難發(fā)生, 發(fā)生誤判的可能性越大. 但如果讓信號發(fā)送者再次納入研究, 相當P(D)=50%, 為信號發(fā)送者發(fā)送正確信號的概率, 替換了原先的1%, 再使用貝葉斯定理進行計算, 將得到信號接收者采取正確行動時, 信號發(fā)送者發(fā)送正確信號的概率為99%, 以此下去, P(D/+)=0.9999遠遠超過信號博弈的檢測率.
從以上邏輯推理可以發(fā)現(xiàn), 已有先驗信息對信號傳輸博弈效率的提升有著顯著的影響. 當最初信號發(fā)送者發(fā)送正確信號的概率越難發(fā)生, 那么, 采取正確行動的信號接收者, 接收到信號發(fā)送者發(fā)出的正確信號的概率就越低, 信息破缺概率也越大, 信號傳輸系統(tǒng)傳輸效率也越低. 同時, 提高信號發(fā)送者發(fā)送正確信號的概率, 可以提高信號傳輸博弈效率. 結合信號傳輸系統(tǒng)中信息破缺的理論基礎, 包括貝葉斯定理以及羅斯—埃里夫強化學習理論和指數(shù)響應法的理論基礎可知, 在動物存在心智能力的前提下, 重復性學習帶來的先驗知識以及強化學習形式, 可以有效地提高信號傳輸系統(tǒng)的效率. 進一步說明, 隨著人類的發(fā)展, 先驗知識和強化學習對信號傳輸博弈系統(tǒng)的影響越來越大, 為理解信號傳輸博弈系統(tǒng)的發(fā)展提供了新思路.
在信號傳輸博弈中, 信息的選擇、 傳送和處理存在信息破缺. 信息破缺嚴重影響信號傳輸效率. 進化理論、 信號博弈模型、 強化學習模型為信息的選擇、 傳送和處理存在的信息破缺提供理論基礎. 以貝葉斯定理為代表的歸納邏輯, 可以結合動物的心智能力, 以結果倒推原因, 可以得出當信號發(fā)送者發(fā)送正確信號的概率越難發(fā)生時, 采取正確行動的信號接收者, 接收到信號發(fā)送者發(fā)出的正確信號的概率就越低的結論. 換句話說, 信息破缺的概率越大, 信號傳輸系統(tǒng)的傳輸效率越低. 據(jù)此, 重復性強化學習, 先驗知識的獲得, 對于提高信號傳輸系統(tǒng)的效率具有顯著作用.
在信號傳輸博弈中, 如果使用電話或者視頻通信技術, 兩端的人充當著信號發(fā)送者和信號接收者, 此時信號傳輸?shù)氖д`率已經(jīng)降到了很低. 這既是技術進步, 也是對先驗知識的進一步應用. 但是信號傳輸系統(tǒng)過程中的信息破缺不可避免, 通過強化學習以及充分利用先驗信息, 可以有效地提高信號傳輸效率.