東坡
剛走出考場,耳邊充斥的總是花式比慘的話語:同桌自稱一點沒復(fù)習(xí),前桌瘋狂吐槽題目太難,學(xué)霸小王感慨差點沒做完……咦,只有自己感覺還不錯,甚至覺得挺穩(wěn)嗎?直到試卷發(fā)下來,看到同桌考了80分,前桌拿了85分,學(xué)霸小王喜提98分,而你,因為59分不及格而被點名批評。你恍然,原來同學(xué)間的較勁也暗藏心機(jī)。
這其中蘊(yùn)含的正是博弈。簡單來說,博弈可以理解為做決定,要不要瘋狂采購、報考什么學(xué)校、是否競爭總裁職位……小到菜市場的斤斤計較,大到國家間的寸土必爭,生活處處都有博弈。面對復(fù)雜的問題,我們?nèi)绾芜\用博弈知識絕地求生呢?
“零花錢困境”
假設(shè)你和學(xué)霸小王是一層樓的鄰居,并且同在一個班。學(xué)校要統(tǒng)一購買參考書,費用為12元。回家路上,你們發(fā)現(xiàn)樓下小賣部新進(jìn)了一種網(wǎng)紅雪糕,售價1元。對于早早用完了零花錢的你們,這1元的雪糕也顯得遙不可及。因此你打算告訴父母,參考書是13元一本,這樣你就能擁有雪糕,享受清涼的快樂。
可正當(dāng)你準(zhǔn)備向父母開口時,媽媽向你透露了一個消息:今晚她要去小王家串門。這時你就面臨了一個困境,你不知道小王要了多少錢買書,但你的父母去串門后肯定會知道。如果你要了13元但小王只要了12元,那你“謊報軍情”的事情就會敗露,你不僅吃不到雪糕,還會被扣除1元下個月的零花錢。如果你要了12元但小王要了13元,那被扣錢的就會是小王,而作為誠實的獎勵,你會獲得一支2元的高級雪糕。此時,你應(yīng)該誠實還是虛報參考書費用呢?
在博弈論中,我們通常將這類問題簡化為支付矩陣(Payoffmatrix)的方式來分析,如左圖。
支付矩陣中一共有四個格子,每個格子中是你和小王的一種決定及對應(yīng)收益。左上方的格子,代表你和小王都“謊報軍情”,結(jié)果均得到13元的情況:紅色的1指的是你在此時能獲得1元,藍(lán)色的1指小王在此時能獲得1元。同理,左下方的格子代表你誠實而小王撒謊,此時,紅色的2指的是你獲得了2元的高級雪糕獎勵,藍(lán)色的-1指小王被扣除了下個月的1元零花錢。
矩陣有了,該如何選擇呢?由于你無法和小王溝通,也猜不到小王會怎么做,所以我們要引入一個新的概念來解決問題——重復(fù)剔除嚴(yán)格劣戰(zhàn)略。
合適的戰(zhàn)略=最多的零花錢?
現(xiàn)在有一堵墻,隔絕了你和小王的所有聯(lián)系,讓你無從知道他的決定,因此你需要一個戰(zhàn)略來保護(hù)自己,并且獲得更大收益。有了它,你就能“運籌屋檐之下,勝負(fù)一墻之隔”了。
我們再來一起看看右邊的支付矩陣。
如上面表格所示,對你而言,當(dāng)小王撒謊時,誠實的你能獲得價值2元的高級雪糕,撒謊的你只能多獲得1元。所以當(dāng)小王撒謊時,誠實是比撒謊更好的選擇。而當(dāng)小王誠實時,撒謊的你會被罰去1元零花錢,誠實的你不會受罰也不會得到獎勵。所以當(dāng)小王誠實時,你的誠實依舊是比撒謊更好的選擇。綜合來看,無論小王如何抉擇,對你來說,誠實都是收益更大的選擇,而撒謊是嚴(yán)格劣于誠實的策略。
同樣的道理,下面表格,我們站在小王的角度來分析,也能得出結(jié)論:無論你是誠實還是撒謊,對小王來說,誠實都是更好的選擇。
現(xiàn)在結(jié)果出來了:當(dāng)你和小王都不清楚對方會如何抉擇時,最佳的策略是誠實地告訴父母參考書的價格。這個結(jié)果就是通過博弈論的方法得到的最優(yōu)解。
但很明顯,其實收益最大的情況是,你和小王都撒謊,這樣你們各能獲得1元收益,共計2元;而都選擇誠實卻是0元收益,共計0元。因為條件的限制,運用博弈論,你們只能做出沒有收益也不會被懲罰的決策。
囚徒困境
“零花錢困境”實際上是博弈論中經(jīng)典的囚徒困境的一種形式。
囚徒困境指的是,兩名共謀犯罪的人被關(guān)入監(jiān)獄,分開在不能互相溝通的單人牢房內(nèi)。已有的證據(jù)只能讓每個人坐1年的牢,不過如果任意一人檢舉揭發(fā)另一個人,而另一方保持沉默,那么揭發(fā)方就能戴罪立功,逃離牢獄之災(zāi),而被揭發(fā)方會因為證據(jù)確鑿并且抗拒司法入獄10年。不過,如果雙方互相揭發(fā),那么雙方都會因確鑿的證據(jù)而被判刑8年。
對兩名囚犯而言,他們的最佳選擇和作為團(tuán)隊的最佳選擇是什么呢?同學(xué)們可以用支付矩陣來分析分析。
結(jié)果是不是有點扎心?即便合作對雙方都有利,但想要達(dá)成并保持合作卻困難重重。
或許你會想,有溝通不就能打破困境了嗎?不管是獲得零花錢,還是減少監(jiān)禁時間,充分溝通后就能雙贏。
真有這么容易嗎?
如果下次考試,只要低于最高分60%的分?jǐn)?shù)會被判為不及格,也就是如果最高分是80分,那么及格線就是48分。這時有人給出一個“完美”方案,只要大家都考一樣的分?jǐn)?shù),就能保證全員及格,哪怕大家都是0分!學(xué)渣小李聽后開心得不行,準(zhǔn)備放手一搏,交白卷。但知道了囚徒困境的你,相信大家會統(tǒng)一交白卷嗎?以及,你又會交白卷嗎?