陳曉旭
(青島濱海學(xué)院,山東 青島 266500)
在概率論與統(tǒng)計(jì)學(xué)中,與頻率學(xué)派不同,貝葉斯定理是在確定某事件發(fā)生的概率時(shí),加入了該事件歷史經(jīng)驗(yàn)先驗(yàn)概率,通過實(shí)踐結(jié)果不斷調(diào)整先前的認(rèn)知。
假設(shè)A1,A2,…,An為事件樣本空間Ω的一個(gè)完備事件組(即一事件發(fā)生的所有可能的假設(shè)),結(jié)果發(fā)生為事件E,則:
公式中的P(Ai)為事件發(fā)生前的先驗(yàn)概率,往往是主觀概率,而P(Ai/E)則為加入了結(jié)果之后的后驗(yàn)概率,是對(duì)主觀概率的一種調(diào)整。
例1:突發(fā)性疾病診斷。
新冠肺炎患者的診斷核酸檢測(cè)是目前主要參考,但不乏有患者數(shù)次檢測(cè)為陰性或者檢測(cè)為陽性卻沒有任何相關(guān)的癥狀表現(xiàn)。本例中采用貝葉斯公式,從數(shù)學(xué)角度分析核酸檢測(cè)的準(zhǔn)確率。
首先做以下假設(shè):事件E為“核酸檢測(cè)呈陽性”;事件A為“患者確診患新冠肺炎”。99%的新冠肺炎患者能通過核酸檢測(cè)確診(這一數(shù)據(jù)是通過新聞以及相關(guān)數(shù)據(jù)通告估計(jì)),誤診率為1%。
然而上式得出的確診概率非常低,與直覺認(rèn)為的99%確診率貌似相悖,原因是P(A)值計(jì)算為所有人群。因此,想要提高準(zhǔn)確度,可以將P(A)的值提高。方法有提高核酸檢驗(yàn)條件,如出現(xiàn)某些臨床癥狀(咳嗽、胸悶、發(fā)燒等癥狀)時(shí)再做檢測(cè),檢驗(yàn)準(zhǔn)確度則會(huì)大大提高。假設(shè)在有相關(guān)癥狀的人群中確診率為P(A)=15%,則結(jié)果為P(A/E)=94.6%。配合胸部CT掃描,結(jié)果也會(huì)更加準(zhǔn)確。
因此,通過在檢測(cè)前對(duì)患者進(jìn)行初步診斷能夠有效提高核酸檢驗(yàn)的準(zhǔn)確度。
例2:刑事偵查決策。
在未掌握完全信息的情況下,根據(jù)有限證據(jù)對(duì)嫌疑人做犯罪概率的推斷有時(shí)顯得尤為重要。假設(shè)有這樣一則案例,認(rèn)為嫌疑人甲有大約50%的把握犯罪。審訊過程中,尋得一位現(xiàn)場(chǎng)目擊證人,該證人肯定罪犯做事時(shí)為左撇子。若嫌疑人確實(shí)為左撇子,是否就可以認(rèn)定其為罪犯?若不能判定,則目擊證人提供的證據(jù)有多大價(jià)值?用貝葉斯定理的思路進(jìn)行分析:
模型中用到的初始概率p(A)其實(shí)為相對(duì)主觀的先驗(yàn)概率,這一先驗(yàn)概率的合理性也會(huì)直接影響后續(xù)的推斷,因此在假定先驗(yàn)概率時(shí),盡可能地客觀和考慮充分信息會(huì)使得模型更具有參考性。在避免案件誤判方面,貝葉斯的后驗(yàn)概率也能提供更客觀的信息。在本例中,嫌疑人被中度懷疑的情況下,有線索表明罪犯為左撇子,若不假思索,則很容易陷入直覺誤區(qū),繼而肯定此人確為罪犯。但實(shí)際的模型計(jì)算并沒有100%認(rèn)定這一點(diǎn),可見主觀概率一定是不斷根據(jù)實(shí)踐經(jīng)驗(yàn)修正才能更趨向于客觀。
例3:誠信度下降。
“烽火戲諸侯”的故事:從數(shù)學(xué)角度來講,諸侯對(duì)周幽王的信任度不斷下降,并且這個(gè)信任度可以量化。
第二次周幽王無故點(diǎn)燃烽火,這時(shí)用0.36代替原先的0.7,代入公式計(jì)算,得P(A/E)=0.12??梢娭T侯對(duì)周幽王的信任已經(jīng)所剩無幾了。
從歷史故事中挖掘很多,像韓非子著作中的“三人成虎”的故事,用貝葉斯分析魏王對(duì)謠言從疑到信的背后理論;或者伊索寓言中狼來了的故事,代入估計(jì)概率模擬村民對(duì)小男孩的信任如何降到冰點(diǎn)[2]。
例4:投資風(fēng)險(xiǎn)規(guī)避。
近期股市很多意外波動(dòng),很多人認(rèn)為經(jīng)濟(jì)危機(jī)又將會(huì)出現(xiàn),有的公司在投資市場(chǎng)有很多算法預(yù)測(cè)股市漲跌。對(duì)于投資人,如何理性應(yīng)用各種理論模型避免誤判則尤為重要。以美股為例,歷史上大約2000個(gè)交易日出現(xiàn)一次股指單日下跌10%的狀態(tài)。假設(shè)目前已有算法預(yù)測(cè)大跌的概率達(dá)到90%,如投資人收到算法預(yù)警明天股市大跌,則是否選擇緊急拋售?
可見實(shí)際發(fā)生的概率非常低。如果每次都僅僅按照算法進(jìn)行操作則大多時(shí)候是誤判的。因?yàn)樵跉v史上,結(jié)果出現(xiàn)的可能性極低,為小概率事件,這就造成了歷史經(jīng)驗(yàn)的欠缺。主觀概率在未經(jīng)實(shí)驗(yàn)檢測(cè)的情況下準(zhǔn)確率往往存在較大偏差。
本研究選取了4個(gè)典型的應(yīng)用案例,其中突發(fā)性疫情的診斷符合當(dāng)下的社會(huì)形勢(shì),但由于精確數(shù)據(jù)的統(tǒng)計(jì)有很多的臨床復(fù)雜性,上述新冠肺炎的數(shù)據(jù)是根據(jù)新聞估算,存在不足之處。臨床研究中,可以對(duì)數(shù)據(jù)和假設(shè)做更多的調(diào)整優(yōu)化。案件偵破的線索價(jià)值判斷,可以結(jié)合專業(yè)領(lǐng)域更多的場(chǎng)景進(jìn)行推廣使用。“烽火戲諸侯”的故事是現(xiàn)代人社會(huì)信用的量化模型,在信貸機(jī)構(gòu)或平臺(tái)有一定的使用價(jià)值,也可作為教學(xué)中案例探索,潛移默化影響學(xué)生,熟悉歷史典故,提高人文素養(yǎng)的同時(shí),傳承和發(fā)揚(yáng)中華民族的誠信美德。投資誤判的規(guī)避可給普通投資人一些決策參考。在投資市場(chǎng)中,散戶常會(huì)加入一些決策群或者收到很多不可靠的內(nèi)參消息。參考上述思路,在分析時(shí)加入貝葉斯定理的后驗(yàn)概率,要比人們憑直覺的先驗(yàn)概率要更加明智。雖然無法每次都得到事件背后的充分信息,但從數(shù)學(xué)角度來講,已知的越多,就能為了解未知的東西提供更多的信息和方法支撐,這正是貝葉斯的通俗解釋。