陳路路 張玲 高學(xué)攀 杜楚
摘要:針對(duì)民調(diào)結(jié)果精度低的問題,提出了一種基于貝塔—二項(xiàng)概率分布模型的選舉預(yù)測(cè)方法。利用歷史民調(diào)數(shù)據(jù),建立貝塔—二項(xiàng)概率分布模型,并采用參數(shù)估計(jì)方法,實(shí)現(xiàn)分布參數(shù)的估計(jì),完成民調(diào)結(jié)果的改善。同時(shí)本模型將未表態(tài)資料考慮在內(nèi),提高了選舉預(yù)測(cè)結(jié)果的精度。實(shí)驗(yàn)結(jié)果表明,貝塔—二項(xiàng)概率分布模型能夠達(dá)到誤差小于2%的選舉預(yù)測(cè)結(jié)果。
關(guān)鍵詞:選舉預(yù)測(cè);民調(diào)數(shù)據(jù);概率分布模型;高精度
中圖分類號(hào):TN713文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2021)18-57-4
0引言
選舉過程中如何精確地預(yù)測(cè)選民投票意向具有一定的難度,無論在國(guó)內(nèi)還是國(guó)外,以民意調(diào)查方式是基礎(chǔ)的選舉預(yù)測(cè),除了存在訪問失敗的問題或抽樣及估計(jì)方式的誤差,導(dǎo)致許多選舉預(yù)測(cè)經(jīng)常與選舉結(jié)果相悖,或者即使是成功預(yù)測(cè)候選人,但是預(yù)測(cè)得票率與實(shí)際得票率仍相差甚遠(yuǎn)。
有關(guān)選舉預(yù)測(cè)的研究主要分為兩大方向[1]:一是預(yù)測(cè)模型的構(gòu)建,二是預(yù)測(cè)模型的評(píng)估,為此專家學(xué)者也做了很多研究[2-5]。預(yù)測(cè)模型的構(gòu)建主要基于貝氏理論或頻度理論,但貝氏理論與頻度理論的統(tǒng)計(jì)推論是建立在不同的統(tǒng)計(jì)決策觀點(diǎn)上的[6]。頻度理論的概率觀點(diǎn)及其統(tǒng)計(jì)推論是以重復(fù)多次試驗(yàn)的理論為基礎(chǔ),而貝氏理論的觀點(diǎn)則是承認(rèn)以歷史結(jié)果作為當(dāng)前的主觀經(jīng)驗(yàn),以此修正當(dāng)前的觀察結(jié)果,并且依據(jù)最新的證據(jù)不斷更新。就預(yù)測(cè)模型的評(píng)估而言,專家指出,一個(gè)好的預(yù)測(cè)模型由三部分組成:對(duì)候選人的得票率提供精確的估計(jì);必須在選舉結(jié)果發(fā)生之前及時(shí)的做出事前預(yù)測(cè),預(yù)測(cè)模型最好是盡可能地簡(jiǎn)單易懂和方便操作。
本文以二項(xiàng)分布和貝塔分布[7]為基礎(chǔ),構(gòu)建符合貝氏理論觀點(diǎn)的新架構(gòu)進(jìn)行預(yù)測(cè),提出了一種基于貝塔—二項(xiàng)概率分布模型的選舉預(yù)測(cè)方法。該方法基于民調(diào)數(shù)據(jù)實(shí)現(xiàn)了模型參數(shù)的估計(jì),并考慮未表態(tài)資料,修正了民調(diào)結(jié)果,實(shí)現(xiàn)了選舉的高精度預(yù)測(cè)。
1貝塔—二項(xiàng)概率分布模型
1.1二項(xiàng)分布
3數(shù)值實(shí)驗(yàn)
選取2組民調(diào)數(shù)據(jù),分別對(duì)其民調(diào)值進(jìn)行改進(jìn),并且考慮未表態(tài)資料,預(yù)測(cè)未表態(tài)選民的投票意向,獲取最終選舉預(yù)測(cè)值。表1和表2分別給出了民調(diào)資料A和民調(diào)資料B。
圖1給出了基于民調(diào)資料A的針對(duì)候選人A的支持率分布函數(shù)和針對(duì)候選人B的支持率分布函數(shù)。
圖2給出了基于民調(diào)資料B的針對(duì)候選人A的支持率分布函數(shù)和針對(duì)候選人B的支持率分布函數(shù)。
由圖1和圖2的結(jié)果可知,對(duì)候選人A和候選人B的支持率偏低。
采用將未表態(tài)資料考慮在內(nèi)的貝塔-二項(xiàng)概率分布模型分別對(duì)民調(diào)資料A中最后一次民調(diào)結(jié)果和民調(diào)資料B中最后一次民調(diào)結(jié)果進(jìn)行民調(diào)值的修正,實(shí)現(xiàn)選舉的預(yù)測(cè),且預(yù)測(cè)結(jié)果如表3和表4所示。
由表3和表4的預(yù)測(cè)結(jié)果可知,貝塔—二項(xiàng)概率分布模型可實(shí)現(xiàn)當(dāng)前民調(diào)結(jié)果的修正,同時(shí)將未表態(tài)資料考慮在內(nèi),實(shí)現(xiàn)了選舉的高精度預(yù)測(cè),且基于民調(diào)資料A的預(yù)測(cè)誤差小于2%,基于民調(diào)資料B的預(yù)測(cè)誤差小于10%,民調(diào)資料A比民調(diào)資料B更加可靠。
4結(jié)束語
基于貝塔—二項(xiàng)概率分布模型的選舉預(yù)測(cè)實(shí)現(xiàn)了選舉的定量分析,采用各民調(diào)機(jī)構(gòu)的民調(diào)數(shù)據(jù),通過建立對(duì)應(yīng)的貝塔-二項(xiàng)概率分布模型以及添加未表態(tài)資料的選舉意向,修正了預(yù)測(cè)模型,有效提高了選舉預(yù)測(cè)定量分析的精度,且通過分析不同民調(diào)資料的可靠性,為后期事前選舉預(yù)測(cè)提供指導(dǎo)。
參考文獻(xiàn)
[1] THOMAS M H, JAY A D. Using State Polls to Forecast Presidential Election Outcomes in the American States[J]. International Journal of Forecasting, 1999,15(2):137-142.
[2]王富迪.臺(tái)灣地區(qū)選舉中的網(wǎng)絡(luò)動(dòng)員研究[D].廣州:暨南大學(xué),2020.
[3]吳二華.臺(tái)灣選舉中的地下賭盤[J].兩岸關(guān)系,2020(4):41-43.
[4]金龍,聞杰.回歸分析法在情報(bào)預(yù)測(cè)中的使用—基于“白宮鑰匙”模型的選情分析[J].科技情報(bào)研究,2020,2(2):59-66.
[5]夏鳳嵐.社交網(wǎng)站上的美國(guó)大選[D].北京:北京外國(guó)語大學(xué), 2017.
[6] JAMES O B.Statistical Decision Theory and Bayesian Analysis[M].New York:Springer-Verlag,1985.
[7]范玉妹,汪飛星,王萍,等.概率論與數(shù)理統(tǒng)計(jì):第2版.[M].北京:機(jī)械工業(yè)出版社,2017.
[8] MILTON A,IRENE S. Handbook of Mathematical Functions[J].Am J Phys,1966,34(2):177.