李沁杭
摘要:為了彌補(bǔ)傳統(tǒng)正態(tài)分布概率查表計(jì)算的局限性,本文根據(jù)定積分的極限定義,融合計(jì)算機(jī)的快速計(jì)算能力,設(shè)計(jì)和實(shí)現(xiàn)正態(tài)分布機(jī)器計(jì)算。數(shù)據(jù)仿真表明本文提出的機(jī)器計(jì)算精度達(dá)到了工程要求。
關(guān)鍵詞:正態(tài)分布;概率;機(jī)器計(jì)算
1.引言
由大數(shù)定理和中心極限定理可知[1],自然界的許多隨機(jī)變量均可由正態(tài)分布來(lái)模擬。如醫(yī)學(xué)中同質(zhì)群體的身高、紅細(xì)胞數(shù)、血紅蛋白量均呈現(xiàn)正態(tài)或近似正態(tài)分布,實(shí)驗(yàn)中的隨機(jī)誤差也可按正態(tài)分布規(guī)律處理。正態(tài)分布是一個(gè)在數(shù)學(xué)、物理及工程等領(lǐng)域都非常重要的概率分布,甚至在統(tǒng)計(jì)學(xué)的許多方面存在重大的影響力。
連續(xù)性正態(tài)分布的密度函數(shù) 為:
(1)
式中表示隨機(jī)變量,是隨機(jī)變量均值,是隨機(jī)變量的方差。正態(tài)分布的密度函數(shù)的特點(diǎn)是:關(guān)于對(duì)稱且在該處最大值,在正(負(fù))無(wú)窮遠(yuǎn)處取值為0,在處有拐點(diǎn), 它的形狀是中間高兩邊低。當(dāng)是為標(biāo)準(zhǔn)正態(tài)分布,如圖1所示。服從正態(tài)分布的隨機(jī)變量的概率規(guī)律為:鄰近的概率大,而遠(yuǎn)離的概率越?。辉叫?,分布集中在附近,反之,分布越分散。
對(duì)于標(biāo)準(zhǔn)正態(tài)分布概率計(jì)算常常采用查表計(jì)算方法,正態(tài)分布的概率計(jì)算一般使用將原來(lái)的分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布利用查表進(jìn)行計(jì)算。
傳統(tǒng)查表計(jì)算正態(tài)分布概率必須具有標(biāo)準(zhǔn)正態(tài)分布表,同時(shí)需要人為進(jìn)行必要的的計(jì)算。上述因素使得傳統(tǒng)計(jì)算方法效率較低,為了彌補(bǔ)這些不足,本文運(yùn)用定積分的極限定義,結(jié)合計(jì)算機(jī)的快速計(jì)算能力,實(shí)現(xiàn)正態(tài)分布概率的快速計(jì)算。
2.機(jī)器計(jì)算
設(shè)隨機(jī)變量服從期望為方差為 的正態(tài)分布,隨機(jī)變量在區(qū)間的概率:
(2)
(2)無(wú)法運(yùn)用牛頓積分法得到其解析解。本文運(yùn)用定積分的極限定義[2],將區(qū)間等間隔劃分為個(gè)子區(qū)間,如圖2所示。運(yùn)用矩形面積逼近(2)式:
(3)
(3)式的取值決定了得精度,越大,其精度越高,但計(jì)算量較大。
在實(shí)際應(yīng)用中,除了計(jì)算區(qū)間的概率外,還存在和兩種概率的計(jì)算,由于計(jì)算無(wú)法對(duì)進(jìn)行數(shù)值計(jì)算,本文根據(jù)正態(tài)分布的對(duì)稱性,將的概率轉(zhuǎn)化為:
(4)
同理可得
(5)
3.實(shí)驗(yàn)仿真
為了驗(yàn)證本文算法的有效性,在1.6GHz主頻CPU和4G RAM的個(gè)人計(jì)算機(jī)上,運(yùn)用C語(yǔ)言編程實(shí)現(xiàn)[3],本文未采用任何優(yōu)化計(jì)算,對(duì)服從標(biāo)準(zhǔn)正態(tài)分布的任意區(qū)間概率進(jìn)行計(jì)算,并與人工查表計(jì)算相比較,部分結(jié)果如表1所示。本文算法的運(yùn)行時(shí)間較短,其中最大為2.710ms。相對(duì)于人工計(jì)算,本文算法最大相對(duì)誤差為0.877%,滿足工程要求。
為了進(jìn)一步驗(yàn)證本文算法的有效性,對(duì)服從期望為方差為 的正態(tài)分布的任意區(qū)間概率進(jìn)行計(jì)算,并與人工查表計(jì)算相比較,部分結(jié)果如表2所示。本文算法的運(yùn)行時(shí)間較短,其中最大為2.882ms。相對(duì)于人工計(jì)算,本文算法最大相對(duì)誤差為0.961%,滿足工程要求。
4.結(jié)論
傳統(tǒng)查表計(jì)算正態(tài)分布概率必須具有標(biāo)準(zhǔn)正態(tài)分布表,效率較低,同時(shí)需要人為進(jìn)行必要的的計(jì)算。為了彌補(bǔ)為了彌補(bǔ)傳統(tǒng)正態(tài)分布概率查表計(jì)算的局限性這些不足,本文運(yùn)用定積分的極限定義,結(jié)合計(jì)算機(jī)的快速計(jì)算能力,實(shí)現(xiàn)正態(tài)分布概率的快速計(jì)算。仿真結(jié)果表明,本文算法的計(jì)算效率較高,且計(jì)算精度滿足工程要求。
參考文獻(xiàn):
[1]劉紹學(xué) 普通高中課程標(biāo)準(zhǔn)試驗(yàn)教科書(shū) 數(shù)學(xué)選修2-3 人民教育出版社,2009年4月第3版 2015年6月成都第7次印刷
[2]劉紹學(xué) 普通高中課程標(biāo)準(zhǔn)試驗(yàn)教科書(shū) 數(shù)學(xué)選修2-2 人民教育出版社,2007年1月第2版 2015年5月成都第7次印刷
[3]譚浩強(qiáng) C程序設(shè)計(jì)(第四版)清華大學(xué)出版社 2012年07月