林照授 李金釬 陳森森
摘要:根據(jù)泊松分布檢驗(yàn)計(jì)算原理,利用Excel函數(shù),計(jì)算出了各統(tǒng)計(jì)數(shù)據(jù)的參數(shù)及卡方值,以自動(dòng)查找臨界值,并可以利用圖表工具繪制統(tǒng)計(jì)數(shù)據(jù)直方圖。該模板適合泊松分布卡方檢驗(yàn),具有界面直觀、操作簡(jiǎn)單、速度快捷的特點(diǎn)。
關(guān)鍵詞:泊松分布;Excel函數(shù);圖表工具;直方圖
中圖分類(lèi)號(hào):S7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-9944(2019)17-0171-02
1 引言
泊松分布(Poisson distribution),也稱布瓦松分布、普阿松分布等,由19世紀(jì)的法國(guó)著名數(shù)學(xué)家泊松推出,它是一種離散分布,在概率與統(tǒng)計(jì)中較為常見(jiàn)和使用。其主要描述在單位時(shí)間(或空間)內(nèi),某一隨機(jī)事件所發(fā)生次數(shù)的概率分布。泊松分布的特征與二項(xiàng)分布在離散時(shí)域上的特點(diǎn)相近似,作為概率論中較為重要的幾大分布之一,泊松分布日益凸顯其重要作用。泊松分布的檢驗(yàn),用“卡方檢驗(yàn)”(chi-squaretest)來(lái)檢驗(yàn)所給樣本X是否服從泊松分布,即檢驗(yàn)觀察值與期望值之間是否存在顯著差異。若差異顯著,不是服從泊松分布,差異不顯著,就服從泊松分布[1]。
泊松分布在林分結(jié)構(gòu)分布、林木群落特征及空間分布格局等研究領(lǐng)域,均有運(yùn)用[2,3]。其內(nèi)業(yè)計(jì)算可以手工計(jì)算,或用IBM、VB等計(jì)算機(jī)程序完成,但手工慢,有時(shí)也無(wú)法自動(dòng)制作圖表,而利用計(jì)算機(jī)程序,編程比較繁瑣,非專業(yè)人員根本無(wú)法實(shí)現(xiàn)。目前國(guó)內(nèi)計(jì)算機(jī)使用最為普遍Microsoft Office軟件中的Excel電子表格組件,不僅具有強(qiáng)大的數(shù)據(jù)處理和計(jì)算功能,而且具有圖表制作功能,其計(jì)算結(jié)果直觀易懂,便于使用者學(xué)習(xí)算法、分析算法和改進(jìn)算法。為了解決泊松分布模型的分析、檢驗(yàn),本文利用Excel軟件的內(nèi)置函數(shù)和圖表工具,列出方差、標(biāo)準(zhǔn)差、偏度、峭峰、頻率、預(yù)測(cè)值、卡方檢驗(yàn)值等公式函數(shù)進(jìn)行計(jì)算。解決了只要用Excel工作表就能完成泊松分布的卡方檢驗(yàn)[4]。
2 計(jì)算原理
樣本出現(xiàn)的個(gè)數(shù)和樣方數(shù)(頻數(shù))為原始數(shù)據(jù),用矩法計(jì)算各統(tǒng)計(jì)參數(shù),如m(數(shù)學(xué)期望值)s(方差)、A(偏度)、E(峭峰),用泊松分布概率密度函數(shù)P(x=r)=e-mmr/r!計(jì)算pi(理論頻數(shù)),最后,根據(jù)實(shí)際頻數(shù)和理論頻數(shù)求出卡方值。
使用者可以按圖示建立計(jì)算模板,按本文提供的公式輸入相應(yīng)單元格即可。利用Excel計(jì)算模板和圖表工具,可以繪制統(tǒng)計(jì)數(shù)據(jù)直方圖,并實(shí)現(xiàn)泊松分布卡方檢驗(yàn)。
3 利用Excel進(jìn)行泊松分布卡方檢驗(yàn)的方法
泊松分布卡方檢驗(yàn)計(jì)算、分析、繪圖過(guò)程采用一個(gè)模板。凡是單元格內(nèi)填充顏色的部分,必須按照其位置和要求填入正確數(shù)據(jù)。下面以表1蝗蝻的調(diào)查數(shù)據(jù),檢驗(yàn)蝗蝻的分布是否為Poisson分布(α=0.05),作為例子,進(jìn)行模板制作。
3.1 輸入原始數(shù)據(jù)及統(tǒng)計(jì)參數(shù)計(jì)算
打開(kāi)泊松分布卡方檢驗(yàn)?zāi)0?,按照?qǐng)D1淺藍(lán)所示輸入原始數(shù)據(jù)。
為了計(jì)算各統(tǒng)計(jì)參數(shù),在黃色區(qū)域輸入計(jì)算公式。各單元格內(nèi)輸入的
公式如下(等于號(hào)“=”前為單元格位置代碼,從等于號(hào)開(kāi)始為實(shí)際輸入公式,以下同):
G4=SUM(B4:F4),復(fù)制公式填充到G5:G8。
B5=B3*B4,復(fù)制公式填充到C5:F5。
B6=B3*134^2,復(fù)制公式填充到C6:F6。
137=133*B4^3,復(fù)制公式填充到C7:F7。
B8=B3*B4^4,復(fù)制公式填充到C7:F7。
用卡方值χ與查得的臨界值進(jìn)行比較,由于1.845<7.81,在工作中可以認(rèn)為當(dāng)時(shí)的蝗蝻分布型為Pois-son分布。
3.4 樣本直方圖的繪制
在實(shí)際工作中,總體的分布類(lèi)型往往也是未知的,這時(shí)可由樣本直方圖對(duì)總體的分布作一個(gè)大致的推斷,然后再?gòu)睦碚撋霞右詸z驗(yàn)(圖3)。
選取B4:F4數(shù)據(jù),插入條形圖中簇狀柱形圖類(lèi)型,然后按確定,顯示出如圖4所示的直方圖,最后設(shè)置數(shù)軸格式。
4 要點(diǎn)及使用說(shuō)明
(1)原始數(shù)據(jù)輸入?yún)^(qū)的列數(shù)可以增加至自己所需的列數(shù),甚至更多。
(2)如果原始數(shù)據(jù)輸入?yún)^(qū)設(shè)置的列數(shù)比實(shí)際的數(shù)據(jù)多,在卡方值計(jì)算區(qū)內(nèi)理論頻率計(jì)算公式要注意條件的設(shè)置。
(3)繪制統(tǒng)計(jì)數(shù)據(jù)直方圖,可以根據(jù)工作需要或個(gè)人習(xí)慣,對(duì)圖表區(qū)、坐標(biāo)軸、圖例、對(duì)應(yīng)曲線進(jìn)行修改。
參考文獻(xiàn):
[1]梁林峰.基于Excel函數(shù)及圖表工具的樹(shù)干解析方法[J].林業(yè)調(diào)查規(guī)劃,2015,40(6):11~16.
[2]汪洋,汪林波,余春前等.紅椿天然種群分布格局的檢驗(yàn)方法[J].湖北農(nóng)業(yè)科學(xué),2016,55(13):3383~3386.
[3]張華香,汪洋,冷艷芝等.九宮山紅椿種群結(jié)構(gòu)和空間分布格局分析[J].湖北農(nóng)業(yè)科學(xué),2017,56(14):2685~2689.
[4]馮浩,周瑩.基于Matlab的泊松分布數(shù)學(xué)特征研究[J].湖南城市學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,25(4):63~64.
收稿日期:2019-09-16
作者簡(jiǎn)介:林照授(1970-),男,高級(jí)工程師,主要從事森林資源培育工作。