殷冬琴
摘要:本論述根據(jù)實(shí)驗(yàn)提供的25組有關(guān)二氧化硫濃度與顏色讀數(shù)的數(shù)據(jù),利用EXCEL數(shù)據(jù)分析工具,建立了二氧化硫濃度與顏色讀數(shù)GBRSH之間的五元線性回歸模型,結(jié)果顯示該模型擬合程度較好,但是t統(tǒng)計(jì)值和P值顯示顏色分量RSB對(duì)二氧化硫濃度的影響不顯著。隨后計(jì)算顏色分量之間的相關(guān)系數(shù),結(jié)果顯示顏色分量之間存在多重共線性。為此,對(duì)建立的五元線性回歸模型采用逐步回歸法進(jìn)行優(yōu)化,統(tǒng)計(jì)結(jié)果顯示出在給定的5個(gè)顏色分量GBRSH中,對(duì)二氧化硫濃度的影響由主到次的順序依次為:G>H>B>S>R,可見(jiàn)影響二氧化硫濃度的主要顏色分量為G和H。
關(guān)鍵詞:顏色讀數(shù);二氧化硫;線性回歸;逐步回歸
中圖分類(lèi)號(hào):G642.0 文獻(xiàn)標(biāo)志碼:A
1概述
隨著照相技術(shù)和顏色分辨率的提高,人們希望建立物質(zhì)濃度和顏色讀數(shù)之間的數(shù)量關(guān)系。《物質(zhì)濃度與顏色讀數(shù)的回歸分析》一文根據(jù)實(shí)驗(yàn)數(shù)據(jù),利用向后變量易0除法,建立了組胺、溴酸鉀、奶中尿素三種物質(zhì)的濃度與顏色讀數(shù)之間的多元線性回歸模型。但根據(jù)實(shí)驗(yàn)數(shù)據(jù),用類(lèi)似的方法討論二氧化硫濃度與顏色讀數(shù)之間的多元回歸模型時(shí),效果不理想。本論述利用逐步回歸法,建立了二氧化硫濃度與顏色讀數(shù)之間的多元線性回歸模型,并且在顯著性水平a=0.05下,通過(guò)相關(guān)系數(shù)R2、F檢驗(yàn)、t檢驗(yàn)對(duì)該模型進(jìn)行了評(píng)估,得出在顏色分量RGBsH讀數(shù)中對(duì)二氧化硫濃度影響由主到次的順序?yàn)椋篏>H>B>s>R,其中紅(R)、綠(G)、藍(lán)(B)是顏色的三基色,亮度(B)、飽和度(S)、色調(diào)(H)是顏色的三要素,文中實(shí)驗(yàn)數(shù)據(jù)B是指三基色中的藍(lán)色。
2多元線性回歸分析
2.1模型建立
首先整理實(shí)驗(yàn)數(shù)據(jù),見(jiàn)表1所列。利用ExCEL數(shù)據(jù)分析工具對(duì)表1數(shù)據(jù)進(jìn)行回歸分析,得到二氧化硫濃度與各顏色分量的五元線性回歸結(jié)果見(jiàn)表2所列。
從而五元回歸方程為:
y=2846.29122+0.64717R-19.92775G+5.27286B-4.89616S-10.35390H (1)
由表2看出,相關(guān)系數(shù)0.89957,說(shuō)明方程(1)擬合程度較好,但是t統(tǒng)計(jì)值和P值顯示顏色分量R、s、B對(duì)二氧化硫濃度的影響不顯著,造成這一現(xiàn)象的原因可能是數(shù)據(jù)量或錯(cuò)誤,也可能是各顏色分量之間存在多重共線性。下面計(jì)算各顏色分量之間的相關(guān)系數(shù),結(jié)果見(jiàn)表3所列。
表3顯示顏色分量R、G之間,R、B之間,R、H之間,G、B之間,G、H之間,B、H之間相關(guān)程度都很高,表明確實(shí)各顏色分量存在多重共線性。
2.2模型優(yōu)化
針對(duì)上述模型中的多重共線性問(wèn)題,運(yùn)用逐步回歸的方法對(duì)模型進(jìn)行優(yōu)化。逐步回歸的基本思想是將變量逐個(gè)引入模型,每引入一個(gè)解釋變量后都要進(jìn)行F檢驗(yàn),并對(duì)已經(jīng)選人的解釋變量逐個(gè)進(jìn)行t檢驗(yàn),當(dāng)原來(lái)引入的解釋變量由于后面解釋變量的引入變得不再顯著時(shí),則將其刪除。先利用EXCEL數(shù)據(jù)分析工具,建立二氧化硫濃度分別與各顏色分量RGBSH的一元回歸模型,見(jiàn)表4一表8所列。
對(duì)于一元線性回歸,t值、P值與相關(guān)系數(shù)檢驗(yàn)是等價(jià)的,故比較表4-表8的相關(guān)系數(shù),可知二氧化硫濃度與顏色分量G擬合最佳,說(shuō)明RGB三基色中G對(duì)二氧化硫濃度的反應(yīng)最顯著,其回歸方程為:
y=295.6374-2.15228G (2)
下面以二氧化硫濃度y與顏色分量G的一元回歸為基礎(chǔ),依次加入其他顏色分量,進(jìn)行二元回歸分析,具體結(jié)果見(jiàn)表9-表12所列。
比較表9一表12的相關(guān)系數(shù),F(xiàn)值和t值可知二氧化硫濃度與顏色分量GH的二元回歸效果最佳,說(shuō)明顏色要素SH中的H對(duì)二氧化硫濃度的反應(yīng)最顯著。其二元回歸方程為:
y=1802.638-11.735G-5.04823H(3)
表12顯示相關(guān)系數(shù)為0.88285,說(shuō)明模型擬合度較好,但是多元回歸還要通過(guò)F檢驗(yàn)和t檢驗(yàn)。F檢驗(yàn):在給定顯著性水平a=0.05下,查表可得自由度為k-l=2和n-k=22的臨界值F0.05(2,22)=3.443,模型求得F=82.90042>F0.05(2,22),說(shuō)明方程整體顯著,通過(guò)F檢驗(yàn);t檢驗(yàn):在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=22的臨界值為t0.05(22)=1.7171,型求得各顏色分量G、H對(duì)應(yīng)的t統(tǒng)計(jì)值分別為:6.03992、-4.95371,絕對(duì)值均大于t0.05(22)=1.7171,通過(guò)t檢驗(yàn)。
以二氧化硫濃度y與顏色分量GH的二元回歸為基礎(chǔ),依次加入其他顏色分量,進(jìn)行三元回歸分析,具體結(jié)果見(jiàn)表13-表15所列。
比較表13-表15的相關(guān)系數(shù),F(xiàn)值和t值可知二氧化硫濃度與顏色分量GHB的三元回歸效果最佳,其三元回歸方程為:
y=1867.406-17.2342G+5.155534B-8.91935H(4)
表14顯示相關(guān)系數(shù)為0.89576,說(shuō)明模型擬合度較好,下面進(jìn)行F檢驗(yàn)和t檢驗(yàn)。F檢驗(yàn):在給定顯著性水平a=0.05下,查表可得自由度為k-1=3和n-k=21的臨界值F0.05(3,21)=3.072,模型求得F=60.15237>F0.05(3,21),說(shuō)明方程整體顯著,通過(guò)F檢驗(yàn);t檢驗(yàn):在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=21的臨界值為t0.05(21)=1.7207,模型求得各顏色分量G、B、H對(duì)應(yīng)的t統(tǒng)計(jì)值分別為:-4.42757,1.61238,-3.43757,其中G、H的均t計(jì)值絕對(duì)值均大于to.05(21)=1.7207,通過(guò)t檢驗(yàn),但B的t系計(jì)值小于t0.05(21)=1.7207說(shuō)明回歸方程(4)中顏色分量B對(duì)二氧化硫濃度影響不顯著。
以二氧化硫濃度與顏色分量GHB的三元回歸為基礎(chǔ),依次加入其他顏色分量,進(jìn)行四元回歸分析,具體結(jié)果見(jiàn)表16-表17。
比較表16-表17的相關(guān)系數(shù),F(xiàn)值和t值可知二氧化硫濃度與顏色分量GBSH的四元回歸效果佳,其四元回歸方程為:
y=2864.877-19.8835G+5.496888B-4.60243S-10.4529H(5)
表17顯示相關(guān)系數(shù)為0.8995,說(shuō)明模型擬合度較好。F檢驗(yàn):在給定顯著性水平a=0.05下,查表可得自由度為k-1=4和n-k=20的臨界值F0.05(4,20)=2.886,模型求得F=44.7526>F0.05(4,20),說(shuō)明方程整體顯著,通過(guò)F檢驗(yàn);t檢驗(yàn):在給定顯著性水平首先a=0.05下,查表可得自由度為n-k=20的臨界值為t0.05(201=1.7247,模型求得各顏色分量G、B、S、H對(duì)應(yīng)的t統(tǒng)計(jì)值分別為:-3.99595,1.695899,-0.86311,-3.31012,其中G、H的t統(tǒng)計(jì)值絕對(duì)值均大于to.05(20)=1.7247,通過(guò)t檢驗(yàn),但B、s的t統(tǒng)計(jì)值小于t0.05(20)=1.7247,說(shuō)明回歸方程④中顏色分量B、s對(duì)二氧化硫濃度影響不顯著。
綜上,得到以下結(jié)論:
第一,二氧化硫濃度y與顏色分量的最優(yōu)回歸模型是回歸方程(3),即
y=1802.638-11.735G-5.04823H
第二,顏色分量RGBSH中對(duì)二氧化硫濃度影響由主到次的順序依次為:G>H>B>S>R。
第三,顏色分量三基色RGB中,綠色GXCZ.氧化硫濃度影響最顯著,藍(lán)色B次之,紅色R最弱。顏色要素SH中,色調(diào)H對(duì)二氧化硫濃度影響最顯著,飽和度S次之。
3模型不足
本論述中得到的最優(yōu)線性回歸模型顯示二氧化硫的濃度僅與兩個(gè)顏色分量GH的讀數(shù)關(guān)系顯著,與其他三個(gè)顏色分量RBS關(guān)系不顯著,造成這一結(jié)果的原因可能是提供的實(shí)驗(yàn)數(shù)據(jù)量不足或有錯(cuò)誤數(shù)據(jù),也可能是實(shí)驗(yàn)數(shù)據(jù)更適合非線性回歸的討論,后續(xù)將進(jìn)一步探討。