丁學(xué)利 曹文康 李玉葉
(1.阜陽職業(yè)技術(shù)學(xué)院基礎(chǔ)教學(xué)部,安徽 阜陽 236031;2.赤峰學(xué)院數(shù)學(xué)與統(tǒng)計學(xué)院,內(nèi)蒙古 赤峰 024000)
顏色與質(zhì)量濃度辨識的方法目前常用的是比色法[1],即把待測物質(zhì)制備成溶液后滴在特定的白色試紙表面,等其充分反應(yīng)后獲得1張有顏色的試紙,再把該顏色試紙與標(biāo)準(zhǔn)比色卡進行對比,就可以確定待測物質(zhì)的質(zhì)量濃度檔位。由于每個人對顏色的敏感差異和觀測誤差,使得這一方法在精度上受到很大影響。隨著照相技術(shù)和顏色分辨率的提高,希望建立顏色讀數(shù)和質(zhì)量濃度的數(shù)學(xué)模型,即只要輸入照片中的顏色讀數(shù)即可獲得待測物質(zhì)的質(zhì)量濃度。顏色讀數(shù)和質(zhì)量濃度的關(guān)系一般是多元非線性關(guān)系,如何建立它們之間的數(shù)量關(guān)系成為該問題研究的重點。多數(shù)研究利用多項式擬合、多元非線性回歸、差值分析和主成分分析等方法建立數(shù)學(xué)模型[2-6]。
此次研究以2017年“高教社杯”全國大學(xué)生數(shù)學(xué)建模競賽C題[7]為例,運用相關(guān)性分析和多元非線性逐步回歸分析方法,通過逐步剔除最不顯著變量,建立最優(yōu)的質(zhì)量濃度與顏色讀數(shù)的數(shù)學(xué)模型。利用該模型可以較好地建立顏色讀數(shù)和質(zhì)量濃度的數(shù)量關(guān)系,也為實際的質(zhì)量濃度辨識問題提供理論參考。
SO2質(zhì)量濃度和物質(zhì)顏色讀數(shù)的原始數(shù)據(jù),如表1所示[7]。表1中的變量B、G、R、H、S的含義依次為:藍色顏色值、綠色顏色值、紅色顏色值、色調(diào)、飽和度。
為了分析SO2質(zhì)量濃度與顏色讀數(shù)之間的關(guān)系,對其進行相關(guān)性分析。表2是SO2質(zhì)量濃度與物質(zhì)顏色讀數(shù)的相關(guān)系數(shù)。從表2可看出,SO2質(zhì)量濃度與B、G、R和H的相關(guān)系數(shù)的絕對值較大,與S的相關(guān)系數(shù)的絕對值稍小,但S的作用不能忽略。因此認為SO2質(zhì)量濃度受B、G、R、S和H等5個變量的影響。
根據(jù)SO2質(zhì)量濃度和顏色讀數(shù)的相關(guān)性分析,初步考慮建立五元線性回歸模型,稱為模型I,表達式為:
y=c0+c1x1+c2x2+c3x3+c4x4+c5x5+ε
(1)
式中:x1——藍色顏色值(B);
x2——綠色顏色值(G);
x3——紅色顏色值(R);
x4——色調(diào)(H);
x5——飽和度(S);
y——SO2質(zhì)量濃度;
c0,c1,c2,c3,c4,c5——回歸系數(shù);
ε——隨機誤差變量。
表1 SO2質(zhì)量濃度與物質(zhì)顏色讀數(shù)的原始數(shù)據(jù)
表2 SO2質(zhì)量濃度與顏色讀數(shù)的相關(guān)系數(shù)
利用EViews軟件,采用最小二乘法對模型I進行計算,參數(shù)估計見表3,方差分析見表4。
表3 模型I最小二乘法參數(shù)估計
從圖1可看出,雖然模型I通過逐步回歸后各變量明顯顯著了,但擬合效果較差,說明SO2質(zhì)量濃度與各顏色讀數(shù)之間不是簡單的線性關(guān)系,因此考慮建立五元完全二次多項式回歸模型,稱其為模型II:
表4 模型I最小二乘法方差分析
表5 模型I剔除不顯著變量后的參數(shù)估計
(2)
式中,b0、b1、b2、b3、b4、b5、bjk(j≥1,k≤5)為回歸系數(shù)。通過如下變換,可將式(2)的非線性問題轉(zhuǎn)化成線性問題來求解。
令z1=x1;z2=x2;z3=x3;z4=x4;z5=x5;
z12=x1x2;z13=x1x3;z14=x1x4;z15=x1x5;
z23=x2x3;z24=x2x4;z25=x2x5;z34=x3x4;
z35=x3x5;z45=x4x5;z11=x1x1;z22=x2x2;
z33=x3x3;z44=x4x4;z55=x5x5。
變換后的方程為:
(3)
利用EViews求解模型II,結(jié)果如表7、8所示。
表6 模型I剔除不顯著變量后的方差分析
圖1 逐步回歸擬合曲線
下面將這些最不顯著項z2、z12、z13和z24依次去掉,作逐步回歸[8-9]分析,得到逐步回歸后的參數(shù)估計和方差分析,如表9、10所示。
表7 模型II最小二乘法參數(shù)估計
表8 模型II最小二乘法方差分析
從表9可看出,剔除變量z2、z12、z13、z24后,回歸方程的每一項均在顯著性水平0.05以下,p均小于0.05,說明每一項均是顯著的。表10中的F統(tǒng)計量明顯大于表8中的F統(tǒng)計量,說明通過逐步回歸后的模型優(yōu)于逐步回歸之前的模型。
為了進一步檢驗逐步回歸后的模型是否存在異方差,對逐步回歸后的模型進行White檢驗[10]。構(gòu)造輔助函數(shù)式(4):
(4)
式中:E——殘差;
γ0,γ1,γ2——回歸系數(shù);
ε——隨機誤差項。
輔助回歸估計結(jié)果如下:
(5)
根據(jù)非線性逐步回歸分析后的模型可得到原始數(shù)據(jù)散點和逐步回歸后的擬合圖,如圖2所示。從圖2可看出,非線性逐步回歸分析后的模型擬合效果較好。
表9 模型II剔除不顯著變量后的參數(shù)估計
圖2 非線性逐步回歸擬合曲線
依據(jù)SO2質(zhì)量濃度與顏色讀數(shù),先后建立五元線性回歸模型和五元非線性回歸模型,并不斷檢驗和修正SO2質(zhì)量濃度與顏色讀數(shù)間的回歸關(guān)系。通過變換將非線性回歸模型轉(zhuǎn)化成線性回歸模型,再對變換后的線性回歸模型作逐步回歸分析,剔除不顯著變量,最終得到最優(yōu)的非線性回歸模型。對比分析知非線性逐步回歸模型擬合效果較好,且不存在異方差性,因此該模型具有較好的實用價值。但是,此次只研究了SO2質(zhì)量濃度與各顏色讀數(shù)之間的多元非線性回歸模型,還可進一步研究SO2質(zhì)量濃度與單個顏色讀數(shù)之間的相關(guān)關(guān)系。
表10 模型II剔除不顯著變量后的方差分析