劉志強(qiáng) 王秋 任廣行 金巍
摘? ? ? 要:以無截距線性回歸模型及SPSS軟件對(duì)一生產(chǎn)裝置單一原料的主要產(chǎn)品收率進(jìn)行線性回歸分析,通過對(duì)該裝置23組投入產(chǎn)出數(shù)據(jù)的研究,確定了回歸效果顯著、穩(wěn)定性良好的無截距項(xiàng)線性模型,得到了有代表性的單一原料的產(chǎn)品A、B的收率。該分析方法的正確建立,對(duì)優(yōu)化裝置原料結(jié)構(gòu)有意義。
關(guān)? 鍵? 詞:線性回歸; SPSS;產(chǎn)品收率
中圖分類號(hào):TQ 021.9? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? 文章編號(hào):1671-0460(2019)10-2392-04
Abstract: The linear regression analysis of the main product yield from a single feedstock in the production plant was carried out with the non-intercept linear model and SPSS software. Through the study of 23 sets of input-output data of the device, a linear model without intercept term was established. The model had obvious regression effect and good stability, and the yields of the products A and B of single raw material were obtained. The establishment of the analytical method is of great significance to optimize the raw material structure of the plant.
Key words: Linear regression;SPSS;? Product yield
在化工生產(chǎn)優(yōu)化操作中,建立正確的分析方法,明確各原料產(chǎn)品收率,對(duì)于正確評(píng)價(jià)每種原料的經(jīng)濟(jì)性,優(yōu)化裝置原料結(jié)構(gòu)有著重要意義[1-3]。
以某生產(chǎn)裝置為例,該裝置主要原料可分為F1、F2、F3、F4四大類,主要產(chǎn)品為A、B兩種,本次分析以23組該裝置月投入產(chǎn)出數(shù)據(jù)為基礎(chǔ),利用無截距項(xiàng)正態(tài)線性模型及SPSS(Statistical Product and Service Solutions)軟件[4-6]對(duì)裝置單一原料的主要產(chǎn)品收率進(jìn)行線性回歸分析。
1? 無截距項(xiàng)線性模型的建立及SPSS軟件的應(yīng)用
1.1? 建立無截距項(xiàng)正態(tài)線性模型
設(shè)b1、b2、b3、b4分別為原料F1、F2、F3、F4對(duì)于產(chǎn)A的收率,每月四種原料投入量分別為X1、X2、X3、X4,A的產(chǎn)量為Y,建立無截距項(xiàng)四元線性模型
1.2? SPSS軟件應(yīng)用
1.2.1? 數(shù)據(jù)來源
以該裝置23個(gè)月的投入產(chǎn)出數(shù)據(jù)(見表1)為基礎(chǔ)進(jìn)行分析。
1.2.2? 模型操作
將表1中數(shù)據(jù)在模型數(shù)據(jù)錄入界面輸入后,進(jìn)行以下操作:
在操作菜單中選擇回歸、線性,點(diǎn)擊確認(rèn)。
將因變量、自變量分別選入,在方法中選擇進(jìn)入。
在統(tǒng)計(jì)量、繪制、保存選項(xiàng)中進(jìn)行相應(yīng)操作后
在選擇選項(xiàng)中進(jìn)行如下操作。
2? 線性回歸方程確定及顯著性檢驗(yàn)
2.1? 根據(jù)模型輸出結(jié)果確定回歸方程
=0.326x1i+0.438x2i+0.308x3i+0.326x4i? ? (2)
2.2? 線性回歸方程顯著性檢驗(yàn)
利用方程求因變量估計(jì)值及相關(guān)差值平方(見表2)。
在表2數(shù)據(jù)基礎(chǔ)上,可計(jì)算得到
R2=0.965、R=0.982、F=74.6、SIG=0(模型給出)
根據(jù)方程的R、R2、SIG和F得出該模型表現(xiàn)出顯著性。
3? 結(jié)果與討論
3.1? 用留一法檢驗(yàn)?zāi)P头€(wěn)定性
留一法LOO(leave one out)交叉性驗(yàn)證是一種內(nèi)部化的檢驗(yàn),這種檢驗(yàn)過程是以所建模型的參數(shù)為自變量來進(jìn)行的[7],具體操作為逐一從全部樣本中剔除1個(gè)樣本然后重新建方程,用該新建方程預(yù)測剔除掉的樣本,比較預(yù)測結(jié)果與統(tǒng)計(jì)結(jié)果得到殘差,通過推倒得到交叉驗(yàn)證相關(guān)系數(shù)q2(q2代表模型的內(nèi)部穩(wěn)健程度)。
由表3可以看出,q2>0.5,說明該模型具有穩(wěn)定性和可預(yù)測性,公式模型的q2=0.926,另外,該模型的R2- q2=0.039 ,該差值與所建立的模型穩(wěn)定性正相關(guān),差值越小,模型穩(wěn)定性越好。
3.2? 模型的殘差分析
殘差分析結(jié)果如表3所示,標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖如圖1所示,統(tǒng)計(jì)值與預(yù)測值殘差頻率直方圖如圖2所示。
由圖1和圖2可以看出,預(yù)測值與統(tǒng)計(jì)值表現(xiàn)出良好的線性關(guān)系,標(biāo)準(zhǔn)P-P圖的對(duì)角線上分布著大多數(shù)樣本。另外,模型的直方圖基本符合正態(tài)分布的特點(diǎn),代表了該模型被成功建立。
3.3? 產(chǎn)品B收率的回歸方程及檢驗(yàn)值
對(duì)產(chǎn)品B相關(guān)的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行了同樣的分析:
確定回歸方程:
=0.153x1i+0.318x2i+ .138x3i+0.150 x4i? ?(4)
各檢驗(yàn)值? ?R2= 0.846? R=0.920? F=39.3? SIG=0? ?q2=0.867
說明產(chǎn)品B收率的線性回歸模型同樣具有顯著性和穩(wěn)定性。
由圖3和圖4可以看出產(chǎn)品B收率模型的建立也是成功的。
3.4? 產(chǎn)品A、B收率的確定
通過以上分析可得出在統(tǒng)計(jì)學(xué)上有意義的產(chǎn)品A、B的收率(見表4)
4? 結(jié) 論
通過對(duì)該裝置23組投入產(chǎn)出數(shù)據(jù)的研究,確定了回歸效果顯著、穩(wěn)定性良好的無截距項(xiàng)線性模型,得到了有代表性的單一原料的產(chǎn)品A、B的收率。
參考文獻(xiàn):
[1]陳 魁.應(yīng)用概率統(tǒng)計(jì)[M].北京:清華大學(xué)出版社,2000:20-30.
[2]同濟(jì)大學(xué)數(shù)學(xué)系.線性代數(shù)[M].北京:高等教育出版社,2006:25-28.
[3]史春薇,田強(qiáng),葛騫,魯傳濤.基于SPSS統(tǒng)計(jì)軟件在多元線性回歸校驗(yàn)數(shù)據(jù)中的應(yīng)用[J].當(dāng)代化工, 2014, 6.
[4]謝海宇.用線性回歸技術(shù)降低汽油調(diào)合成本[J].當(dāng)代化工, 2004, 4.
[5] 蘭秀菊.1.8 Mt/a催化裂化裝置生產(chǎn)方案模型的建立和優(yōu)化研究[D].北京:中國石油大學(xué)(北京),2005.
[6]于戰(zhàn)德.多元線性回歸分析法在蠟油加氫產(chǎn)品質(zhì)量控制上的應(yīng)用[C].中國統(tǒng)計(jì)學(xué)會(huì)石油化工統(tǒng)計(jì)分會(huì)第四次統(tǒng)計(jì)學(xué)術(shù)研討會(huì)論文集.廣州分公司,2010:20-27.
[7]閆輝.1.8Mt/a催化裂化裝置工藝模型的建立和生產(chǎn)方案優(yōu)化研究[D].河北:河北工業(yè)大學(xué),2007. DOI:10.7666/d.d042300.