張思雨
摘要:彈簧鋼是指由于在淬火和回火狀態(tài)下的彈性,而專門用于制造彈簧和彈性元件的鋼。我們希望通過回歸分析等統(tǒng)計(jì)方法建立并優(yōu)化模型,通過對(duì)模型的檢驗(yàn),診斷,調(diào)整現(xiàn)有成分組合,從理論上找到最優(yōu)成分組合,使對(duì)應(yīng)的低溫沖擊功達(dá)到最佳效果,從而使彈簧鋼保持穩(wěn)定的耐低溫沖擊韌性。
Abstract: Research issues and objectives: Spring steel is due to the elasticity of steel in the quenched and tempered condition, and specifically for the manufacture of springs and elastic elements. We hope to establish and optimize the model by statistical regression analysis, the model by testing, diagnosis, adjust the existing combination of ingredients, theoretically find the optimal combination of ingredients, so that the corresponding low-temperature impact energy to achieve the best results, so that the spring steel remained stable low temperature impact toughness.
關(guān)鍵詞:沖擊功;彈簧鋼;成分設(shè)計(jì);多元線性回歸分析;多元非線性回歸分析
Key words: impact energy;spring steel;component design;multiple linear regression analysis;multiple nonlinear regression analysis
中圖分類號(hào):TF762+.5 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2018)21-0229-04
1 研究目標(biāo)
分析彈簧鋼相關(guān)元素和沖擊功數(shù)據(jù),研究對(duì)于彈簧鋼低溫沖擊韌性的影響因素,通過回歸分析等統(tǒng)計(jì)方法建立并優(yōu)化模型,根據(jù)對(duì)模型的檢驗(yàn),診斷,調(diào)整現(xiàn)有成分組合,從理論上找到最優(yōu)成分組合,使對(duì)應(yīng)的低溫沖擊功達(dá)到最佳效果。
2 分析方法與過程
2.1 總體流程
本文包括以下幾個(gè)步驟:步驟一:數(shù)據(jù)預(yù)處理包括缺失值補(bǔ)充、變量的剔除;步驟二:初步建立線性回歸模型;步驟三:對(duì)模型進(jìn)行檢驗(yàn)是否存在異方差、自相關(guān)性和多重共線性等問題;步驟四:消除異常情況再次檢驗(yàn),建立非線性模型;步驟五:最優(yōu)模型的應(yīng)用效果。
2.2 具體步驟
2.2.1 步驟一 數(shù)據(jù)預(yù)處理
2.2.1.1 變量的剔除和缺失值的處理
缺失值處理有如下常用的幾個(gè)方法:
①忽略元組:當(dāng)缺少類標(biāo)號(hào)時(shí)通常這樣做。除非元組有多個(gè)屬性缺少值,否則該方法不是很有效。②人工填寫缺失值:一般情況下,該方法很費(fèi)時(shí)。③使用一個(gè)全局常量填充缺失值:將缺失值用同一個(gè)常數(shù)(如Unknown或﹣∞)替換。如果缺失值都用Unknown替換,則挖掘程序可能誤認(rèn)為它們形成了一個(gè)有趣的概念,因?yàn)樗鼈兌季哂邢嗤闹怠癠nknown”。因此此方法雖然簡(jiǎn)單但不可靠。④使用屬性的均值填充缺失值:例如,假定顧客的平均收入為56000美元,則使用該值替換income中的缺失值。⑤使用與給定元組屬同一類的所有樣本的屬性均值,例如,將顧客按credit_risk分類,則用具有相同信用度給定元組的顧客的平均收入替換income中的缺失值。⑥使用最可能的值填充缺失值:可以用回歸、使用貝葉斯形式化的基于推理的工具或決策樹歸納確定。
由于我們的研究目的是探究彈簧鋼所含成分的含量對(duì)于其低溫沖擊韌性的影響,所以我們選取了各個(gè)元素含量和對(duì)應(yīng)沖擊功的真實(shí)數(shù)據(jù),根據(jù)實(shí)際實(shí)驗(yàn)的爐號(hào)為順序重新整理。另外,對(duì)數(shù)據(jù)進(jìn)行缺失值的補(bǔ)充和多余數(shù)值的去除。每一爐鋼鐵測(cè)量三次沖擊功,取三次沖擊功均值作為因變量Y(單位:J),取六種元素的含量作為自變量x1、x2、x3、x4、x5、x6。歷史數(shù)據(jù)不充足,若補(bǔ)充缺失值,誤差較大,于是予以剔除。
2.2.1.2 數(shù)據(jù)的基本假設(shè)的檢驗(yàn)
從步驟二和上述結(jié)果可以分析出,由因變量和全部自變量建立的線性回歸模型的R方僅為0.181,說明該模型的擬合效果非常不理想。首先,盡管方差分析表中F檢驗(yàn)顯著性檢驗(yàn)通過,但是系數(shù)表t檢驗(yàn)只有Mn和P通過,其余元素均沒有通過檢驗(yàn),且各元素標(biāo)準(zhǔn)誤較大,我們推測(cè)這組樣本數(shù)據(jù)可能存在異方差性。從相關(guān)系數(shù)矩陣中可以看出各元素之間存在自相關(guān)性,且殘差的絕對(duì)值與各個(gè)自變量之間的Spearman等級(jí)相關(guān)系數(shù)檢驗(yàn)也是顯著的,說明數(shù)據(jù)可能存在異方差性。其次,觀察各元素對(duì)應(yīng)的容忍度,均小于10,暫時(shí)排除多重共線性的可能。另外,通過學(xué)生化殘差和學(xué)生化已刪除殘差分別為3.411和3.669,均大于3,而庫克距離為0.099,小于1,說明1F11140爐的實(shí)驗(yàn)鋼出現(xiàn)了異常值,推測(cè)是由沖擊功異常導(dǎo)致的。
2.2.4 步驟四:消除異常情況再次檢驗(yàn),建立非線性模型
在消除異方差之前,首先進(jìn)一步檢驗(yàn)是否確有異方差。先對(duì)原回歸模型做OLS估計(jì),構(gòu)造殘差平方變量uhat2和因變量預(yù)測(cè)變量yhat及其平方變量yhat2。再將uhat2關(guān)于常數(shù)、yhat和yhat2作OLS回歸,計(jì)算或查出該回歸方程估計(jì)的F檢驗(yàn)統(tǒng)計(jì)量值,進(jìn)行F檢驗(yàn)。如拒絕,則存在異方差,進(jìn)行以下第二步;否則,不存在,不需作異方差糾正。(表5)
2.3最優(yōu)模型的應(yīng)用效果
分別計(jì)算每爐實(shí)驗(yàn)鋼的沖擊功95%置信區(qū)間,共126爐實(shí)驗(yàn),大約有8%的沖擊功沒有落在預(yù)期的16~20J以上區(qū)間內(nèi)。這組由C、Si、Mn、P、Cr、Ni組成的成分設(shè)計(jì)效果基本通過。
3 結(jié)果分析
本文主要通過線性回歸分析和非線性回歸分析兩種方法進(jìn)行模型的擬合,采用了曲線回歸和多項(xiàng)式回歸,本質(zhì)上是將非線性模型化為線性模型分析,構(gòu)建好線性模型之后,在將其轉(zhuǎn)化回非線性模型,得到相對(duì)線性模型更加精確的結(jié)果,即彈簧鋼的低溫沖擊韌性,并不是只是受P,Mn,Ni的主要影響,還有三種元素之間的交互作用,以及三種元素的二次效應(yīng)的影響。在最后,本文簡(jiǎn)單分析了這組實(shí)驗(yàn)數(shù)據(jù)反映的此次生產(chǎn)的合格率,也顯示出這是一次較為成功的生產(chǎn)。
參考文獻(xiàn):
[1]何曉群,劉文卿.應(yīng)用回歸分析[M].三版.北京:中國人民大學(xué)出版社,2011.
[2]Jiawei Han Micheline Kamber Jian Pei 著,范明,孟小峰譯.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012.
[3]蔣大軍著.采用多元線性回歸預(yù)測(cè)釩鈦燒結(jié)礦強(qiáng)度[J].燒結(jié)球團(tuán),2006,31(2).
[4]盧慶華,任康樂,周鳳璽,著.基于偏最小二乘法實(shí)現(xiàn)非線性回歸分析[J].甘肅科技,2005,21(11).
[5]王蕊,董祥雯,何衛(wèi)蘋.一種多元非線性回歸模型的建立方法及其應(yīng)用,2010.
[6]洪國華,楊順虎,肖波,周建,著.國內(nèi)外彈簧鋼的生產(chǎn)現(xiàn)狀和發(fā)展前景[J].現(xiàn)代冶金,2009,37(1).