崔劍 巴合提努爾·巴贊
(1馬鋼(集團)控股有限公司能源環(huán)保部安徽馬鞍山243002安徽工業(yè)大學能源與環(huán)境學院安徽馬鞍山24300)
Smooth函數(shù)平滑處理馬鋼SO2排放數(shù)據(jù)方法與應用
崔劍1巴合提努爾·巴贊2
(1馬鋼(集團)控股有限公司能源環(huán)保部安徽馬鞍山243002安徽工業(yè)大學能源與環(huán)境學院安徽馬鞍山24300)
為了解決生產(chǎn)現(xiàn)場數(shù)據(jù)波動大、數(shù)據(jù)處理困難,統(tǒng)計結果失真等問題,本文提出利用Smooth函數(shù)對數(shù)據(jù)樣本進行預處理。針對馬鋼SO2排放數(shù)據(jù),通過對比研究不同方法的誤差,確定5點滑動平均法效果最佳。
Smooth函數(shù);預處理;5點滑動平均法
在進行生產(chǎn)數(shù)據(jù)統(tǒng)計和模型計算分析時,受生產(chǎn)過程、儀器儀表、人員操作等因素的影響,現(xiàn)場數(shù)據(jù)往往會出現(xiàn)異常波動,這些異常值進入統(tǒng)計分析系統(tǒng)后,往往對計算結果產(chǎn)生重大偏差,造成結果失真,模型失效。
為了恢復現(xiàn)場采集數(shù)據(jù)的客觀真實性,同時為了將來得到更好的統(tǒng)計分析結果,有必要對現(xiàn)場采集的原始數(shù)據(jù)進行響應的預處理以剔除異常值[1]。另外,無論是人工觀測的現(xiàn)場數(shù)據(jù)又或者是由數(shù)據(jù)采集設備系統(tǒng)獲取的數(shù)據(jù),都不可避免疊加上“噪聲”干擾(反映在曲線圖上是一些明顯的“毛刺和尖峰”)[2]。而這些情況導致的最后模型計算結果較工序?qū)嶋H值的波動較大,最大波動值甚至達到60%。為提高模型精度與科學性,有必要對現(xiàn)場采集的數(shù)據(jù)進行平滑預處理。
MATLAB軟件中有一個專門進行數(shù)據(jù)平滑處理的smooth函數(shù),可以用于初步實現(xiàn)數(shù)據(jù)的平滑過程。在編程過程中,MATLAB軟件中的smooth函數(shù)主要有以下幾種常用的調(diào)用格式,如表1所示,smooth函數(shù)調(diào)用方法。
表1 MATLAB軟件中smooth函數(shù)的調(diào)用方法
其中,Smooth函數(shù)的指定方法中METHOD的方法共有6種類型[3],詳見表2。
表2 Smooth函數(shù)指定方法中METHOD的方法類型
MATLAB軟件中Smooth函數(shù)實現(xiàn)數(shù)據(jù)平滑過程的實質(zhì)是采用選定的平滑因子對數(shù)據(jù)曲線進行濾波,選定的平滑因子的頻譜特性直接影響其平滑處理效果,選定的平滑因子相當于一個低通濾波器[4],如果數(shù)據(jù)曲線不光滑,說明采集信號中高頻成分相應比較豐富,信號中的高頻成分經(jīng)過平滑因子低通濾波后得到有效的過濾或者抑制,曲線就變得比較平滑??梢哉f,Smooth函數(shù)中信號的平滑處理過程,其實質(zhì)就是低通濾波處理所采集的信號的過程。
圖1為馬鋼三鐵廠燒結脫硫裝置在線數(shù)據(jù)和模型計算數(shù)據(jù)的對比圖。由圖可知,模型計算數(shù)據(jù)雖然能較好的反應實際數(shù)據(jù)的整體趨勢,但是在個別點存在誤差較大的問題。需要對數(shù)據(jù)進行平滑處理,去除數(shù)據(jù)壞點。
圖1 在線數(shù)據(jù)和模型計算數(shù)據(jù)對比圖
由于圖1表示形式不明顯,為了更加直觀的觀察誤差的變化,將誤差轉(zhuǎn)換成折線圖的形式,圖2為馬鋼三鐵廠燒結脫硫裝置在線數(shù)據(jù)和模型計算數(shù)據(jù)的相對誤差對比圖。從圖中可以看出,整體誤差范圍在40%左右,但是個別數(shù)據(jù)的誤差會急劇上升,最大誤差能到80%。這可能是由于生產(chǎn)工序不穩(wěn)定和檢測設備異常引起的。誤差波動較大。由于誤差波動造成模型的預測結果失真,不能有效指導脫硫工段的配料和操作。因此需要對此誤差進行平滑處理。
圖2 誤差對比圖
利用MATLAB軟件中的Smooth函數(shù)對馬鋼數(shù)據(jù)庫中提取的原始數(shù)據(jù)進行平滑處理,其結果如圖3所示。通過比較lowess、loess、5點滑動平均法等6種方法的平滑效果可以看出,5點滑動平均法對原始數(shù)據(jù)處理效果最好,對初始信號高頻干擾成分可以實現(xiàn)有效過濾,對初始數(shù)據(jù)的特征信號可以實現(xiàn)準確提取。而對于lowess、rlowess、loess和sgolay等方法在指定同樣的窗寬值時,其數(shù)據(jù)平滑處理效果一般,處理后的曲線中依舊存在較大程度的“噪聲干擾”現(xiàn)象。
圖3 數(shù)據(jù)的平滑處理結果
圖4 誤差五點法處理對比圖
從圖4誤差五點法處理對比圖分析結果看,通過5點滑動平均法預處理后,減少了生產(chǎn)數(shù)據(jù)波動對模型參數(shù)的影響,提高了預測結果的正確率,平均誤差降低到了5%以下,滿足了計算精度要求。
(1)Smooth函數(shù)具有平滑數(shù)據(jù)和濾除雜波的作用,對于生產(chǎn)數(shù)據(jù)波動較大的數(shù)據(jù)進行處理,可以有效提高模型的準確率;
(2)通過對Smooth函數(shù)中的缺省參數(shù)(5點滑動平均法)、lowess、rlowess、loess、和sgolay等幾種方法的平滑效果對比可以看出,5點滑動平均法對于馬鋼SO2排放模型系統(tǒng)的數(shù)據(jù)處理效果最好,對初始信號高頻干擾成分的實現(xiàn)了有效過濾,模型的精確度得到了有效提升。
[1]鄒鯤,袁俊泉.MATLAB6.X信號處理[M].北京:清華大學出版社,2002
[2]趙紅怡,張常年.數(shù)字信號處理及其MATLAB實現(xiàn)[M].北京:化學工業(yè)出版社,2002
[3]張倩茹,殷奎喜,趙華,等.BPSK信號的平滑化方法及其比較[J].信息化研究,2010,36(1):12-15.
[4]劉哲,宋文愛,王俊峰.基于虛擬的信號預處理方法的研究[J].科技情報開發(fā)與經(jīng)濟,2006,(2):234-235.作者簡介
崔劍(1971—),男,安徽省馬鞍山市人,大學本科,研究方向:環(huán)境保護。
Application and Method of Disposing Data of Smooth Function
Smooth function is used to pre-disposing data sample for solving the problem of fluctuation in production and data treating and result distortion.On the background of MaSteel of emission data of SO2,method of five point moving average is proved optimum by comparative error.
Smooth function;pre-disposing; method of five point moving average