延樹港,周溪召,高林,陳晶
(1.上海海事大學(xué)a.物流工程學(xué)院;b.商船學(xué)院,上海201306;2.華東理工大學(xué)信息學(xué)院,上海200237)
兩種數(shù)據(jù)校正模型性能的統(tǒng)計(jì)特征分析與比較
延樹港1a,周溪召1a,高林2,陳晶1b
(1.上海海事大學(xué)a.物流工程學(xué)院;b.商船學(xué)院,上海201306;2.華東理工大學(xué)信息學(xué)院,上海200237)
針對(duì)傳統(tǒng)化工數(shù)據(jù)校正模型,文章提出了一種改進(jìn)型校正模型,并對(duì)兩種模型在單一平衡約束的校正效果的統(tǒng)計(jì)特性進(jìn)行了定量分析與比較,得出了兩種模型在不同工藝要求下各自的適應(yīng)情況,可為數(shù)據(jù)校正工作的最佳決策提供理論依據(jù)。
數(shù)據(jù)校正;平衡約束;誤差;方差
自Kuehn和Davidson提出數(shù)據(jù)校正方法[1]以來(lái),一直采用在滿足物料、能量等平衡關(guān)系的條件下,以與對(duì)應(yīng)測(cè)量值偏差的平方和最小的解作為校正值,這種校正模型一直沿用至今。目前數(shù)據(jù)校正領(lǐng)域的研究重點(diǎn)多放在如何根據(jù)傳統(tǒng)模型選擇高效的全局解搜索方法,以節(jié)省計(jì)算時(shí)間和提高搜索全局最優(yōu)解得成功率,而對(duì)傳統(tǒng)模型的校正性能很少做定量分析。本文擬在綜合考慮各種影響因素的情況下,提出將平衡關(guān)系加入到校正模型中的一種改進(jìn)模型,并從數(shù)理統(tǒng)計(jì)的角度對(duì)兩種模型進(jìn)行定量分析與比較,以說(shuō)明兩種模型各自所適用的場(chǎng)合。
上世紀(jì)60年代,Kuehn和Davidson用拉格朗日乘子法求解帶線性約束的最小二乘問(wèn)題,從而揭開了工業(yè)過(guò)程數(shù)據(jù)校正的序幕。校正的準(zhǔn)則為:在滿足物料平衡、熱量平衡、化學(xué)反應(yīng)計(jì)量關(guān)系或其它物化關(guān)系的條件下,要求已測(cè)數(shù)據(jù)的校正值與其對(duì)應(yīng)的測(cè)量值的偏差的平方和最小。在傳統(tǒng)模型中,測(cè)量數(shù)據(jù)的校正值嚴(yán)格滿足平衡約束,在采樣數(shù)據(jù)中不存在大誤差的情況下可以實(shí)現(xiàn)良好的校正結(jié)果。但是當(dāng)參與校正的數(shù)據(jù)中局部測(cè)點(diǎn)隨機(jī)誤差分布的方差相對(duì)于其它測(cè)點(diǎn)顯著較大時(shí),而求解過(guò)程由于必須滿足剛性的約束關(guān)系,導(dǎo)致該測(cè)點(diǎn)誤差被硬性平攤到其它各個(gè)測(cè)點(diǎn)。此時(shí)若采用傳統(tǒng)模型,相當(dāng)于用大部分測(cè)點(diǎn)數(shù)據(jù)的劣化來(lái)?yè)Q取少數(shù)測(cè)點(diǎn)數(shù)據(jù)的優(yōu)化,從許多工程實(shí)際角度來(lái)看是一種得不償失的校正過(guò)程。許多學(xué)者針對(duì)傳統(tǒng)模型未考慮過(guò)失誤差的問(wèn)題,提出了一些解決辦法。這些方法都是在數(shù)據(jù)校正之前進(jìn)行顯著誤差偵測(cè)和處理[2][3][4][5],但均無(wú)法確保顯著誤差被準(zhǔn)確無(wú)誤的偵測(cè),導(dǎo)致依概率出現(xiàn)的大誤差難以有效剔除,這些大誤差對(duì)后續(xù)的校正模型的抗擾性提出了很高的要求,傳統(tǒng)校正模型由于剛性的平衡約束關(guān)系難以適應(yīng)此類情況。
為了方便統(tǒng)計(jì)分析與比較,設(shè)定如下前提:
(1)不同測(cè)點(diǎn)的測(cè)量誤差相互獨(dú)立;
(2)誤差分布均呈高斯分布,分布參數(shù)因工況各異,分布的對(duì)稱軸為理論真值。
同時(shí)為了分析時(shí)的規(guī)范,對(duì)分析過(guò)程中用到的符號(hào)形式做如下約定:
(1)測(cè)點(diǎn)的理論真值Xo:xo1,xo2,xo3,…,xon,n表示測(cè)點(diǎn)個(gè)數(shù)(注:該值在假定傳感器絕對(duì)精準(zhǔn)情況下測(cè)得,現(xiàn)實(shí)工藝過(guò)程中無(wú)法獲得。);
(2)測(cè)點(diǎn)的采樣值X:x1,x2,x3,…,xn;
(5)測(cè)點(diǎn)的采樣誤差△X=X-Xo:△x1,△x2,△x3,…,△xn;
(6)平衡方程殘差R:r1,r2,r3,…,rn;
(7)約束方程中各測(cè)點(diǎn)的正負(fù)號(hào)表示:bji,表示第j個(gè)方程的第i個(gè)測(cè)點(diǎn);
對(duì)于傳統(tǒng)數(shù)據(jù)校正模型有:
(1)理論平衡式:
(2)實(shí)際平衡式:
(注:由于式中各測(cè)點(diǎn)存在隨機(jī)誤差,所以存在滿足隨機(jī)分布的殘差r)
式(2)-(1)即得到由各測(cè)點(diǎn)誤差引起的平衡約束關(guān)系殘差式:
式(3)表明,各測(cè)點(diǎn)隨機(jī)誤差的代數(shù)和造成了平衡關(guān)系式的殘差,數(shù)據(jù)校正的目的就在于剔除殘差R。而數(shù)據(jù)校正方案優(yōu)劣的本質(zhì)在于在剔除殘差R的過(guò)程中,各個(gè)測(cè)點(diǎn)的采樣誤差是否也隨著校正過(guò)程依一定概率縮減。
(3)校正后的平衡式:
式(4)表明,經(jīng)過(guò)校正處理后得到的值應(yīng)滿足理論平衡約束方程。
式(4)-(2)即得到校正偏移量與殘差相抵的關(guān)系式:
式(5)表明,校正過(guò)程本質(zhì)是抵消殘差,各測(cè)點(diǎn)數(shù)據(jù)做相應(yīng)改變使?jié)M足理論平衡關(guān)系式。在最優(yōu)方案中,各測(cè)點(diǎn)校正方向均與減小殘差的方向相一致。若校正方案中出現(xiàn)某兩個(gè)測(cè)點(diǎn)的校正增量相抵消,則此方案不是最佳方案。
綜上所述,傳統(tǒng)校正模型可用如下形式表述:
其中約束條件也可寫作式(4),兩者等效。
改進(jìn)模型的主要思想是:將約束方程中的所有等式約束轉(zhuǎn)化成一定條件下的不等式約束,即容許等式約束在一定范圍內(nèi)存在殘差,將殘差連同所有的約束關(guān)系放入到校正目標(biāo)函數(shù)當(dāng)中[6]。具體數(shù)學(xué)表述如下:
理論平衡式與實(shí)際平衡式:同(1)和(2)式。
平衡關(guān)系殘差式:
校正后的平衡式:
式(8)—(10)即得到校正偏移量與殘差相抵的關(guān)系式:
改進(jìn)模型中△r贊為殘差偏移量。與傳統(tǒng)模型區(qū)別在于△r贊并非完全抵消掉r。這是由于傳統(tǒng)校正模型為等式約束,要求校正解嚴(yán)格滿足理論平衡約束方程,而新校正模型則為不等式約束,允許校正處理之后依然存留部分偏差。
由此,新校正模型可用如下形式表述:
由于改進(jìn)模型的約束關(guān)系實(shí)際為不等式約束,為了方便分析,需要從形式上將式(3)~(9)改變成傳統(tǒng)模型的形式,具體操作如下。
這樣,式(12)從結(jié)構(gòu)形式上與傳統(tǒng)模型相同,只是變量的向量多出一維,意味著解空間多出一個(gè)自由度,而全局最優(yōu)的解很可能在新拓寬的解空間當(dāng)中。
本文著重論述在單一約束關(guān)系情況下兩種模型校正結(jié)果的統(tǒng)計(jì)特性。在單一約束情況下所有測(cè)點(diǎn)在式中的代數(shù)地位完全并列。在約束為“總校正效果剛好平衡掉方程殘差”的情況下,要求每個(gè)測(cè)點(diǎn)為了“平衡掉殘差”這個(gè)目的貢獻(xiàn)一份力量,并且模型校正目標(biāo)函數(shù)的實(shí)質(zhì)要求是在總貢獻(xiàn)固定(為相對(duì)常數(shù)r)的情況下每個(gè)測(cè)點(diǎn)貢獻(xiàn)的力量要盡可能的小。由此產(chǎn)生一個(gè)命題:每個(gè)測(cè)點(diǎn)數(shù)據(jù)的貢獻(xiàn)大小相同,并且貢獻(xiàn)的方向均為抵消殘差的方向(注:抵消殘差的方向相同不等同于數(shù)據(jù)在增減方向上相同)。如果該命題成立,則每個(gè)測(cè)點(diǎn)的校正偏移量就可以用殘差的線性函數(shù)定量的表達(dá),每個(gè)測(cè)點(diǎn)校正之后的誤差特性也可以定量的表達(dá)和討論。以下為該命題的數(shù)學(xué)表述與論證過(guò)程:
當(dāng)校正偏移量為-r時(shí)使fmin最小的解滿足
將b1i△xi代入得到:
所以傳統(tǒng)模型求得全局最優(yōu)解時(shí),每個(gè)測(cè)點(diǎn)的校正偏移量為-r/n(負(fù)號(hào)表示與殘差抵消的方向,即為抵消殘差做積極貢獻(xiàn)的方向)。由上述結(jié)論可知,只要能將殘差r的數(shù)值情況定量的表達(dá)出來(lái),就可以定量的表達(dá)校正偏移量的數(shù)字特征。殘差r是平衡關(guān)系中各測(cè)點(diǎn)誤差的線性組合,各測(cè)點(diǎn)誤差是滿足相互獨(dú)立的、參數(shù)各異的高斯分布:N(μi,σ2i)。的分布參數(shù)滿足:
由前述公式可知:當(dāng)且僅當(dāng)?shù)仁阶筮吀黜?xiàng)均相等且均等于-r/(n+1)時(shí),fmin有最小值,即當(dāng)贊=r/(n+1)時(shí),fmin有最小值。關(guān)于其中的符號(hào),也可從工程的角度來(lái)做解釋:由于殘差r在校正過(guò)程中呈縮小趨勢(shì),校正后的殘差贊為[0,r]區(qū)間中較為接近0點(diǎn)的基值,所以與r同向,而校正偏移量△贊由于是抵消r的作用,所以贊與r反向。由于
3.3.1 所有測(cè)點(diǎn)方差相等或近似的情況(無(wú)局部測(cè)點(diǎn)方差較大的情況)
當(dāng)所有測(cè)點(diǎn)方差均相等,即σ1=σ2=…=σn=σ,則:
由圖1可知,隨測(cè)點(diǎn)數(shù)增加,兩種模型計(jì)算結(jié)果均向σ趨近,在達(dá)到0.8σ后增幅極小,并且兩種方法從n=3開始差別極小,即在測(cè)點(diǎn)采樣值標(biāo)準(zhǔn)差相等或相近的情況下,兩種模型處理結(jié)果的數(shù)字特征基本基本相同。
3.3.2 局部測(cè)點(diǎn)方差較大的情況
當(dāng)局部測(cè)點(diǎn)誤差的方差顯著大于其他測(cè)點(diǎn),即
(1)對(duì)于方差較大測(cè)點(diǎn)的分析
傳統(tǒng)模型校正結(jié)果的方差特征:
由圖2可見,當(dāng)標(biāo)準(zhǔn)差倍數(shù)k分別等于2、3、5時(shí)(此時(shí)該測(cè)點(diǎn)初始方差分別為其他測(cè)點(diǎn)的4、9、25倍,具有廣泛的代表性),隨著測(cè)點(diǎn)數(shù)的增加,在達(dá)到0.8σ之后增幅趨緩,即對(duì)于方差顯著較大的測(cè)點(diǎn),傳統(tǒng)模型約以0.7~0.8的比例將該點(diǎn)隨機(jī)誤差減小。
改進(jìn)模型校正結(jié)果的方差特征:
根據(jù)式(21)與(22),兩種模型的方差差異如下:
由圖3可見,就該測(cè)點(diǎn)而言,傳統(tǒng)模型校正后的誤差小于改進(jìn)模型。這是由于傳統(tǒng)模型為了保證嚴(yán)格的平衡約束關(guān)系,將該測(cè)點(diǎn)的誤差硬性分?jǐn)偟狡渌麥y(cè)點(diǎn)上,而改進(jìn)模型則相對(duì)較好的防止了大誤差測(cè)點(diǎn)的誤差擴(kuò)散。
(2)對(duì)于其它測(cè)點(diǎn)的分析
傳統(tǒng)模型校正結(jié)果的方差特征:
改進(jìn)模型校正結(jié)果的方差特征:
根據(jù)式(24)與(25),兩種模型的方差差異如下:
由圖5可見,對(duì)于其他測(cè)點(diǎn),傳統(tǒng)模型校正后誤差的方差均大于改進(jìn)模型,證實(shí)了傳統(tǒng)模型將大誤差測(cè)點(diǎn)的誤差分?jǐn)偟狡渌麥y(cè)點(diǎn)上,使整個(gè)系統(tǒng)的測(cè)點(diǎn)均受到明顯污染,而改進(jìn)模型則相對(duì)穩(wěn)健一些。
本文應(yīng)用概率論及數(shù)理統(tǒng)計(jì)的方法較為詳細(xì)地定量分析并推理了兩種校正模型在單一約束關(guān)系下采樣數(shù)據(jù)隨機(jī)誤差分布情況不同時(shí)的校正效果,根據(jù)概率統(tǒng)計(jì)理論得出的定量結(jié)論可以看出,改進(jìn)模型以一定理論和操作上的優(yōu)勢(shì):
(1)方便運(yùn)用啟發(fā)式算法進(jìn)行可行解的搜索。傳統(tǒng)模型求解過(guò)程要求校正解嚴(yán)格滿足平衡約束關(guān)系。當(dāng)平衡關(guān)系中部分解向量確定后,剩余向量由于與這些向量之間存在由平衡約束關(guān)系決定的相關(guān)關(guān)系而被確定下來(lái),被隨之確定的向量可能嚴(yán)重偏離原始采樣值,卻無(wú)法自行糾正。這使得求解過(guò)程捉襟見肘,實(shí)際操作中很難顧全所有變量。而改進(jìn)模型把等式約束轉(zhuǎn)化成為不等式約束,并將不等式的“傾斜程度”作為優(yōu)化目標(biāo)中的一個(gè)參考量,不但與傳統(tǒng)模型等效,而且在生成解向量的過(guò)程中,維與維之間互不約束,拓展了求解空間,使求解過(guò)程更容易運(yùn)用各種優(yōu)化算法,只在評(píng)判解的適應(yīng)度環(huán)節(jié)中將劣質(zhì)解篩除。
(2)避免個(gè)別測(cè)點(diǎn)依概率產(chǎn)生的大誤差過(guò)分污染其他測(cè)點(diǎn)。傳統(tǒng)校正方法會(huì)有預(yù)處理環(huán)節(jié),校正之前對(duì)顯著誤差進(jìn)行甄別,但無(wú)法確保能將所有顯著誤差甄別出來(lái)。當(dāng)甄別后的數(shù)據(jù)中依然存有顯著誤差時(shí),如果采用傳統(tǒng)模型,由于必須滿足剛性的約束關(guān)系,誤差無(wú)法避免地平攤到其他測(cè)點(diǎn)中。改進(jìn)模型的優(yōu)勢(shì)便在于,平衡約束將發(fā)揮積極的“吸能”效用,將誤差的一部分吸入不等式約束關(guān)系中,以避免其他測(cè)點(diǎn)數(shù)據(jù)受到直接的沖擊。
綜上所述,通過(guò)對(duì)兩種模型性能的統(tǒng)計(jì)特征定量分析,可知改進(jìn)模型更易于進(jìn)行編程求解,在各測(cè)定誤差統(tǒng)計(jì)特征相近時(shí)與傳統(tǒng)模型等效,并在局部測(cè)點(diǎn)誤差較大時(shí),校正效果明顯優(yōu)于傳統(tǒng)模型,可為化工生產(chǎn)決策提供更加科學(xué)的決策支持。
[1]Kuehn,D.R,Davidson H.Computer Control:Mathematics of Control [J].Chem Eng Prog,1961,7(6).
[2]Madron F,Veverka V[J].AIChEJ.,1992,38(2).
[3]袁永根.化工過(guò)程測(cè)量數(shù)據(jù)校正的序貫?zāi)K算法[R].第四屆化工過(guò)程的數(shù)學(xué)模擬分析年會(huì),1993.
[4]王希若,榮岡.高置信度的顯著誤差綜合檢測(cè)法[J].儀器儀表學(xué)報(bào), 2000,21(2).
[5]葉蕾,侍洪波.動(dòng)態(tài)過(guò)程的數(shù)據(jù)校正和過(guò)失誤差的偵破[J].世界儀表與自動(dòng)化,2005,(9).
[6]陳晶.電廠數(shù)據(jù)在線校正系統(tǒng)建模及誤差特征的研究[D].華東理工大學(xué)碩士學(xué)位論文,2009.
(責(zé)任編輯/亦民)
TP274
A
1002-6487(2011)05-0004-04
延樹港(1970-),男,山東東營(yíng)人,博士研究生,研究方向:交通信息數(shù)據(jù)處理。