姜 勇,韋朝奧,陳紹輝,陳 亮,張愛輝,陳 余
(云南電網(wǎng)有限責(zé)任公司大理供電局,云南大理 671000)
在許多研究領(lǐng)域中,數(shù)學(xué)模型是對復(fù)雜系統(tǒng)進(jìn)行合理分析的最常用方法。而且知道模型開發(fā)過程中的一個(gè)重要步驟是參數(shù)識別(PI),即通過分析最小化模擬結(jié)果和測量值之間的差異來確定未知模型參數(shù)。但是需要注意的是即使是在確定性條件下進(jìn)行測量,也很難獲得精確有效的參數(shù),如最大生長速率和底物親和常數(shù)[1]的確定。況且在實(shí)際測量過程中常常伴隨著噪聲干擾,因此測量所得的估計(jì)參數(shù)具有明顯的不確定性[2],這一現(xiàn)象的存在使得模型質(zhì)量難以得到保證,但是研究發(fā)現(xiàn)具有較小方差的參數(shù)可以保證模擬結(jié)果具有高精度的預(yù)測能力。基于此,參數(shù)識別(PI)在保證預(yù)測結(jié)果有效合理這一方面便顯得至關(guān)重要,同時(shí)針對PI所進(jìn)行的適當(dāng)實(shí)驗(yàn)設(shè)計(jì)也被稱為優(yōu)化實(shí)驗(yàn)設(shè)計(jì)(OED)。
OED作為系統(tǒng)生物學(xué)領(lǐng)域中的一個(gè)重要方法,其主要由兩個(gè)步驟組成:(1)通過可用的實(shí)驗(yàn)數(shù)據(jù)確定來自PI的參數(shù)變化;(2)通過在新的實(shí)驗(yàn)中對系統(tǒng)進(jìn)行“最佳地”刺激來使參數(shù)變化實(shí)現(xiàn)最小化。當(dāng)然,這些步驟可以重復(fù)進(jìn)行,直到參數(shù)滿足合適的準(zhǔn)確度。在此過程中常利用基于費(fèi)舍爾信息矩陣(FIM)的逆矩陣[3]來獲取有關(guān)估計(jì)參數(shù)的統(tǒng)計(jì)信息。但是如果模型參數(shù)是非線性的,那么FIM便有可能導(dǎo)致最終的方差與實(shí)際值具有偏差。為了克服這個(gè)問題,目前已經(jīng)開發(fā)出多種改進(jìn)參數(shù)不確定性的計(jì)算方法,而這些計(jì)算方法大多是基于Bootstrap方法[4]的。
基于對目前OED研究現(xiàn)狀以及所面臨問題的掌握,將在本文中驗(yàn)證基于SP方法的應(yīng)用對于參數(shù)統(tǒng)計(jì)量近似值的獲取是有利的。而且將給出PI和OED的基礎(chǔ)知識,此外,也將對FIM、基于Bootstrap和SP的方法進(jìn)行介紹,并對它們在OED中的應(yīng)用進(jìn)行評估,同時(shí)通過一個(gè)簡單的生物反應(yīng)器模型來對基于SP方法的OED進(jìn)行說明分析。
參數(shù)識別(PI)是模型開發(fā)過程中的一項(xiàng)步驟,其對于數(shù)學(xué)模型的建立以及結(jié)果的可靠性獲取有著至關(guān)重要的作用。PI的有效進(jìn)行主要依賴于常微分方程的建立與計(jì)算,具體表達(dá)式如下:
在表達(dá)式(1-3)中,x(t)表示動(dòng)態(tài)狀態(tài),u(t)表示系統(tǒng)輸入量,w(t)表示測量過程中的噪聲干擾量,t為具體測量時(shí)間,其中參數(shù)u的大小將決定數(shù)學(xué)模型的預(yù)測能力,同時(shí)也可對仿真結(jié)果的加權(quán)區(qū)進(jìn)行表達(dá)。
但是在具體計(jì)算過程中,需要將成本函數(shù)表達(dá)式(3)最小化,進(jìn)而通過表達(dá)式(2)得到預(yù)先定義的輸入量u(t),其中u為模型參數(shù)的估計(jì)值。此外,由于非線性模型可能導(dǎo)致結(jié)果產(chǎn)生偏差,所以在計(jì)算過程中需要增加平均值與矩陣,以此來保證模型的計(jì)算精度。而且如果已確定參數(shù)的協(xié)方差太大,則可以另外選擇更加合理的實(shí)驗(yàn)條件來降低協(xié)方差的值,從而使其一直保持在合理穩(wěn)定的范圍內(nèi)。換言之,就是利用輸入量來給模型提供額外自由度,當(dāng)然,這種方法也是OED的主要思想。
目前,OED作為一種數(shù)值優(yōu)化方法,主要通過對變量進(jìn)行調(diào)整來降低參數(shù)的不確定性,而如果要將這個(gè)優(yōu)化過程程式化,則需要定義一個(gè)基于參數(shù)偏差和協(xié)方差矩陣的標(biāo)量成本函數(shù),將具體的優(yōu)化準(zhǔn)則定義如下:
公式(7-8)中,λ作為特征根,在計(jì)算過程中主要依賴模型和設(shè)計(jì)參數(shù)來求得,因此可以知道,目前并沒有通用的方法來對Co進(jìn)行預(yù)測。
研究發(fā)現(xiàn),OED在數(shù)值優(yōu)化過程中可以通過改變設(shè)計(jì)參數(shù)來降低參數(shù)的不確定性,而在參數(shù)改善過程中,由于參數(shù)之間沒有相關(guān)性,所以需要在保證原有參數(shù)估計(jì)范圍不再增大的前提下引入入口流的概念。入口流在數(shù)據(jù)測量過程中可以快速找到參數(shù)測量的最優(yōu)軌跡,從而將測量信息內(nèi)容最大化,繼而降低參數(shù)方差。將入口流定義為以下線性函數(shù):
此線性函數(shù)可以構(gòu)建高效合理的入口輪廓,并將其用于改進(jìn)這種簡單的非結(jié)構(gòu)化增長模型的參數(shù)精度[5]過程中?;诖耍琌ED數(shù)據(jù)預(yù)測過程中目標(biāo)函數(shù)值不能有效降低的問題得到了有效解決。但是目前OED使用過程中仍面臨著兩個(gè)關(guān)鍵性問題,即如何獲得參數(shù)協(xié)方差矩陣和均值。
在本節(jié)中將在對PI和OED基礎(chǔ)知識了解的前提下具體討論FIM、基于Bootstrap和SP的方法,同時(shí)選擇合適的方法來對OED所面臨的兩個(gè)關(guān)鍵性問題(如何獲得參數(shù)協(xié)方差矩陣和均值)進(jìn)行解決。
對于FIM,在考慮測量噪聲存在的基礎(chǔ)上將其定義為:
同時(shí)將公式(10)內(nèi)的參數(shù)靈敏度矩陣Stn定義如下:
本式中,tn為測量時(shí)間。但是由于測量時(shí)間的確定依賴于動(dòng)態(tài)狀態(tài),所以在求解過程中需要結(jié)合公式(2)、(7),計(jì)算結(jié)果可得:
雖然最后所得C0就OED來說具有一定的有利影響,但是研究發(fā)現(xiàn),F(xiàn)IM-1在某些復(fù)雜模型中可能會對實(shí)際協(xié)方差造成估計(jì)失誤。所以基于FIM的OED在非線性模型中并不適用。
接下來,對基于Bootstrap的方法進(jìn)行簡要介紹。Boot?strap的根計(jì)算主要依賴于蒙特卡羅方法[6],此方法通過隨機(jī)創(chuàng)建的虛擬測量向量來使得樣本的均值、協(xié)方差與實(shí)際分布保持一致,具體表達(dá)式如下:
但是運(yùn)算后可以發(fā)現(xiàn),在基于Bootstrap的方法中,只有當(dāng)重復(fù)樣本數(shù)量B趨于無窮的時(shí)候才可以對Cy進(jìn)行有效計(jì)算,同時(shí)在OED進(jìn)行預(yù)測計(jì)算的過程中也需要保證精度和計(jì)算量之間是處于平衡狀態(tài)的。
然后,對基于SP的方法進(jìn)行論述。SP的基本思想是通過非線性映射來對高維空間隨機(jī)向量的期望和方差進(jìn)行確定[7],具體參照表達(dá)式為:
在公式(16)中,ξ為測量值,η為模型估計(jì)參數(shù)。其在對隨機(jī)向量的方差的確定過程中首先會生成一個(gè)高維空間樣本yn:
高維空間樣本生成后,利用樣本yn便可對隨機(jī)向量方差進(jìn)行確定,進(jìn)而確定參數(shù)向量、協(xié)方差矩陣以及均值,計(jì)算公式如下:
如上所述,對FIM、基于Bootstrap和SP方法的參數(shù)計(jì)算過程進(jìn)行了敘述,并且利用基于SP方法解決了OED執(zhí)行過程中所面臨的兩個(gè)關(guān)鍵性問題。同時(shí)發(fā)現(xiàn)與FIM和基于Bootstrap方法相比,基于SP的方法在OED執(zhí)行過程中有以下五項(xiàng)優(yōu)點(diǎn):(1)與FIM方法相比,SP方法不僅可以得到協(xié)方差矩陣的下限,而且可以在測量參數(shù)噪聲不大的情況下得到更精確的參數(shù)估計(jì)量;(2)SP方法不需對參數(shù)識別過程進(jìn)行假設(shè),只需通過一些數(shù)值計(jì)算的方法就可以對參數(shù)進(jìn)行識別;(3)SP方法不需計(jì)算梯度或雅克比行列式。這樣就適用于更多的模型,例如Monte carlo模型;(4)SP模型的計(jì)算方法比較簡單,直觀;(5)SP方法對樣本的選擇是隨機(jī)但合理的,而所需樣本的數(shù)量也比Bootstrap小很多。結(jié)合以上SP方法的優(yōu)點(diǎn),可以知道SP方法的應(yīng)用對于參數(shù)統(tǒng)計(jì)量近似值的獲取是有利的。
在第三節(jié)中,對FIM、基于Bootstrap和SP方法進(jìn)行了論述,同時(shí)解決了OED執(zhí)行過程中面臨的兩個(gè)關(guān)鍵性問題。而在本節(jié)中,將通過一個(gè)廣泛使用的生物模型來對基于SP方法的OED進(jìn)行說明分析,并由此驗(yàn)證之前對于相關(guān)問題的解決是科學(xué)合理的。
對于所構(gòu)建的生物模型,假設(shè)其反應(yīng)器的出口流量和入口流量相等,其他諸如稀釋率、生物質(zhì)濃度以及反應(yīng)物濃度等影響因素可以利用表達(dá)式表示為:
公式(23-24)中的待定生長速率μ可由公式(25)確定:
在對此生物模型進(jìn)行構(gòu)建的過程中發(fā)現(xiàn)其并不能讓對生物學(xué)機(jī)制具有更深層次的理解,但是它卻可以證明SP方法對于非線性模型的建立以及最小化參數(shù)協(xié)方差矩陣的確定是可行的。通過表達(dá)式可以發(fā)現(xiàn)該生物模型有三個(gè)參數(shù):(1)Yx|s,此產(chǎn)量因子描述了生成物數(shù)量主要與底物的吸收量有關(guān);(2)μm,該自變量表示生長速率;(3)Ks的上限。同時(shí)為了使生物模型得到最大限度的簡化,假設(shè)Yx|s在相關(guān)文獻(xiàn)中已知?;诖耍瑢⒃诙S的參數(shù)空間進(jìn)行生物模型的構(gòu)建以及證明分析。
在生物模型構(gòu)建完成后,將對參數(shù)可識別性、估計(jì)參數(shù)的置信區(qū)間以及參數(shù)不確定性的確定依次展開敘述,從而對基于SP方法的OED進(jìn)行具體的說明分析。
在對參數(shù)進(jìn)行識別之前,需要檢查未知參數(shù)在原則上是否可用。但是這一過程卻意味著測量數(shù)據(jù)的取用將會受到時(shí)間間隔長短的影響。為了避免這種影響,假設(shè)初始底物濃度是已知的。
于是可以得到:
根據(jù)K與μm可知,SP在理論上是完全可行的。
其次,將從包括FIM、基于Bootstrap和SP方法在內(nèi)的三個(gè)方法對估計(jì)參數(shù)的置信區(qū)間進(jìn)行介紹:(1)基于Bootstrap方法的有效應(yīng)用關(guān)鍵在于樣本數(shù)目的正確選擇,即樣本的數(shù)量是否足夠。如果樣本數(shù)量滿足模型構(gòu)建要求,那么便可以快速獲得估計(jì)參數(shù)的平均值以及其所對應(yīng)的協(xié)方差矩陣;(2)對基于SP的方法進(jìn)行測試。測試表明如果在OED運(yùn)行過程中增加一個(gè)測量標(biāo)量和三個(gè)測量時(shí)間點(diǎn),那么便可以適當(dāng)減少計(jì)算工作量,而且預(yù)期的運(yùn)行檢測結(jié)果仍可以被保證。由此表明基于SP的方法對復(fù)雜模型的構(gòu)建分析將是重要的;(3)由于FIM是基于無偏差參數(shù)估計(jì)的,所以它只能提供有關(guān)協(xié)方差的信息,而不提供估計(jì)值的平均值。由于合適范圍內(nèi)的估計(jì)值平均值對于參數(shù)不確定性的降低有作用,所以據(jù)此可知FIM并不適用于OED的運(yùn)行檢測。
根據(jù)以上三種方法在估計(jì)參數(shù)的置信區(qū)間內(nèi)的應(yīng)用合理性分析,知道基于SP的方法較其他兩種方法來說有著便于模型構(gòu)建以及減少運(yùn)行工作量的優(yōu)點(diǎn)。
最后,將對生物模型的參數(shù)不確定性進(jìn)行論述?;谝陨戏治隹梢园l(fā)現(xiàn)FIM和基于SP的方法適用于擴(kuò)展模型的構(gòu)建,但是由于其所對應(yīng)的置信區(qū)域不一致,所以FIM和基于SP的方法計(jì)算所得的協(xié)方差矩陣也并不相同。在生物模型構(gòu)建過程中提到了入口流量這一概念,而在應(yīng)用過程中可以發(fā)現(xiàn),基于SP的方法可以將入口流量定義為設(shè)計(jì)變量,從而有效降低參數(shù)不確定性。
換言之,基于SP的方法可以利用優(yōu)化設(shè)計(jì)標(biāo)準(zhǔn)成為設(shè)計(jì)變量的最優(yōu)選擇,同時(shí)也可以發(fā)現(xiàn),基于SP的方法在進(jìn)行優(yōu)化設(shè)計(jì)實(shí)驗(yàn)后,能夠快速對參數(shù)協(xié)方差矩陣進(jìn)行確定[8-9]。也就是說基于SP的方法可以在最短的時(shí)間內(nèi)對參數(shù)進(jìn)行準(zhǔn)確性預(yù)測,而且之前對于相關(guān)問題的解決也是科學(xué)合理的。
綜上所述,在本文中對FIM、基于Bootstrap和SP的方法分別進(jìn)行了介紹,并對它們在OED中的應(yīng)用進(jìn)行了評估,評估結(jié)果表明傳統(tǒng)的FIM方法并不能完全適用于OED,而基于SP的方法卻可以有效解決OED在檢測過程中所遇到的問題。同時(shí)通過一個(gè)簡單的生物反應(yīng)器模型對基于SP方法的OED進(jìn)行說明分析。且從分析結(jié)果中可以發(fā)現(xiàn)基于SP方法的應(yīng)用對于參數(shù)統(tǒng)計(jì)量近似值的獲取是有利的,也就是說基于SP的方法可以有效提高OED的執(zhí)行能力以及檢測速度。
[1]HOLMBERG A..On the practical identifiability of micro?bial growth models incorporating Michaelis–Menten type nonlinearities[J] .Mathe.Biosci.,1982,62:23-43.
[2] WALTER P.L..Identification of parametric models(Springer,1997).
[3] KAY S.M..Fundamentals of statistical signal process?ing: estimation theory(Prentice Hall PTR,1993).
[4] EFRON B., TIBSHIRANI R.J..An introduction to the bootstrap(Chapman&Hall,1993).
[5]BALTES M.,SCHEIDER R.,STURM C.,et al.Opti?mal experimental design for parameter estimation in un?structured growth models [J] .Biotechnol.Prog.,1994(10):480-488.
[6] EMERY A.F.,NENAROKOMOV A.V..Optimal exper?iment design [J].Meas.Sci.Technol.,1998 (9):864-876.
[7] JULIER S.,UHLMANN J..A general method for ap?proximating nonlinear transformation of probability distri?butions,1996.
[8]董煒,沈金榮,惠杰,等.基于全生命周期管理的微電網(wǎng)設(shè)備管理系統(tǒng)[J].機(jī)電工程,2017(11):1330-1333.
[9] GUTENKUNST R.N.,WATERFALL J.J.,CASEY F.P.,et al.Universally sloppy parameter sensitivities in systems.biology models’,PLoS Comput.Biol.,2007,3:1871-1878.