國家燃?xì)庥镁弋a(chǎn)品質(zhì)量監(jiān)督檢驗中心(佛山) 張明偉
熱效率是燃?xì)庠罘浅V匾臒峁ば阅苤笜?biāo),因而國家強制要求檢測燃?xì)庠畹臒嵝?。熱效率的檢測會受到燃?xì)鉄嶂?、燃?xì)鉁囟纫约皽y量環(huán)境的溫度等因素的影響。理想的外在條件是采用燃?xì)獾臉?biāo)準(zhǔn)熱值,測試環(huán)境和燃?xì)鉁囟染跇?biāo)準(zhǔn)狀態(tài)下。但是在實際的測試過程中,滿足這樣的條件是存在一定困難的,因此國家標(biāo)準(zhǔn)GB16410-2007中,允許這些外在影響因素可以在一定范圍內(nèi)變化。從檢測的角度,需要了解這些外在因素對燃?xì)庠顭嵝实挠绊懗潭?,提出高精度測量燃?xì)庠畹男路椒ā?/p>
另一方面,在不同的季節(jié)測量的同一款燃?xì)庠畹臒嵝蕰休^大的波動,這種波動對于燃?xì)庠钛邪l(fā)具有較大的干擾性,無法確認(rèn)燃?xì)庠顭嵝实淖兓莵碜酝庠谝蛩剡€是燃?xì)庠畹淖陨斫Y(jié)構(gòu)。因而,也需要了解外在因素對燃?xì)庠顭嵝蕼y量的影響規(guī)律。
建立物理模型來分析這些外在因素的變化是困難的,因為目前尚無法建立一個較為準(zhǔn)確的物理模型來計算燃?xì)庠畹臒嵝??;诖罅康娜細(xì)庠顭嵝实臏y試數(shù)據(jù),可以采用機器學(xué)習(xí)的方法,通過數(shù)據(jù)挖掘的方式對外在環(huán)境因素的影響進行分析。隨機森林算法(Rondom forest algorithm)是一種集成機器學(xué)習(xí)算法,隨機森林由很多的樹組成,每一棵樹之間沒有關(guān)聯(lián)。采用自助采樣法帶來的樣本擾動和對屬性隨機抽取帶來的屬性擾動,使得作為隨機森林基學(xué)習(xí)器的樹具有“多樣性”。隨機森林可以用于分類和回歸,具有計算開銷小、泛化性能強、可以擬合復(fù)雜的非線性函數(shù)等諸多優(yōu)點。
本文利用實驗數(shù)據(jù)通過隨機森林算法的學(xué)習(xí)和驗證,建立外部因素的熱負(fù)荷和熱效率的關(guān)系模型,并通過模型進行影響因素重要性分析。
2.1.1 構(gòu)建模型
實驗獲得的485組數(shù)據(jù)中,數(shù)據(jù)集的75%的劃分為訓(xùn)練集,其余25%劃分為測試集。特征為室溫波動、燃?xì)鉁囟炔▌雍偷蜔嶂挡▌?,?biāo)記為熱效率。采用隨機森林機器學(xué)習(xí)算法,使用交叉驗證法得到最優(yōu)參數(shù)。訓(xùn)練得到熱效率預(yù)測模型,探究三個外部因素(室溫、燃?xì)鉁囟群偷蜔嶂担嵝实挠绊憽?/p>
2.1.2 模型分析
測試集和訓(xùn)練集熱效率預(yù)測值與實際值的關(guān)系、模型預(yù)報熱效率的絕對誤差和相對誤差分別如圖2-1、2-2和2-3所示。
圖2-1 模型測試集和訓(xùn)練集熱效率預(yù)測值與實際值關(guān)系
圖2-2 模型熱效率預(yù)報的絕對誤差
圖2-3 模型熱效率預(yù)報的相對誤差
輸出顯示,測試數(shù)據(jù)熱效率平均絕對誤差為1.147%,訓(xùn)練數(shù)據(jù)熱效率平均絕對誤差為0.549%。統(tǒng)計結(jié)果表明,對于熱效率絕對誤差[-2,2]%內(nèi),占所有數(shù)據(jù)集的97.13%;對于熱效率相對誤差[-0.03,0.03]內(nèi),占所有數(shù)據(jù)集的97.13%,這些表明模型性能良好。
此外,對于三個輸入特征:室溫波動、燃?xì)鉁囟炔▌雍偷蜔嶂挡▌樱卣髦匾确謩e為0.26725、0.28533和0.44742。
根據(jù)建立的模型,進行了影響因素的特征重要程度分析,分析結(jié)果如圖2-4所示。從圖2-4可以看到,對熱效率影響的重要程度最大的是燃?xì)獾蜔嶂档牟▌?,其次是燃?xì)鉁囟炔▌?,最后才是室溫波動?/p>
圖2-4 三個熱效率預(yù)測模型中的特征重要程度
利用所建立的數(shù)據(jù)模型,對室溫、燃?xì)鉁囟群偷蜔嶂祵嵝实挠绊戇M行了單變量分析。
燃?xì)鉄嶂?、燃?xì)鉁囟纫约笆覝貙嵝实膯巫兞坑绊懛謩e如圖2-5、2-6、2-7所示。
燃?xì)鉄嶂祵θ細(xì)庠顭嵝实挠绊懛浅o@著,一般地,采用高熱值燃?xì)鉁y量的熱效率要低于采用低熱值燃?xì)獾臏y量結(jié)果。因此在進行燃?xì)庠顭嵝蕼y量,如果有條件,盡量保證燃?xì)鉄嶂档姆€(wěn)定。
燃?xì)鉁囟仍?8-22℃范圍內(nèi),對燃?xì)庠顭嵝实臋z測影響非常劇烈,這個區(qū)域是檢測燃?xì)庠畹闹饕細(xì)鉁囟葏^(qū)域。因而燃?xì)鉁囟鹊木_測定對燃?xì)庠顭嵝蕶z測精度意義重大。
觀察到,隨室溫增加,熱效率波動下降,22℃之后又波動上升;隨燃?xì)鉁囟仍黾?,熱效率波動較大,整體呈增加趨勢,最后趨于平緩;隨低熱值增加,熱效率波動下降。
圖2-5 低熱值與熱效率關(guān)系
圖2-6 燃?xì)鉁囟扰c熱效率關(guān)系
圖2-7 室溫與熱效率關(guān)系
(1)隨機森林算法適用于研究環(huán)境、氣源條件對燃?xì)庠顭嶝?fù)荷和熱效率的影響。利用隨機森林算法可以成功地建立室溫、燃?xì)鉁囟?、低熱值與燃?xì)庠顭嵝实年P(guān)系模型,模型能夠較好地預(yù)報熱效率。
(2)在室溫、燃?xì)鉁囟?、低熱值三個因素中,對熱負(fù)荷影響重要程度為低熱值>室溫>燃?xì)鉁囟龋粚嵝视绊懼匾潭葹榈蜔嶂担救細(xì)鉁囟龋臼覝亍?/p>
(3)在燃?xì)庠畹臒嵝蕶z測中盡量保持燃?xì)鉄嶂档姆€(wěn)定,提高燃?xì)鉁囟鹊臏y量精度可以提高燃?xì)庠顭嵝实臏y量精度。