亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SVR算法的光伏電站工程造價預測研究

        2023-04-10 06:50:36李東偉姚雅婷周子東
        水力發(fā)電 2023年3期
        關鍵詞:電站工程造價變量

        李東偉,姚雅婷,周子東

        (1.中國電建集團華東勘測設計研究院有限公司,浙江 杭州 310014;2.河海大學商學院,江蘇 南京 211100)

        0 引 言

        當前,我國企業(yè)在海外光伏電站項目建設領域已經有一些經驗,但由于海外工程不確定因素較多,且業(yè)主要求嚴苛,競爭者眾多,企業(yè)仍有進一步提高效率、提升競爭力的需求。在工程管理中,工程造價的計量工作貫穿工程建設的全壽命周期,為工程建設提供隨時的價格服務,是成本管控能否成功的關鍵。我國傳統(tǒng)的工程計價主要將工程定額作為設計、咨詢單位進行工、料、機消耗量計算的依據和標準。傳統(tǒng)的定額體系存在著管理途徑有限、與實際工程情況脫節(jié)、缺乏現(xiàn)代理念等缺陷,計價人員在依據定額測算工程造價的同時,需結合自身經驗及市場變化,耗時較長且對于計價人員計價水平的依賴較大,有較強的不確定性,影響企業(yè)的成本管理和控制。由于影響工程造價的因素錯綜復雜,建筑工程造價測算涉及到眾多領域的知識。對建筑工程的造價進行建模預測,可幫助造價人員提前了解工程造價,并在項目建設過程中時刻把握各部分造價的變化。因此,對建筑工程造價管理的一個重點研究方向即建立能進行快速、準確預測的模型。

        引入機器學習方法建立數(shù)學模型,將大大提高效率,在沒有時間進行詳細估算、信息不充分等特殊情況下,提供一種快速估價的方法。為此,本文以海外光伏電站工程為研究對象,引入支持向量回歸(SVR)算法,對該工程造價的分解及對其影響因素進行深入分析并預測總造價,為系統(tǒng)研究光伏電站各部分造價及總造價提供了思路,同時也拓展了支持向量回歸算法在工程造價預測領域的應用。

        1 研究設計

        1.1 研究方法

        對比發(fā)現(xiàn),支持向量回歸(SVR)算法能在小樣本情況下表現(xiàn)出較好的效果[1],適合海外光伏電站項目較少的現(xiàn)狀。采用支持向量回歸算法構建預測模型遵循的一般步驟見圖1。

        圖1 構建預測模型的步驟

        支持向量回歸算法是支持向量機算法在處理回歸問題時的變體,核心在于確定1個與所有樣本點之間的距離總體最小的超平面[2]。其基本思想是將核函數(shù)加入SVM算法中,使非線性問題變?yōu)榫€性問題,從而降低算法的復雜性,且得到與原來一樣的結論[3-4]。算法的性能受核函數(shù)類型的較大影響,常用的類型主要有多層感知機核函數(shù)、多項式核函數(shù)和高斯徑向核函數(shù)[5]。其中,高斯徑向核函數(shù)中的參數(shù)較少,空間復雜度較低,且非線性能力強,同時易實現(xiàn)SVR的優(yōu)化過程[6-9],本文模型擬采用高斯徑向核函數(shù)。

        由于支持向量回歸算法對樣本要求較高,本文引入逐步回歸法進行特征選擇以精簡變量體系,降低變量間的多重共線性。其基本思想是:若判定輸入變量偏回歸平方和顯著,則將其放入回歸模型,并且每增加1個新變量都會對之前已經引入的變量進行檢驗,刪除不顯著變量,保留顯著變量。為保證效果,本文模型采用向前逐步回歸法和向后逐步回歸法相結合的方法。

        1.2 變量體系

        考慮到機器學習算法小樣本的特點,樣本質量對預測結果的影響較大,變量體系的設計尤為重要。因此,需對光伏電站工程進行深入分析,并結合光伏電站結構特點,進行變量體系設計。

        1.2.1 光伏電站造價劃分及輸出變量的確定

        本文在實踐經驗的基礎上,借鑒了傳統(tǒng)劃分方式及學者馬翠萍[10]、魯正[11]的優(yōu)秀成果,最終將光伏電站工程造價劃分為3大類7個模塊,見表1。本文所指電站造價僅包含發(fā)電系統(tǒng)和升壓變電站(簡稱升壓站)2部分及其他必要費用,將其總造價劃分為光伏場區(qū)采購及建安工程費用、升壓站采購及建安工程費用、其他費用等3大類,不考慮間接費。由于電站設備及材料購置費、土建費用及安裝調試費用(以下將三者統(tǒng)稱為“建安工程費”)占到80%以上,而根據相關計價標準規(guī)定,將建安工程費作為基準,乘以取費費率即可得到其他部分的價格。因此,主要測算光伏場區(qū)和升壓站的設備采購和建安工程費。

        表1 光伏電站造價模塊劃分

        根據理論和實踐經驗,將光伏電站場區(qū)的重點部分單獨提取作分析,每個模塊再劃分基本項作為模型輸出變量。考慮將占總造價比例較大的分部工程(組件、結構構件、電路系統(tǒng))單獨提取出,結構構件即用以支撐光伏組件穩(wěn)定的設備,包括支架和樁基礎;電路系統(tǒng)是光伏發(fā)電系統(tǒng)中電力的主要電力設備,包括逆變器和箱式變壓器??紤]海外項目海運費用占電站總造價的比例較大且變化多、風險大,將物流費用單獨進行預測。項目管理及一般費用、勘測設計費均與電站總容量有較大相關性,因此進行統(tǒng)一預測。最終,提煉出如表2所示6個需要進行預測的部分作為本文模型的輸出變量。剩余基本項由于透明易得,均作為已知項直接給出。

        表2 輸出變量及其內涵界定

        1.2.2 影響因素分析及輸入變量的確定

        在分析光伏電站結構的基礎上,通過專家訪談、調查問卷等方式,得出影響海外光伏電站造價的所有因素并轉化為相應的變量,進一步將所有輸入變量劃分為普遍輸入變量和特殊輸入變量,得到本文的輸入變量體系,并對變量內涵進行界定。輸入變量及其內涵界定見表3。將所有變量匯總,各變量間關系見圖2。

        圖2 變量間關系

        表3 輸入變量及其內涵界定

        2 預測模型構建

        2.1 樣本準備

        2.1.1 數(shù)據來源

        本文以某公司的海外光伏電站項目為例構建預測模型,國別因素對應的項目所在國人均GDP數(shù)據來源于國家統(tǒng)計局,其他項目數(shù)據全部來自該公司海外光伏電站項目的實際報價表。從報價表中分別摘取所需數(shù)據并進行整理,對于報價表中少量缺失的數(shù)據,結合工程實際進行計算填充。本文分析以美洲區(qū)域數(shù)據為例,選定12個項目作為樣本,其中,哥倫比亞6個,智利2個,巴西、巴拿馬、多米尼加、秘魯各1個,項目規(guī)模最小50 MW,最大409 MW。

        2.1.2 數(shù)據預處理

        采用機器學習算法構建預測模型時,數(shù)據是模型學習規(guī)律的重要參照,樣本數(shù)據本身的質量直接影響到模型最終的預測效果。因此,在構建模型前對樣本數(shù)據進行預處理,以保證模型性能。

        首先,考慮到支持向量回歸算法對于輸入數(shù)據中的缺失值比較敏感,在收集數(shù)據后,針對由于數(shù)據可獲得性而出現(xiàn)的缺失和異常數(shù)據,根據造價人員的專業(yè)建議進行填補和修正,得到了較為完善的數(shù)據。其次,作為樣本數(shù)據,各輸入變量值的量綱可能會有所不同,若差別較大,算法會有選擇地忽略量級較小的變量數(shù)據,或減小其比重,進而影響到數(shù)據分析的結果和算法的預測效果。因此,本文在構建模型之前,先對數(shù)據進行了歸一化處理,以符合分析要求,保證得出的變量關系不受影響。采用python 3.9內已包含的min-max標準化法代碼包,實現(xiàn)min-max標準化方式處理樣本數(shù)據。具體公式如下

        (1)

        式中,x為待標準化的樣本值;x′為樣本值標準化結果;n為樣本數(shù)量;x1,x2,…,xn為變量x對應的所有樣本值。經過數(shù)據填補、修正及標準化處理,得到了標準、完善的樣本數(shù)據,為構建預測模型奠定基礎。

        2.2 模型構建

        2.2.1 逐步回歸分析

        本文將向前逐步回歸法和向后逐步回歸法結合做雙向逐步回歸,將前文分析得到的變量體系,采用python 3.9實現(xiàn)。主要步驟及實現(xiàn)見圖3。

        圖3 逐步回歸分析步驟

        (1)導入數(shù)據。采用python 3.9中的pandas庫導入excel數(shù)據。

        (2)手動定義1個逐步回歸函數(shù),使其同時具備向前篩選和向后篩選的功能,設置逐步回歸函數(shù)的主要代碼如下

        def stepwise(x,y,alpha_in=0.15,alpha_out=0.20)

        上述代碼中,x為所有輸入變量構成的數(shù)據框架;y為輸出變量。設可選入的輸入變量的顯著性水平上限為alpha_in,本文將其設置為0.15,即顯著性水平小于0.15的變量均可選入模型,剔除變量的顯著性水平下限為alpha_out,本文設置為0.20,即顯著性水平大于0.20的變量均應從模型中剔除。向前篩選功能的實現(xiàn):用所有還未選入的輸入變量與選入變量的子集建立一元或多元線性回歸方程,當所有回歸方程中得到的最小的p值(回歸方程自變量系數(shù)的p檢驗統(tǒng)計量的值)小于引入變量的顯著性水平α(alpha_in)時,則作為引入變量。向后篩選功能與向前篩選恰好相反,先將所有變量作為選入變量,再逐步剔除,當其中最大的p值大于剔除變量的顯著性水平α(alpha_out)時,則剔除。

        (3)引入數(shù)據。采用函數(shù)得出重要輸入變量,將步驟(1)中導入的數(shù)據應用于步驟(2)定義的函數(shù)中,即

        result=stepwise(x,y)

        (2)

        (4)用上一步中得到的重要輸入變量進行最小二乘回歸分析,得到模型逐步回歸結果,見表4。

        表4 逐步回歸方法篩選變量結果及其回歸系數(shù)

        經過向前向后逐步回歸法的篩選,保留了p值小于0.10的顯著變量,考慮到有些變量對模型的影響可能較復雜,同時保留了p值位于0.15~0.25之間的變量,最終每個輸出變量只保留1~3個輸入變量,避免了輸入變量之間的多重共線性對模型的影響,精簡了變量體系,提高了模型精度和泛化能力,得到的參數(shù)估計值均與實踐經驗相符。同時也發(fā)現(xiàn),在采用逐步回歸方法做簡單回歸分析得到的結果中,模型表現(xiàn)不及預期,究其原因,一方面,由于樣本數(shù)量少,不能滿足回歸分析的樣本要求;另一方面,各個部分的影響因素對其產生影響的途徑和方式比較復雜,不一定是簡單的線性關系,在無法確定其關系時,回歸分析性能受到影響,難以得出有效的結果。

        2.2.2 支持向量回歸

        采用向前向后逐步回歸法對變量體系進行進一步精簡后,將剩余的顯著變量輸入SVR模型中進行分析。由于海外光伏電站樣本數(shù)量限制,可充分利用SVR模型優(yōu)秀的小樣本學習能力,得出更為精確的預測結果,同時保證模型的泛化能力。根據SVR算法的基本原理,構建基于向前向后逐步回歸法的SVR模型,并采用python 3.9實現(xiàn),主要步驟見圖4。

        圖4 SVR算法應用步驟

        (1)劃分訓練集和測試集數(shù)據。本文直接引用python 3.9的sklearn庫中內置的模型實現(xiàn)訓練集和測試集的劃分??紤]樣本有限,需要適當控制2個集合的樣本數(shù)量,以保證模型結果的準確性。本文將test size參數(shù)設置為0.20,即將全部樣本的20%用作測試集,80%用作訓練集,即

        x_train,x_test,y_train,y_test

        train_test_split(x,y,test_size=0.20)

        (2)數(shù)據歸一化。防止數(shù)據量級差別大影響模型預測精度。

        (3)構建SVR模型。本文采用高斯徑向核函數(shù)進行輸入變量的映射,以解決非線性問題。python 3.9中自帶有SVR模型包,用如下代碼可得到

        from sklearn.svm import SVR

        svr=SVR(kernel=‘rbf’,C=le3,gamma=0.10)

        上述代碼中,rbf即高斯徑向核函數(shù);C和gamma是模型中的參數(shù)。C表示懲罰因子,代表著模型對離群數(shù)據的重視程度,趨近無窮時模型會過擬合;gamma是核函數(shù)的核系數(shù),gamma越大,模型越容易出現(xiàn)過擬合和泛化誤差,即對訓練集的擬合程度越好,而對測試集的擬合優(yōu)度越差。經過多次嘗試,本文最終設置C為1e3,gamma為0.10時,得到了較好的效果。

        (4)利用訓練集數(shù)據訓練模型,即

        svr,fit(x_train,y_train)

        (5)采用測試集數(shù)據檢驗模型性能。本文采用R2擬合優(yōu)度、均方差MSE、平均絕對誤差MAE評估模型效果。

        (6)對模型結果進行反歸一化處理,得到最終預測值。并將預測值和真實值進行對比分析。

        本文對預測結果的具體值進行分析,采用R2擬合優(yōu)度、MSE、MAE分別衡量6個模型的預測精度,評價結果見表5。從表5可知,擬合優(yōu)度大于0.90,表明模型預測精度較高;MSE和MAE均小于0.10,表示模型預測的誤差較小,本文構建的基于逐步回歸法的SVR模型的預測精度和泛化性能達到了預期。SVR算法對數(shù)據的依賴較大,因此前期充分、有效的變量篩選和數(shù)據處理可保證最終模型的預測精度和泛化性能,本文在這2個方面做了大量工作,充分結合文獻成果和實踐經驗,為模型的最終結果奠定了良好的基礎。

        表5 模型結果評價

        3 結 語

        本文將海外光伏電站作為主要研究對象,將光伏電站總造價進行分解,得出6個需要預測的基本項,構建了基于向前向后逐步回歸法的SVR模型預測海外光伏電站工程造價,得出以下結論:

        (1)將光伏電站造價劃分為組件及支架安裝、樁基礎、場區(qū)其他部分、升壓站、物流費用和其他費用6個待預測部分,并通過專家訪談和調查問卷的形式得到各部分的影響因素,據此設計出模型的變量體系,為系統(tǒng)研究光伏電站各部分造價及總造價提供了思路,可為我國企業(yè)積極建設國內外光伏電站提供參考。

        (2)將SVR算法和逐步回歸法結合建立造價預測模型,模型預測精度較高。該模型融合了逐步回歸法篩選顯著變量的優(yōu)勢和SVR算法在小樣本預測方面的優(yōu)勢,避免了傳統(tǒng)預測方法的缺陷,為造價預測模型研究提供了新的思路。

        猜你喜歡
        電站工程造價變量
        三峽電站再創(chuàng)新高
        抓住不變量解題
        也談分離變量
        低影響開發(fā)(LID)在光伏電站中的應用
        如何加強工程造價管理有效的控制工程造價
        工程造價之旅
        SL(3,3n)和SU(3,3n)的第一Cartan不變量
        分離變量法:常見的通性通法
        對工程造價進行審計的幾點思考
        如何有效控制工程造價
        日产国产亚洲精品系列| 色狠狠一区二区三区香蕉| 风流少妇又紧又爽又丰满| 杨幂Av一区二区三区| 久久中文字幕av一区二区不卡| 日韩亚洲一区二区三区四区 | 国产成人小视频| 日本一区二区视频高清| 国产亚洲精品久久久久久国模美| 国产亚洲精品久久久ai换| 女人与牲口性恔配视频免费| 91自国产精品中文字幕| 久久精品国产在热亚洲不卡| 国产精品成人无码久久久久久| 初尝人妻少妇中文字幕| 天天做天天爱天天爽综合网| 91短视频在线观看免费| 亚洲国产成人av第一二三区| 日本精品久久不卡一区二区 | 国产亚洲精久久久久久无码| 无码熟妇人妻av在线c0930| 亚洲精彩av大片在线观看| 老熟女富婆激情刺激对白| 国产 字幕 制服 中文 在线| 国产男女插插一级| 国产91精品清纯白嫩| 久久婷婷综合激情亚洲狠狠| 最新露脸自拍视频在线观看| 国产精品美女久久久久久| 亚洲国产韩国欧美在线| 亚色中文字幕| 中文字幕文字幕一区二区| 日韩日韩日韩日韩日韩日韩日韩| 一本一道波多野结衣av中文| 国产男女插插一级| 最全精品自拍视频在线| 青青草原综合久久大伊人精品| 亚洲av无码久久| 中文字幕精品久久久久人妻红杏1| 日产精品一区二区三区免费 | 亚洲精品国产av成人精品|