亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于k -fold交叉驗證的代理模型序列采樣方法

        2022-04-20 14:30:14李正良彭思思
        計算力學學報 2022年2期
        關鍵詞:計算成本多邊形代理

        李正良, 彭思思, 王 濤*

        (1.重慶大學 土木工程學院,重慶 400045;2.重慶大學 山地城鎮(zhèn)建設與新技術教育部重點實驗室,重慶 400045)

        1 引 言

        對于一些較為復雜的實際工程問題,常采用物理實驗和仿真模擬進行深入探究和分析,但這些方法往往需要消耗大量的人力物力,耗時長,成本高,其應用受到很大限制。而代理模型技術可以有效解決上述問題,成為一種非常流行的代替昂貴數值模擬的有效方式[1]。代理模型的本質是用輸入和輸出參數來模擬響應系統(tǒng)的行為,通過選取一定數量的樣本點來構建具有相當精度的數學函數模型,其在工程設計和優(yōu)化中得到廣泛應用[1]。作為構建代理模型的關鍵步驟,采樣方法至關重要,采樣方法選取的樣本點很大程度地決定了代理模型的精度水平。如何選取盡可能少的樣本點構建具有足夠精度的代理模型一直是研究者們關注的重點和熱點,對此國內外學者展開了大量的研究[1]。

        現有的代理模型采樣方法一般分為一次性采樣方法和序列采樣方法兩大類。一次性采樣(one -shot sampling)方法主要考慮空間填充設計,使樣本點盡量均勻地分布在整個設計空間中,較為常見的方法有全因子試驗設計法、正交設計法和拉丁超立方采樣法等[2]。然而在實際工程中采樣數量往往難以確定,一次性采樣容易導致過采樣或欠采樣[2],造成計算資源的浪費或近似精度難以滿足要求,且自適應能力差。相較于一次性采樣方法,序列采樣方法(sequential sampling)對初始樣本的依賴性較弱,能有效控制樣本的數量,可以根據實際物理系統(tǒng)的空間特性進行采樣,因此得到了學者們的青睞[3-7]。序列采樣方法的基本思路為選取少量樣本初步構建近似模型,在序列迭代的過程中充分利用已有樣本和模型的信息來確定候選樣本點的位置,通過在欠采樣和高度非線性的局部區(qū)域逐步加點,不斷提高模型的近似精度,直至滿足設計者的需求。當前,該方法已應用于模型預測[3,4]、優(yōu)化設計[5,6]以及可靠度分析[7]等諸多領域。

        為了在整個設計空間中得到良好的全局近似結果,兼顧代理模型的全局精度和局部精度,不少學者針對全局代理模型的序列采樣方法進行了深入探究。其中,泰森多邊形(或Voronoi)作為一種合理劃分空間和分析影響區(qū)域的常用工具,能有效地對整個設計空間進行全局探索,近些年來應用于序列采樣方法的相關研究中。Crombecq等[2]提出了一種LOLA-Voronoi序列采樣方法,創(chuàng)新性地根據泰森多邊形法衡量樣本密度,并通過局部線性逼近法分析數據點周圍的非線性程度,進而選擇新的候選樣本點。但該方法在估計樣本的梯度信息時需進行復雜的鄰域選擇,計算速度較慢;Xu等[8]結合了泰森多邊形法和LOO交叉驗證(leave -one -out cross validation)誤差進行采樣,發(fā)展了一類魯棒性強的CV-Voronoi序列采樣方法;繆繼華等[9]將CV-Voronoi方法與支持向量回歸模型相結合,提出了基于支持向量點的空間加點策略。雖然CV-Voronoi序列采樣方法具有較高的精度和較強的魯棒性,但其序列采樣過程中交叉驗證涉及大量的建模計算,且隨著樣本點數量的增加,計算量不斷上升,致使其計算成本較為昂貴。

        鑒于此,為了節(jié)約計算成本、加快采樣速度及提高建模效率,本文引入k-fold交叉驗證(k-fold cross validation)[10]方法,并結合泰森多邊形法對設計空間進行全局探索和局部開發(fā),發(fā)展了一種k-fold CV-Voronoi自適應序列采樣方法,并通過數值算例和工程算例對本文方法進行驗證。

        2 序列采樣方法

        2.1 k -fold CV-Voronoi序列采樣方法

        本文發(fā)展的k-fold CV-Voronoi自適應序列采樣方法基于泰森多邊形法剖分設計空間,通過k-fold交叉驗證方法展開誤差追蹤,在交叉驗證誤差最大的區(qū)域內進行自適應采樣。該方法核心內容包括剖分設計空間、確定子區(qū)域以及選取候選點。

        (1) 設計空間剖分。泰森多邊形由離散點連成的三角形各條邊的垂直平分線圍成,是對空間區(qū)域的一種無縫不重疊剖分。對于d維設計空間Ω的一組樣本點X={x1,x2,…,xn},其中第i個點xi的Voronoi區(qū)域Di定義為[9]

        Di={x∈Ω|d(x,xi)

        (j=(1,2,…,n),j≠i)

        (1)

        式中n為已知的樣本數量,x為設計空間Ω的向量點,d(xi,xj)為樣本點xi和xj之間的距離。

        以二維設計空間為例,在[-1,1]2范圍內隨機生成10個樣本點,其Voronoi單元劃分情況如 圖1 所示??梢钥闯觯我庖粋€泰森多邊形Di內部只存在一個已知樣本點xi,且多邊形Di中的點與其中心樣本xi的距離最近,因此可將多邊形Di圍成的區(qū)域視為樣本xi的有效影響范圍。

        圖1 二維Voronoi圖及其單元預測誤差

        (2) 子區(qū)域確定。當整個設計空間劃分為一系列多邊形區(qū)域后,需進一步考慮代理模型在各個子區(qū)域內的近似情況,在預測誤差較大的區(qū)域增加樣本點能有效提高模型精度。交叉驗證方法可以獲取樣本點的預測誤差信息,可用于評價代理模型的近似效果,但常見的LOO交叉驗證方法隨著序列采樣過程的進行,所需的計算量在成倍上升,計算成本較大。因此,本文引入k-fold交叉驗證方法[10]計算樣本點的預測誤差,其詳細步驟如圖2所示。

        圖2 k -fold交叉驗證方法流程

        k-fold交叉驗證方法將樣本集X隨機分成k組(k≤n)互斥的子集{V1,V2,…,Vk},分別計算各集合中樣本點的預測誤差[1],其表達式可寫為

        (i=1,2,…,k)(2)

        圖1所示的二維實例中,采用不同大小的實心圓點表示由式(2)計算的樣本點預測誤差值,當樣本點xi的誤差ei越大,即表明在多邊形Di區(qū)域內代理模型的擬合效果越差,與實際函數存在較大偏差。假設第c個樣本點xc的誤差最大,在相應的多邊形Dc區(qū)域內進行采樣。

        (3) 候選點選取。為保證樣本的空間填充特性,最大程度獲取函數局部信息,k-fold CV-Voronoi自適應序列采樣法應滿足多邊形區(qū)域Dc內的候選樣本點與其中心點xc之間的距離盡可能大。具體操作為在預測誤差最大的多邊形區(qū)域內產生一批隨機點,根據式(3)所示的最大距離最小化(maxmin)準則[11]抽取新的樣本點,

        max[d(x,xc)] (x∈Dc)

        (3)

        式中max(·)為求最大值的函數,x為區(qū)域Dc的向量點。

        對于二維空間,采用上述方法進行采樣的結果如圖3所示,其中空圓圈代表一系列隨機點,實心點即為新增樣本點。

        圖3 二維采樣過程

        與一般的序列采樣方法對比,本文建議的k-fold CV-Voronoi自適應采樣方法存在三點優(yōu)勢。其一,該采樣方法本身完全獨立于代理模型技術,因此能與多種類型的代理模型相結合,可應用于不同工程問題,具有普適性;其二,算法中包括探索階段和開發(fā)階段兩個過程,通過泰森多邊形的空間劃分和交叉驗證誤差的計算,實現了整個設計空間內局部開發(fā)和全局探索之間的動態(tài)平衡,自適應性強;其三,引入k-fold交叉驗證策略能有效減少建模過程的計算成本,加快采樣速度,提高建模效率。

        2.2 算法流程

        對于實際工程中的建模問題,采用k-fold CV-Voronoi自適應序列采樣方法構建精確代理模型的具體步驟如下。

        (1) 選取適當的試驗設計方法,在設計空間中抽取少量初始樣本集X,并計算其響應Y。

        (2) 根據樣本及其響應值,建立相應的代理模型,并計算模型的近似精度。

        (3) 基于已有樣本信息,利用泰森多邊形法剖分整個設計空間。

        (4) 采用k-fold交叉驗證方法計算每個樣本點的預測誤差,選出誤差最大的樣本點所在的多邊形區(qū)域。

        (5) 在選出的多邊形區(qū)域中產生一系列隨機點,根據maxmin準則選擇候選樣本點xnew并計算真實響應值ynew,將其加入集合X和Y,更新樣本。

        (6) 檢查停止準則。若計算結果滿足給定的停止準則,建模結束;否則,繼續(xù)步驟(2),進行下一輪迭代。

        3 數學算例

        RBF是目前應用最為廣泛的代理模型之一[12],其選擇某一歐氏距離函數作為基函數,通過徑向基函數的線性組合來擬合實際函數,所得模型近似精度比較高,具有良好的魯棒性,適用于解決高度非線性問題[13]。為驗證k-fold CV-Voronoi自適應序列采樣方法的效率以及適用性,將建議的自適應序列采樣方法與RBF代理模型相結合,應用于數學函數算例進行對比分析,并針對k-fold交叉驗證方法中k的取值展開討論。

        3.1 數學函數測試

        將建議的k-fold CV-Voronoi自適應序列采樣方法應用于5個典型的數學函數,建立RBF模型并檢驗其精度,并與Xu等[8]提出的基于LOO 交叉驗證的CV-Voronoi采樣方法進行對比。數學測試函數的相關信息列入表1。

        表1 測試函數信息

        為了獲得盡可能多的函數信息,初始樣本點應在整個設計空間中均勻分布,并且具有良好的投影特性,故本文采用操作簡單和易于實現的拉丁超立方抽樣法(LHS)[14]選取初始樣本。在序列加點過程中,考慮有限的計算成本,設置停止準則為,循環(huán)加點過程中當生成的總樣本達到設置的最大樣本數量時停止采樣。若測試函數的設計維度為d,設置初始樣本數量為N0=5d,最大樣本個數為N=4N0。抽取500個測試樣本驗證代理模型的精度,采用兩個常見的模型全局精度指標評價模型的近似程度,均方根誤差(RMSE)和平方相關系數(R2)的表達式為

        (4)

        (5)

        為了消除隨機誤差的影響,表2所列結果為多次計算的平均值。

        表2 不同采樣方法下RBF建模結果

        由表2可知,在初始樣本和總樣本數量不變的條件下,本文方法所得能以少量的計算成本取得較好的建模效果,而LOO交叉驗證策略下序列采樣過程中的建模次數遠高于k-fold交叉驗證。設初始樣本數量為N0,采樣結束時的樣本總量為N,采用LOO交叉誤差驗證的CV-Voronoi自適應序列加點方法共需要1/2(N+N0-1)(N-N0)次建模,而采用本文的k-fold CV-Voronoi方法僅需k(N-N0+1)次建模計算,大幅縮減了計算消耗。

        另一方面,對比表2各個函數模型的精度指標發(fā)現,在計算成本較小的前提下,本文方法的精度水平不低于CV-Voronoi自適應序列加點方法。綜合而言,本文方法計算成本低,計算效率高,且魯棒性強。

        3.2 關于k的討論

        值得注意的是,表2中代理模型的精度結果隨本文方法k的取值變化而發(fā)生改變,因此,為了確定k值的取值,本文進一步探究不同k值對代理模型精度的影響。仍采用表1的函數為例,對于每個測試函數,分別選取了不同的初始樣本值N0,其相應k值在N0的公因數按從小到大的順序分別進行取值[16],如當初始樣本個數N0=12時,k值分別取2,3,4,6和12,樣本總量保持不變。采用本文方法建立RBF模型,以全局指標R2衡量模型精度,將多次測試結果整理成如圖4所示的箱線圖。

        圖4 不同k值情況下RBF模型精度

        通過觀察圖4平均數、眾數和分位數等數據發(fā)現,在初始樣本數量相同的情況下,同一測試函數不同k值下所得代理模型計算結果均未表現出明顯的線性規(guī)律,即當k發(fā)生變化時,RBF模型的整體精度R2可能上升亦可能下降,在局部區(qū)域會出現極值。根據試驗中多種情況下所得測試結果可知,對于所有測試函數,當k/N0=1/6~1/3時,所得模型的精度較高,且一般在k=1/4*N0處取得極值,建模效果最佳(如圖4中Rosenbrock函數在N0=12,k=3;N0=56,k=14時取得最優(yōu)結果),并且此時交叉驗證的次數較少,計算成本低。

        文獻[17,18]也對比了LOO和k-fold交叉驗證,證明在一次性采樣建模中k-fold交叉驗證方法取k=10時取得較優(yōu)結果。但采用序列采樣方法構建代理模型時,可以通過不斷添加新的樣本來更新模型,在多次循環(huán)迭代過程中不斷提高模型精度,常選用較小的初始樣本值和k值,故在上述k-fold CV-Voronoi方法測試中,k的建議取值略小于以往文獻給出的參考值。

        4 工程算例

        圖5所示的交叉斜材作為保證輸電塔結構穩(wěn)定性的重要部件,對承受橫向荷載起著關鍵作用,并且常與輔材一起改善輸電塔內部的結構受力。

        圖5 輸電塔交叉斜材構造

        交叉斜材的承載力與截面幾何尺寸和拉壓比等因素之間的函數關系是其設計與優(yōu)化的關鍵。本文選取交叉斜材的角鋼截面肢長l、肢寬b以及拉力與壓力的比γ作為自變量,通過ANSYS有限元分析軟件對輸電塔交叉斜材進行數值模擬分析,計算不同參數下桿件的最大內應力響應,采用本文方法建立RBF模型。建模過程中初始樣本數量為N0=15,測試樣本數量為30,k-fold交叉驗證的k值取為1/4N0。

        表3展現了建模過程中隨著樣本數量N的增加,RBF模型精度的變化情況。由表3可知,本文方法能快速提高代理模型的近似程度,當樣本總量為30時,代理模型的整體精度R2達到80%以上,能夠以較小的計算成本取得令人滿意的建模效果,且所得代理模型可進一步用于輸電塔交叉斜材的設計和優(yōu)化。在實際應用中,設計者可根據目標函數精度要求控制加點過程的進行,從而提高建模效率,節(jié)約了計算成本。

        5 結 論

        針對現有采樣方法的不足之處,本文發(fā)展了一種適用于任意代理模型的k-fold CV-Voronoi自適應序列采樣方法,該法能有效地在整個函數設計空間進行全局探索和局部開發(fā),具有很強的自適應性和魯棒性。通過數學算例和工程算例得結論如下。

        (1) 相同條件下,本文方法在序列迭代過程中交叉驗證的建模計算次數較低,能大幅減少計算成本,提高建模效率。

        (2) 本文方法適用于復雜系統(tǒng)的建模分析,且在計算資源有限的情況下具有顯著優(yōu)勢。

        (3) 提供了本文方法中k值的最佳取值范圍,即k=(1/6~1/3)N0,可供設計及科研人員參考。

        猜你喜歡
        計算成本多邊形代理
        王瑛的詩(三首)
        多邊形中的“一個角”問題
        春與人間相遇
        中外文摘(2021年13期)2021-08-06 09:30:04
        多邊形的藝術
        解多邊形題的轉化思想
        多邊形的鑲嵌
        趣味(數學)(2019年11期)2019-04-13 00:26:32
        代理圣誕老人
        趣味(數學)(2018年12期)2018-12-29 11:24:00
        代理手金寶 生意特別好
        復仇代理烏龜君
        學生天地(2016年23期)2016-05-17 05:47:15
        圖解各個行業(yè)的成本真相
        記者觀察(2015年3期)2015-04-29 00:44:03
        中文 国产 无码免费| 无码字幕av一区二区三区| 亚洲 精品 综合 精品 自拍| 中文字幕第八页| 九色精品国产亚洲av麻豆一 | 国产成人高清在线观看视频| 国产综合久久久久久鬼色| 欧美丰满熟妇乱xxxxx图片| 国产在线视频h| 午夜一区二区三区福利视频| 豆国产96在线 | 亚洲| 99久久人人爽亚洲精品美女| 欧美日韩精品一区二区三区高清视频 | 美丽的小蜜桃在线观看| 少妇高潮惨叫久久久久久电影 | 少妇深夜吞精一区二区| 国语自产精品视频在线看| 丰满人妻av无码一区二区三区| 国产精品 精品国内自产拍| 99视频偷拍视频一区二区三区| 国内永久福利在线视频图片 | 国产黄色片在线观看| 国产一级黄色av影片| 美丽的小蜜桃在线观看| 亚洲综合久久精品无码色欲| 中文字幕大屁股熟女乱| 亚洲av手机在线一区| 天堂在线资源中文在线8| 欧美疯狂性xxxxxbbbbb| 久久久久亚洲AV无码去区首| 中文字幕一区二区三区四区| 久久国产亚洲高清观看| 午夜一级在线| 国产激情免费观看视频| 亚洲日韩成人无码| 色欲av亚洲一区无码少妇| 亚洲国产精品综合福利专区 | 一区二区三区四区亚洲综合| 亚洲综合偷自成人网第页色| 久久久久香蕉国产线看观看伊| 亚洲丁香五月激情综合|