亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        建筑基本周期多因素機器學習預測模型

        2024-02-25 01:28:14宋穎豪王澤濤
        工程力學 2024年2期
        關(guān)鍵詞:機器建模預測

        陳 雋,宋穎豪,王澤濤

        (1.同濟大學土木工程學院,上海 200092;2.土木工程防災國家重點實驗室,同濟大學,上海 200092)

        建筑物的基本周期是建筑結(jié)構(gòu)最重要的動力特性,綜合反映了結(jié)構(gòu)的剛度、質(zhì)量及其分布情況,在設計階段的荷載估計、參數(shù)化建模,以及使用階段的結(jié)構(gòu)健康監(jiān)測、實際性能評估等方面,都有十分重要的用途。例如,結(jié)構(gòu)基本周期決定了地震下頻譜加速度/地震影響系數(shù)[1-2],影響基底剪力設計值;已建結(jié)構(gòu)健康監(jiān)測系統(tǒng)設計時基本周期的預估,周期的變化也往往預示著結(jié)構(gòu)中系統(tǒng)性損傷的發(fā)生與演變[3];城市區(qū)域抗震分析中,建筑物周期是參數(shù)化建模的核心變量[4]。

        面向設計階段對建筑周期快速預測的需要,以及無實測條件時已建建筑物特性評估的需求,學者們提出了大量的結(jié)構(gòu)基本自振周期經(jīng)驗預測模型[5-7]。然而,受傳統(tǒng)的指定函數(shù)后擬合回歸建模手段的限制,目前大多數(shù)預測模型僅含有單因素(如建筑高度或?qū)訑?shù)等),再通過對結(jié)構(gòu)形式或材料進行分類的方式反映其他因素的影響,回歸模型形式大多如:

        式中:T為基本周期;H為高度。但是,大量實測數(shù)據(jù)表明:除高度、材料以外,建筑物結(jié)構(gòu)形式和功能、基礎類型、地域等因素對于周期的影響也不能忽視。

        近年來,機器學習方法因其強大的數(shù)據(jù)特征提取能力和處理大規(guī)模數(shù)據(jù)的優(yōu)勢,作為一種新型建模手段備受關(guān)注。例如,基于生成對抗網(wǎng)絡的方法研究主余震下結(jié)構(gòu)的破壞機制[8]、基于決策樹和人工神經(jīng)網(wǎng)絡等方法建立砌體填充混凝土框架的基本周期預測模型[9]、基于BP 神經(jīng)網(wǎng)絡的RC 框架結(jié)構(gòu)地震易損性曲面分析[10]。上述工作基于機器學習方法得到了有價值的成果,也展示了用于建筑基本周期預測的可行性,但還存在如下需要解決的問題:① 由于實測數(shù)據(jù)獲取困難,現(xiàn)有機器學習模型大多基于數(shù)值模擬的數(shù)據(jù)進行訓練,如果要包含多因素影響,特別是語義型因素,必須基于既有建筑的實測數(shù)據(jù)來建立新模型;② 預測模型的輸入?yún)?shù)在結(jié)構(gòu)初步設計階段難以獲取,因此,新模型應使用容易確定的結(jié)構(gòu)參數(shù),并應允許部分輸入?yún)?shù)缺失;③ 模型的超參數(shù)調(diào)節(jié)和模型選擇過程需要人工參與,難以隨著數(shù)據(jù)量的增加實現(xiàn)模型的高效、動態(tài)更新,因此,新模型應具有對新增數(shù)據(jù)的自學習能力,以及對新型機器學習算法的自適應能力。

        針對以上關(guān)鍵問題,本文收集了公開文獻中大量的建筑周期的實測數(shù)據(jù),并建立了數(shù)據(jù)庫。在此基礎上,以新興的AutoML(Auto Machine Learning,自動機器學習)技術(shù)建立基本周期預測模型,可利用結(jié)構(gòu)初步設計階段全部或部分已知信息作為輸入?yún)?shù),預測建筑結(jié)構(gòu)的周期。最后,分別采用本文模型、現(xiàn)有規(guī)范模型和文獻建議公式對未參與訓練過程的500 多棟實際建筑進行了周期預測,并對結(jié)果進行了對比分析。

        1 實測結(jié)構(gòu)周期數(shù)據(jù)庫

        1.1 數(shù)據(jù)來源

        建筑物基本周期的數(shù)據(jù)來源分為實測數(shù)據(jù)和模擬數(shù)據(jù)。由于數(shù)值模型與實際結(jié)構(gòu)顯然存在差異,難以反映真實的建筑物周期,本研究只選用實測數(shù)據(jù)進行分析。作者在文獻[5]中報告了實測周期數(shù)據(jù)收集的詳細過程和結(jié)果,為全文完整性,本節(jié)做簡要說明。

        研究采用從大量公開發(fā)表的文獻和書籍中檢索建筑物基本周期(及其相關(guān)信息)的方式,截至本文撰寫時,已經(jīng)完成了上萬篇論文的檢索,并建立了原始數(shù)據(jù)庫。進一步,采用查重、離群點檢驗等手段進行數(shù)據(jù)清洗,形成用于建模分析的可靠數(shù)據(jù)庫。其中,由于不同文獻中可能存在相同的建筑,通過比較位置、結(jié)構(gòu)信息和名稱等可識別重復的建筑。此外,由于研究角度的差異,不同文獻中對同一建筑的描述信息不同,綜合多篇文獻的內(nèi)容可實現(xiàn)信息補全。

        本文分析的主要數(shù)據(jù)來源于文獻[7, 11 - 29],其他僅包含單條數(shù)據(jù)的文獻,由于數(shù)量眾多,不一一列舉。主要數(shù)據(jù)來源和建筑數(shù)量情況見表1。

        表1 主要建筑周期信息數(shù)據(jù)庫來源及相關(guān)信息Table 1 Main buildings period information database sources and related information

        1.2 數(shù)據(jù)特征說明

        經(jīng)數(shù)據(jù)收集與數(shù)據(jù)清洗后,目前數(shù)據(jù)庫包含2561 條記錄。雖然在收集數(shù)據(jù)時已盡可能全面地收集建筑信息,但不同數(shù)據(jù)來源所包含的信息完整性會有差別,因此在選擇用于機器學習的建筑特征(如材料、抗側(cè)力體系、功能等)時,既要關(guān)注它們與基本周期的相關(guān)性,也需考慮數(shù)據(jù)庫中包含對應特征的有效記錄數(shù)量。

        結(jié)合已有研究的成果,本研究初步從數(shù)據(jù)庫中篩選出了16 個能夠影響到建筑物周期的特征,并將其歸為分類型(即語義型)和數(shù)值型兩大類,具體見表2。表2 和圖1 同時給出了在2561 條數(shù)據(jù)中,16 個特征各自的有效數(shù)據(jù)量比例??梢?,包含“抗側(cè)力體系”“材料”“高度”及“所在國”四個特征的數(shù)據(jù)均超過了70%。此外,“基礎深度”的有效數(shù)據(jù)量最小,為8.9%,但也有228 條。以往研究中,文獻[12 - 13]的預測模型分別用到287 條和574 條,文獻[15]用到244 條。因此,認為初篩的建筑特征的最低有效數(shù)量滿足建模要求。

        圖1 不同特征的有效信息占比Fig.1 Percentage of valid information of different factors

        表2 特征類型及具體特征Table 2 Feature type and specific features

        收集數(shù)據(jù)過程中,分類型數(shù)據(jù)的“值”(文本)盡量遵照原文描述,如抗側(cè)力體系中的“框架”“框架剪力墻”等,這可能導致某些分類值所對應的數(shù)據(jù)偏少。若將此類數(shù)據(jù)直接用于訓練,機器學習模型容易對這些分類值的特征產(chǎn)生過擬合。為此,需要對語義型特征的分類值進行聚合操作,即合并某一種特征中相近的分類值。由于“材料”和“平面形狀”兩特征在聚合前,其分類值所對應的數(shù)據(jù)量就比較多,因此將聚合前的數(shù)據(jù)作為其補充信息用于模型訓練,其余的分類型特征則僅保留聚合后的特征數(shù)據(jù)。對于目前數(shù)據(jù)量很小且難以與其他分類值聚合的情況,如圖2抗側(cè)力體系的“核心筒”“框架-核心筒”“框架-砌體承重墻”分類以及圖3 材料中的“木材”“砌體+木材”分類,統(tǒng)一聚合為對應特征的“未知類型”。一方面,解決數(shù)據(jù)量小不利于模型訓練的問題;另一方面,提升模型包容未來新增其他類型的能力。表3 為聚合完成后,模型具體的分類型輸入特征。

        圖2 抗側(cè)力體系數(shù)據(jù)分布情況Fig.2 Data distribution of lateral force resisting system

        圖3 材料數(shù)據(jù)分布情況Fig.3 Data distribution of material

        表3 分類型特征輸入Table 3 Input of classified features

        2 基本周期自動機器學習預測模型

        2.1 數(shù)據(jù)填充

        不完整性是大數(shù)據(jù)的重要特點,本文問題中體現(xiàn)為并非每條數(shù)據(jù)都包含全部上述16 個特征信息,用于模型訓練前還必須進行填充處理。本研究針對分類型和數(shù)值型兩類記錄,采用了不同的填充方式,具體為:

        1) 分類型特征填充。采用缺失值處理為對應分類型特征中的“未知類型”的方式進行填充[32]。表4 展示了分類型數(shù)據(jù)的缺失示例(表4 中的“[未知類型]”表示缺失值及其填充處理)。

        表4 分類型數(shù)據(jù)填充示例Table 4 Classification data filling example

        2) 數(shù)值型特征填充。表5 為數(shù)值型數(shù)據(jù)填充示例,對于缺失值分別嘗試了常用的中位數(shù)、平均數(shù)和眾數(shù)填充,對比表明最終模型的預測效果相差不大。因此,后續(xù)分析中均采用了中位數(shù)填充。

        表5 數(shù)值型數(shù)據(jù)填充示例Table 5 Numerical data filling example

        填充好的2561 條數(shù)據(jù)再分為訓練集(1844 條)、驗證集(205 條)和測試集(512 條)3 部分,分別用于后續(xù)模型訓練和測試。

        2.2 基于AutoML 的預測模型

        選擇合適的模型并進行訓練調(diào)參,是傳統(tǒng)機器學習任務中不可避免、十分繁瑣但非常重要的一個環(huán)節(jié),需要嘗試多次并且依賴一定的經(jīng)驗才能得到性能相對優(yōu)秀的模型。當數(shù)據(jù)量增加后,往往還需要重新進行模型的調(diào)參優(yōu)化,使用不便。

        考慮建筑物類型會不斷變化及實測數(shù)據(jù)會不斷增加的需求,本研究采用了AutoGluon[32]策略來實現(xiàn)自動學習,此方法的基本思想類似于采用基函數(shù)的線性組合來逼近復雜函數(shù),通過融合多個未進行調(diào)參的簡單模型來提高最終模型的性能,稱為stacking(堆疊)方法。

        本研究采用目前常用的三類機器學習模型:BP 神經(jīng)網(wǎng)絡、XGBoost[33]和LightGBM[34]作為“基模型”,并預先設置每類模型的超參數(shù)選擇空間。以BP 模型為例,隱藏層有3 層(可取50×40×30、100×80×60、300×200×100 三種,數(shù)字為每層神經(jīng)元數(shù))、二層(200×100)或一層(100、1000)三種選擇;3 種激活函數(shù)(Relu、Tanh、Softrelu)、學習率在10-5與10-2之間、5 種計算輪次(100、200、300、400、500)、神經(jīng)元丟失(dropout)概率在0 與0.5 之間。隨后,對每類基模型在其對應的參數(shù)空間內(nèi)隨機選取N組超參數(shù),可得到3×N個模型,構(gòu)成底層學習器,本研究將N取為20。此外,為了節(jié)約資源AutoGluon 會提前終止預測精度不再隨訓練而顯著提升的底層學習器,以便為其他底層學習器釋放計算資源。

        利用訓練集和驗證集數(shù)據(jù)對底層學習器中的每個模型進行訓練,訓練好的模型在訓練集和驗證集上的周期預測結(jié)果連同對應的真實值,組成新的訓練集和驗證集,分別是[1844, 61]和[205, 61]的數(shù)組(其中61 列=3 類×20 列預測值+1 列真實值)。最后,利用新的訓練集和驗證集對一個線性回歸模型進行訓練,獲得最終的模型。該線性回歸模型的輸入是前3×N個模型的預測值,輸出是這些值加權(quán)平均后的結(jié)果。

        圖4 是AutoGluon 融合建模的全過程。整個建模過程中,超參數(shù)的選擇、單個模型的訓練都無須人工介入、無須先驗經(jīng)驗。由于底層學習器中的每個“基模型”自身比較簡單,其訓練成本不高且可并行完成,模型的計算效率很高。當有新的數(shù)據(jù)加入或者有更好的“子模型”出現(xiàn),重復上述建模步驟重新訓練即可完成模型的更新和功能提升,實現(xiàn)數(shù)據(jù)驅(qū)動的模型自動學習。

        圖4 模型建立流程Fig.4 Model establishment process

        2.3 AutoML 預測模型性能對比

        為了證明AutoGluon 算法的有效性,將融合模型結(jié)果與僅使用底層學習器的結(jié)果作了對比。表6 為模型的預測性能的排序,按照512 條測試集數(shù)據(jù)上的RMSE 從小到大排列,受篇幅限制只比較了融合模型和4 個最優(yōu)的底層學習器的預測精度性能和預測時間成本。結(jié)果顯示,融合模型的預測精度(RMSE)最好,特別是在模型訓練中未接觸過的測試集上。同時,相較于底層學習器,融合模型的預測時間也非常小。

        表6 不同機器學習模型性能對比Table 6 Performance comparison of different machine learning models

        此外,AutoGluon 預測模型中包含2.1 節(jié)中的數(shù)據(jù)填充功能,模型使用時就可將結(jié)構(gòu)在初步設計階段尚未明確的參數(shù)(如平面形狀、基礎類型、基礎深度等)作為“未知類型”輸入,從而顯著提高模型的適應性。因融合模型的預測是底層學習器加權(quán)平均后的結(jié)果,其預測需在底層學習器預測之后才能計算,所以預測時間高于底層學習器,平均下來每次預測在0.01 s 以內(nèi),是可以接受的。

        訓練數(shù)據(jù)時除了將數(shù)據(jù)劃分為訓練集和驗證集這種簡單交叉驗證方式外,還可采用k折交叉驗證。k折交叉驗證的步驟如下:

        1) 將樣本分為k個大小相等的樣本子集;

        2) 依次遍歷這k個子集,每次把當前子集作為驗證集,其余所有樣本作為訓練集,進行模型的訓練和評估;

        3) 最后把k次評估指標的平均值作為最終的評估指標。

        本研究分別嘗試了5 折交叉驗證以及10 折交叉驗證,結(jié)果發(fā)現(xiàn)采用交叉驗證后訓練時間增加了數(shù)十倍,且在測試集上的預測精度也沒有明顯提升,RMSE 分別為0.3585、0.3598。因此本研究采用簡單交叉驗證的方法進行訓練。

        3 特征指標重要性的量化分析

        1.2 節(jié)中初步選擇了16 個影響周期的特征,傳統(tǒng)上可進一步采用方差分析、卡方檢驗、最大信息系數(shù)等方式,分析其中是否存在冗余特征或不相關(guān)特征。利用已經(jīng)建立的融合模型,也可以通過置換重要性[35]的方式來量化分析各特征參數(shù)的重要性,具體方法如下:

        1) 將順序正確的驗證集數(shù)據(jù)輸入已經(jīng)訓練好的預測模型,得到預測結(jié)果。

        2) 將驗證集數(shù)據(jù)中某一特征對應的某列數(shù)據(jù)隨機打亂后輸入預測模型,得到預測結(jié)果。重復M次。

        3) 比較每次數(shù)據(jù)打亂前后模型的預測結(jié)果,如均方誤差RMSE 的差異。

        4) 對其他特征參數(shù)重復上述步驟。

        以“高度”特征為例,將205 條驗證集記錄的高度值隨機打亂后輸入預測模型,由于高度信息是錯誤的,預測誤差應增大,誤差增大的程度可用來量化“高度”特征的重要性。若誤差不變或減小,說明該特征對于預測模型無效或有害。為了減小計算偶然性,對205 條驗證集數(shù)據(jù)的每列數(shù)據(jù)都進行了100 次順序打亂,最終計算結(jié)果如表7 所示,其中P值表征特征無效的概率。例如,P值為0.01 表示有1%可能性,該特征對建立模型是無用的或有害的。

        表7 特征重要性及相關(guān)參數(shù)Table 7 Feature importance and related parameters

        表7 顯示:高度、所在國、地上層數(shù)、材料和抗側(cè)力體系五個特征重要性程度高,除去“所在國”,其余特征與以往研究認識相同。對于“所在國”特征,由于過往研究的數(shù)據(jù)大多集中于某一地區(qū),地域因素的影響未受到重視。由于“所在國”特征暗含了設計規(guī)范、經(jīng)濟水平等因素,值得隨著數(shù)據(jù)的增加進一步關(guān)注,文獻[36]也提出,中國規(guī)范《高層建筑混凝土結(jié)構(gòu)技術(shù)規(guī)程》(JGJ 3-2010)中對于高層建筑的劃分顯著地影響到了建筑的基本周期。重要性排在最后四位的特征為:平面形狀、地下層數(shù)、基礎深度和基礎類型,可以認定為冗余特征。在預測模型中刪除這些冗余特征后,發(fā)現(xiàn)訓練時間未有明顯減少,從模型的發(fā)展及完備性角度考慮,目前研究中保留了所有特征作為模型輸入。

        4 預測模型性能分析

        4.1 預測性能

        圖5、圖6 為最終模型在訓練集和測試集數(shù)據(jù)上的預測結(jié)果,其中橫軸為真實值,豎軸為預測值,預測結(jié)果越靠近圖中斜線越好,左上角為平均絕對誤差MAE、平均百分比誤差MAPE 和均方根誤差RMSE,訓練集和測試集的這三項指標都較小??梢?,模型的預測效果良好。

        圖5 訓練集基本周期預測結(jié)果Fig.5 Training set natural period prediction results

        圖6 測試集基本周期預測結(jié)果Fig.6 Testing set natural period prediction result

        4.2 對比分析

        與以往預測模型以及相比,本研究預測模型基于多源實測數(shù)據(jù),可以預測多種類型的建筑。與之前研究[4]采用傳統(tǒng)統(tǒng)計回歸的建模思路不同的是,本研究采用機器學習的方法建模,模型的參數(shù)更加復雜多樣,同時進一步應用新興的AutoML技術(shù),大大簡化了模型建立流程。

        表8 中給出了當前規(guī)范和文獻中的一些結(jié)構(gòu)周期預測模型,本文將它們的預測結(jié)果與自動機器學習模型結(jié)果進行對比。

        表8 規(guī)范及文獻中基本周期預測模型Table 8 Natural period prediction model in specification and literature

        本研究訓練模型時采用的訓練集包含1844 棟建筑,驗證集包含205 棟建筑,測試集包含512 棟建筑未參與任何工作,為了保證驗證結(jié)果的可靠性,將測試集的建筑用于預測模型的對比。由于傳統(tǒng)的預測模型大多針對某類建筑進行預測,在進行預測之前需要進一步篩選出不同預測模型所適用的建筑。

        以GOEL 和CHOPRA[19]的模型為例,其模型主要針對框架結(jié)構(gòu),測試集中相應建筑一共有205 棟,圖7 為GOEL 和CHOPRA[19]的模型與本文模型預測結(jié)果對比。可見,機器學習模型的預測結(jié)果在真實值附近,而GOEL 模型的預測結(jié)果總體上較真實值偏低。

        圖7 GOEL 和CHOPRA[19]模型與本文模型在框架結(jié)構(gòu)預測結(jié)果對比Fig.7 Comparison of prediction results between GOEL and CHOPRA[19] model and this model in frame structure

        圖8、圖9 為表8 中的四個預測模型與本研究預測模型在MSE 和R2兩個指標上的對比。MSE是指真實值與預測值之差平方的期望值,MSE 越小說明預測精度越好;R2用以衡量整體的擬合度,R2越大表示擬合效果越好。此外,表9 給出了MAE、MAPE、RMSE 的對比結(jié)果。可以發(fā)現(xiàn),本文預測模型在整體上保證預測范圍廣泛的情況下,整體上預測結(jié)果的準確性也是最好的。

        圖8 不同模型預測結(jié)果MSE 對比Fig.8 Comparison of MSE of prediction results of different models

        圖9 不同模型預測結(jié)果R2 對比Fig.9 Comparison of R2 of prediction results of different models

        表9 模型其他準確性指標對比Table 9 Comparison of other accuracy indexes of model

        5 結(jié)論

        本文基于多源實測數(shù)據(jù),利用機器學習方法建立了建筑結(jié)構(gòu)基本周期的多因素自動機器學習預測模型。所提出的機器學習模型較以往模型可以考慮多因素影響,并適用于多類型建筑,從而顯著提高了周期預測的準確性。所建立的自動機器學習模型具有三方面特點:

        (1) 無須調(diào)參,顯著提升了建模效率。

        (2) 當有新型、性能更好的“子模型”出現(xiàn)時,僅需對底層學習器進行更換。

        (3) 當有新的實測數(shù)據(jù)加入,也可自動實現(xiàn)模型的更新和功能提升。

        將此模型與云端動態(tài)更新的建筑周期數(shù)據(jù)庫相結(jié)合,可形成一種全新的、網(wǎng)頁開放的、在線自學習的建筑周期預測功能。本文模型的源代碼將連同文章一起公開,服務于科學研究與工程實踐。

        猜你喜歡
        機器建模預測
        無可預測
        黃河之聲(2022年10期)2022-09-27 13:59:46
        機器狗
        選修2-2期中考試預測卷(A卷)
        選修2-2期中考試預測卷(B卷)
        機器狗
        聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
        基于PSS/E的風電場建模與動態(tài)分析
        電子制作(2018年17期)2018-09-28 01:56:44
        未來機器城
        電影(2018年8期)2018-09-21 08:00:06
        不對稱半橋變換器的建模與仿真
        不必預測未來,只需把握現(xiàn)在
        精品一区二区三区老熟女少妇| 1717国产精品久久| 欧美视频第一页| 少妇被爽到自拍高潮在线观看| 男女搞事在线观看视频| 亚洲性码不卡视频在线| 亚洲中文字幕日韩综合| 绝顶潮喷绝叫在线观看| 日本夜爽爽一区二区三区| 无码人妻丰满熟妇区免费| 麻豆国产av在线观看| 欧美激情一区二区三区| 99久久综合狠狠综合久久| 国产 在线播放无码不卡| 男性av天堂一区二区| 久久精品国产久精国产果冻传媒| 精品久久无码中文字幕| 久久精品有码中文字幕1| 三区中文字幕在线观看| 国产精品久久久久久久妇| 四虎精品影视| 麻豆激情视频在线观看| 未满十八18禁止免费无码网站| 三级在线看中文字幕完整版| 亚洲色图视频在线观看网站| 男女啪啪啪的高清视频| 含紧一点h边做边走动免费视频| 国产农村妇女高潮大叫| 人妻丝袜中文字幕久久| 女同性恋一区二区三区av| 色婷婷综合久久久久中文字幕| 97视频在线播放| 羞涩色进入亚洲一区二区av| 国产在线无码不卡影视影院| 狠狠色噜噜狠狠狠狠888奇禾| 无码伊人久久大香线蕉| 亚洲国产综合在线亚洲区亚洲av| 私人毛片免费高清影视院| 麻豆国产av尤物网站尤物| 国产91九色免费视频| 不卡av电影在线|