袁文輝,蒲浩,王光輝,李偉,張文初
(1. 中南大學(xué) 土木工程學(xué)院,湖南 長(zhǎng)沙 410075;2. 高速鐵路建造技術(shù)國(guó)家工程實(shí)驗(yàn)室,湖南 長(zhǎng)沙 410075;3. 長(zhǎng)沙交通投資控股集團(tuán)有限公司,湖南 長(zhǎng)沙 410014)
鐵路主要技術(shù)標(biāo)準(zhǔn)是鐵路建筑物和設(shè)備的類型、能力及規(guī)模的基本標(biāo)準(zhǔn),對(duì)鐵路能力、運(yùn)營(yíng)安全、運(yùn)輸效率、投資規(guī)模、經(jīng)濟(jì)和社會(huì)效益產(chǎn)生極其重要的影響??茖W(xué)合理選擇主要技術(shù)標(biāo)準(zhǔn),應(yīng)根據(jù)運(yùn)輸需求,充分考慮資源分布和科學(xué)技術(shù)的發(fā)展,結(jié)合自然、經(jīng)濟(jì)及社會(huì)環(huán)境,全面比選確定,實(shí)現(xiàn)所有鐵路要素(能源供應(yīng)、機(jī)車車輛性能、線路與結(jié)構(gòu),通信信號(hào)系統(tǒng))的協(xié)調(diào)工作,滿足安全、經(jīng)濟(jì)、環(huán)保、舒適運(yùn)營(yíng)要求[1]。主要技術(shù)標(biāo)準(zhǔn)優(yōu)選是鐵路全生命周期最重要的先決技術(shù)決策之一。傳統(tǒng)的主要技術(shù)標(biāo)準(zhǔn)優(yōu)選主要依靠人工完成:由經(jīng)驗(yàn)豐富的工程師根據(jù)運(yùn)量需求,綜合考慮地形地質(zhì)等自然條件、橋隧站等構(gòu)筑物修建技術(shù)、機(jī)車信號(hào)等裝備水平等多維因素,擬定多組有價(jià)值的主要技術(shù)標(biāo)準(zhǔn);然后分別針對(duì)每組標(biāo)準(zhǔn)設(shè)計(jì)出優(yōu)化的線路方案,再通過(guò)線路方案的綜合比選,完成主要技術(shù)標(biāo)準(zhǔn)的優(yōu)化決策。這種基于經(jīng)驗(yàn)驅(qū)動(dòng)的決策方法工作量大、效率低、嚴(yán)重依賴設(shè)計(jì)者的認(rèn)知水平和經(jīng)驗(yàn)水平,且難以獲得主要技術(shù)標(biāo)準(zhǔn)最優(yōu)值。為提升主要技術(shù)標(biāo)準(zhǔn)決策的效率與水平,國(guó)內(nèi)外學(xué)者開展了大量研究。這些研究可分為直接法(建立模型直接求解主要技術(shù)標(biāo)準(zhǔn))和間接法(借助智能選線技術(shù)間接提高決策水平)兩大類:
1)直接法
此類方法建立經(jīng)濟(jì)性、安全性等線路評(píng)價(jià)指標(biāo)與主要技術(shù)標(biāo)準(zhǔn)之間的數(shù)學(xué)模型,直接求解滿足條件的最優(yōu)技術(shù)標(biāo)準(zhǔn)。最具代表性的是王柢等[2-3]構(gòu)建了線路經(jīng)濟(jì)指標(biāo)D與機(jī)車持續(xù)牽引力F,限制坡度G,最小曲線半徑R之間的數(shù)學(xué)模型,并用非線性規(guī)劃優(yōu)化方法求解最優(yōu)的主要技術(shù)標(biāo)準(zhǔn)。陳進(jìn)杰等[4]在此基礎(chǔ)上進(jìn)一步考慮了資金的時(shí)間價(jià)值,采用動(dòng)態(tài)經(jīng)濟(jì)指標(biāo)作為標(biāo)準(zhǔn)綜合優(yōu)化的目標(biāo)函數(shù)。楊長(zhǎng)根[5]將鐵路主要技術(shù)標(biāo)準(zhǔn)決策問(wèn)題看作為多目標(biāo)決策問(wèn)題,采用線性加權(quán)的方式將其轉(zhuǎn)化為單目標(biāo)函數(shù)進(jìn)行標(biāo)準(zhǔn)的綜合優(yōu)化。雖然上述研究實(shí)現(xiàn)了主要技術(shù)標(biāo)準(zhǔn)的自動(dòng)化優(yōu)選,但是它們將沿線的地形條件粗略劃分為4類,不能反映真實(shí)的地形特征;而且經(jīng)濟(jì)指標(biāo)與鐵路主要技術(shù)標(biāo)準(zhǔn)之間的關(guān)系十分復(fù)雜,難以用顯函數(shù)準(zhǔn)確表達(dá),上述方法很少應(yīng)用于工程實(shí)際。
2)間接法
間接法是通過(guò)研究智能選線技術(shù),自動(dòng)生成擬定技術(shù)標(biāo)準(zhǔn)條件下的最優(yōu)線路方案,從而快速完成對(duì)主要技術(shù)標(biāo)準(zhǔn)的評(píng)價(jià)。智能選線技術(shù)經(jīng)過(guò)60余年的發(fā)展,優(yōu)化目標(biāo)從二維的線路平面優(yōu)化[6]或縱斷面優(yōu)化[7?8]發(fā)展為三維空間的平縱面整體優(yōu)化[9?10];尋優(yōu)方法從傳統(tǒng)的變分法、線性規(guī)劃等數(shù)學(xué)方法[6,11]演變?yōu)檫z傳算法、粒子群等啟發(fā)式搜索[12?13];研究重點(diǎn)也從平原區(qū)[12]向復(fù)雜山區(qū)[14?15,25]轉(zhuǎn)變。
綜上,既有的直接法以模型為中心,通過(guò)有限樣本統(tǒng)計(jì)回歸模型參數(shù)的方法,無(wú)法準(zhǔn)確反映客觀規(guī)律且不具有普適性;現(xiàn)有的智能選線技術(shù)只能間接提升主要技術(shù)標(biāo)準(zhǔn)決策效率,難以實(shí)現(xiàn)主要技術(shù)標(biāo)準(zhǔn)全面、科學(xué)、高效智能優(yōu)選,主要技術(shù)標(biāo)準(zhǔn)優(yōu)選已成為制約鐵路決策的技術(shù)瓶頸難題。因此,亟需一種人因失誤少、決策效率高的方法實(shí)現(xiàn)主要技術(shù)標(biāo)準(zhǔn)的智能優(yōu)選。
近年來(lái),快速發(fā)展的大數(shù)據(jù)、機(jī)器學(xué)習(xí)技術(shù)為發(fā)掘多維環(huán)境因素與主要技術(shù)標(biāo)準(zhǔn)之間的潛在規(guī)律提供了新的解決思路。本文提出了基于并行多任務(wù)深度學(xué)習(xí)的鐵路主要技術(shù)標(biāo)準(zhǔn)優(yōu)選新方法。
現(xiàn)代的機(jī)器學(xué)習(xí)方法已經(jīng)在數(shù)據(jù)挖掘方面進(jìn)入了商用階段。尤其是深度學(xué)習(xí)方法,通過(guò)模擬人腦神經(jīng)元連接方式建立深層神經(jīng)網(wǎng)絡(luò),經(jīng)過(guò)海量數(shù)據(jù)學(xué)習(xí),使其具備模擬人腦機(jī)制解釋數(shù)據(jù)的能力。目前,在語(yǔ)音識(shí)別[16?17],智能翻譯[18]、圖像識(shí)別[19?20]問(wèn)題的求解上取得了巨大成功。谷歌DEEP-MIND團(tuán)隊(duì)2016年基于深度學(xué)習(xí)研發(fā)的圍棋程序Alpha Go[21],微軟研究院研發(fā)的圖像識(shí)別程序[22]甚至超越了人類水平。
受深度學(xué)習(xí)在圖像特征識(shí)別方面成功應(yīng)用的啟發(fā),本研究提出一種新思路:將影響技術(shù)標(biāo)準(zhǔn)決策的多維環(huán)境因素表征為多通道特征圖像,以這些圖像為樣本,主要技術(shù)標(biāo)準(zhǔn)值為標(biāo)簽,建立深度學(xué)習(xí)網(wǎng)絡(luò)模型,通過(guò)對(duì)圖像特征的識(shí)別,認(rèn)知多維環(huán)境因素-主要技術(shù)標(biāo)準(zhǔn)之間的潛在規(guī)律,建立多維環(huán)境因素到主要技術(shù)標(biāo)準(zhǔn)的映射關(guān)系,實(shí)現(xiàn)主要技術(shù)標(biāo)準(zhǔn)的智能優(yōu)選。主要需解決:深度學(xué)習(xí)樣本的生成和深度學(xué)習(xí)網(wǎng)絡(luò)模型構(gòu)建兩大關(guān)鍵問(wèn)題。
考慮到輸入端的多維環(huán)境和輸出端的主要技術(shù)標(biāo)準(zhǔn)值較多,無(wú)法一次性完全解決其映射規(guī)律的揭示難題,本文重點(diǎn)選取了部分主要因素開展研究。輸入端多維環(huán)境包括:地形條件、運(yùn)輸需求和路網(wǎng)中的作用。輸出端的主要技術(shù)標(biāo)準(zhǔn)包括限制坡度、設(shè)計(jì)速度、最小曲線半徑、到發(fā)線有效長(zhǎng)、機(jī)車類型、牽引質(zhì)量。
與其他深度卷積神經(jīng)網(wǎng)絡(luò)處理單模態(tài)輸入信息不同,本研究中輸入端既有連續(xù)分布的地形,也有數(shù)值型的運(yùn)量,還有枚舉型的路網(wǎng)中的作用。為此,本文將連續(xù)分布的地形裁剪為固定大小的圖像,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)化為數(shù)值型數(shù)據(jù),再將枚舉型路網(wǎng)中的作用通過(guò)編碼轉(zhuǎn)化為數(shù)值型數(shù)據(jù),最后與數(shù)值型運(yùn)量輸入融合,最終形成單模態(tài)輸入信息,接入深度學(xué)習(xí)網(wǎng)絡(luò)??傮w流程如圖1所示。

圖1 混合模態(tài)學(xué)習(xí)樣本生成Fig.1 Hybrid modal learning sample generation
針對(duì)地形,本文首先將地形數(shù)據(jù)轉(zhuǎn)換為數(shù)字高程模型(DEM);然后依據(jù)DEM 生成如圖2 所示的2個(gè)灰度圖像,即高程圖和坡度圖;然后將高程圖和坡度圖合成為雙通道圖像;再通過(guò)卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征,最后將特征圖展開為一維向量,并映射為反映地形條件的數(shù)值。
運(yùn)輸需求通常由年客貨運(yùn)量預(yù)測(cè)得到,是數(shù)值型數(shù)據(jù),可以直接作為深度神經(jīng)網(wǎng)絡(luò)的輸入。路網(wǎng)中的作用按線路作用分為干線和支線2類,屬于枚舉型數(shù)據(jù),可分別編碼為1和0。
最后,將上述代表線路基本信息的3個(gè)數(shù)值型數(shù)據(jù)融合成數(shù)值向量,作為深度學(xué)習(xí)的樣本輸入。而輸出端6項(xiàng)待優(yōu)選的主要技術(shù)標(biāo)準(zhǔn)則可全部用數(shù)值表示,由人工進(jìn)行標(biāo)注。在此基礎(chǔ)上,本文將建立深度卷積神經(jīng)網(wǎng)絡(luò)挖掘線路基本信息與主要技術(shù)標(biāo)準(zhǔn)之間的映射規(guī)律。
通常的深度學(xué)習(xí)模型輸出端為單一因素,或者是相互獨(dú)立的多維因素,而主要技術(shù)標(biāo)準(zhǔn)決策輸出端各標(biāo)準(zhǔn)是相互關(guān)聯(lián)的。如何在網(wǎng)絡(luò)訓(xùn)練過(guò)程中考慮各標(biāo)準(zhǔn)之間的關(guān)聯(lián)是基于深度學(xué)習(xí)鐵路主要技術(shù)標(biāo)準(zhǔn)優(yōu)選中另一個(gè)關(guān)鍵問(wèn)題。
多任務(wù)學(xué)習(xí)是一種通過(guò)利用相關(guān)任務(wù)訓(xùn)練信號(hào)中有價(jià)值的信息來(lái)提升模型泛化能力的方法[23]。在深度學(xué)習(xí)中,神經(jīng)網(wǎng)絡(luò)可以通過(guò)設(shè)置共享層引入多任務(wù)學(xué)習(xí)機(jī)制,可以看出該模型適于主要技術(shù)標(biāo)準(zhǔn)決策。然而,在鐵路主要技術(shù)標(biāo)準(zhǔn)優(yōu)選問(wèn)題中,如何在各個(gè)標(biāo)準(zhǔn)決策分支間設(shè)置共享層,即采用怎樣的多任務(wù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能夠更好地考慮標(biāo)準(zhǔn)之間的耦合關(guān)聯(lián)關(guān)系是一個(gè)值得探索的問(wèn)題。
多任務(wù)深度學(xué)習(xí)網(wǎng)絡(luò)整體由卷積神經(jīng)網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò)2 部分構(gòu)成,網(wǎng)絡(luò)結(jié)構(gòu)概覽如圖3所示。
其中,卷積神經(jīng)網(wǎng)絡(luò)能夠提取地形圖的特征并將圖像數(shù)據(jù)轉(zhuǎn)化為數(shù)值數(shù)據(jù),全連接神經(jīng)網(wǎng)絡(luò)則利用多任務(wù)學(xué)習(xí)機(jī)制更好地挖掘輸入與多任務(wù)輸出之間的潛在規(guī)律。本研究基于ALEXNET[24]建立了如圖4所示的面向主要技術(shù)標(biāo)準(zhǔn)決策的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。

圖4 并行多任務(wù)基準(zhǔn)模型的卷積神經(jīng)網(wǎng)絡(luò)部分Fig.4 Convolutional neural network part of parallel multitask benchmark model
基準(zhǔn)模型的全連接神經(jīng)網(wǎng)絡(luò)部分采用并行多任務(wù)網(wǎng)絡(luò)形式(如圖5),具體網(wǎng)絡(luò)參數(shù)參照卷積神經(jīng)網(wǎng)絡(luò)部分的全連接層確定。全連接神經(jīng)網(wǎng)絡(luò)部分首先采用融合層將表征地形條件、運(yùn)輸需求和路網(wǎng)中的作用的數(shù)值數(shù)據(jù)融合為長(zhǎng)度為3的一維向量;然后設(shè)置一個(gè)包含2個(gè)全連接層的全連接模塊共享6項(xiàng)主要技術(shù)標(biāo)準(zhǔn)決策的訓(xùn)練信號(hào),神經(jīng)元數(shù)目均為512;最后每項(xiàng)主要技術(shù)標(biāo)準(zhǔn)決策分支從共享層中獨(dú)立出來(lái),各自包含與共享層相同的全連接模塊,用于學(xué)習(xí)各項(xiàng)任務(wù)所獨(dú)有的特征。

圖5 并行多任務(wù)基準(zhǔn)模型的全連接網(wǎng)絡(luò)部分Fig.5 Fully connected network part of the parallel multitasking benchmark model
首先確定損失函數(shù),以及訓(xùn)練集和驗(yàn)證集的損失函數(shù)曲線。然后需要通過(guò)調(diào)節(jié)關(guān)鍵的網(wǎng)絡(luò)參數(shù)提升并行多任務(wù)網(wǎng)絡(luò)的性能。卷積層和全連接層是并行多任務(wù)網(wǎng)絡(luò)的主要組成部分,卷積層層數(shù)、卷積核數(shù)量、全連接層層數(shù)和包含的神經(jīng)元數(shù)目與網(wǎng)絡(luò)性能有著密切的關(guān)系。本文通過(guò)對(duì)比實(shí)驗(yàn)確定上述4種網(wǎng)絡(luò)參數(shù)。為了簡(jiǎn)化網(wǎng)絡(luò)參數(shù)調(diào)節(jié)過(guò)程,本研究假設(shè)卷積層有著相同的卷積核數(shù)量,相鄰全連接層組成全連接模塊,全連接模塊具有相同的層數(shù),每層具有相同的神經(jīng)元數(shù)量。
1) 損失函數(shù)由于工程實(shí)際中各項(xiàng)標(biāo)準(zhǔn)是從多個(gè)離散值中選取,因此,將主要技術(shù)標(biāo)準(zhǔn)優(yōu)選問(wèn)題視為多分類問(wèn)題,并選定多分類交叉熵函數(shù)作為每項(xiàng)標(biāo)準(zhǔn)的損失函數(shù)形式。為了綜合評(píng)價(jià)網(wǎng)絡(luò)輸出的主要技術(shù)標(biāo)準(zhǔn)組合與人工決策結(jié)果的接近程度,將各項(xiàng)標(biāo)準(zhǔn)的目標(biāo)函數(shù)進(jìn)行加權(quán)求和,構(gòu)建了鐵路主要技術(shù)標(biāo)準(zhǔn)優(yōu)選的損失函數(shù)如式(1)和式(2)所示。

其中:L為神經(jīng)網(wǎng)絡(luò)的總損失函數(shù);Li為各項(xiàng)標(biāo)準(zhǔn)的損失函數(shù);wi為各項(xiàng)標(biāo)準(zhǔn)損失函數(shù)在總損失函數(shù)中的權(quán)重;Ni為各項(xiàng)標(biāo)準(zhǔn)中的分類數(shù)量;yij=[yi1,yi2,…,yiNi]是第i項(xiàng)標(biāo)準(zhǔn)中第j個(gè)標(biāo)簽,yij= 1,否則,yik= 0(k≠j);pij=[pi1,pi2,…,piNi]是網(wǎng)絡(luò)對(duì)樣本歸屬于第i項(xiàng)標(biāo)準(zhǔn)中各個(gè)分類的概率預(yù)測(cè)。
2) 訓(xùn)練集和驗(yàn)證集的損失函數(shù)曲線根據(jù)損失函數(shù)定義和試驗(yàn)訓(xùn)練,訓(xùn)練集總損失在第48 步達(dá)到最小值0.547 7,驗(yàn)證集總損失在第43 步達(dá)到最小值0.537 1,如圖6所示(詳見第4節(jié)試驗(yàn)部分)。

圖6 訓(xùn)練集和驗(yàn)證集的損失函數(shù)曲線對(duì)比Fig.6 Comparison diagram of loss function curves of training set and verification set
3) 卷積層層數(shù)一般來(lái)說(shuō),卷積層越深,網(wǎng)絡(luò)的表達(dá)能力越強(qiáng),有助于提高網(wǎng)絡(luò)性能。但是卷積和池化操作會(huì)壓縮特征圖尺寸,過(guò)深的卷積層會(huì)丟失較多的特征圖信息,而過(guò)淺的卷積層會(huì)因?yàn)樘卣鲌D尺寸過(guò)大而降低訓(xùn)練效率。本研究中輸入的地形圖尺寸為333×333,卷積層為2 層時(shí),特征圖尺寸為157×157,展平為一維向量后長(zhǎng)度是24 649,連接全連接層會(huì)占用過(guò)多的計(jì)算資源而影響訓(xùn)練效率;卷積層為6 時(shí),特征圖尺寸為3×3,特征圖信息被過(guò)度壓縮。因此,本研究分別取3,4和5作為卷積層層數(shù),其他網(wǎng)絡(luò)參數(shù)同基準(zhǔn)模型,在相同數(shù)據(jù)集和訓(xùn)練參數(shù)條件下進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如下:
通過(guò)圖7 可知,具有5 個(gè)卷積層的網(wǎng)絡(luò)決策準(zhǔn)確率顯著高于具有2個(gè),因此卷積層取5層。

圖7 卷積層層數(shù)對(duì)網(wǎng)絡(luò)準(zhǔn)確率的影響Fig.7 Effect of the number of convolutional layers on the accuracy of the network
4) 卷積核數(shù)量卷積核數(shù)量即為卷積層中提取到的特征圖數(shù)量,目前大多數(shù)研究中的卷積核數(shù)量通過(guò)實(shí)驗(yàn)確定。一般卷積核數(shù)量為2n個(gè),本研究中地形特征沒(méi)有特別復(fù)雜的模式,因此分別取神經(jīng)網(wǎng)絡(luò)的卷積核數(shù)量為8,16,32 個(gè),設(shè)置5 個(gè)卷積層,其他網(wǎng)絡(luò)參數(shù)同基準(zhǔn)模型,觀察卷積核數(shù)量對(duì)網(wǎng)絡(luò)性能的影響。
從圖8 可以看出,采用8 個(gè)卷積核能讓網(wǎng)絡(luò)有更好的性能表現(xiàn),因此卷積核數(shù)量取8。

圖8 卷積核數(shù)量對(duì)網(wǎng)絡(luò)準(zhǔn)確率的影響Fig.8 Effect of the number of convolution kernels on the accuracy of networks
5) 全連接層層數(shù)通常深層的全連接網(wǎng)絡(luò)具有更強(qiáng)的表達(dá)能力,但是過(guò)深的網(wǎng)絡(luò)可能會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練困難,引起性能退化。由于并行多任務(wù)網(wǎng)絡(luò)中最多有3個(gè)全連接模塊首尾相連,本研究分別取1,2 和3 作為全連接模塊中的網(wǎng)絡(luò)層數(shù),即總?cè)B接層分別為3,6和9層,設(shè)置5個(gè)卷積層,每層8個(gè)卷積核,其他網(wǎng)絡(luò)參數(shù)同基準(zhǔn)模型,試驗(yàn)結(jié)果如下:
從圖9 可看出,全連接模塊的層數(shù)取2 時(shí)即可以提升網(wǎng)絡(luò)的表達(dá)能力,因此本研究取全連接模塊的層數(shù)為2。

圖9 全連接層層數(shù)對(duì)網(wǎng)絡(luò)準(zhǔn)確率的影響Fig.9 Effect of the number of fully connected layers on the accuracy of network
6) 全連接層神經(jīng)元數(shù)目在全連接層中,神經(jīng)元數(shù)目越多,網(wǎng)絡(luò)自由度越高,能夠擬合更加復(fù)雜的規(guī)律,但過(guò)于復(fù)雜的模型可能會(huì)導(dǎo)致實(shí)驗(yàn)出現(xiàn)過(guò)擬合。為了避免模型過(guò)于復(fù)雜以至于出現(xiàn)過(guò)擬合的現(xiàn)象,在AlexNet 的基礎(chǔ)上(全連接層有4 096 個(gè)神經(jīng)元)減少了全連接層的神經(jīng)元數(shù)目。本研究分別將全連接層的神經(jīng)元數(shù)目設(shè)置為128,256,512 和1 024,卷積層層數(shù)、卷積核數(shù)量、全連接模塊中網(wǎng)絡(luò)層數(shù)分別取5,8 和2,試驗(yàn)結(jié)果如下:
實(shí)驗(yàn)結(jié)果表明,全連接層采用512 個(gè)神經(jīng)元時(shí),網(wǎng)絡(luò)性能最好,因此,多任務(wù)網(wǎng)絡(luò)中神經(jīng)元數(shù)目取512個(gè)。

圖10 全連接層神經(jīng)元數(shù)目對(duì)網(wǎng)絡(luò)準(zhǔn)確率的影響Fig.10 Effect of the number of neurons in the full connection layer on the accuracy of the network
最終,確定并行多任務(wù)學(xué)習(xí)的結(jié)構(gòu)參數(shù)為5個(gè)卷積層,各有8個(gè)卷積核,每個(gè)全連接網(wǎng)絡(luò)模塊包含2個(gè)全連接層,每層包含512個(gè)神經(jīng)元。
本研究從各大鐵路設(shè)計(jì)單位,收集了包含32條鐵路共5 736 km 線路數(shù)據(jù)。地形數(shù)據(jù)來(lái)源于地理空間數(shù)據(jù)云(http://www.gscloud.cn/),數(shù)據(jù)類型為DEM,地形圖分辨率為30 m。在32 條鐵路中,干線與支線比例為26:6。由于神經(jīng)網(wǎng)絡(luò)只能處理固定大小的地形圖,而每個(gè)鐵路區(qū)間的地形圖大小不一,因此本文將每個(gè)鐵路區(qū)間的地形圖裁剪為若干尺寸為333×333 像素,即9.99 km×9.99 km 的局部地形圖,每個(gè)局部地形圖和線路的運(yùn)輸需求、在路網(wǎng)中的作用及其6項(xiàng)主要技術(shù)標(biāo)準(zhǔn)組成一個(gè)案例。因此1個(gè)鐵路區(qū)間可以產(chǎn)生多個(gè)案例,最終32個(gè)鐵路區(qū)間裁剪出2 624了個(gè)案例樣本。
每個(gè)案例樣本輸入包括地形圖、運(yùn)輸需求和路網(wǎng)中的作用,所有輸入在進(jìn)入網(wǎng)絡(luò)前都進(jìn)行了歸一化處理。對(duì)應(yīng)的標(biāo)簽包括設(shè)計(jì)速度、限制坡度、最小曲線半徑、機(jī)車類型、牽引質(zhì)量和到發(fā)線有效長(zhǎng)6項(xiàng)標(biāo)準(zhǔn)。
基于谷歌深度學(xué)習(xí)TensorFlow 框架,實(shí)驗(yàn)中訓(xùn)練集和驗(yàn)證集的比例為6:4,訓(xùn)練輪數(shù)為50。網(wǎng)絡(luò)采用Adam 算法進(jìn)行批量訓(xùn)練,批大小為16,學(xué)習(xí)率為3×10?4。深度學(xué)習(xí)網(wǎng)絡(luò)優(yōu)選的主要技術(shù)標(biāo)準(zhǔn)與人工決策對(duì)比,準(zhǔn)確率達(dá)到96.88%(限制坡度)、81.25%( 設(shè) 計(jì) 速 度)、 87.5%( 最 小 曲 線 半 徑)、93.75%(機(jī)車類型)、84.38%(牽引質(zhì)量)、84.38%(到發(fā)線有效長(zhǎng))。其中,人工決策結(jié)果與網(wǎng)絡(luò)推薦標(biāo)準(zhǔn)的對(duì)比如表1所示。

表1 深度學(xué)習(xí)網(wǎng)絡(luò)優(yōu)選的主要技術(shù)標(biāo)準(zhǔn)與人工決策對(duì)比Table 1 Comparison table of main technical standards between deep learning network and manual decision making
實(shí)例驗(yàn)證,本研究提出的基于并行多任務(wù)深度學(xué)習(xí)的鐵路主要技術(shù)標(biāo)準(zhǔn)優(yōu)選方法具有較好的效果,可為新建鐵路項(xiàng)目主要技術(shù)標(biāo)準(zhǔn)的優(yōu)選提供有效的技術(shù)決策支持。
鐵路主要技術(shù)標(biāo)準(zhǔn)優(yōu)選的本質(zhì)是建立運(yùn)量需求、自然條件、裝備水平等多維環(huán)境因素到限制坡度、最小曲線半徑、牽引種類、機(jī)車類型等主要技術(shù)標(biāo)準(zhǔn)之間的潛在映射關(guān)系。現(xiàn)有的智能選線技術(shù)只能間接提升主要技術(shù)標(biāo)準(zhǔn)決策效率,無(wú)法從根本上解決該問(wèn)題。既有的直接法以模型為中心,通過(guò)有限樣本統(tǒng)計(jì)回歸模型參數(shù)的方法,無(wú)法準(zhǔn)確反映客觀規(guī)律且不具有普適性。對(duì)此,本研究基于最新的機(jī)器學(xué)習(xí)方法,提出了基于并行多任務(wù)深度學(xué)習(xí)的鐵路主要技術(shù)標(biāo)準(zhǔn)優(yōu)選方法,具有以下特點(diǎn):
1) 將連續(xù)分布的地形進(jìn)行分割并轉(zhuǎn)換為多通道圖像;再建立卷積神經(jīng)網(wǎng)絡(luò)提取特征轉(zhuǎn)化為數(shù)值數(shù)據(jù);然后與枚舉型鐵路性質(zhì)、數(shù)值型鐵路運(yùn)量融合;最終形成適于深度學(xué)習(xí)的輸入?yún)?shù),有效解決了主要技術(shù)標(biāo)準(zhǔn)深度學(xué)習(xí)多模態(tài)輸入端參數(shù)的構(gòu)建問(wèn)題。
2) 針對(duì)主要技術(shù)標(biāo)準(zhǔn)優(yōu)選的輸出端各標(biāo)準(zhǔn)之間相互關(guān)聯(lián)的問(wèn)題,建立了適于主要技術(shù)標(biāo)準(zhǔn)優(yōu)選的并行多任務(wù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并通過(guò)大量實(shí)驗(yàn),確定了網(wǎng)絡(luò)模型中的關(guān)鍵參數(shù)。
3) 經(jīng)5 736 km 既有線路實(shí)例驗(yàn)證,主要技術(shù)標(biāo)準(zhǔn)決策的平均準(zhǔn)確率可達(dá)88%以上,證明了本文方法的有效性。