謝亞楠 周森鑫
摘 要:隨著城鎮(zhèn)化建設(shè)的快速推進(jìn),園林工程項(xiàng)目的規(guī)模以及復(fù)雜程度也在日益增長(zhǎng),然而傳統(tǒng)計(jì)算工程項(xiàng)目關(guān)鍵路線的方法由于自身的局限性,很難在規(guī)模大的項(xiàng)目中找出最優(yōu)路線。因此,在工程網(wǎng)絡(luò)圖的基礎(chǔ)上,提出基于DQN(Deep Q Network)的工程進(jìn)度管理方法,通過(guò)構(gòu)建神經(jīng)網(wǎng)絡(luò),將大量的歷史數(shù)據(jù)輸入進(jìn)去,讓計(jì)算機(jī)來(lái)計(jì)算關(guān)鍵線路,進(jìn)而預(yù)測(cè)施工周期,并以某公園為例進(jìn)行實(shí)驗(yàn)仿真分析。實(shí)驗(yàn)表明此算法在應(yīng)對(duì)規(guī)模較大的項(xiàng)目時(shí),計(jì)算關(guān)鍵線路更加準(zhǔn)確,效率也更高,可以幫助施工單位快速找到最優(yōu)策略,有效減少由于不確定性因素造成的工期延誤以及資金的損失。
關(guān)鍵詞:深度強(qiáng)化學(xué)習(xí);DQN;園林工程進(jìn)度管理;工程網(wǎng)絡(luò)圖
中圖分類號(hào):TU986.3? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):1673-260X(2022)02-0032-05
1 引言
自黨的十八大以來(lái),生態(tài)環(huán)境理念越來(lái)越被重視,而園林工程項(xiàng)目在生態(tài)環(huán)境建設(shè)中起著至關(guān)重要的作用?,F(xiàn)代園林工程項(xiàng)目具有規(guī)模大、復(fù)雜度高、周期長(zhǎng)、工期緊等特點(diǎn)[1],所以在實(shí)施過(guò)程中環(huán)境、技術(shù)以及資源等一些不確定因素都會(huì)影響整個(gè)工程的進(jìn)度管理。進(jìn)度管理是制約園林工程項(xiàng)目質(zhì)量的關(guān)鍵因素之一,沒(méi)有合理的項(xiàng)目進(jìn)度管理,各項(xiàng)目之間就會(huì)很難協(xié)調(diào)運(yùn)作,從而影響整個(gè)工程進(jìn)度。然而傳統(tǒng)進(jìn)度管理的方法由于自身局限性,很難做出精準(zhǔn)預(yù)測(cè),因此探索智能化的園林工程進(jìn)度管理方法十分必要。
目前,常用的進(jìn)度管理方法主要包括甘特圖法、關(guān)鍵路徑法和關(guān)鍵鏈法等[2]。然而在這些方法中,甘特圖雖然比較直觀,易于理解,但是在面對(duì)復(fù)雜的項(xiàng)目時(shí),不能夠很好地體現(xiàn)項(xiàng)目之間的邏輯關(guān)系[3],適用于相對(duì)簡(jiǎn)單的項(xiàng)目;關(guān)鍵路徑法通過(guò)分析項(xiàng)目之間的邏輯關(guān)系和結(jié)構(gòu)得出網(wǎng)絡(luò)計(jì)劃圖,然后再推斷出不同工序的持續(xù)時(shí)間和時(shí)間參數(shù),利用數(shù)學(xué)和運(yùn)籌學(xué)的方法確定工程項(xiàng)目的關(guān)鍵路線[4],這種方法雖然也能準(zhǔn)確計(jì)算關(guān)鍵線路,但是面對(duì)規(guī)模大且復(fù)雜的項(xiàng)目時(shí),計(jì)算就需要耗費(fèi)大量的時(shí)間,進(jìn)而影響整個(gè)進(jìn)度管理,而且該方法對(duì)于資源受限產(chǎn)生的資源沖突也無(wú)法有效解決[5];相對(duì)于關(guān)鍵路徑法,關(guān)鍵鏈法做了許多改進(jìn),它將資源約束考慮到實(shí)際運(yùn)用中,用有限的資源對(duì)項(xiàng)目進(jìn)度管理進(jìn)行規(guī)劃[6],并采用集中項(xiàng)目管理的緩沖時(shí)間來(lái)保證項(xiàng)目的運(yùn)行,有效改善了項(xiàng)目的進(jìn)度管理,同時(shí)也提升了公司的績(jī)效水平。但是一旦項(xiàng)目規(guī)模大時(shí),關(guān)鍵鏈法在前期確定關(guān)鍵路線時(shí)就會(huì)顯得效率低下,因此探索智能化的園林工程進(jìn)度管理方法對(duì)于日后的項(xiàng)目進(jìn)度管理尤為重要。
實(shí)際上,智能化的項(xiàng)目進(jìn)度管理方法早在多年前就被有些學(xué)者所研究。Kim等開(kāi)發(fā)了基于Agent技術(shù)的智能土方系統(tǒng),實(shí)現(xiàn)了對(duì)土方建設(shè)工程進(jìn)度的有效管理[7];丁烈云等以精準(zhǔn)制造理論和多層次階段進(jìn)度計(jì)劃為基本原理,從智能進(jìn)度計(jì)劃概念入手,分析了智能管理系統(tǒng)的必要性和重要性[8]。早期的研究一般都是基于理論概念的,近兩年也有學(xué)者對(duì)智能化的進(jìn)度管理方法進(jìn)行探索,顏功達(dá)等建立了基于多智能體的進(jìn)度風(fēng)險(xiǎn)評(píng)估模型并進(jìn)行實(shí)驗(yàn)分析,得出應(yīng)優(yōu)先合理采取措施控制重要工序中的風(fēng)險(xiǎn)因素,為復(fù)雜工程項(xiàng)目提供了很好地參考價(jià)值[9];吳曼茜以地鐵站為例,研究了地鐵站建設(shè)進(jìn)度以及投資智能預(yù)測(cè)和控制系統(tǒng),大大提升了地鐵站建設(shè)的進(jìn)度管理,同時(shí)對(duì)投資成本控制也做出了很好的規(guī)劃[10]。
綜上所述,當(dāng)園林工程施工項(xiàng)目較多且復(fù)雜時(shí),傳統(tǒng)的甘特圖法、關(guān)鍵路徑法以及關(guān)鍵鏈法在計(jì)算關(guān)鍵路線時(shí)由于自身理論的局限性,不僅需要大量的人工計(jì)算而且容易受到不確定性因素的影響,從而導(dǎo)致工期延誤。因此,本文基于前人研究的基礎(chǔ)提出DQN的工程進(jìn)度管理模型,并以某公園為例進(jìn)行實(shí)驗(yàn)仿真分析,通過(guò)構(gòu)造神經(jīng)網(wǎng)絡(luò),將施工項(xiàng)目抽象化,讓計(jì)算機(jī)去計(jì)算該項(xiàng)目的關(guān)鍵路線,進(jìn)而預(yù)測(cè)施工周期,實(shí)驗(yàn)表明此算法對(duì)于精準(zhǔn)計(jì)算關(guān)鍵路線有較好的效果,可以幫助施工單位更快更準(zhǔn)確地預(yù)測(cè)工期,進(jìn)而按時(shí)完工。
2 基于DQN的園林工程進(jìn)度管理方法
2.1 DQN算法
經(jīng)典的強(qiáng)化學(xué)習(xí)是表格型方法,在處理高維數(shù)據(jù)特征時(shí),容易發(fā)生維數(shù)災(zāi)難問(wèn)題,受深度學(xué)習(xí)啟發(fā),將二者結(jié)合形成了深度強(qiáng)化學(xué)習(xí),而DQN算法在深度強(qiáng)化學(xué)習(xí)中使用尤為廣泛。DQN算法是一種經(jīng)典的基于值函數(shù)的深度強(qiáng)化學(xué)習(xí)算法[11,12],它將卷積神經(jīng)網(wǎng)絡(luò)CNN與Q-Learning算法相結(jié)合,利用CNN對(duì)圖像的強(qiáng)大表征能力,將視頻幀數(shù)據(jù)視為強(qiáng)化學(xué)習(xí)中的狀態(tài)輸入網(wǎng)絡(luò),然后由網(wǎng)絡(luò)輸出離散的動(dòng)作值函數(shù),Agent再根據(jù)動(dòng)作值函數(shù)選擇對(duì)應(yīng)的動(dòng)作。DQN算法之所以能夠較好的將深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合是因?yàn)樗肓?個(gè)核心技術(shù),分別是目標(biāo)函數(shù)、目標(biāo)網(wǎng)絡(luò)和經(jīng)驗(yàn)回放機(jī)制。其訓(xùn)練過(guò)程如圖1所示:
(1)目標(biāo)函數(shù):使用卷積神經(jīng)網(wǎng)絡(luò)結(jié)合全鏈接作為動(dòng)作值函數(shù)的逼近器,實(shí)現(xiàn)端到端的效果,輸入為圖像畫(huà)面,輸出為有限的動(dòng)作值函數(shù)。
(2)目標(biāo)網(wǎng)絡(luò):為了使DQN算法性能更加穩(wěn)定,使用兩個(gè)包含CNN的網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí)。一是網(wǎng)絡(luò)模型Q(s,a,w)代替預(yù)測(cè)Q網(wǎng)絡(luò),用于評(píng)估當(dāng)前狀態(tài)-動(dòng)作對(duì)應(yīng)的值;二是使用網(wǎng)絡(luò)模型Q(s,a,w’)代替目標(biāo)Q網(wǎng)絡(luò),用于計(jì)算目標(biāo)值。這樣就可以得到雙網(wǎng)絡(luò)架構(gòu)下的DQN損失函數(shù)L(w):
式中,w表示損失函數(shù)中的網(wǎng)絡(luò)參數(shù),E表示數(shù)學(xué)期望,r+γQ(s′,a′,w′)表示Q網(wǎng)絡(luò)優(yōu)化的目標(biāo)值,其中w′表示目標(biāo)網(wǎng)絡(luò)的參數(shù)。深度Q網(wǎng)絡(luò)是基于梯度規(guī)則更新網(wǎng)絡(luò)參數(shù),(1)式損失函數(shù)對(duì)權(quán)重求偏導(dǎo)即可得到:
式中?表示梯度計(jì)算。雙網(wǎng)絡(luò)的結(jié)構(gòu)和初始參數(shù)都是一樣的,即w0=w0′。每經(jīng)過(guò)數(shù)輪迭代后都有w′=w。所以DQN算法引入目標(biāo)網(wǎng)絡(luò),在一段時(shí)間內(nèi)目標(biāo)Q值保持不變,降低了訓(xùn)練時(shí)損失值震蕩和發(fā)散的可能性,充分保證了訓(xùn)練時(shí)間,提高了算法的穩(wěn)定性。
(3)經(jīng)驗(yàn)回放機(jī)制:DQN算法引入經(jīng)驗(yàn)回放機(jī)制,將每個(gè)時(shí)刻Agent與環(huán)境交互得到的經(jīng)驗(yàn)遷移樣本存儲(chǔ)到經(jīng)驗(yàn)池中[13],在執(zhí)行步數(shù)之后,從經(jīng)驗(yàn)池中隨機(jī)取出批量大小的樣本作為離散數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò),然后再采取小批量隨機(jī)半梯度下降法(MBSGD)更新網(wǎng)絡(luò)參數(shù)。
所以文章根據(jù)DQN算法的特性以及園林工程進(jìn)度管理數(shù)據(jù)的特征,使用DQN算法計(jì)算關(guān)鍵路線進(jìn)而預(yù)測(cè)施工周期,并進(jìn)行仿真模擬實(shí)驗(yàn)分析,得到的關(guān)鍵路線與關(guān)鍵鏈法的一致且預(yù)測(cè)的工期周期與真實(shí)值很接近。同時(shí)也證明了此算法在園林工程進(jìn)度管理中的可行性與可靠性。
2.2 深度Q網(wǎng)絡(luò)的Q值更新方法
DQN網(wǎng)絡(luò)模型的關(guān)鍵設(shè)計(jì)點(diǎn)要在Q值更新,本文根據(jù)項(xiàng)目的特點(diǎn),為了使網(wǎng)絡(luò)更加穩(wěn)定,設(shè)計(jì)了兩個(gè)相同結(jié)構(gòu)但參數(shù)不同的神經(jīng)網(wǎng)絡(luò),分別對(duì)Q實(shí)際值和估計(jì)值更新來(lái)實(shí)現(xiàn)價(jià)值函數(shù)的收斂。其更新過(guò)程如圖2所示。
與此同時(shí),DQN算法使用一個(gè)記憶庫(kù)來(lái)學(xué)習(xí)之前的經(jīng)歷[14],每次更新時(shí),都會(huì)隨機(jī)抽取之前的經(jīng)歷進(jìn)行學(xué)習(xí),而針對(duì)本項(xiàng)目,目標(biāo)網(wǎng)絡(luò)用兩個(gè)相同結(jié)構(gòu)但參數(shù)不同的網(wǎng)絡(luò)進(jìn)行更新使得效率更高也更加穩(wěn)定。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)可能會(huì)出現(xiàn)不穩(wěn)定或者是訓(xùn)練困難,針對(duì)此問(wèn)題,DQN采用目標(biāo)網(wǎng)絡(luò)和經(jīng)驗(yàn)回放池來(lái)改進(jìn),使用的損失函數(shù)為:
公式(3)中采用了相同的估計(jì)值、現(xiàn)實(shí)值和權(quán)重,因?yàn)槭褂猛痪W(wǎng)絡(luò)來(lái)計(jì)算目標(biāo)值和預(yù)測(cè)值容易產(chǎn)生很大的差別,所以本文采用目標(biāo)網(wǎng)絡(luò)來(lái)計(jì)算目標(biāo)值,使用的損失函數(shù)具體為:
DQN采用了兩個(gè)結(jié)構(gòu)相同但參數(shù)不同的神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)Q估計(jì)值的神經(jīng)網(wǎng)絡(luò)使用的是最新的參數(shù),而預(yù)測(cè)Q實(shí)際值同樣采用神經(jīng)網(wǎng)路最新參數(shù)[15],這樣可以使訓(xùn)練過(guò)程更加穩(wěn)定。
2.3 狀態(tài)和動(dòng)作的選擇
狀態(tài)的設(shè)定對(duì)實(shí)驗(yàn)的影響至關(guān)重要,根據(jù)項(xiàng)目的特點(diǎn),本文將施工的事件抽象為狀態(tài),文中選取的數(shù)據(jù)共有21個(gè)事件,也就是有21個(gè)狀態(tài),狀態(tài)空間為設(shè)為S,si表示第i個(gè)狀態(tài)(i=1,2,3,…,21)。狀態(tài)之間的轉(zhuǎn)移表示為動(dòng)作,A表示動(dòng)作空間,ai表示第i個(gè)動(dòng)作(i=1,2,3,…,21),動(dòng)作與狀態(tài)一樣,也有21個(gè)。
在強(qiáng)化學(xué)習(xí)中,Agent通過(guò)與環(huán)境不斷進(jìn)行交互來(lái)獲得獎(jiǎng)勵(lì)[16],如何在和環(huán)境交互時(shí)找到一個(gè)最優(yōu)策略但又不至于在試錯(cuò)過(guò)程中丟失太多獎(jiǎng)勵(lì),就需要一個(gè)好的方法來(lái)平衡。探索是Agent進(jìn)行不斷的試錯(cuò)來(lái)搜集更多的信息,擴(kuò)大記憶庫(kù),短期內(nèi)不會(huì)帶來(lái)很大的獎(jiǎng)勵(lì),看重的是長(zhǎng)期回報(bào)。而利用則是根據(jù)當(dāng)前記憶庫(kù)做出當(dāng)前狀態(tài)下的最佳選擇,獲得即刻的獎(jiǎng)勵(lì),注重的是短期回報(bào),但是這樣會(huì)導(dǎo)致長(zhǎng)期利益受損。所以本文結(jié)合ε-greedy(0<ε<1)進(jìn)行選擇,其中,ε=0.9,即90%的情況下可以作出最佳選擇,10%情況下隨機(jī)選擇。通過(guò)這樣的設(shè)置,不僅能夠保證短期利益同時(shí)也能保證長(zhǎng)期利益。
2.4 獎(jiǎng)賞函數(shù)的設(shè)置
強(qiáng)化學(xué)習(xí)的最終目標(biāo)就是使獲得的獎(jiǎng)勵(lì)最大,在本實(shí)驗(yàn)中,將上一個(gè)事件到達(dá)下一個(gè)事件所用的時(shí)間設(shè)為獎(jiǎng)勵(lì)值,G為獎(jiǎng)賞值函數(shù),R表示Agent由當(dāng)前狀態(tài)S到下一個(gè)狀態(tài)S 執(zhí)行動(dòng)作a后所獲得的立即獎(jiǎng)賞[17],有了立即獎(jiǎng)賞,我們就可以得到項(xiàng)目中由上一個(gè)事件到達(dá)下一個(gè)事件獲得的獎(jiǎng)勵(lì)值,記為關(guān)鍵路徑。獎(jiǎng)賞函數(shù)的計(jì)算公式如下:
式中表示總的回報(bào)等于下一個(gè)狀態(tài)的折扣獎(jiǎng)賞加上立即獎(jiǎng)賞,其中λ是折扣因子,此公式也說(shuō)明,項(xiàng)目中由上一個(gè)事件到下一個(gè)事件獲得的獎(jiǎng)勵(lì)值越大,最優(yōu)路徑被選擇的概率也就越大。
3 實(shí)驗(yàn)與分析
3.1 實(shí)驗(yàn)案例介紹
某市一個(gè)公園需要進(jìn)行維修,該工程要求完成時(shí)間緊,涉及事件繁多,各項(xiàng)工作交叉緊密,技術(shù)要求高等特點(diǎn),各部門都高度重視,要求施工人員快速找到關(guān)鍵路徑進(jìn)行完工,根據(jù)歷史數(shù)據(jù)及以往工程進(jìn)展情況,進(jìn)行了數(shù)據(jù)搜集與整理,如表1所示。
由表1可以看出該項(xiàng)目共有21個(gè)事件,根據(jù)各個(gè)工作之間的邏輯關(guān)系可以得到項(xiàng)目活動(dòng)網(wǎng)絡(luò)圖[18],如圖3所示,如果使用傳統(tǒng)的關(guān)鍵鏈法找出關(guān)鍵路線需要人工進(jìn)行大量的計(jì)算,不僅要耗費(fèi)大量的人力物力,而且還有可能出現(xiàn)錯(cuò)誤,所以本文使用深度強(qiáng)化學(xué)習(xí)中的DQN算法進(jìn)行訓(xùn)練找出關(guān)鍵路線,進(jìn)而來(lái)預(yù)測(cè)施工周期。
3.2 實(shí)驗(yàn)過(guò)程
由表1可以看出該項(xiàng)目共有21個(gè)事件,由各個(gè)事件之間的邏輯關(guān)系可以得到各項(xiàng)工作之間轉(zhuǎn)移所獲得的獎(jiǎng)勵(lì),構(gòu)成獎(jiǎng)勵(lì)矩陣。本實(shí)驗(yàn)使用Tensorflow平臺(tái)進(jìn)行實(shí)現(xiàn),利用python語(yǔ)言進(jìn)行編程,運(yùn)用DQN算法進(jìn)行訓(xùn)練,首先將事件抽象為狀態(tài),事件之間的轉(zhuǎn)移抽象為動(dòng)作同時(shí)輸入到神經(jīng)網(wǎng)絡(luò)中,然后使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行處理,兩層卷積核的數(shù)目分別是21和42,卷積核大小為3*3。在訓(xùn)練過(guò)程中,設(shè)置Q學(xué)習(xí)的折扣因子λ=1,迭代次數(shù)N=1000,經(jīng)驗(yàn)池大小D=1000,每次提取的樣本數(shù)batch=50,設(shè)置神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率α=1。有了這些參數(shù)的設(shè)置,把數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)以后,由神經(jīng)網(wǎng)絡(luò)進(jìn)行判斷,最后輸出動(dòng)作價(jià)值,得到的Q獎(jiǎng)勵(lì)矩陣如下:
3.3實(shí)驗(yàn)結(jié)果
根據(jù)DQN算法的訓(xùn)練結(jié)果,我們可以得到每一個(gè)工作向另一個(gè)工作移動(dòng)的價(jià)值,如圖4所示。
由實(shí)驗(yàn)結(jié)果可以得知,當(dāng)Q矩陣收斂后,智能體Agent就可以學(xué)習(xí)到該工程管理進(jìn)度的關(guān)鍵路線。由此可知當(dāng)狀態(tài)為1時(shí),最優(yōu)的轉(zhuǎn)移方式是2,對(duì)應(yīng)的價(jià)值為52,到狀態(tài)2時(shí),可轉(zhuǎn)移的狀態(tài)有3和4,對(duì)應(yīng)的價(jià)值分別為50和49,選擇價(jià)值較大的為50,即轉(zhuǎn)移方式為3,以此類推可以得到當(dāng)狀態(tài)為20時(shí),選擇21,對(duì)應(yīng)的價(jià)值為3,所以最優(yōu)路徑為1→2→3→4→6→8→10→11→12→13→14→15→17→19→20→21,即A→B→C→E→H→J→L→M→O→Q→S→U→W→X,從而可以得到施工周期為55天。
以上實(shí)驗(yàn)結(jié)果表明了DQN算法在園林工程進(jìn)度管理中確定關(guān)鍵路線與施工周期時(shí)的準(zhǔn)確性與可行性,相比較傳統(tǒng)的進(jìn)度管理方法,DQN算法減少了計(jì)算量,縮短了計(jì)算最優(yōu)路徑的時(shí)間,進(jìn)一步說(shuō)明DQN算法用于探索智能園林工程進(jìn)度管理的可行性與合理性。
4 結(jié)語(yǔ)
傳統(tǒng)的工程進(jìn)度管理方法在面對(duì)工程項(xiàng)目規(guī)模大時(shí)很難計(jì)算出關(guān)鍵路線,本文針對(duì)此問(wèn)題進(jìn)行研究,提出基于DQN園林進(jìn)度管理模型探索智能化的進(jìn)度管理方法并以某公園為例進(jìn)行仿真實(shí)驗(yàn)分析,實(shí)驗(yàn)表明此算法對(duì)于計(jì)算項(xiàng)目的最優(yōu)路線效率更高,準(zhǔn)確率也更高,進(jìn)一步說(shuō)明此算法對(duì)于探索智能化的園林工程進(jìn)度管理方法的可行性與合理性。人工智能的快速發(fā)展使得各行各業(yè)都在探尋智能化的管理方法,而園林工程項(xiàng)目作為城市建設(shè)的重要一環(huán)也要跟上時(shí)代的腳步,尋找智能化的管理方法對(duì)其來(lái)說(shuō)有著重要的意義。文章將深度強(qiáng)化學(xué)習(xí)方法應(yīng)用到園林工程進(jìn)度管理中,并且通過(guò)仿真實(shí)驗(yàn)分析證實(shí)了此方法的有效性,從而讓相關(guān)部門在項(xiàng)目施工時(shí)可以不再依賴人工去計(jì)算關(guān)鍵路線,有效減少了人力成本,節(jié)省了大量資源,同時(shí)也為一些學(xué)者提供了一定的研究思路。
參考文獻(xiàn):
〔1〕趙德剛.關(guān)鍵鏈法在工程多項(xiàng)目進(jìn)度管理中的應(yīng)用[J].項(xiàng)目管理技術(shù),2008(S1):223-226.
〔2〕葉舸文.基于掙值技術(shù)的民航通信臺(tái)站機(jī)電工程項(xiàng)目成本—進(jìn)度管理研究[D].上海:東華大學(xué),2018.
〔3〕Ruoyu Jin, Tong Yang, Poorang Piroozfar, Byung-Gyoo Kang, Dariusz Wanatowski, Craig Matthew Hancock, Llewellyn Tang. Project-based pedagogy in interdisciplinary building design adopting BIM[J]. Engineering, Construction and Architectural Management, 2018,25(10):16-20.
〔4〕劉燁.關(guān)鍵鏈法在工程項(xiàng)目進(jìn)度管理中的應(yīng)用[J].石化技術(shù),2017,24(04):233-239.
〔5〕Xie Fang, Li Haitao, Xu Zhe. Multi-mode resource-constrained project scheduling with uncertain activity cost[J]. Expert Systems With Applications, 2021,168.
〔6〕Mahdavi Amirhosein, Shirazi Babak, Rezaeian Javad. Toward a scalable type-2 fuzzy model for resource-constrained project scheduling problem[J]. Applied Soft Computing Journal, 2021,100.
〔7〕Seiichiro Nakao, Dong-Hyun Kim, Keigo Obata, Sinji Inazawa, Masatoshi Majima, Keiji Koyama,Yoshie Tani. Electroless pure nickel plating process with continuous electrolytic regeneration system[J]. Surface & Coatings Technology, 2003,169.
〔8〕丁烈云,祁神軍,陳峰.大型復(fù)雜工程智能進(jìn)度計(jì)劃管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].施工技術(shù),2006,30(12):121-123.
〔9〕顏功達(dá),董鵬,文昊林.基于多智能體的復(fù)雜工程項(xiàng)目進(jìn)度風(fēng)險(xiǎn)評(píng)估仿真建模[J].計(jì)算機(jī)科學(xué),2019, 46(S1):523-526.
〔10〕吳曼茜.地鐵車站建設(shè)進(jìn)度及投資智能預(yù)測(cè)與控制方法研究[D].石家莊:石家莊鐵道大學(xué),2020.
〔11〕楊冉.利用深度強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)智能網(wǎng)絡(luò)流量控制[D].北京:北京郵電大學(xué),2019.
〔12〕余晨.基于智能SDN的傳輸優(yōu)化和流量分配機(jī)制研究[D].杭州:浙江大學(xué),2018.
〔13〕孫浩,陳春林,劉瓊,趙佳寶.基于深度強(qiáng)化學(xué)習(xí)的交通信號(hào)控制方法[J].計(jì)算機(jī)科學(xué),2020,47(02):169-174.
〔14〕李艷慶.基于遺傳算法和深度強(qiáng)化學(xué)習(xí)的多無(wú)人機(jī)協(xié)同區(qū)域監(jiān)視的航路規(guī)劃[D].西安:西安電子科技大學(xué),2018.
〔15〕李季.基于深度強(qiáng)化學(xué)習(xí)的移動(dòng)邊緣計(jì)算中的計(jì)算卸載與資源分配算法研究與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2019.
〔16〕徐涌.基于多Agent系統(tǒng)的主題爬行蟲(chóng)協(xié)作與實(shí)現(xiàn)方法研究[D].成都:西華大學(xué),2012.
〔17〕李兆榮.數(shù)據(jù)挖掘中關(guān)于動(dòng)作知識(shí)提取方法的研究[D].揚(yáng)州:揚(yáng)州大學(xué),2018.
〔18〕陳俊波.考慮施工設(shè)備租賃的項(xiàng)目調(diào)度問(wèn)題研究[D].武漢:華中科技大學(xué),2009.
收稿日期:2021-10-10
基金項(xiàng)目:國(guó)家社科基金一般項(xiàng)目(15BGL035);安徽財(cái)經(jīng)大學(xué)研究生科研創(chuàng)新基金項(xiàng)目(ACYC2020366)
3571501908233
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2022年2期