亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于可變形卷積時(shí)空網(wǎng)絡(luò)的乘車需求預(yù)測(cè)模型*

        2021-02-25 12:16:06于瑞云林福郁高寧蔚
        軟件學(xué)報(bào) 2021年12期
        關(guān)鍵詞:交通流量乘車時(shí)空

        于瑞云,林福郁,高寧蔚,李 婕

        1(東北大學(xué) 軟件學(xué)院,遼寧 沈陽(yáng) 110169)

        2(東北大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,遼寧 沈陽(yáng) 110169)

        在城市交通日漸發(fā)達(dá)的今天,建立一個(gè)高效的交通系統(tǒng)已成為打造智慧城市的核心問(wèn)題.準(zhǔn)確的需求預(yù)測(cè)模型,成為解決此類問(wèn)題的關(guān)鍵.如果我們能夠準(zhǔn)確地預(yù)測(cè)出乘客的出行需求,就可以預(yù)先分配資源,即可避免空載現(xiàn)象發(fā)生,從而達(dá)到節(jié)約資源、緩解交通壓力的目的.目前,隨著滴滴、Uber 等出租車服務(wù)的日益普及,我們能夠以前所未有的規(guī)模收集大量需求數(shù)據(jù).如何利用大數(shù)據(jù)來(lái)更好地預(yù)測(cè)交通需求的問(wèn)題,已經(jīng)引起了人工智能研究界越來(lái)越多的關(guān)注.

        本文主要研究區(qū)域乘車需求預(yù)測(cè)問(wèn)題,即通過(guò)歷史乘車請(qǐng)求數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)時(shí)間的區(qū)域乘車請(qǐng)求數(shù)量.隨著道路上車流量逐年遞增以及乘客對(duì)出租車、快車等服務(wù)需求量的不斷增大,乘車服務(wù)供需不匹配的問(wèn)題逐漸暴露出來(lái).例如:有時(shí)候,一些司機(jī)因?yàn)樗趨^(qū)域乘客需求量較少而導(dǎo)致無(wú)單可接;同時(shí),由于周邊地區(qū)的乘客需求遠(yuǎn)超過(guò)出租車數(shù)量,導(dǎo)致大量乘客在惡劣天氣或高峰時(shí)段很難乘車.所以,對(duì)出租車、快車等營(yíng)利性車輛的需求預(yù)測(cè),在近些年就越發(fā)引起研究人員重視.

        以往的文獻(xiàn)顯示研究人員已經(jīng)對(duì)交通數(shù)據(jù)預(yù)測(cè)進(jìn)行了長(zhǎng)期研究.其中,預(yù)測(cè)對(duì)象包括人流量、車流量、出租車需求量等.在研究初期,研究人員把城市進(jìn)行區(qū)塊化處理,并把其中一塊區(qū)域不同時(shí)間段的車輛需求數(shù)量看作時(shí)間序列,進(jìn)而對(duì)時(shí)間序列進(jìn)行預(yù)測(cè).比較有代表性的方法為:整合移動(dòng)平均自回歸模型(ARIMA)[1]及其相關(guān)變種,上述方法已被廣泛應(yīng)用于交通預(yù)測(cè)[2,3].在之前的研究基礎(chǔ)上,Abadi 等人[4]、Wu 等人[5]以及Tong 等人[6]意識(shí)到天氣、節(jié)假日、場(chǎng)地以及特殊事件等外在因素對(duì)城市的交通流量仍具有很大影響,所以就把此類影響因素加入到預(yù)測(cè)模型中.雖然研究表明,通過(guò)結(jié)合各類外部因素可以改善預(yù)測(cè)精度,但它們?nèi)匀粺o(wú)法捕捉到復(fù)雜且非線性的時(shí)空相關(guān)性.

        近幾年,機(jī)器學(xué)習(xí)與深度學(xué)習(xí)在國(guó)內(nèi)外科研人員的不懈努力下都取得了突破性的進(jìn)展,同時(shí)也給交通流量預(yù)測(cè)場(chǎng)景帶來(lái)了新的解決方案.Yi 等人[7]與Wang 等人[8]使用深度神經(jīng)網(wǎng)絡(luò)(DNN)對(duì)交通流量進(jìn)行預(yù)測(cè)并取得了較高的準(zhǔn)確度,但Zhao 等人[9]分別使用馬爾可夫模型與神經(jīng)網(wǎng)絡(luò)(ANNs)模型對(duì)出租車需求進(jìn)行預(yù)測(cè),并將結(jié)果進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果表明,馬爾可夫模型在可預(yù)測(cè)性高的場(chǎng)景下效果要好于神經(jīng)網(wǎng)絡(luò)模型.由此可見:在此場(chǎng)景下,簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)并不能捕捉到復(fù)雜的時(shí)空相關(guān)性.

        然而,深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域取得的成就卻給了研究人員新的啟發(fā).例如:可以將整個(gè)城市的出租車需求按一定時(shí)間段切片,然后把城市每塊區(qū)域內(nèi)的需求數(shù)量看作一個(gè)像素點(diǎn),這樣就可以得到一張單位時(shí)間內(nèi)的城市出租車需求圖像.給定一組歷史需求圖像,用模型預(yù)測(cè)下一個(gè)時(shí)間戳的出租車需求圖像.其中最典型的模型就包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)[10]以及循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[11]:一些學(xué)者使用CNN 及其變種模型來(lái)模擬城市復(fù)雜的空間相關(guān)性[12-14];另一些學(xué)者則使用RNN 以及長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)[15]模擬城市交通流量的時(shí)序性[16-18].與之前的回歸模型、神經(jīng)網(wǎng)絡(luò)等模型相比,這些開創(chuàng)性的嘗試在性能上表現(xiàn)出明顯的優(yōu)越性.然而,這些嘗試都沒有同時(shí)考慮到時(shí)間和空間的相關(guān)性.近些年,Ke 等人[19]與Zhou 等人[20]則將CNN 與LSTM 相結(jié)合,使用卷積LSTM[21]對(duì)出租車需求進(jìn)行預(yù)測(cè)并取得了很好的效果.在此基礎(chǔ)上,Yao 等人[22]在AAAI2018 會(huì)議中提出在一個(gè)聯(lián)合模型中捕捉空間和時(shí)間的復(fù)雜非線性關(guān)系,從而對(duì)城市交通流量進(jìn)行預(yù)測(cè),其預(yù)測(cè)效果較之前模型有很大提升.

        但是該類模型也存在不足之處,模型中使用CNN 對(duì)城市流量進(jìn)行空間特征提取.眾所周知,傳統(tǒng)CNN 中感受野的形狀是固定的,所以在提取特征信息時(shí),只能提取到關(guān)鍵像素點(diǎn)與其相鄰區(qū)域內(nèi)的特征信息.然而就實(shí)際情況而言,某一塊區(qū)域內(nèi)的交通情況可能與另一塊相距較遠(yuǎn)的區(qū)域有很大關(guān)聯(lián)[23].如圖1 所示,這是將地圖網(wǎng)格化處理后,兩塊在11×11 范圍內(nèi)且曼哈頓距離大于4 的區(qū)域乘車需求對(duì)比圖.由圖可得,兩塊區(qū)域在高峰時(shí)期需求趨勢(shì)相似.然而這僅為可以被可視化的顯性關(guān)聯(lián),還有很多隱性關(guān)聯(lián)隱含在數(shù)據(jù)中.如果使用CNN 進(jìn)行空間特征提取,很可能使這些關(guān)聯(lián)在池化層進(jìn)行下采樣時(shí)被模糊掉,最終導(dǎo)致空間特征提取結(jié)果存在誤差.

        Fig.1 Comparison of demand in different regions圖1 不同區(qū)域需求對(duì)比

        文獻(xiàn)[23-25]將算計(jì)視覺領(lǐng)域的圖卷積網(wǎng)絡(luò)(GCN)[26]應(yīng)用到交通流量預(yù)測(cè)領(lǐng)域,以嘗試解決上述問(wèn)題.實(shí)驗(yàn)表明,其在空間特征提取上有了很大的改善.但GCN 在交通流量預(yù)測(cè)領(lǐng)域的應(yīng)用還不完善,例如無(wú)法很好地獲取各個(gè)時(shí)間片圖之間的時(shí)間特征,并且部分該類模型也沒有考慮到城市中興趣點(diǎn)(POI)對(duì)乘車需求的影響.大量的調(diào)研[27]結(jié)果也證實(shí)了POI 對(duì)交通流量存在不可忽視的影響.

        為解決以上問(wèn)題,本文提出了可變形卷積時(shí)空網(wǎng)絡(luò)(deformable convolution spatial-temporal network,簡(jiǎn)稱DCSN)模型.其使用可變形卷積網(wǎng)絡(luò)(DCN)[28]與LSTM 共同捕捉空間和時(shí)間的復(fù)雜非線性關(guān)系,并使用圖結(jié)構(gòu)來(lái)模擬各區(qū)域間POI 和出租車需求的相似關(guān)系.如圖2 所示:之所以使用DCN 來(lái)對(duì)城市交通空間特征進(jìn)行提取,因?yàn)镈CN 可以改變卷積核映射在目標(biāo)圖像上感受野的形狀,使得不相鄰且相對(duì)較遠(yuǎn)的兩塊區(qū)域的空間特征也能保留下來(lái),進(jìn)而解決傳統(tǒng)CNN 模型提取城市交通流量空間特征信息時(shí)誤差較大的問(wèn)題.但如果將整個(gè)城市的出租車需求視為圖像并在此圖像上應(yīng)用DCN 模型,是無(wú)法取得最佳效果的.因?yàn)橥ㄟ^(guò)研究發(fā)現(xiàn),在預(yù)測(cè)目標(biāo)區(qū)域中包含相關(guān)性較弱的區(qū)域?qū)嶋H上會(huì)損害模型性能、降低預(yù)測(cè)準(zhǔn)確度.所以,本文借鑒了Yao 等人[22]論文中僅對(duì)局部區(qū)域做特征提取的方法,僅對(duì)要預(yù)測(cè)目標(biāo)附近區(qū)域使用DCN 模型.然而所選區(qū)域的大小對(duì)模型至關(guān)重要,本文對(duì)其大小進(jìn)行對(duì)比實(shí)驗(yàn),既保證DCN 在CNN 的基礎(chǔ)上提取到更多不相鄰的空間特征,也保證DCN 模型不被相關(guān)性較弱的區(qū)域影響.只對(duì)目標(biāo)附近區(qū)域做特征提取顯然是不夠全面的,通過(guò)研究[6,22]發(fā)現(xiàn):POI 整體差異較小且乘車需求波動(dòng)相似的兩塊區(qū)域,在需求預(yù)測(cè)問(wèn)題上可以為彼此提供助力.所以,本文對(duì)距預(yù)測(cè)目標(biāo)較遠(yuǎn)區(qū)域基于POI 差異進(jìn)行需求建模,通過(guò)圖結(jié)構(gòu)來(lái)捕捉兩個(gè)區(qū)域需求的潛在關(guān)系,并使用嵌入算法將區(qū)域信息以向量形式嵌入到模型中.本文使用滴滴出行的真實(shí)訂單數(shù)據(jù)進(jìn)行大量實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,本文提出的方法優(yōu)于其他現(xiàn)有車輛需求預(yù)測(cè)方法.

        Fig.2 Comparison of convolution patterns between CNN and DCN圖2 CNN 與DCN 的卷積模式對(duì)比

        本文的主要貢獻(xiàn)概括如下:

        ? 本文提出,使用由可變形卷積時(shí)空模型以及POI 需求關(guān)聯(lián)模型組成的聯(lián)合模型來(lái)對(duì)區(qū)域車輛需求進(jìn)行預(yù)測(cè),它同時(shí)考慮了時(shí)間、空間以及不同區(qū)域的需求關(guān)聯(lián)性等因素;

        ? 在可變形卷積時(shí)空模型中,使用DCN 與LSTM 提取時(shí)空特征;在POI 需求關(guān)聯(lián)模型中,使用區(qū)域間的POI 差異化指數(shù)以及需求差異化指數(shù)來(lái)捕捉區(qū)域間的需求相似關(guān)系.

        1 相關(guān)工作

        交通流量預(yù)測(cè)問(wèn)題在眾多研究學(xué)者多年來(lái)的探索實(shí)踐下,取得了許多突破性的進(jìn)展.從傳統(tǒng)統(tǒng)計(jì)學(xué)方法到機(jī)器學(xué)習(xí)與深度學(xué)習(xí),都在使預(yù)測(cè)精度逐漸提高.本節(jié)將主要討論與交通流量預(yù)測(cè)的相關(guān)工作.

        Li 等人[2]提出了一種基于ARIMA 的預(yù)測(cè)方法來(lái)預(yù)測(cè)熱點(diǎn)地區(qū)乘客的時(shí)空變化,以幫助司機(jī)找到他們的下一位乘客.Moreira-Matias 等人[3]使用滑動(dòng)窗口集合框架,將時(shí)變泊松模型、加權(quán)時(shí)變泊松模型和ARIMA 模型相結(jié)合,對(duì)乘客需求進(jìn)行預(yù)測(cè),并取得了不錯(cuò)的效果.

        Abadi 等人[4]進(jìn)一步考慮了外部環(huán)境數(shù)據(jù)(例如場(chǎng)地以及特殊事件等)對(duì)交通流量預(yù)測(cè)的影響,并基于自回歸模型對(duì)交通流量進(jìn)行預(yù)測(cè).Wu 等人[5]通過(guò)實(shí)驗(yàn)揭示了天氣與城市交通數(shù)據(jù)間隱藏的相關(guān)性.Tong 等人[6]結(jié)合POI 信息提出具有高維度特征的統(tǒng)一線性回歸模型LinUOTD,并設(shè)計(jì)了一系列的優(yōu)化技術(shù)來(lái)對(duì)模型進(jìn)行有效的訓(xùn)練和更新.模型突出的靈活性,使其在交通流量預(yù)測(cè)場(chǎng)景取得不錯(cuò)的效果.雖然此類方法結(jié)合外部因素使預(yù)測(cè)精度有所提升,但它們?nèi)匀粺o(wú)法捕捉到復(fù)雜且非線性的時(shí)空相關(guān)性.

        隨著機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的飛速發(fā)展,研究人員們嘗試使用神經(jīng)網(wǎng)絡(luò)解決交通流量預(yù)測(cè)問(wèn)題.Yi 等人[7]使用實(shí)時(shí)交通數(shù)據(jù)利用DNN 對(duì)交通流量進(jìn)行預(yù)測(cè),其實(shí)驗(yàn)結(jié)果表明,該模型具有較高的準(zhǔn)確性.Wang 等人[8]受到殘差神經(jīng)網(wǎng)絡(luò)(ResNet)[23]的啟發(fā),提出一個(gè)名為“深度供需(DeepSD)”的端到端框架,其框架具有高度的靈活性和可擴(kuò)展性,可利用多個(gè)數(shù)據(jù)源(例如打車指令、天氣數(shù)據(jù)和交通數(shù)據(jù))來(lái)實(shí)現(xiàn)對(duì)交通流量的高精度預(yù)測(cè).Zhao等人[9]使用ANN 模型對(duì)出租車需求進(jìn)行預(yù)測(cè),實(shí)驗(yàn)結(jié)果表明:在可預(yù)測(cè)性高的場(chǎng)景下,馬爾可夫模型預(yù)測(cè)精度為89%,比神經(jīng)網(wǎng)絡(luò)模型高11%.可見,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在此場(chǎng)景下表現(xiàn)并不理想.

        進(jìn)而,研究人員又把目光投向了近些年在計(jì)算機(jī)視覺領(lǐng)域聲名鵲起的CNN.Wang 等人[12]和Zhang 等人[13]將城市交通流量視為圖片,進(jìn)而使用CNN 及其變種ResNet[29]對(duì)交通流量進(jìn)行預(yù)測(cè).Liu 等人[14]提出一個(gè)面向時(shí)空數(shù)據(jù)的大規(guī)模車輛需求預(yù)測(cè)集成框架,其使用注意力機(jī)制將多個(gè)基礎(chǔ)模型和3 個(gè)注意力模塊(通道注意力模塊、空間注意力模塊和位置注意力模塊)組合在一起,進(jìn)而提高原有基礎(chǔ)模型的性能.其中,空間注意力模塊使用卷積網(wǎng)絡(luò)進(jìn)行空間特征提取.以上方法都取得了很好的成績(jī),但因?yàn)閭鹘y(tǒng)CNN 固定的卷積模式,導(dǎo)致提取空間特征時(shí)產(chǎn)生了一定的誤差;此外,雖然這些方法確實(shí)使用歷史時(shí)間戳的交通圖像進(jìn)行預(yù)測(cè),但它們沒有明確地模擬時(shí)序依賴性.進(jìn)而,Zhao 等人[18]使用LSTM 網(wǎng)絡(luò)通過(guò)由許多存儲(chǔ)器單元組成的二維網(wǎng)絡(luò)來(lái)模擬交通系統(tǒng)中的時(shí)空相關(guān)性,進(jìn)而對(duì)交通流量進(jìn)行預(yù)測(cè).遺憾的是:他們?cè)诳紤]交通流量的時(shí)序變化時(shí)僅模擬了單塊區(qū)域的時(shí)序依賴性,卻忽略了各個(gè)區(qū)域間的空間關(guān)聯(lián)性.

        通過(guò)多年的不懈研究和不斷改進(jìn),終于有學(xué)者將時(shí)序依賴性和空間關(guān)聯(lián)性結(jié)合到一起.Ke 等人[19]與Zhou等人[20]使用卷積LSTM 來(lái)處理出租車需求預(yù)測(cè)的時(shí)空依賴性.在此基礎(chǔ)上,Yao 等人[22]提出了一個(gè)深度多視圖時(shí)空網(wǎng)絡(luò)(DMVST-Net)框架來(lái)模擬空間和時(shí)間關(guān)系,從而對(duì)出租車需求進(jìn)行預(yù)測(cè).其模型包括3 個(gè)視圖:時(shí)間視圖、空間視圖和語(yǔ)義視圖.通過(guò)使用大量真實(shí)出租車數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),證明該模型預(yù)測(cè)效果優(yōu)于上述方法.然而該模型也存在不足之處,如未解決傳統(tǒng)CNN 在交通流量預(yù)測(cè)場(chǎng)景下的誤差問(wèn)題以及并未考慮城市中POI 對(duì)出租車需求的影響等.

        總體來(lái)說(shuō),與上述研究方法相比,本文提出的DCSN 模型創(chuàng)新點(diǎn)在于設(shè)計(jì)并結(jié)合了可變形卷積時(shí)空模型與POI 需求關(guān)聯(lián)模型.即:使用DCN 與LSTM 共同捕捉空間和時(shí)間的復(fù)雜非線性關(guān)系,并基于POI 差異指數(shù)以及歷史需求差異指數(shù)對(duì)不同區(qū)域需求相似性進(jìn)行建模.最后將兩個(gè)模型輸出,通過(guò)全連接神經(jīng)網(wǎng)絡(luò)得出最終的預(yù)測(cè)結(jié)果.

        2 算法設(shè)計(jì)

        圖3 展示了本文所提出的DCSN 模型總體框架圖,其主要由兩部分組成,分別為可變形卷積時(shí)空模型與POI需求關(guān)聯(lián)模型.其中,可變形卷積時(shí)空模型包括DCN 與LSTM,使用DCN 卷積對(duì)不同時(shí)間片同一塊區(qū)域做空間特征提取.輸出的特征向量與當(dāng)前時(shí)間片的天氣、溫度等上下文特征相連接作為L(zhǎng)STM 中一個(gè)時(shí)間單元的輸入,可變形卷積時(shí)空模型最終的輸出為時(shí)空特征向量.POI 需求關(guān)聯(lián)模型首先構(gòu)建區(qū)域的加權(quán)圖(POI 差異指數(shù)和歷史需求差異指數(shù)為權(quán)重影響因子);將所要預(yù)測(cè)的區(qū)域節(jié)點(diǎn)編碼為向量,將兩個(gè)模型輸出的向量相連接,再使用全連接網(wǎng)絡(luò)進(jìn)行聯(lián)合訓(xùn)練;最后,得出區(qū)域需求預(yù)測(cè)結(jié)果.

        Fig.3 DCSN model overall architecture diagram圖3 DCSN 模型整體架構(gòu)圖

        2.1 問(wèn)題定義

        本小節(jié)將對(duì)出租車需求預(yù)測(cè)問(wèn)題進(jìn)行定義.將地圖進(jìn)行網(wǎng)格化處理.L={l1,l2,…,ln}為城市地圖中的所劃分的區(qū)域集合,其中,n為將地圖劃分的網(wǎng)格數(shù)量;T={t1,t2,…,tm}為按相等時(shí)間間隔劃分的時(shí)間片集合,其中,m為時(shí)間片數(shù)量總和.解決區(qū)域出租車需求預(yù)測(cè)問(wèn)題的實(shí)質(zhì),即為使用前h個(gè)時(shí)間片的乘車需求來(lái)預(yù)測(cè)第h+1 個(gè)時(shí)間節(jié)點(diǎn)該區(qū)域的需求數(shù)量.結(jié)合本文提出的模型,其主要問(wèn)題具體可表達(dá)為

        其中,

        ?PL為區(qū)域的POI 信息.

        公式中,h為時(shí)間步長(zhǎng).公式整體意為:將前h個(gè)時(shí)間片的乘車需求信息、天氣信息以及區(qū)域POI 信息輸入到本模型中,最終得出當(dāng)前區(qū)域下一時(shí)間片的出租車需求數(shù)量.

        2.2 可變形卷積時(shí)空模型

        可變形卷積時(shí)空模型由時(shí)間和空間兩部分組成,如圖3 所示.本文使用DCN 對(duì)地圖區(qū)域中的需求進(jìn)行空間特征提取,進(jìn)而將其結(jié)果應(yīng)用于LSTM 模型中模擬出租車需求的時(shí)間依賴性.接下來(lái),本小節(jié)將著重對(duì)這兩個(gè)部分進(jìn)行分析講解.

        2.2.1 空間特征:局部DCN 模型

        DCN 在CNN 的基礎(chǔ)上引入了兩個(gè)全新的模塊(即可變形卷積模塊與可變形RoI 池化模塊),其主要思想為:從目標(biāo)任務(wù)中學(xué)習(xí)偏移量,然后使用額外的偏移量來(lái)改變模型中的空間采樣位置,從而有效提升CNN 的泛化能力.本文研究發(fā)現(xiàn),DCN 通過(guò)學(xué)習(xí)偏移量改變感受野范圍的特性.在此場(chǎng)景下,能更好地模擬空間相關(guān)性,從而提取出更為準(zhǔn)確的特征信息.

        本文使用DCN 對(duì)地圖區(qū)域間的需求進(jìn)行空間特征提取時(shí),借鑒Yao 等人[22]論文中所使用的局部分解方法,僅將要預(yù)測(cè)的區(qū)域以及其周圍信息輸入到模型中.在不同的時(shí)間片中,本文將每個(gè)區(qū)域及其周圍鄰域的乘車需 求數(shù)量視為具有一個(gè)通道的s×s圖像集合(圖像中,城市邊界缺失部分用0 補(bǔ)齊),其中,尺寸s控制空間粒度.對(duì)于區(qū)域i的不同時(shí)間片t,都可以得到二維張量圖像,進(jìn)而將輸入到DCN 模型中進(jìn)行卷積.對(duì)于中一個(gè)像素x0的卷積操作可表示為

        其中,R={(-1,-1),(-1,0),…,(0,0),…,(1,0),(1,1)}表示卷積核為3×3 的感受野網(wǎng)格,網(wǎng)格中心點(diǎn)坐標(biāo)(0,0)映射到要做卷積操作的像素點(diǎn)x0.W(·)表示獲取卷積核中對(duì)應(yīng)位置的卷積權(quán)重,d(·)表示獲取張量圖像中對(duì)應(yīng)像素點(diǎn)的值.DCN 與CNN 的主要差別就在于Δrn,即為上文所提到的偏移量,通過(guò)對(duì)像素點(diǎn)周圍部分圖像卷積所得.具體形式為二通道矩陣,分別對(duì)應(yīng)橫縱坐標(biāo)偏移量.

        對(duì)單一像素點(diǎn)的卷積過(guò)程如圖4 所示.

        Fig.4 Deformable convolution process schematic圖4 可變形卷積過(guò)程示意圖

        本文將區(qū)域i不同時(shí)間片t的乘車需求特征圖饋送到K個(gè)卷積層,第k層卷積表達(dá)式如下:

        2.2.2 時(shí)間特征:LSTM 模型

        本文使用LSTM 來(lái)捕獲乘車需求時(shí)序相關(guān)性,該模塊的基本表達(dá)式為

        2.3 POI需求關(guān)聯(lián)模型

        本文通過(guò)研究發(fā)現(xiàn),空間上不相近的兩塊區(qū)域在乘車需求上也可能存在相似關(guān)系.例如:大型商場(chǎng)所在的區(qū)域在周末可能具有較高的乘車需求,而居民區(qū)所在的區(qū)域在工作日的清晨將迎來(lái)乘車需求高峰等.因?yàn)榍懊嫠岬降木植緿CN 模型僅提取目標(biāo)像素點(diǎn)鄰近區(qū)域的空間相似性,所以本文從POI 以及歷史需求兩個(gè)方面來(lái)提取較遠(yuǎn)區(qū)域間的相似關(guān)系.這樣即可與局部DCN 模型相互補(bǔ)充,使模型預(yù)測(cè)結(jié)果更加準(zhǔn)確.

        因?yàn)樵诘貓D中每塊區(qū)域皆可互通,所以本文將目標(biāo)地圖按區(qū)域劃分后轉(zhuǎn)換成一張無(wú)向完全圖,具體定義為G=(V,E,W).V為節(jié)點(diǎn)集合,對(duì)應(yīng)城市地圖中的所劃分的區(qū)域集合L;E為圖中點(diǎn)與點(diǎn)之間邊的集合;W為每條邊上的權(quán)重,即表示兩個(gè)區(qū)域之間的相似程度.W的表達(dá)式為

        其中,Dm與Pij分別為區(qū)域間的POI 差異化指數(shù)與需求差異化指數(shù),將在接下來(lái)的部分著重講解求解方法.δ(·)為min-max 標(biāo)準(zhǔn)化方法,為了避免因兩個(gè)差異化指數(shù)數(shù)值上差距過(guò)大從而對(duì)結(jié)果造成影響;α則是為了權(quán)衡兩種差異化指數(shù)對(duì)權(quán)重大小的影響,本文通過(guò)多次實(shí)驗(yàn)得出,當(dāng)α取值在0.4 與0.6 之間時(shí),模型準(zhǔn)確性最高,所以本文將其最優(yōu)區(qū)間平均數(shù)0.5 作為α的最終取值.

        2.3.1 區(qū)域POI 差異化指數(shù)

        現(xiàn)實(shí)生活中,POI 對(duì)其所在的區(qū)域乘車需求影響非常大,所以本文提取不同區(qū)域間的POI 相似性,并將其嵌入到模型中.本模塊著重考慮地鐵站、公交車站、旅游景點(diǎn)、大型商場(chǎng)、醫(yī)院、學(xué)校以及居民區(qū)這七類不易變更的POI,使用線性神經(jīng)網(wǎng)絡(luò)模型[30]提取不同種類POI 對(duì)乘車需求的影響權(quán)重.其中,線性神經(jīng)網(wǎng)絡(luò)的輸入為各個(gè)區(qū)域不同種類POI 的數(shù)量以及當(dāng)前區(qū)域各個(gè)時(shí)間片乘車需求數(shù)量的總和,訓(xùn)練得出的不同種類POI 對(duì)乘車需求的影響權(quán)重即為所求.表達(dá)式如下:

        2.3.2 區(qū)域需求差異化指數(shù)

        經(jīng)本文研究發(fā)現(xiàn):在捕捉兩個(gè)區(qū)域的相似關(guān)系時(shí),不僅要從POI 功能的角度出發(fā),還應(yīng)該考慮兩個(gè)區(qū)域需求序列的相似性.本模塊以周為單位對(duì)各個(gè)模塊每個(gè)時(shí)間片的乘車需求數(shù)量取平均值,得出各區(qū)域一天的需求序列.進(jìn)而對(duì)不同區(qū)域間的需求序列使用動(dòng)態(tài)時(shí)間規(guī)整算法(DTW)[31]求出區(qū)域需求差異化指數(shù),其計(jì)算公式如下:

        其中,Si,Sj代表兩個(gè)不同區(qū)域的平均需求序列,DTW(·)為動(dòng)態(tài)時(shí)間規(guī)整算法,Dm即為所求區(qū)域需求差異化指數(shù).

        得到區(qū)域POI 差異化指數(shù)Pij及區(qū)域需求差異化指數(shù)Dm后,即可使用公式(5)完成無(wú)向完全圖中,邊權(quán)重W的計(jì)算.在獲取完整的圖信息后,本文使用Node2vec 圖嵌入方法[32]將區(qū)域節(jié)點(diǎn)i轉(zhuǎn)化為多維向量gi.為使嵌入的多維向量gi能與整個(gè)網(wǎng)絡(luò)架構(gòu)進(jìn)行協(xié)同訓(xùn)練,本模塊將區(qū)域節(jié)點(diǎn)i的特征向量饋送到全連接層,其公式定義為

        其中,Wpd與bpd都為可學(xué)習(xí)的參數(shù),即為整個(gè)POI 需求關(guān)聯(lián)模型的輸出.

        2.4 模型整合

        為了使前面兩小節(jié)的模型相關(guān)聯(lián),本小節(jié)將可變形卷積時(shí)空模型輸出的特征向量與POI 需求關(guān)聯(lián)模型輸出的特征向量相連接,進(jìn)而得到向量.此時(shí),已經(jīng)包含區(qū)域i的時(shí)空以及POI 等特征,最后將其饋送到全連接網(wǎng)絡(luò)以獲取區(qū)域i的最終需求預(yù)測(cè)值.最終預(yù)測(cè)函數(shù)如下:

        其中,Wf與bf都為可學(xué)習(xí)的參數(shù).因?yàn)檎鎸?shí)的需求值經(jīng)過(guò)標(biāo)準(zhǔn)化處理,所以σ(·)為Sigmoid函數(shù)使最終輸出的 區(qū)間為[0,1],目的為使整個(gè)模型更快收斂.模型使用的損失函數(shù)定義為

        其中,γ為超參數(shù).上述損失函數(shù)實(shí)際由均方誤差和平均絕對(duì)百分誤差兩部分組成.因?yàn)榫秸`差易受極端值影響,為了避免訓(xùn)練被大值樣本支配,所以引入平均絕對(duì)百分誤差.

        3 實(shí)驗(yàn)與結(jié)果分析

        3.1 數(shù)據(jù)集處理

        本文使用快車平臺(tái)真實(shí)的訂單軌跡數(shù)據(jù)CD2Data 與XA2Data 來(lái)驗(yàn)證模型的有效性,數(shù)據(jù)集來(lái)自滴滴出行“蓋亞”數(shù)據(jù)開放計(jì)劃.

        ? CD2Date:數(shù)據(jù)為2016 年10 月和11 月成都市二環(huán)部分區(qū)域快車平臺(tái)訂單數(shù)據(jù);

        ? XA2Date:數(shù)據(jù)為2016 年10 月和11 月西安市二環(huán)部分區(qū)域快車平臺(tái)訂單數(shù)據(jù).

        本文將兩個(gè)數(shù)據(jù)集中2016 年10 月8 日至2016 年11 月23 日(共47 天)的數(shù)據(jù)作為訓(xùn)練集,2016 年11 月24 日至2016 年11 月30 日(共7 天)的數(shù)據(jù)作為測(cè)試集.數(shù)據(jù)集中,2016 年國(guó)慶假期期間的數(shù)據(jù)因?yàn)檩^平時(shí)相比波動(dòng)過(guò)大所以舍棄.處理數(shù)據(jù)時(shí),本文將兩個(gè)數(shù)據(jù)集所對(duì)應(yīng)的區(qū)域進(jìn)行網(wǎng)格化處理,劃分成20×20 個(gè)小區(qū)域.并且僅將早6 點(diǎn)到晚21 點(diǎn)之間的數(shù)據(jù)作為觀測(cè)數(shù)據(jù),每個(gè)時(shí)間片的時(shí)間跨度設(shè)為半小時(shí).進(jìn)而提取出每塊區(qū)域每個(gè)時(shí)間片的需求數(shù)量.值得注意的是:因?yàn)楸疚闹饕治龅膯?wèn)題為乘車需求預(yù)測(cè),所以訂單的位置以乘客的初始位 置為準(zhǔn).最后將單位需求數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,進(jìn)而得到所有區(qū)域單個(gè)時(shí)間片的需求數(shù)據(jù)集合.DCSN 模型 除了應(yīng)用到了乘車的軌跡數(shù)據(jù),還應(yīng)用了外部數(shù)據(jù)以及城市的POI 數(shù)據(jù).本文將天氣等外部離散數(shù)據(jù)轉(zhuǎn)化為One-Hot 向量嵌入到模型中;POI 數(shù)據(jù)則使用百度地圖信息檢索功能獲取,同樣將其進(jìn)行網(wǎng)格劃分,進(jìn)而統(tǒng)計(jì)每塊區(qū)域的POI 種類及數(shù)量.

        當(dāng)測(cè)試預(yù)測(cè)結(jié)果時(shí),本文使用待預(yù)測(cè)時(shí)間片的前8 個(gè)時(shí)間片(即前4 小時(shí))來(lái)對(duì)該區(qū)域接下來(lái)的乘車需求進(jìn)行預(yù)測(cè).并且在實(shí)驗(yàn)過(guò)程中,本文過(guò)濾掉了區(qū)域需求小于5 的樣本,這是工業(yè)中常用的做法.因?yàn)樵诂F(xiàn)實(shí)生活的應(yīng)用程序中,人們并不關(guān)心這種低需求場(chǎng)景.

        3.2 實(shí)驗(yàn)參數(shù)設(shè)置

        本文基于Tensorflow 和Keras 框架實(shí)現(xiàn)DCSN 模型.在空間特征提取時(shí),控制輸入特征圖大小的s取11,即對(duì)目標(biāo)及其周圍11×11 的區(qū)域進(jìn)行空間特征提取.在DCN 模型中,本文將卷積層數(shù)K設(shè)為3,濾波器大小設(shè)為3×3,濾波器數(shù)量設(shè)為64.經(jīng)過(guò)多次對(duì)比實(shí)驗(yàn)后,本文將LSTM 模型中時(shí)間步長(zhǎng)h設(shè)為8.在DCSN 模型中,除了作為最終預(yù)測(cè)組件的全連接層,其中的激活函數(shù)為Sigmoid函數(shù),其余全連接層中的激活函數(shù)皆為ReLU函數(shù).模型的損失函數(shù)已在第2.4 節(jié)中具體說(shuō)明,模型使用的優(yōu)化算法為Adam.

        本文使用平均絕對(duì)百分比誤差(MAPE)和均方誤差(RMSE)作為評(píng)價(jià)指標(biāo),其具體計(jì)算公式下:

        3.3 對(duì)比實(shí)驗(yàn)結(jié)果分析

        本小節(jié)將DCSN 模型與以下5 種主流及最新的交通流量預(yù)測(cè)方法進(jìn)行比較.

        ? 歷史均值法(HA):使用歷史流量的平均值來(lái)作為下一時(shí)間片的預(yù)測(cè)值.此處,本文同樣使用前8 個(gè)時(shí)間片的歷史數(shù)據(jù)來(lái)預(yù)測(cè)下一時(shí)間片的乘車需求數(shù)量;

        ? ARIMA 是一種眾所周知的時(shí)間序列預(yù)測(cè)模型,它結(jié)合了移動(dòng)平均和自回歸分量來(lái)建模時(shí)間序列;

        ? LSTM 在傳統(tǒng)RNN 的基礎(chǔ)上改進(jìn),新增遺忘門等機(jī)制,有效解決傳統(tǒng)RNN 所存在的梯度爆炸和梯度消失等問(wèn)題.作為目前解決時(shí)間序列預(yù)測(cè)問(wèn)題的主流算法之一;

        ? ST-ResNet[13]:ST-ResNet 是一種基于深度學(xué)習(xí)的流量預(yù)測(cè)方法,該方法將不同時(shí)間片的城市交通流量繪制成圖像,然后使用殘差神經(jīng)網(wǎng)絡(luò)提取圖像特征,進(jìn)而完成流量預(yù)測(cè);

        ? DMVST-Net[22]:DMVST-Net 是一種基于多視圖的深度學(xué)習(xí)框架,用于出租車需求預(yù)測(cè).它由3 個(gè)不同的視圖組成,分別為時(shí)間視圖、空間視圖和語(yǔ)義視圖.

        為了對(duì)比公平,在實(shí)驗(yàn)時(shí),除HA 與ARIMA 外的其他算法都使用公式(11)所定義的損失函數(shù).DCSN 模型與其他5 個(gè)主流交通流量預(yù)測(cè)方法性能對(duì)比見表1.

        Table 1 Performance comparison of different approaches表1 不同方法性能對(duì)比

        表1 顯示了本文所提出的模型與其他基準(zhǔn)算法在數(shù)據(jù)集CD2Data 與XA2Data 上的性能對(duì)比.DCSN 模型在所有方法中實(shí)現(xiàn)了最低的MAPE 和最低的RMSE.更具體地說(shuō),HA 和ARIMA 等傳統(tǒng)方法因?yàn)橥耆蕾囉跉v史需求值并且建模能力有限,所以預(yù)測(cè)表現(xiàn)不佳.LSTM 與ST-ResNet 在預(yù)測(cè)時(shí)考慮空間特征和時(shí)間特征對(duì)交通流量的影響,使預(yù)測(cè)誤差較傳統(tǒng)方法大大降低,但并未將二者相結(jié)合.DMVST-Net 模型使用三層視圖將時(shí)空特征以及外部特征相融合,取得了非常不錯(cuò)的預(yù)測(cè)效果.本文所提出的DCSN 模型在DMVST-Net 模型的基礎(chǔ)上進(jìn)行改進(jìn),使用DCN 進(jìn)行空間特征提取,并將POI 對(duì)乘車需求的影響因素加入到模型中,使模型的預(yù)測(cè)性能進(jìn)一步提升.

        DCSN 模型的平均訓(xùn)練時(shí)長(zhǎng)為47.2s/輪,基準(zhǔn)算法中效果最好的DMCVST-Net 模型的平均訓(xùn)練時(shí)長(zhǎng)為45.4s/輪.因?yàn)槭褂肈CN 代替了CNN 并加入了POI 需求關(guān)聯(lián)模型,所以使前者的模型復(fù)雜性略高于后者.但整體訓(xùn)練時(shí)長(zhǎng)差距不大,且DCSN 模型準(zhǔn)確性得到顯著提升.

        3.4 消融實(shí)驗(yàn)結(jié)果分析

        本文為了研究DCSN 模型內(nèi)部各改進(jìn)之處對(duì)性能的影響,在CD2Data 數(shù)據(jù)集下分別對(duì)其進(jìn)行消融實(shí)驗(yàn).

        ? CLN:僅包含時(shí)空模型,但將本文的可變形卷積時(shí)空模型中的DCN 用傳統(tǒng)CNN 替代.即,僅使用CNN和LSTM 的組合對(duì)乘車需求進(jìn)行預(yù)測(cè);

        ? DLN:僅使用本文所提出的可變形卷積時(shí)空模型對(duì)乘車需求進(jìn)行預(yù)測(cè),不包含POI 需求關(guān)聯(lián)模型;

        ? CLMN:在CLN 的基礎(chǔ)上添加需求關(guān)聯(lián)模塊,但公式(5)中α取1,即,僅考慮區(qū)域需求差異化指數(shù)對(duì)模型的影響;

        ? DLMN:在DLN 的基礎(chǔ)上添加需求關(guān)聯(lián)模塊,同樣,α取1;

        ? CLPDN:在CLN 模型的基礎(chǔ)上加入本文所提出的POI 需求關(guān)聯(lián)模型;

        ? DCSN:為本文所提出的完整模型.

        此外,本文還對(duì)DCSN 模型中所使用的損失函數(shù)進(jìn)行消融實(shí)驗(yàn),以找出最優(yōu)的損失函數(shù).所作對(duì)比如下.

        ? LMSE:僅使用最常用的均方誤差(MSE)作為模型的損失函數(shù);

        ? LMAPE:僅使用MAPE 作為模型的損失函數(shù);

        ?L:模型最終使用的損失函數(shù),結(jié)合了均方誤差和平均絕對(duì)百分誤差,其中,γ取0.01.具體形式已在第2.4節(jié)中詳細(xì)說(shuō)明.

        各方案性能對(duì)比如圖5 所示.

        Fig.5 Improved program performance comparison chart圖5 改進(jìn)方案性能對(duì)比圖

        DLN 模型在CLN 模型的基礎(chǔ)上將卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)為可變形卷積神經(jīng)網(wǎng)絡(luò),從結(jié)果來(lái)看,模型整體效果有所提升.所以可以證明:可變形卷積神經(jīng)網(wǎng)絡(luò)在此場(chǎng)景下提取空間特征信息,可以取得很好的效果.CLMN 模型與DLMN 模型在DLN 模型與CLN 模型的基礎(chǔ)上加入了僅考慮區(qū)域需求差異化指數(shù)的需求關(guān)聯(lián)模型,使得模型的準(zhǔn)確性得到顯著提升.最后兩個(gè)模型則在前兩個(gè)模型的基礎(chǔ)上加入了完整的POI 需求關(guān)聯(lián)模型,從圖中可以看出,預(yù)測(cè)誤差大大減小,證明了在POI 需求關(guān)聯(lián)模型中POI 差異化指數(shù)的必要性.POI 需求關(guān)聯(lián)模型既將POI對(duì)乘車需求的影響因素加入到模型中,又彌補(bǔ)了局部DCN 模型在空間上的距離局限性.同時(shí)可以看出,本文所使用的損失函數(shù)L效果最好.所以綜上所述,當(dāng)前DCSN 模型效果最佳.

        本文還在實(shí)驗(yàn)過(guò)程中對(duì)DCN 模型中輸入特征圖尺寸s的大小以及濾波器的大小做了調(diào)優(yōu)實(shí)驗(yàn).特征圖的尺寸對(duì)局部DCN 模型很重要,這決定模型將提取目標(biāo)區(qū)域周圍多大范圍內(nèi)的空間特征信息.同樣,濾波器的大小本身也是DCN 模型的重要屬性,所以在CD2Data 數(shù)據(jù)集下對(duì)其進(jìn)行調(diào)優(yōu)實(shí)驗(yàn).卷積層數(shù)都設(shè)為3,具體實(shí)驗(yàn)結(jié)果如圖6 所示.

        Fig.6 Tuning experiment results comparison chart圖6 調(diào)優(yōu)實(shí)驗(yàn)結(jié)果對(duì)比圖

        由實(shí)驗(yàn)結(jié)果可以得出,DCN 模型中輸入特征圖尺寸s取11 并且濾波器尺寸為3×3 時(shí)模型性能最佳,故模型實(shí)驗(yàn)最終采用此參數(shù).

        本文研究發(fā)現(xiàn),時(shí)間步長(zhǎng)h是進(jìn)行時(shí)間特征提取的重要參數(shù).為了確定其對(duì)模型性能的影響,所以本文在CD2Data 數(shù)據(jù)集下對(duì)h的不同取值進(jìn)行對(duì)比實(shí)驗(yàn).具體實(shí)驗(yàn)結(jié)果見表2.

        Table 2 Performance comparison of different sequence length表2 不同時(shí)間步長(zhǎng)性能對(duì)比

        由表2 可以得出,模型誤差整體上隨時(shí)間步長(zhǎng)h的增長(zhǎng)而下降.由此可以說(shuō)明時(shí)間步長(zhǎng)對(duì)時(shí)間特征提取的重要性.當(dāng)時(shí)間步長(zhǎng)為8 時(shí),模型性能最佳.此外,h增加到8 以上時(shí)模型性能略有下降.一個(gè)潛在的原因是:在考慮更長(zhǎng)的時(shí)間依賴性時(shí),需要學(xué)習(xí)更多的參數(shù),進(jìn)而使訓(xùn)練變得更加困難.

        4 總 結(jié)

        本文在乘車需求預(yù)測(cè)場(chǎng)景下對(duì)傳統(tǒng)時(shí)空模型進(jìn)行改進(jìn),提出多組件的可變形卷積時(shí)空網(wǎng)絡(luò)DCSN.本模型將傳統(tǒng)時(shí)空模型中的卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)為可變形卷積神經(jīng)網(wǎng)絡(luò),使對(duì)目標(biāo)區(qū)域的空間特征提取效果得到提升.本文還將POI 對(duì)乘車需求的影響因素加入到模型中,彌補(bǔ)了局部DCN 模型在空間上的距離局限性,使DCSN 模型效果優(yōu)于其他已有的乘車需求預(yù)測(cè)方法.

        未來(lái),本文將在兩個(gè)主要方面對(duì)模型進(jìn)行改進(jìn).將更多對(duì)乘車需求有顯著影響的外部因素進(jìn)行更合適的建模,并將其嵌入到模型中;本文在進(jìn)行預(yù)測(cè)時(shí)僅考慮了近4 個(gè)小時(shí)的歷史需求對(duì)未來(lái)需求的影響,在接下來(lái)的研究中,本文將進(jìn)一步考慮長(zhǎng)周期(如日或周)歷史數(shù)據(jù)對(duì)未來(lái)需求的影響并將其加入到模型中,使預(yù)測(cè)結(jié)果更加準(zhǔn)確.

        致謝實(shí)驗(yàn)數(shù)據(jù)來(lái)自滴滴出行“蓋亞”數(shù)據(jù)開放計(jì)劃.

        猜你喜歡
        交通流量乘車時(shí)空
        跨越時(shí)空的相遇
        鏡中的時(shí)空穿梭
        基于XGBOOST算法的擁堵路段短時(shí)交通流量預(yù)測(cè)
        玩一次時(shí)空大“穿越”
        基于GA-BP神經(jīng)網(wǎng)絡(luò)的衡大高速公路日交通流量預(yù)測(cè)
        乘車
        乘車禮儀
        時(shí)空之門
        小淘氣乘車
        基于復(fù)合卡和ETC的交通流量采集研究
        色欲av蜜桃一区二区三| 亚洲女同精品一区二区久久| 一区二区三区四区在线观看日本| 国产精久久一区二区三区| 欧洲日本一线二线三线区本庄铃| 亚洲熟女av超清一区二区三区| 日本免费一区二区精品| 日韩综合无码一区二区| 丰满人妻被黑人中出849| 国产精品美女黄色av| 人妻少妇中文字幕久久hd高清| 亚洲色大成网站www永久| 99精品国产综合久久久久五月天| 日本不卡一区二区高清中文| 日本三区在线观看视频| 少妇被粗大的猛进出69影院| 久久欧美与黑人双交男男| 丰满人妻AV无码一区二区三区| 五月婷婷开心六月激情| 不卡一卡二卡三乱码免费网站| 国产日韩网站| 日本黑人人妻一区二区水多多| 国产亚洲精品熟女国产成人| 国产黄在线观看免费观看不卡| 日韩中文字幕一区二区高清| 久久国产精品精品国产色| 亚洲第一狼人天堂网亚洲av| 久久精品视频在线看99| 少妇bbwbbw高潮| 中文字幕国产亚洲一区| 女人被狂c躁到高潮视频| 97人妻视频妓女网| 成人爽a毛片免费网站中国| 香港三级午夜理论三级| 亚洲欧洲日产国码高潮αv| 青青草视频在线视频播放| av网站在线观看大全| 边做边流奶水的人妻| 欧美日韩国产另类在线观看| 亚洲av日韩专区在线观看| 韩日午夜在线资源一区二区|