亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于圖自編碼-生成對抗網絡的路網數據修復

        2021-12-31 03:52:12徐東偉彭航商學天魏臣臣楊艷芳
        關鍵詞:檢測器路網編碼器

        徐東偉,彭航,商學天,魏臣臣,楊艷芳

        (1.浙江工業(yè)大學,網絡空間安全研究院,杭州 310023;2.交通運輸部科學研究院,北京 100029)

        0 引言

        近年來,人工智能、通信技術、無人駕駛的進步促進了智能交通系統(tǒng)(Intelligent Transportation Systems,ITS)的發(fā)展,采集到的交通數據量越來越龐大和多樣[1]。但在實際應用中,這些設備會由于突發(fā)天氣、設備電路故障、網絡通信中斷等問題產生數據異?;蛉笔А?/p>

        目前,已經提出許多方法來估計數據缺失值,路網數據修復的方法大致可以分為3 類:基于預測、基于插值和基于統(tǒng)計學習的路網數據修復方法[2]?;陬A測的路網數據修復方法是根據歷史數據構建預測模型,將預測值作為修復的路網數據,典型方法包括支持向量回歸、貝葉斯網絡等。這些方法均依據既有數據預測缺失數據,構建出來的預測模型沒有考慮到數據集的全局特征,在缺失率大的情況下修復精度不高。基于插值的路網數據修復方法是根據相鄰非缺失點的平均或加權平均交通數據值來填充缺失數據,典型方法包括歷史平均方法、局部最小二乘法等。這些插值方法在路網數據變化不規(guī)律時修復效果較差?;诮y(tǒng)計學習的路網數據修復方法是假設或學習一個路網數據分布,對路網數據缺失值進行插補[3],常用的方法包括概率主成分分析,馬爾可夫鏈蒙特卡羅方法等。然而這些方法都提前假定數據符合一個概率分布,如果數據不符合某特定分布時,會導致插補結果[4]的不準確。

        完整的路網數據是實現智能交通系統(tǒng)的基礎[5],因此本文從路網數據的時空特性出發(fā),提出一種基于圖自編碼器-生成對抗網絡的路網數據修復方法,可實現高缺失率和隨機缺失情況下的路網數據修復。

        1 基于DVGAE-GAN的路網數據修復模型

        圖1為本文方法的總體框架,主要包括兩部分:(1)利用降噪圖變分自編碼器(Denoising Graph Variational Auto-Encoder,DVGAE)提取路網缺失數據的時空特征;(2)根據時空特征,采用生成對抗網絡(Generative Adversarial Network,GAN)實現路網缺失數據修復。其中,在GAN 的損失函數中引入重建損失(Lcons),以加快模型收斂速度,保障路網數據修復的時效性??傮w框架圖的關鍵符號定義如表1所示。

        圖1 DVGAE-GAN總體框架圖Fig.1 Overall framework of DVGAE-GAN

        表1 關鍵符號定義Table 1 Summary of key symbols

        1.1 路網數據獲取

        構建路網圖G=(V,A),其中,V={v1,v2,v3,…,vN},N為路網中檢測器數量。A={air}Ni,r=1表示路網中檢測器節(jié)點之間的連邊關系:若檢測器vi與vr在路網中物理相鄰,則認為兩個檢測器存在連邊,即air=1;反之,air=0。

        X(t)為完整路網數據,表示在第t時刻檢測器測得的T維歷史路網數據。X∈?N×T,其中,T為選取的數據時間維度。

        式中:xi(t-jΔt)為檢測器vi在(t-jΔt)時刻的路網數據,j=0,1,…,T-1;Δt為路網數據采樣間隔。

        實際采集的路網數據為

        1.2 基于DVGAE的路網時空特征提取

        變分圖自編碼器(Variational Graph Auto-Encoder,VGAE)[6]可從原始數據分布中隨機采樣得到數據的潛在表示特征,增加了潛在表示特征的泛化能力。在VGAE 模型基礎上加入降噪自編碼器(Denoising Auto-Encoder,DAE)架構,即得到降噪圖變分自編碼器,其框架如圖2所示?;贒VAGE學習到的路網潛在表示能有效重構原始路網數據(有效映射完備路網數據的時空特征),即可由部分觀測數據推演完整路網數據分布。

        圖2 降噪圖變分自編碼器框架圖Fig.2 Frame diagram of Denoising Variational Graph Auto-Encoder

        1.2.1 基于編碼器的路網數據潛在特征生成

        編碼器部分由圖卷積神經網絡(Graph Convolutional Network,GCN)構成,可以根據不同路網節(jié)點與節(jié)點之間的連邊關系來實現空間特征聚合,如圖3所示。編碼部分表示為

        圖3 空間特征聚合示意圖Fig.3 Schematic diagram of spatial feature aggregation

        在基于GCN學習整個路網數據潛在表示的過程中,可利用重參數化[7]方法防止梯度消失。路網時空特征Z(t)的采樣計算公式為

        式中:ε~Ν(0,I) ;diag(·) 為對角協(xié)方差矩陣;q[Zi(t)|μι(t),diag(σ2i(t))]為檢測器vi通過GCN 形成的采樣分布;Zi(t)為檢測器vi從分布中提取的潛在特征,將其對路網不同檢測器上的潛在特征拼接,得到完整路網時空特征Z(t)∈?N×E;E為時間嵌入維度。

        1.2.2 基于解碼器的路網數據重構

        VGAE 的解碼器不僅可以重構原始路網鄰接矩陣,還可以降噪重構完整路網數據。因此降噪圖變分自編碼器(DVGAE)的損失函數分別由對應重構鄰接矩陣和重構路網數據的損失函數組成,目的是保證路網結構的完整性同時能最大程度重構出完整路網數據,使得經過了空間聚合和時間嵌入后提取的時空特征,包含完整的路網信息。損失函數計算公式為

        1.3 基于生成對抗網絡(GAN)的路網數據修復

        基于時空特征、利用GAN 的強大數據生成能力,可生成路網數據以實現數據修復[8]。生成器目的是讓生成路網數據的分布盡可能符合真實數據樣本分布;判別器目的是將生成路網數據與真實路網數據區(qū)分開,將生成路網數據判別為假,這里生成路網數據與已觀測真實數據部分進行重組;兩個網絡交替對抗訓練,直至判別器難以判定生成路網數據是否為假。基于GAN修復路網數據的框架如圖4所示,其中,G_Loss為生成器損失函數,D_Loss為判別器損失函數。

        圖4 生成對抗網絡框架圖Fig.4 Generative Adversarial Network frame diagram

        鑒于交通流數據的時間相關性,本文將LSTM作為生成器的內部結構。當基于Wasserstein 距離衡量的生成路網數據和真實路網數據之間的差異達到最小時,生成器輸出修復后的路網數據X′(t)∈?N×T為

        基于GAN 生成的是整個路網數據,而最終目標是實現對局部缺失的路網數據的有效修復,因此將生成器生成的路網數據X′(t)與原始路網數據X(t)重組,以實現缺失路網數據的重點修復。重組矩陣定義為

        為了防止訓練時出現模型崩塌問題,采用GAN的變種WGAN[9],即Wasserstein距離代替真實分布與生成分布的JS散度。這樣可以避免兩個分布之間沒有重疊時造成無法度量距離的后果。生成器損失函數G_Loss 和判別器損失函數D_Loss分別定義為

        式中:Lcons為重建損失;D為判別器的輸出狀態(tài);β為重建損失系數;p為缺失位置的數目。

        2 實驗

        2.1 數據描述和缺失情況分析

        實驗數據集包含2015年全年西雅圖4個高速公路段(SR-52、I-5、I-405、I-90)323 個檢測器采集的速度數據集和加利福利亞州交通運輸部的績效評估系統(tǒng)采集的pems-04 區(qū)域307 個檢測器(2018.01-2018.02)兩個月的速度數據集。采樣間隔均為5 min,即每5 min 計算所有車流量的平均速度。

        圖5為西雅圖數據集2015年1月1日的檢測器速度分布熱力圖,顏色程度對應不同的交通速度。圖5第195 個檢測器路段在13:00 左右有小范圍車輛速度較低,可能是由于出現交通事故造成了交通擁堵。

        圖5 2015年1月1日西雅圖速度數據熱圖Fig.5 Heatmap of Seattle speed data on January 1,2015

        實際情況中,會由于天氣原因或者系統(tǒng)、電源故障造成數據缺失。最常見的缺失類型有完全隨機缺失和集群缺失,本文討論的路網缺失類型是完全隨機缺失(Missing Completely at Random,MCAR)和聚集的時間缺失(Missing Completely at Random Temporal,MCART)。圖6是圖5中數據在兩種缺失類型、不同缺失率下的熱圖。

        圖6 2015年1月1日西雅圖速度數據集缺失數據熱圖Fig.6 Seattle's heatmap of missing speed data on Jan 1,2015

        2.2 參數設置和評估

        數據集選取的時間維度為T=12,訓練集與測試集劃分比例a=0.8。降噪圖變分自編碼器中編碼器的兩層圖卷積網絡層隱藏單元個數分別為32、8;解碼器全連接層隱藏單元個數分別為32、12;提取出來的時空特征維度E=8 ;損失函數中α=0.0001。

        GAN 中生成器采用一層64 隱藏單元個數的LSTM和全連接層;判別器采用4層全連接層,隱藏單元個數分別為32、64、32、1。重建損失系數β=500。

        本文采用平均絕對誤差(MAE),均方根誤差(RMSE),平均絕對百分比誤差(MAPE)指標對模型進行評估,計算公式分別為

        式中:K為缺失數據的個數,x′k,xk分別為第k個真實和修復后的交通數據。

        2.3 對比實驗和分析

        對比模型包含反向傳播網絡(Backpropagation Network,BP)、降噪堆疊自編碼器(Denoising Stacked Auto-Encoder,DSAE)、貝葉斯高斯張量分解(Bayesian Gaussian Candecomp/Parafac,BGCP)、貝葉斯時間矩陣分解(Bayesian Temporal Matrix Factorization,BTMF)。此外,還選用修改后的DVGAE-GAN*,與本文方法區(qū)別在于其生成器由全連接層構成。

        對比模型參數設置為:BP 和DSAE 模型兩層隱藏層的單元個數分別為128、64,批處理大小分別為64;BGCP將數據矩陣分解重構為三階張量表示為路段乘小時數乘時間間隔,CP秩為10;BTMF將路段乘時間序列的數據矩陣分解為空間因子矩陣和時間因子矩陣,矩陣低秩為30;DVGAE-GAN*的生成器部分全連接層隱藏層單元個數為32、16、12。

        西雅圖數據集在不同缺失模式、不同缺失比例下的實驗結果如表2和表3所示,pems04數據集在不同缺失模式、不同缺失比例下實驗結果如表4和表5所示。

        由表2和表3可以看出,DVGAE-GAN 模型在兩種缺失類型下都優(yōu)于其他基準模型。在MCAR情況下,本文模型在低缺失率下表現最優(yōu),在高缺失率下MAE 逐漸接近基準模型中表現最佳的BTMF;在MCART 情況下,本文模型的MAE 保持在3.0 以內,優(yōu)于其他基準模型的表現。隨著缺失率的增加模型誤差會呈上升趨勢,因為可觀測數據的減少會導致生成的數據質量降低。DVGAE-GAN*方法在MCAR 情況下修復效果僅次于本文方法和BTMF;但是它在MCART情況下效果欠佳,在低缺失率下判別器的梯度快速進入平緩區(qū),由全連接層組成的生成器生成的路網數據誤差和波動都比較大,表明LSTM可以更好地捕獲路網時間特征。

        表2 MCAR、不同缺失率下修復結果對比(西雅圖數據集)Table 2 Comparison of imputation errors of Seattle dataset under MCAR and different missing rates

        表3 MCART、不同缺失率下修復結果對比(西雅圖數據集)Table 3 Comparison of imputation errors of Seattle dataset under MCART and different missing rates

        由表4和表5可知,BTMF 在MCAR 情況下部分效果略好于本文模型,但是在MCART 情況下BTMF 表現較差,主要因為MCART 條件下獲取到的信息較少。本文模型基于路網拓撲圖構建提取時空特征生成缺失數據,相比其余基準模型更能適應于不同的缺失類型、缺失率情況,具有較好的魯棒性。

        表4 MCAR、不同缺失率下修復結果對比(pems-04數據集)Table 4 Comparison of imputation errors of pems-04 dataset under MCAR and different missing rates

        表5 MCART、不同缺失率下修復結果對比(pems-04數據集)Table 5 Comparison of imputation errors of pems-04 dataset under MCART and different missing rates

        圖7采用MAE 反映不同模型誤差。通過對不同數據集的實驗對比結果可以看出,DVGAE-GAN模型的修復效果優(yōu)于基準方法,同時也證明了LSTM作為路網數據生成器的優(yōu)越性。

        圖7 兩種缺失類型的不同模型誤差對比(西雅圖數據集)Fig.7 Comparison of error of different models under two data missing types(Seattle dataset)

        3 結論

        本文提出一種基于圖自編碼-生成對抗網絡(DVGAE-GAN)的路網缺失數據修復方法。首先利用降噪圖變分自編碼器提取路網缺失數據的時空特征,在一定程度上更能捕獲原始路網數據的深層特征信息;其次將時空特征放入生成對抗網絡實現路網數據重構,生成器采用LSTM以實現路網數據的時間維度特征,加入路網結構的重建損失可以實現對于缺失數據的著重插補。對兩個典型路網數據集進行實驗,結果表明,本文方法的修復精度優(yōu)于目前主流的基準方法,且適用于實際中不同缺失率和缺失類型的數據采集情況。后期希望考慮引入動態(tài)的路網節(jié)點圖和分層構圖來充分考慮數據的時空變化,以此提升路網數據修復精度。

        猜你喜歡
        檢測器路網編碼器
        基于FPGA的同步機軸角編碼器
        打著“飛的”去上班 城市空中交通路網還有多遠
        省際路網聯(lián)動機制的錦囊妙計
        中國公路(2017年11期)2017-07-31 17:56:30
        首都路網 不堪其重——2016年重大節(jié)假日高速公路免通期的北京路網運行狀況
        中國公路(2017年7期)2017-07-24 13:56:29
        路網標志該如何指路?
        中國公路(2017年10期)2017-07-21 14:02:37
        車道微波車輛檢測器的應用
        基于PRBS檢測的8B/IOB編碼器設計
        一種霧霾檢測器的研究與設計
        JESD204B接口協(xié)議中的8B10B編碼器設計
        電子器件(2015年5期)2015-12-29 08:42:24
        多總線式光電編碼器的設計與應用
        国产在线一区二区三区四区| 亚洲日本中文字幕高清在线| 奇米影视久久777中文字幕| 久久成人成狠狠爱综合网| 久草视频在线视频手机在线观看| 色拍拍在线精品视频| 少妇伦子伦精品无吗| 日本高清在线播放一区二区| 国产WW久久久久久久久久| 在线高清理伦片a| 亚洲综合日韩精品一区二区| 国产一级片内射在线视频| 扒开双腿疯狂进出爽爽爽视频| 亚洲男女内射在线播放| 亚洲国产丝袜美女在线| 麻豆久久五月国产综合| 欧洲熟妇色xxxxx欧美老妇伦| 男女射黄视频网站在线免费观看| 性色av成人精品久久| jizz国产精品免费麻豆| 国语对白嫖老妇胖老太| av在线免费观看网站免费| 国产91熟女高潮一曲区| 日韩免费一区二区三区在线| 无码字幕av一区二区三区 | 亚洲熟女一区二区三区250p| 最新国产精品精品视频| 国产精品片211在线观看| 国产在线 | 中文| 亚洲国产亚综合在线区| 日本一区二区三区高清视| 国产三级黄色片子看曰逼大片| 国产在线播放网址| 国产精品免费精品自在线观看| 免费a级毛片18禁网站免费| 成人国产av精品麻豆网址| 久久99精品久久久久久国产人妖| 青草热久精品视频在线观看| 台湾无码av一区二区三区| 粗大的内捧猛烈进出看视频| 国产剧情av麻豆香蕉精品|