姚磊,劉淵
1.江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院,江蘇無錫 214122
2.江南大學(xué)數(shù)字媒體學(xué)院,江蘇無錫 214122
基于改進模糊聚類與ANFIS的高速公路事件檢測
姚磊1,劉淵2
1.江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院,江蘇無錫 214122
2.江南大學(xué)數(shù)字媒體學(xué)院,江蘇無錫 214122
交通事件[1]是指導(dǎo)致道路通行能力下降或交通需求不正常升高的非周期性發(fā)生的情況,事件一般可分為可預(yù)測的和不可預(yù)測的兩類??深A(yù)測類交通事件包括大型活動、道路修筑、路面養(yǎng)護等。不可預(yù)測類交通事件主要包括交通事故、車輛拋錨、貨物散落等。
對于不可預(yù)測類交通事件,其發(fā)生的時間和地點無法事先獲知,駕駛員無法采取躲避措施,尤其高速公路具有車流量大和行車速度高的特點,一旦發(fā)生交通事故則往往非常嚴(yán)重,不僅一次事故影響的車輛多、傷亡率高,會造成嚴(yán)重的交通阻塞和行車延誤,還會引起二次事故的發(fā)生,嚴(yán)重影響高速公路的整體通行能力和運營效率。因此,本文主要研究對象為高速公路的不可預(yù)測類交通事件。
目前國內(nèi)外對交通事件檢測算法的研究主要集中在新理論和新技術(shù)的應(yīng)用方面,包括神經(jīng)網(wǎng)絡(luò)、模糊理論、小波分析以及支持向量機等,例如張良春等[2]采用一種改進的模糊C均值聚類對訓(xùn)練樣本進行預(yù)處理,提取有可能成為支持向量的訓(xùn)練樣本,通過分析事件產(chǎn)生對交通流的影響,選擇了支持向量機的輸人參數(shù),并進行了算法仿真;?ingliar和Hauskrecht[3]運用動態(tài)樸素貝葉斯和EM算法對實測數(shù)據(jù)進行標(biāo)簽重排,然后利用SVM算法進行分類,取得了較好的結(jié)果;彭宇[4]利用突變理論分析了事件發(fā)生對高速公路交通流特性的影響,建立了突變交通流模型,并利用小波理論的事件檢測算法進行了離線檢驗。
本文將自適應(yīng)模糊神經(jīng)推理系統(tǒng)應(yīng)用于高速公路事件檢測中,提出了用減法聚類對模糊C均值算法進行改進,生成初始模糊推理系統(tǒng),使模型自適應(yīng)地確定模糊系統(tǒng)的初始結(jié)構(gòu)和參數(shù),避免了盲目性和隨機性;利用ANFIS建立交通事件檢測模型,采用最小二乘算法和反向傳播算法對模糊規(guī)則的參數(shù)進行訓(xùn)練獲得最終的模型,并進行了仿真驗證。
自適應(yīng)模糊神經(jīng)推理系統(tǒng)[5](ANFIS),屬于神經(jīng)模糊網(wǎng)絡(luò)的一種。ANFIS融合了人工神經(jīng)網(wǎng)絡(luò)的自適應(yīng)學(xué)習(xí)功能與模糊系統(tǒng)的語言推理功能,并彌補了各自的不足。ANFIS可自動地從輸入輸出數(shù)據(jù)中提取規(guī)則,并依據(jù)神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)性,調(diào)整優(yōu)化前件參數(shù)和結(jié)論參數(shù),提高模糊系統(tǒng)的推理性能。
其對應(yīng)的結(jié)構(gòu)圖如圖1所示。
圖1 ANFIS結(jié)構(gòu)圖
第一層的功能是輸入變量模糊化,輸出為各輸入變量所對應(yīng)的模糊隸屬度函數(shù)。
第二層的功能是計算每條規(guī)則的適應(yīng)度,在圖中用Π表示,它的輸出是所有輸入信號的積,表示規(guī)則的激勵強度,其乘積輸出為:
第三層的功能是將所有規(guī)則的激勵強度歸一化,在圖中用N表示,它計算第i條規(guī)則的激勵強度與所有規(guī)則的激勵強度之和的比值:
第四層的功能是計算每條模糊規(guī)則的輸出,這一層的每個節(jié)點i都為一個有節(jié)點函數(shù)的自適應(yīng)節(jié)點:
第五層的功能是計算模糊系統(tǒng)的輸出,這一層的單節(jié)點是一個標(biāo)以∑的固定節(jié)點,它計算所有輸入信號之和作為總輸出:
從ANFIS的結(jié)構(gòu)可以看出,ANFIS屬于一種典型的自適應(yīng)網(wǎng)絡(luò),其目的是對前件參數(shù)與結(jié)論參數(shù)進行調(diào)整優(yōu)化,當(dāng)前件參數(shù)固定時,系統(tǒng)的總輸出可以表示為后件參數(shù)的線性組合,用符號表示即:
其中,θ={pi1,pi2,pi3,pi4,pi5,pi6}為后件參數(shù)集。固定前件參數(shù)不變,則式(1)是標(biāo)準(zhǔn)的線性最小二乘問題,使用最小二乘估計算法調(diào)整后件參數(shù)θ,接下來,固定上一步計算得到的后件參數(shù),對前件參數(shù)采用前饋神經(jīng)網(wǎng)絡(luò)的BP算法,將誤差由輸出端反傳到輸入端,由梯度下降法更新前件參數(shù),從而改變隸屬函數(shù)的形狀,完成前件參數(shù)的識別。
3.1 減法聚類算法原理
減法聚類[6-7]是一種快速尋找數(shù)據(jù)集的聚類數(shù)和聚類中心的算法,該算法選取數(shù)據(jù)集中所有數(shù)據(jù)點為候選聚類中心。令(x1,x2,…,xn)是M維空間中的n個數(shù)據(jù)點,按照減法聚類選擇每一個數(shù)據(jù)點作為候選聚類中心,使用式(2)計算數(shù)據(jù)點xi處的密度值:
其中,參數(shù)rα是密度的作用半徑,rα越小則所得到的聚類數(shù)目就越多。在計算完每個數(shù)據(jù)點密度指標(biāo)后,選擇密度值最高的數(shù)據(jù)點Xc1作為第一個聚類中心,按照式(3)修正該點的密度指標(biāo):
其中,Xc1為選中的聚類中心,Dc1為該聚類中心的密度值,參數(shù)rβ定義了密度指標(biāo)顯著減小的鄰域,通常rβ=1.5rα,以避免出現(xiàn)距離很近的聚類中心。
在修正第一個數(shù)據(jù)點的密度指標(biāo)后,重新選擇當(dāng)前密度值最高的數(shù)據(jù)點作為下一個聚類中心,利用式(3)對所有數(shù)據(jù)點進行密度值調(diào)整。重復(fù)以上步驟,當(dāng)剩余數(shù)據(jù)點作為聚類中心的可能性低于某一閾值時,停止聚類中心搜索。
3.2 FCM聚類算法原理
模糊C均值聚類[8-10](FCM),即模糊ISODATA,是用隸屬度確定每個數(shù)據(jù)點屬于某個聚類程度的一種聚類算法。其基本思想是通過反復(fù)修改聚類中心V和分類矩陣U來實現(xiàn)動態(tài)的迭代聚類,使得被劃分到同一簇的對象之間相似度最大,而不同簇之間相似度最小。
給定觀察空間的一樣本集xi(i=1,2,…,n),c為預(yù)定的類別數(shù)目,mj為每個聚類的中心,μj(xi)是第i個樣本對于第j類的隸屬度函數(shù)。用隸屬度函數(shù)定義的聚類損失函數(shù)可以寫為:
其中,b∈[1,∞)是一個加權(quán)指數(shù),可以控制聚類結(jié)果的模糊程度的常數(shù),通常取2。標(biāo)準(zhǔn)模糊C均值方法要求一個樣本對于各個聚類的隸屬度之和為1,即:
令Jf對mj和μj(xi)求導(dǎo),使得式(4)達(dá)到最小的必要條件為:
用迭代方法求解式(6)和式(7),算法步驟如下:
步驟1給定聚類數(shù)目c,加權(quán)指數(shù)b,容許誤差ε的值。
步驟2隨機初始化聚類中心mj(1)(j=1,2,…,c)。
步驟3用當(dāng)前聚類中心根據(jù)式(7)計算隸屬度函數(shù)。
步驟4根據(jù)式(6)修正聚類中心mj(k+1)(j=1,2,…,c)。
3.3 改進聚類算法
FCM聚類算法必須預(yù)先指定聚類中心數(shù),無法充分利用數(shù)據(jù)信息的特征。而減法聚類無需規(guī)定聚類數(shù),根據(jù)樣本數(shù)據(jù)即可快速決定聚類中心,既充分利用了數(shù)據(jù)本身提供的信息,又加快了收斂速度。本文將減法聚類后得到的聚類中心全部用于初始FCM的聚類中心,加快了FCM的收斂速度,減少了由用戶確定聚類中心個數(shù)的盲目性。
3.4 交通事件檢測算法建模
本文采用SFCM-ANFIS算法模型流程圖如圖2所示,其具體步驟如下:
步驟1 I-880數(shù)據(jù)庫包括上下游速度,流量和占有率的測量值6個參數(shù),首先對該數(shù)據(jù)進行預(yù)處理,利用Matlab的Mapminmax函數(shù)將樣本數(shù)據(jù)映射到[0,1]區(qū)間進行歸一化。
步驟2為減少人工因素干擾,本文利用減法聚類求得處理后樣本數(shù)據(jù)的聚類中心,然后將該聚類中心賦給FCM初始聚類中心,進行FCM聚類得到聚類數(shù)和聚類中心,若求得聚類個數(shù)為C,則隸屬度函數(shù)的個數(shù)為C×6,從而建立一個6輸入1輸出的ANFIS結(jié)構(gòu)。
步驟3輸入得到的訓(xùn)練樣本數(shù)據(jù),采用反向傳播算法與最小二乘法的混合算法訓(xùn)練ANFIS,若滿足訓(xùn)練終止條件,即得到最終模糊推理系統(tǒng)。
步驟4利用驗證樣本數(shù)據(jù)對得到的FIS模型進行推理判斷,與樣本數(shù)據(jù)中類別標(biāo)簽比較得到檢測率和誤報率兩個評價指標(biāo),并由此進行對比分析。
圖2 交通事件檢測模型流程圖
交通事件檢測算法常用評價指標(biāo)有檢測率(Detection Rate,DR)、誤報率(False Alarm,F(xiàn)AR)和平均檢測時間(Mean Time to Detection,MTTD)。
本文不僅采用常用評價指標(biāo),還采用了接收者操作特性曲線[9](Receiver Operation Characteristic Curve,ROC)和曲線下面積(Area Under the Curve,AUC)來評價AID算法。
ROC曲線是以誤報率(False Positive Rate,F(xiàn)PR)為橫軸,檢測率(True Positive Rate,TPR)為縱軸,橫軸與長度相等,為單位l,形成一個正方形的二維空間,在此二維空間中將各個(FPR,TPR)點標(biāo)出,用直線連接各相鄰兩點構(gòu)建而成的一條曲線。
ROC曲線是分類器識別算法性能的二維直觀描述。為便于比較不同的識別算法,常計算ROC曲線下面積AUC。AUC的理論取值范圍在0.5~1.0之間,0.5對應(yīng)幾率線(對角線)下的面積,1.0對應(yīng)整個ROC平面的面積。ROC越快速逼近左上角,AUC越大,識別算法的性能就越好。
5.1 數(shù)據(jù)來源
本文采用美國加州I-880數(shù)據(jù)庫進行實驗仿真,它已經(jīng)被廣泛應(yīng)用在相似的事件檢測算法研究上。該數(shù)據(jù)庫前期采集時間為1993年2月16日—3月19日,后期采集時間為1993年9月27日—10月29日。I-880數(shù)據(jù)庫保存了交通流量、占有率、速度以及交通事件(包括貨物散落、車輛故障和交通事故等)的原始數(shù)據(jù),是目前最大、最完整的高速公路交通數(shù)據(jù)庫;I-880交通數(shù)據(jù)總共記錄了4 136組交通事故數(shù)據(jù)樣本,共45起交通事件,本文隨機選取了其中22起交通事件,共2 100組樣本數(shù)據(jù),與隨機選取的4 343組非事件樣本數(shù)據(jù),共6 443組數(shù)據(jù)組成輸入樣本數(shù)據(jù)集。本文從樣本特征集中隨機選取60%的數(shù)據(jù)作為訓(xùn)練樣本,20%的數(shù)據(jù)作為驗證樣本,剩下20%的數(shù)據(jù)作為測試樣本;選取上下游檢測器檢測到的速度、流量和占有率的測量值6個參數(shù)組成模型最初的特征輸入集,數(shù)據(jù)樣本有7列,最后一列為樣本數(shù)據(jù)的類別標(biāo)簽,+1表示該樣本為有事件樣本,-1表示該樣本為無事件樣本。
5.2 實驗及結(jié)果分析
交通事件檢測算法常用評價指標(biāo)有檢測率、誤報率和平均檢測時間。然而,在選擇算法時,通常要在這些評價指標(biāo)中進行權(quán)衡,通常來說,為得到較高檢測率,必然有高誤報率,而為減少平均檢測時間,也會相應(yīng)的降低檢測率。因此,本文除了采用均衡的常用評價指標(biāo)外,還采用了ROC曲線及AUC值來對各種算法進行評價。
本文利用Matlab對算法進行仿真驗證[10,-1],并與其他算法進行比較。仿真實驗參數(shù):SVM算法中懲罰參數(shù)c=300,核函數(shù)參數(shù)g=0.04,減法聚類中密度作用半徑rα=0.3。每種算法分別進行10次實驗,訓(xùn)練的迭代次數(shù)均為200次,比較結(jié)果如表1所示。
表1 算法檢測性能比較
從對比實驗看出,無聚類算法的ANFIS平均檢測時間最高,無法達(dá)到交通事件檢測系統(tǒng)實時性的要求;SVM算法雖然得到了較好的平均檢測時間,但其誤報率較高且AUC值最?。粶p法聚類與本文所采用的基于改進FCM和ANFIS的算法的檢測時間大致相同,但本文所用方法具有較高的檢測率和較低的誤報率,并且它的AUC值均高于其他算法。
圖3 交通事件檢測ROC曲線對比圖
ROC曲線中的橫坐標(biāo)表示誤報率,縱坐標(biāo)表示檢測率,上述4種算法的ROC曲線如圖3所示。從圖中可以看出,SVM算法曲線在最下方,具有最低AUC值,并且當(dāng)誤報率在0.4左右時,檢測率才能達(dá)到1.0;無聚類算法的ANFIS與基于減法聚類的ANFIS從曲線上看大致相同,但從表1可知,無聚類算法的ANFIS需要較高檢測時間,不滿足實時性要求,而且,兩種算法誤報率在0.2~0.3之間時,檢測率才能達(dá)到1;SFCM-ANFIS算法誤報率在0.1~0.2之間時,檢測率就可接近1,并且SFCM-ANFIS算法的曲線基本位于其他算法上方,具有最高AUC值,說明其整體性能較優(yōu)。
本文提出了基于改進FCM和ANFIS算法的高速公路交通事件檢測的新模型,使用減法聚類得到聚類中心初始化FCM算法,通過FCM聚類算法得到前件參數(shù),建立初始模糊神經(jīng)系統(tǒng),然后利用混合學(xué)習(xí)算法對該系統(tǒng)進行訓(xùn)練,得到最終模糊神經(jīng)系統(tǒng),最后用檢測數(shù)據(jù)對該系統(tǒng)進行模糊推理,判斷是否為高速公路事件。實驗結(jié)果表明,本文所采用的交通事件自動檢測模型是有效的,且總體性能優(yōu)于一般的事件自動檢測方法。同時,結(jié)合減法聚類和標(biāo)準(zhǔn)FCM對聚類算法進行改進,不僅充分利用了樣本數(shù)據(jù)信息,而且減少了由用戶確定聚類中心個數(shù)的盲目性,將改進后的算法應(yīng)用于模糊系統(tǒng),從而提高模糊系統(tǒng)的應(yīng)用效率。為了降低檢測時間,滿足實時性要求,今后將對交通流數(shù)據(jù)進一步進行處理,為得到更好的檢測結(jié)果,將進一步對ANFIS進行優(yōu)化處理,以提高其在交通事件檢測方面的性能。
[1]王曉原,張敬磊,楊新月.交通流數(shù)據(jù)清洗與狀態(tài)辨識及優(yōu)化控制關(guān)鍵理論方法[M].北京:科學(xué)出版社,2011.
[2]張良春,夏利民,石華瑋.基于模糊聚類支持向量機的高速公路事件檢測[J].計算機工程與應(yīng)用,2007,43(17):206-208.
[3]?ingliar T,Hauskrecht M.Learning to detect incidents from noisily labeled data[J].Machine Learning,2010,79:335-354.
[4]彭宇.基于小波分析的高速公路事件檢測算法[J].湖南交通科技,2011,37(3):123-126.
[5]張智星,孫春在,水谷英二.神經(jīng)-模糊和軟計算[M].西安:西安交通大學(xué)出版社,2000.
[6]曲強,陳雪波.基于ANFIS的鐵水脫硫系統(tǒng)的建模[J].模式識別與人工智能,2004,17(2):218-221.
[7]蔣靜芝,孟相如,李歡,等.減法聚類——ANFIS在網(wǎng)絡(luò)故障診斷的應(yīng)用研究[J].計算機工程與應(yīng)用,2011,47(8):76-78.
[8]邊肇祺,張學(xué)工.模式識別[M].2版.北京:清華大學(xué)出版社,2000.
[9]薛勝君,聶靖.基于混合優(yōu)化模糊C均值算法的網(wǎng)格資源聚類[J].計算機應(yīng)用研究,2010,27(6):2153-2155.
[10]朱喜林,武星星,李曉梅.基于改進型模糊聚類的模糊系統(tǒng)建模方法[J].控制與決策,2007,22(1):73-77.
[11]張國良,王海娟,柯熙政,等.模糊控制及其MATLAB應(yīng)用[M].西安:西安交通大學(xué)出版社,2002.
YAO Lei1,LIU Yuan2
1.School of Internet of Things,Jiangnan University,Wuxi,Jiangsu 214122,China
2.School of Digital Media,Jiangnan University,Wuxi,Jiangsu 214122,China
In order to accurately and timely detect highway traffic accident,reduce traffic delay and improve highway safety, this paper combines subtractive clustering and FuzzyC-Means(FCM)clustering method to cluster the input sample data to build the initial fuzzy inference system,then the hybrid algorithm is used to train the parameters of the fuzzy system,determine the fuzzy reasoning rules,and establish a final training fuzzy model.Compared with the simulation experimental results,the method obtains excellent performance on ROC(Receiver Operation Characteristic)curve,shows the validity of the modeling method based on the improved fuzzy clustering and Adaptive Neural Fuzzy Inference System(ANFIS).
freeway incident detection;FuzzyC-Means(FCM)clustering;subtractive clustering;Adaptive Neural Fuzzy Inference;ROC curve
為了準(zhǔn)確并及時地發(fā)現(xiàn)高速公路上的交通事故隱患,減少事故引發(fā)的交通延遲,提高高速公路運行安全性,結(jié)合減法聚類與模糊C均值(FCM)聚類算法對輸入樣本數(shù)據(jù)進行聚類,建成初始模糊推理系統(tǒng),然后通過神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)機制,訓(xùn)練模糊系統(tǒng)參數(shù),確定模糊推理規(guī)則,建立最終模糊模型。通過仿真實驗結(jié)果對比,驗證了基于改進模糊聚類與自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS)建模方法的有效性。
交通事件檢測;模糊C均值聚類;減法聚類;自適應(yīng)神經(jīng)模糊推理;ROC曲線
A
TP39
10.3778/j.issn.1002-8331.1112-0613
YAO Lei,LIU Yuan.Freeway incident detection based on improved fuzzy clustering arithmetic and ANFIS.Computer Engineering and Applications,2013,49(19):242-245.
國家自然科學(xué)基金(No.61103223);江蘇省自然科學(xué)基金重點研究專項(No.BK2011003)。
姚磊(1986—),女,碩士,主要研究領(lǐng)域為模式識別,事件檢測;劉淵(1967—),男,教授,主要研究領(lǐng)域為軟件工程,網(wǎng)絡(luò)應(yīng)用。E-mail:yjs_latte@163.com
2012-01-04
2012-04-18
1002-8331(2013)19-0242-04
CNKI出版日期:2012-05-22http://www.cnki.net/kcms/detail/11.2127.TP.20120522.1108.008.html