王秀林
(山西交通職業(yè)技術(shù)學(xué)院, 山西 太原 030031)
隨著人們生活水平的提高,車輛的數(shù)量越來越多,車輛的種類、型號(hào)、框架結(jié)構(gòu)等都具有不同的特征,因此應(yīng)用虛擬現(xiàn)實(shí)技術(shù)和圖像處理技術(shù)的目標(biāo)檢測(cè)和識(shí)別技術(shù),例如人臉識(shí)別、行人特征檢測(cè)、車輛檢測(cè)等,在智能交通和傳感技術(shù)發(fā)展的過程中,也越來越多地被應(yīng)用到交通領(lǐng)域,例如車輛碰撞預(yù)測(cè)預(yù)警、車輛偏離車道等突發(fā)情況;在智能交通中通過視頻捕捉利用視覺技術(shù)進(jìn)行分析和跟蹤,檢測(cè)人流擁擠和車輛通行狀況,可便捷高效地進(jìn)行交通管理,減少交通事故。
在車輛檢測(cè)技術(shù)中,通過背景圖像、紋理和顏色等對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行檢測(cè),提高檢測(cè)精度,在檢測(cè)過程中,通過利用高速混合建模、分類器、決策樹等算法進(jìn)行多目標(biāo)檢測(cè)、跟蹤、識(shí)別等。在車輛檢測(cè)中通過視頻和圖像分離背景圖像,常用的技術(shù)有基于背景差分、先驗(yàn)知識(shí)、光流法、機(jī)器學(xué)習(xí)等,其中,機(jī)器學(xué)習(xí)的研究應(yīng)用已成為目前的前沿領(lǐng)域,目標(biāo)檢測(cè)的方法和技術(shù)越來越多。
聚類算法主要是對(duì)生成的簇中的數(shù)據(jù)進(jìn)行相異和相似性判別,盡最大程度地實(shí)現(xiàn)對(duì)象中的相似度度量。
聚類算法主要包括基于劃分、層次、密度、網(wǎng)格、模型、分形、仿生等算法,無(wú)論用什么樣的聚類算法,影響算法結(jié)果的好壞主要受類目、距離函數(shù)和算法優(yōu)良三種因素的影響,其中基于劃分的聚類K-Means算法,容易受離散值或異常點(diǎn)、初始點(diǎn)選擇的影響,且數(shù)據(jù)集越大越容易產(chǎn)生局部最優(yōu)化;基于層次聚類相對(duì)復(fù)雜度較高、容易產(chǎn)生鏈狀且容易受異常點(diǎn)的影響,但該算法不需要預(yù)先對(duì)聚類的類數(shù)進(jìn)行定義,距離或相似度函數(shù)限制少;基于密度聚類的算法,例如DBSCAN算法,對(duì)于高維數(shù)據(jù)和點(diǎn)之間的稀疏難于進(jìn)行密度定義,但該算法可以事先不需要知道形成的簇類的數(shù)量和簇的形狀。
譜聚類算法簡(jiǎn)單易行,其聚類性能優(yōu)于傳統(tǒng)的K-Means算法,將數(shù)據(jù)的劃分轉(zhuǎn)化為圖的分割,該算法是基于圖論的聚類方法,通過對(duì)圖內(nèi)的相似度計(jì)算,將圖劃分為多個(gè)子圖,子圖內(nèi)相互之間相似度高,子圖間相互之間相似度低。
譜聚類算法是將所有的樣本點(diǎn)連接成圖,然后將圖分割成不同的子圖,使得不同的子圖相互間連接的權(quán)值達(dá)到最小。
首先定義兩個(gè)不同子圖間的連接權(quán)值為ω(A,B)=∑i∈A,j∈Bωij,其中 A-與 A 互補(bǔ),記 vi∈A 且 i∈A,若將圖分割為 K 個(gè)子圖 A1、A2,…,AK,則通過對(duì)最優(yōu)問題進(jìn)行分割得到
為了解決圖分割不均衡問題,生成有效分割,主要通過RaioCut和Normalized Cut兩種方法進(jìn)行合理分割,計(jì)算方式如下:
RaioCut和Normalized Cut將子圖大小作為目標(biāo)函數(shù)的分母,這樣可均衡所有子圖大小。其中,Normalized Cut的目標(biāo)函數(shù)對(duì)cut進(jìn)行了最小化,并進(jìn)行了劃分平衡,其中衡量子圖大小的標(biāo)準(zhǔn)是通過子圖中各端點(diǎn)的Degree之和進(jìn)行,本文采用了Normalized Cut的目標(biāo)函數(shù):
式中:d1為第3節(jié)中圖1-1的權(quán)值和,d2為第3節(jié)中圖1-2的權(quán)值和
s.t.:qTDq=1,qTDq=0,泛化瑞利熵為而L'q'=λq'。其中
因而只需要將原L矩陣,歸一化即可
歸一化的L矩陣有:
又:
L'的最小特征值與的最大特征值對(duì)應(yīng)。
該算法聚類的具體步驟如下:
1)根據(jù)視頻采集的圖像數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理,生成圖的鄰接矩陣;
2)根據(jù)歸一化理論,進(jìn)行拉普拉斯矩陣計(jì)算;
3)通過矩陣計(jì)算,生成最小的K個(gè)特征值和對(duì)應(yīng)的特征向量;
4)根據(jù)特征向量進(jìn)行K-Means聚類計(jì)算。
K-Means聚類算法屬無(wú)監(jiān)督的學(xué)習(xí)方法,K-Means算法主要是通過隨機(jī)初始化,生成種子類目K,利用最近鄰算法計(jì)算樣本點(diǎn)分別與各種子間的距離,生成不同的類簇,總類簇?cái)?shù)為類目數(shù),再計(jì)算各類簇的質(zhì)心,計(jì)算新的類目種子,通過迭代計(jì)算,直至種子點(diǎn)的距離小于指定的閾值。具體流程如下:
1)隨機(jī)生成 K 個(gè)類簇種子,即為(ω1,ω2,…,ωK);
2)對(duì)所有樣本點(diǎn)Xi+進(jìn)行計(jì)算,計(jì)算每個(gè)點(diǎn)所屬類目:
然后對(duì)每個(gè)類生成的類j進(jìn)行質(zhì)心計(jì)算
根據(jù)式(6)進(jìn)行優(yōu)化函數(shù)計(jì)算,通過Xi+得到聚類類目:
即:
根據(jù)UCI數(shù)據(jù)集選擇了不同的3種,然后利用譜聚類、K-Means聚類進(jìn)行對(duì)比試驗(yàn),經(jīng)驗(yàn)證,數(shù)據(jù)集1的聚類結(jié)果分別78.26%、77.34%,數(shù)據(jù)集2的聚類結(jié)果為61.73%、49.86%,數(shù)據(jù)集3的聚類結(jié)果為55.21%、44.65%。由此可見,譜聚類算法相對(duì)較為準(zhǔn)確。根據(jù)采集的圖像數(shù)據(jù),對(duì)車輛圖片進(jìn)行標(biāo)示,然后由圖的像素大小和比例進(jìn)行圖像劃分,再根據(jù)劃分后的圖像利用HOG特征經(jīng)過譜聚類算法再次進(jìn)行劃分,通過進(jìn)修迭代計(jì)算,最終得到如圖1所示的樣本聚類結(jié)果,聚類類目分別為6類和12類。
圖1 樣本聚類結(jié)果
由此可見,通過譜聚類進(jìn)行車輛檢測(cè)具有較好的可行性,且能得到較好的應(yīng)用效果。