摘 要:機器學習是現(xiàn)在一個很熱門的研究方向,利用機器深度學習來進行行人的檢測是一個科學有效的辦法。文章通過對于圖像提取與壓縮的方案探討,結(jié)合信號的稀疏表達的技術(shù),對行人的檢測方法進行了分析,結(jié)果表明,機器學習的檢測方案是準確而有效的。
關(guān)鍵詞:機器學習;稀疏表達;行人檢測
1 圖像提取的方法
1.1 分割
在計算機視覺中,圖像分割是將數(shù)字圖像分割成多個片段或者像素集合的過程,分割的目標是將圖像的表示簡化和改變?yōu)楦幸饬x和更容易分析的東西。圖像分割通常用于定位圖像中的對象和邊界。更精確地,圖像分割是向圖像中的每個像素分配標簽,使得具有相同標簽的像素共享某些特性的過程。圖像分割的結(jié)果是集合地覆蓋整個圖像或從圖像提取的一組輪廓的集合的片段。區(qū)域中的每個像素相對于某些特性或計算的屬性是相似的。相對于相同的特征,相鄰區(qū)域是不同的。當應(yīng)用于成像中的圖像堆疊時,在圖像分割之后產(chǎn)生的輪廓可以采用插值算法生成。常見的是閾值分割,使用這種成像技術(shù)可以精確地進行黑白和彩色圖像的自適應(yīng)圖像分割。
1.2 濾波
迭代過濾算法是用于對觀察的圖像進行最大似然推斷的工具,對未知參數(shù)的隨機擾動用于探索參數(shù)空間。將順序蒙特卡羅粒子濾波器應(yīng)用于該擴展模型導致選擇與數(shù)據(jù)更一致的參數(shù)值。適當構(gòu)造的程序,迭代與連續(xù)減少的擾動,收斂到最大似然估計。迭代過濾方法迄今為止被廣泛用于研究圖像的提取與濾波。首先,它們平滑了似然面,使算法能夠克服全局搜索早期階段可能出現(xiàn)的小規(guī)模特征。其次,蒙特卡羅變化允許搜索從局部最小值逃脫。第三,迭代過濾更新使用擾動的參數(shù)值來構(gòu)建最大似然的導數(shù)近似值,即使該量通常不是以閉合形式可用。第四,參數(shù)擾動有助于克服在順序蒙特卡羅期間可能出現(xiàn)的數(shù)值估計困難。
2 基于稀疏表達的圖像特征壓縮
稀疏表達可以理解為將一個原始信號用一組字典元素的線性組合進行表示,將一段時間內(nèi)的信號中的每一個作為一個向量輸入到矩陣中,進行矩陣分解,可以得到其低秩部分、稀疏部分和噪聲部分。信號的稀疏表示近年來引起了研究人員相當大的興趣,假設(shè)自然信號(例如圖像)允許在冗余字典上進行稀疏分解,導致處理這種數(shù)據(jù)源的有效算法。特別地,用于圖像的良好適應(yīng)的字典的設(shè)計已經(jīng)是一個主要的挑戰(zhàn)。K-SVD最近已經(jīng)被提出用于這個任務(wù)并且被示為對于各種灰度圖像處理任務(wù)執(zhí)行得很好。為解決學習彩色圖像的字典的問題,并擴展基于K-SVD的灰度圖像去噪算法。來自稀疏信號表示的技術(shù)通常在非傳統(tǒng)應(yīng)用上開始在計算機視覺中看到顯著影響,其中目標不僅是獲得觀察信號的高保真表示,而且還提取語義信息。詞典的選擇在彌合這種差距中起著關(guān)鍵作用,由訓練樣本組成或從訓練樣本本身學習的非常規(guī)詞典是獲得最先進結(jié)果和將語義含義附加到稀疏信號表示的關(guān)鍵。理解這種非常規(guī)字典的良好性能又需要新的算法和分析技術(shù),這項工作提出了處理非均勻噪聲和丟失信息的方法,為如彩色圖像去噪、去馬賽克和修復等應(yīng)用中的最先進的結(jié)果鋪平了道路。
由于提取到的圖像特征數(shù)據(jù)的維數(shù)過高、數(shù)量過大,不利于存儲和進一步的機器學習,因此需要進行相應(yīng)的壓縮。對于特征提取,我們顯示如果識別問題中的稀疏性正確利用,特征的選擇不再是關(guān)鍵。然而,關(guān)鍵的是特征的數(shù)量是否足夠大以及稀疏表示是否被正確地計算。非常規(guī)特征,例如下采樣圖像和隨機投影,以及常規(guī)特征,例如特征面和拉普拉斯面,只要特征空間的維度超過某一閾值,由稀疏表示的理論預測。該框架可以通過利用這些誤差相對于標準(像素)基礎(chǔ)常常是稀疏的事實來統(tǒng)一地處理由于遮擋和破壞引起的錯誤。稀疏表示的理論有助于預測識別算法可以處理多少遮擋以及如何選擇訓練圖像以最大化遮擋的魯棒性。
3 基于機器學習的行人檢測
3.1 機器學習技術(shù)
機器學習是計算機科學的子領(lǐng)域,它使計算機能夠?qū)W習而不用明確編程。從模式識別和計算學習理論在人工智能的研究演變而來,機器學習探索學習對數(shù)據(jù)進行預測算法的研究和構(gòu)建,這樣的算法克服了嚴格的靜態(tài)程序指令數(shù)據(jù)驅(qū)動的預測或決策,通過從樣本輸入來建立一個模型。機器學習在一系列計算任務(wù)中使用,其中有著明確算法的設(shè)計和編程是不可行的,比如垃圾郵件過濾、檢測網(wǎng)絡(luò)入侵者或惡意內(nèi)部人員、光學字符識別、搜索引擎和計算機視覺,這些方面都沒有明確的算法表示。機器學習與計算統(tǒng)計密切相關(guān),并且經(jīng)常與計算統(tǒng)計重疊,計算統(tǒng)計也集中在通過使用計算機的預測中。它與數(shù)學優(yōu)化有著緊密的聯(lián)系,它將方法、理論和應(yīng)用領(lǐng)域傳遞到現(xiàn)場。機器學習有時與數(shù)據(jù)挖掘相結(jié)合,后者的子領(lǐng)域更側(cè)重于探索性數(shù)據(jù)分析。機器學習也可以是全自動化的,用來學習和建立各種實體的行為預測,然后用于發(fā)現(xiàn)有價值的異常情況。在數(shù)據(jù)分析領(lǐng)域,機器學習是一種用于設(shè)計適合預測的復雜模型和算法的方法,在商業(yè)應(yīng)用中,這被稱為預測分析。這些分析模型允許研究人員、數(shù)據(jù)科學家、工程師和分析師通過學習數(shù)據(jù)中的歷史關(guān)系和趨勢來產(chǎn)生可靠的、可重復的決策和結(jié)果并揭示隱藏的規(guī)律。
3.2 支持向量機技術(shù)
支持向量機(SVM)表示一組從訓練數(shù)據(jù)創(chuàng)建函數(shù)的受監(jiān)督學習技術(shù),訓練數(shù)據(jù)通常包括輸入對象(通常是向量)和期望輸出的對象。學習的函數(shù)可以用于預測新對象的輸出。SVM通常用于其中函數(shù)輸出有限類之一的分類。SVM也用于回歸和偏好學習,為此他們分別稱為支持向量回歸SVR和排名SVM。SVM屬于一類廣義線性分類器,其中分類(或邊界)函數(shù)是特征空間中的超平面。SVM的特殊性質(zhì)是SVM可以實現(xiàn)高度的泛化,泛化表示學習函數(shù)對測試數(shù)據(jù)或在訓練中排除的未知數(shù)據(jù)的性能。
將表征圖像梯度特征的HOG特征和圖像紋理特征的LTP特征相結(jié)合,發(fā)揮二者的優(yōu)勢,并利用稀疏表達的方法進行特征數(shù)據(jù)的壓縮,利用二者相結(jié)合訓練的SVM分類器進行了行人檢測的測試。檢測時,首先對圖像進行預處理,例如圖像仿射糾正幾何形變、圖像去噪、曝光過度圖像的濾除;然后進行前景提取,因為行人在圖像中是以前景的形式出現(xiàn),所以可以得到行人的候選區(qū)域;再對輸入圖片進行尺度縮放,對于每一層圖像,采用大小為128×64的窗口進行滑動計算,提取出每個滑動窗口的HOG特征和LTP特征,并利用SVM分類器進行判別,可以得到該窗口中是否有目標。如果當前窗口符合行人的HOG特征和LTP特征,就將其存儲作為目標區(qū)域;如果沒有,則檢測下一個窗口。
4 結(jié)束語
本文利用基于HOG特征和LTP特征相結(jié)合訓練的SVM分類器進行行人檢測,該方法可以應(yīng)用于靜止攝像頭的監(jiān)控場景中,將前景圖像、背景圖像和噪聲分離,理論意義和實際應(yīng)用價值都比較高。前景提取方法可以很好地抵抗噪聲,并將圖像的3個組成部分:低秩部分、稀疏部分和噪聲部分進行有效地分離。實驗結(jié)果表明提出的算法有精度高、速度快等優(yōu)點。然而,實驗中的前景提取和行人檢測是相分離的,如何將二者進行結(jié)合將是下一步的研究方向。
參考文獻
[1]李紫微.淺析計算機圖像處理技術(shù)的應(yīng)用[J].通訊世界,2016(06).
[2]閆鳳,石磊,張國英,等.計算機圖像處理技術(shù)的應(yīng)用[J].電子技術(shù)與軟件工程,2016(20).
作者簡介:徐政超(1984,12-),男,漢族,籍貫:河南沁陽,當前職務(wù):實驗技術(shù)人員,當前職稱:助理工程師,學歷:碩士,研究方向:計算機科學與應(yīng)用。