李煒
【摘 要】機器學習成為人工智能、模式識別領域的共同研究熱點,其理論方法已經(jīng)被廣泛應用于解決實際工程應用及科學領域的復雜問題。隨著技術的快速發(fā)展,以統(tǒng)計為基礎的機器學習受到人們的關注,并在語音、自然語言、視覺等領域獲得成功應用。本文主要闡述了機器學習的分類,介紹幾種常用的機器學習方法。
【關鍵詞】機器學習分類;人工智能;P-N Leraning
0 概述
機器學習是實現(xiàn)人工智能領域的一個重要的研究分支,其研究的主要內(nèi)容是實現(xiàn)利用計算機程序讓帶有處理器及計算功能的機器可以隨著經(jīng)驗的增加提高處理問題的性能。目前,機器學習的理論已經(jīng)被廣泛的應用到,如智能視頻監(jiān)控、生物識別、無人駕駛等各個領域。
1 機器學習的發(fā)展及分類
機器學習基本上可分為 4 個階段。第一階段:上世紀 50 年代到 60 年代中期,系統(tǒng)通過自身不斷的學習輸入、輸出反饋,完善系統(tǒng)參數(shù)及本身的性能。第二階段:從 1960 年代中葉到 70 年代中,該階段主要是對系統(tǒng)結(jié)構(gòu)的研究,如通過邏輯結(jié)構(gòu)或者圖結(jié)構(gòu)來解釋描述機器內(nèi)部結(jié)構(gòu)。第三階段的時間是從上世紀 70 年代中到 80 年代中期,主要通過研究學習策略和學習方法來提高改善學習的效率,同時引入知識數(shù)據(jù)庫,此階段機器學習取得了長足的發(fā)展; 1986 年至今,神經(jīng)網(wǎng)絡的引入,及人工智能的需要,人們對機器學了得連接機制進行了研究。
目前機器學習領域的研究一般可分四類,即無監(jiān)督學習、監(jiān)督學習、半監(jiān)督學習以及增強學習[1-2]。
1.1 無監(jiān)督學習
無監(jiān)督學習是一種自學習的分類方式,對沒標記的訓練樣本進行學習,發(fā)掘未知數(shù)據(jù)間隱藏的結(jié)構(gòu)關系。無監(jiān)督學習和核密度估計方法非常相似。常用的無監(jiān)督學習有關聯(lián)規(guī)則學習和聚類學習
1.2 監(jiān)督學習
監(jiān)督學習是有人工參與的一種學習。監(jiān)督學習一般分為 3 步,第一標記樣本,第二訓練,第三模型概率估計。其大概過程如下:(1)輸入樣本的特征向量和樣本類別標記 ,(2)訓練時通過分析樣本的特征向量,將預測結(jié)果與訓練樣本的實際標記情況進行比較,(3)調(diào)整預測模型,直到預測模型的準確率和預期的準確率相符。
1.3 半監(jiān)督學習
半監(jiān)督學習是同時使用以標記的樣本數(shù)據(jù)和未標記的樣本數(shù)據(jù)來實現(xiàn)的一種預測方法,半監(jiān)督學習分為直推和歸納兩種模式。要先用已標記數(shù)據(jù)訓練分類器模型,學習數(shù)據(jù)的內(nèi)在結(jié)構(gòu)聯(lián)系以便有效地對數(shù)據(jù)進行預測。
1.4 增強學習
增強學習是通過與環(huán)境的測試性交互來優(yōu)化和估計實際動作,來實現(xiàn)序列的決策,輸入數(shù)據(jù)同時作為對模型的反饋。和其他類型學習相比強化學習輸入的數(shù)據(jù)直接反饋到模型,模型同時作出相應的調(diào)整,并根據(jù)狀態(tài)變化獲得某種強化信號,最終實現(xiàn)與環(huán)境的交互。常用的增強學習算法有 Q-Learning 、時間差學習算法等[3]。
2 P-N Learning算法
在2010年,Kalal提出了基于 P-N Learning的運動目標跟蹤算法,該算法和其他算法的不同點是對未標記的數(shù)據(jù)集進行約束和控制通過約束條件。假設各個不同的樣本間存在相互獨立的關系,大多數(shù)的基于學習的跟蹤算法。視頻圖像中,某幀圖像的時-空關聯(lián),基本上很少是相互獨立的。Kalal 等人認為單獨目標或背景是具有關聯(lián)標記的樣本圖像塊。如下圖,視頻中標記目標的結(jié)構(gòu)約束如軌跡所示,我們可以理解認為所有接近目標軌跡的圖像塊為背景,距離軌跡較遠的圖像塊為運動目標。
3 混合高斯算法
混合高斯算法認為組成圖像的每個像素在一段時間內(nèi)的狀態(tài)都稱搞死狀態(tài)分布的,并且每個像素不具有相關性,都是相互獨立的,因此每個像素的狀態(tài)就可以有幾個高斯函數(shù)模擬組成。該算法可以較為詳細的表示圖像該坐標點的像素,但是由于其在判定運動目標和背景是采用的二值法,視頻環(huán)境中陰影的遮擋、樹葉的擺動、光照強度的不同都可能影響對運動目標的判斷,而且此方法的計算量也較為大,一般情況下都采用基于幀間差分的混合高斯模型,及先對相鄰的兩幀或幾幀視頻進行差分,把視頻圖像分為感興趣區(qū)域和非感興趣區(qū)域,對于感興趣的區(qū)域我們采用混合高斯建模,非感興趣區(qū)域可采用單高斯建模,這樣可以提高算法的運行效率,提高算法的響應時間,在實際的應用中有較大的應用價值。
【參考文獻】
[1]孫宸.基于半監(jiān)督在線學習的目標跟蹤算法研究[D].[碩士學位論文].上海:上海交通大學,2012.
[2]高文.機載光電平臺目標跟蹤技術的研究[D].[博士學位論文].北京:中國科學院研究生院,2012.
[3]V.Gullapalli. A comparison of supervised and reinforcement learning methods on a reinforcement learning task[C]. Proceedings of the 1991 IEEE International.
[責任編輯:朱麗娜]endprint