湯雙霞
(廣州番禺職業(yè)技術學院,廣州511483)
大數(shù)據(jù)技術的興起和大范圍推廣與普及,能夠直接影響到各領域信息技術的發(fā)展。大量數(shù)據(jù)的更新?lián)Q代,亟需對不同類型的數(shù)據(jù)庫提供有效技術支撐。為合理應用相關數(shù)據(jù)信息,就需要明確數(shù)據(jù)信息蘊含的價值。卷積神經網(wǎng)絡是當前研究人工智能的先進技術,并已廣泛應用在語音識別、計算機視覺等方面。深度學習,作為人工神經網(wǎng)絡技術的分支之一,其模型設計屬于深層次學習結構。而卷積神經網(wǎng)絡,則能夠對非線性結構展開進一步的研究,對于復雜函數(shù)的表達加以分析,同時,深度學習還能夠將低層次特征抽象、整合并轉變?yōu)楦邔有畔⑴c決策。經過研究得出:分布式特征,能夠發(fā)揮高強度學習樣本集的功效。因此在當下研究中,嘗試運用深度學習技術,其長足優(yōu)勢之一就是可推動人臉識別技術的創(chuàng)新、改進與飛躍式進步。將其運用在高校課堂中,通過收集教師課堂人臉數(shù)據(jù),即可充分發(fā)揮大數(shù)據(jù)、深度學習的最大應用價值。對此,本文擬做研究闡釋如下。
上溯至十八世紀,相關科研人員就對人臉特征、身份識別進行分析和研究。相關研究人員表示,曾經備受推崇的人臉幾何結構特征研究方法,在將其付諸實施時的效果卻并不理想,因此仍有待后續(xù)的深入研究與開發(fā),以滿足實際場景的需求及達到設計應用目標。人臉識別領域中,麻省理工學院Turk提出了富有時代意義的處理策略,也就是特征人臉識別方法。這一方法的使用,吸引了較多研究人員在此基礎之上進行不斷的研創(chuàng)與革新,眾多的新型識別方法也陸續(xù)涌現(xiàn)。人臉識別算法的完善,將使所得人臉圖像更為清晰,但其中涉及的首要問題就是方法的實用性。一些研究人員對魯棒性人臉識別方法,如:光照、姿態(tài)、遮擋等做出分析,對非理想條件下自然場景的人臉圖像予以識別處理。通常情況下,人臉識別包括多個類型,主要有:幾何特征、模板匹配,以及統(tǒng)計分析和傳統(tǒng)神經網(wǎng)絡等。
神經網(wǎng)絡理論首次面世后,就有研究人員隨后提出了自組織映射神經網(wǎng)絡,通過該網(wǎng)絡可在圖像內容中聽到較大的噪音,還會發(fā)現(xiàn)部分遮擋狀況。此后,則有研究人員開始將卷積神經網(wǎng)絡、自組織映射神經網(wǎng)絡有機聯(lián)系起來,由此即構建出混合神經網(wǎng)絡。研究發(fā)現(xiàn),卷積網(wǎng)絡對圖像平移、尺度的自適應性較弱,但是這對于加強網(wǎng)絡的性能卻尤為有利,并在ORL人臉數(shù)據(jù)庫上取得了較好的效果。值得一提的是,神經網(wǎng)絡結構、以及動態(tài)鏈接結構的使用,將能有效區(qū)別不同的人臉特征。與神經網(wǎng)絡模型相似的方法有很多,如:時滯神經網(wǎng)絡、徑向基函數(shù)網(wǎng)絡,以及Hopfield網(wǎng)絡。與其它人臉識別方法相比,神經網(wǎng)絡模型無需耗費人工去實現(xiàn)算法設計、研究,自動學習數(shù)據(jù)集即可。而且,利用該方法還可提取到優(yōu)秀的人臉特征表達、圖像模式規(guī)律。綜上論述分析可知,神經網(wǎng)絡方法在人臉識別研究中占據(jù)著優(yōu)勢地位,此外也表現(xiàn)出較強的魯棒性。但是,神經網(wǎng)絡缺乏嚴格理論驗證、解釋,需要經過較多人臉圖像學習,訓練的速度較慢。
卷積神經網(wǎng)絡 CNN[1],為經多層感知機 MLP基礎上完善獲得。在生物神經科學領域之上發(fā)展而成,能夠模擬貓視覺皮層的感受野。這一感受野區(qū),對輸入空間分子區(qū)的敏感度較高,同時可均勻地覆蓋于整個視野區(qū)。卷積神經網(wǎng)絡層間的連接方式,需要進行卷積計算,將其與前饋神經網(wǎng)絡相比,研究可知則存在著較大的差異性。總地說來,前饋神經網(wǎng)絡結構的連接方法為全連接,也就是:神經元結點的輸出值均為所有輸入信號向量不同維度加權總和。而卷積計算則為輸入信號向量維度加權總和。全連接、卷積的連接情況對比,詳見圖1。
圖1 全連接、卷積連接情況的分析Fig.1 Analysis of full connection and convolutional connection
人臉識別系統(tǒng)的設計實現(xiàn)流程如圖2所示,研究可知其整體設計主要可分為4個階段,對其分述如下。
(1)部署人臉圖像采集環(huán)境。
(2)進行人臉檢測/識別的數(shù)據(jù)獲取、分析、比對。
(3)進行課堂專注度分析。
(4)導入課堂過程數(shù)據(jù),形成課堂過程專注度分布分析。
圖2 人臉識別系統(tǒng)實現(xiàn)過程Fig.2 Implementation of face recognition system
至此,研究可得本項目的系統(tǒng)結構設計如圖3所示。由圖3可知,本系統(tǒng)主要由5個部分組成,分別是:教室前端學情(人臉)數(shù)據(jù)采集單元、人臉檢測服務器、人臉比對服務器、學情分析呈現(xiàn)平臺、數(shù)據(jù)存儲環(huán)境。
圖3 人臉識別系統(tǒng)結構Fig.3 Face recognition system architecture
卷積神經網(wǎng)絡,應用于計算機視覺領域中,獲得了較好的效果,當前在較多項目中有著出色表現(xiàn)。本文構建2個不同的卷積神經網(wǎng)絡,通過試驗顯示網(wǎng)絡模型特征提取能力較佳??梢?,其間存在競爭,然而如果沒有獲得最佳的識別能力,對于設計過程將產生決定性影響,會直接降低識別的準確性。經不同的網(wǎng)絡比較,能夠看出對網(wǎng)絡性能的影響較大。此后工作,建議深入研究深層網(wǎng)絡模型在復雜人臉圖像中應用的效果情況。此外,對深度網(wǎng)絡應加強訓練,解決相關問題,進行更寬泛意義上的仿真的試驗。卷積神經網(wǎng)絡技術,應用于視頻監(jiān)控工作中,實現(xiàn)人臉識別研究,盡管識別效果頗佳,但在諸多方面仍有很大的改進空間,如:復雜環(huán)境下人臉識別、系統(tǒng)計算效率、添加人臉跟蹤模塊等。