何 源
(黃岡師范學(xué)院,湖北 黃岡 438000)
近幾年來(lái),人工智能、大數(shù)據(jù)、云計(jì)算、網(wǎng)絡(luò)建設(shè)等新技術(shù)、新產(chǎn)業(yè)的迅速發(fā)展,給我們的生活帶來(lái)了巨大的變化,作為當(dāng)代中國(guó)學(xué)生的基本形式,課堂教學(xué)對(duì)學(xué)生知識(shí)和技能結(jié)構(gòu)的形成有著深遠(yuǎn)的影響,在教學(xué)過(guò)程中,控制學(xué)生的課堂教學(xué),改善教學(xué)方法是一個(gè)重要問(wèn)題。傳統(tǒng)課堂控制方法包括現(xiàn)場(chǎng)錄制、課堂教學(xué)、課堂教學(xué)和課堂教學(xué),而采用普通的手工監(jiān)控方式,需要大量的人力資源,班級(jí)點(diǎn)名系統(tǒng)、智能控制系統(tǒng)等應(yīng)用于課堂教學(xué)質(zhì)量控制系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā),該系統(tǒng)利用教室內(nèi)的通用攝像設(shè)備,采集課時(shí)的圖像,分析學(xué)生的學(xué)習(xí)成績(jī),提出學(xué)生的綜合學(xué)習(xí)評(píng)價(jià)結(jié)果[1]。
本系統(tǒng)利用教室內(nèi)部署的視頻監(jiān)控設(shè)備,為學(xué)生采集視頻數(shù)據(jù),識(shí)別界面,并統(tǒng)計(jì)識(shí)別出視頻中的人臉和情緒,系統(tǒng)應(yīng)用可以更好地跟蹤學(xué)生的變化,通過(guò)課堂視頻監(jiān)控滿(mǎn)足學(xué)生的需要,限制了部分學(xué)生不積極參與課堂或制造騷亂的機(jī)會(huì),并通過(guò)手機(jī)圖像評(píng)價(jià)教學(xué)質(zhì)量;視頻采集、人臉檢測(cè)、人臉識(shí)別和統(tǒng)計(jì)反饋的子系統(tǒng)。
視頻采集存儲(chǔ)模塊主要用于學(xué)生課堂視頻的采集和保存,圖像預(yù)處理功能是對(duì)圖像進(jìn)行相應(yīng)的處理和校正,為了更好地識(shí)別圖像中的人臉,人臉檢測(cè)子系統(tǒng)由圖像分割、人臉檢測(cè)和人臉去重三個(gè)要素構(gòu)成,從而更好地對(duì)學(xué)生面部表情進(jìn)行切割、校正,人臉檢測(cè)子系統(tǒng)由圖像分割、人臉檢測(cè)和人臉權(quán)重?fù)p失三個(gè)要素構(gòu)成,從而更好地對(duì)學(xué)生面部表情進(jìn)行檢測(cè),將人臉檢測(cè)結(jié)果傳送到子系統(tǒng),對(duì)學(xué)生面部進(jìn)行人臉識(shí)別、人臉情感的分析,從而更好地對(duì)學(xué)生面部表情進(jìn)行分析、觀察等。
設(shè)計(jì)了一個(gè)人臉識(shí)別系統(tǒng),能夠更好、更全面地識(shí)別所有學(xué)生的面部。但是人臉子系統(tǒng)有它的缺點(diǎn)。這一模塊的設(shè)計(jì)難點(diǎn)在于如何進(jìn)行回收系數(shù)的驗(yàn)證,即在教學(xué)中任何一個(gè)學(xué)生都不可錯(cuò)過(guò)。由于人臉識(shí)別技術(shù)在數(shù)量龐大的情況下不能保證撤銷(xiāo)率,所以這些方法不能直接應(yīng)用到課堂上。本文介紹了一種基于遞歸裁剪的人臉識(shí)別方法。
根據(jù)部分匹配原理,將圖像沿長(zhǎng)邊切割成三幅子圖像,保證圖像切割后不破壞長(zhǎng)寬平衡,部分重疊保護(hù),剪切后的子空間盡可能完整。剪影過(guò)程實(shí)際上創(chuàng)建了一棵有三個(gè)分支的樹(shù),每個(gè)節(jié)點(diǎn)代表一幅剪切圖像。樹(shù)深表示剪切量,其大小取決于圖片中的數(shù)量。對(duì)多個(gè)面的圖像,n可以設(shè)置成較高的值,這樣就可以使原始圖像中較小的人臉在子圖像中以較高比例出現(xiàn),從而提高了反饋驗(yàn)證的水平[2]。
這套系統(tǒng)采用了交互式人臉識(shí)別界面,與其他開(kāi)放式人臉識(shí)別界面相比,可以識(shí)別具有高度認(rèn)同感的人。確認(rèn)身份前,將所有學(xué)生面部資料上傳至開(kāi)放平臺(tái),建立學(xué)生身份數(shù)據(jù)庫(kù),平臺(tái)返回最像人臉的學(xué)生ID,以及情緒、焦點(diǎn)等信息,系統(tǒng)將個(gè)人信息帶回?cái)?shù)據(jù)庫(kù),分析學(xué)生的學(xué)習(xí)質(zhì)量(詳見(jiàn)表1)。資料庫(kù)中的每一項(xiàng)都包含個(gè)人信息,其中包括人名、三維空間的面部角度、面部表情圖像的采集時(shí)間、識(shí)別可靠性等。
表1 人臉信息數(shù)據(jù)表
人臉檢測(cè)不僅是人臉識(shí)別技術(shù)中的第一步,也是最困難的一步,它直接影響到后續(xù)人臉檢測(cè)過(guò)程中人臉檢測(cè)中涉及人臉定位、物體防護(hù)、光線變化等問(wèn)題,目前的研究主要是克服這些干擾。以知識(shí)為基礎(chǔ)的方法主要是基于人臉鼻、口、眼的數(shù)量等形狀特性,用Boost算法對(duì)灰度特征進(jìn)行分類(lèi),并結(jié)合膚色特征,提高了控制速度和控制效率,減小了不同空間和光線變化對(duì)人臉的影響。因?yàn)楣舛扔绊懩w色而非面部行為的性質(zhì),使得基于知識(shí)的人臉識(shí)別方法的有效性有限。
通過(guò)建立神經(jīng)網(wǎng)絡(luò)來(lái)區(qū)分個(gè)體區(qū)域和非個(gè)體區(qū)域,對(duì)難以表達(dá)的規(guī)則有很好的處理能力,訓(xùn)練樣本越多,發(fā)現(xiàn)效果越好,但是運(yùn)行速度卻變慢。應(yīng)用最廣泛的是AdaBoost模型,它由多個(gè)弱分類(lèi)器組成,其錯(cuò)誤率低,效率高,且基于SVM方法分辨率高,但在對(duì)人臉進(jìn)行保護(hù)時(shí),SVM比神經(jīng)網(wǎng)絡(luò)模型具有更好的泛化能力,能更好地表達(dá)復(fù)雜特征。
通過(guò)提取課程中所有學(xué)生的個(gè)人信息,并以網(wǎng)頁(yè)和手機(jī)應(yīng)用終端的形式提供統(tǒng)計(jì)數(shù)據(jù)來(lái)評(píng)估學(xué)生的學(xué)習(xí)狀況。其中包括入學(xué)動(dòng)態(tài)、所有學(xué)生分布情況和趨勢(shì)測(cè)試率、每個(gè)學(xué)生的個(gè)人觀點(diǎn)、情緒分布和面部變化趨勢(shì)以及無(wú)焦慮人群。
對(duì)全部學(xué)生成績(jī)指標(biāo)進(jìn)行動(dòng)態(tài)統(tǒng)計(jì),主要用來(lái)分析課堂教學(xué)中學(xué)生的比例。不同年級(jí)的及格學(xué)生比例各不相同。如果發(fā)現(xiàn),則可以通過(guò)面部表情視圖的分布和變化趨勢(shì)來(lái)分析其面部表情的高低。通過(guò)學(xué)生的表情分布和變化,分析學(xué)生的笑臉,從而確定活動(dòng)的活躍程度。在此提醒下,教師可以檢查他是否早退或有沒(méi)有認(rèn)真聽(tīng)講。
由于網(wǎng)絡(luò)攝像機(jī)等圖像采集工具獲得的圖像中含有人像、背景等信息,影響了網(wǎng)絡(luò)面部的識(shí)別,增加了識(shí)別時(shí)間。圖像輸入網(wǎng)絡(luò)前需先進(jìn)行預(yù)處理。圖像預(yù)處理主要包括光照、直方圖對(duì)齊、人臉檢測(cè)和人臉比對(duì)。本文提出了圖像處理的一個(gè)重要環(huán)節(jié),有待進(jìn)一步完善。經(jīng)過(guò)處理的圖像能最大限度地反映出人臉的共有特征,并利用人臉識(shí)別圖像中某些區(qū)域的特征。但是事實(shí)是,聚集在一起的人往往會(huì)水平和垂直的移動(dòng),導(dǎo)致面部不能持久保持,這就產(chǎn)生了一些困難。利用簡(jiǎn)單的圖像中心對(duì)人臉圖像進(jìn)行旋轉(zhuǎn),就可以將人臉圖像轉(zhuǎn)換成人臉圖像,以下是關(guān)于人臉識(shí)別前圖像的預(yù)處理步驟。第一,要對(duì)人進(jìn)行人臉檢測(cè),即對(duì)人進(jìn)行檢測(cè)。在此基礎(chǔ)上,通過(guò)68點(diǎn)的面形特征檢測(cè)點(diǎn)對(duì)人臉進(jìn)行展平,獲得水平旋轉(zhuǎn)和垂直旋轉(zhuǎn)的描述,利用旋轉(zhuǎn)圖像來(lái)垂直對(duì)齊人臉,利用水平旋轉(zhuǎn)角度計(jì)算出人臉的水平旋轉(zhuǎn)角度,對(duì)訓(xùn)練和存儲(chǔ)模型進(jìn)行分類(lèi),以實(shí)現(xiàn)特征固定,在圖像區(qū)域固定一些人臉特征可以加快模型收斂速度。
現(xiàn)在,該系統(tǒng)已經(jīng)在一些高校的軟件教育機(jī)構(gòu)試用,大多數(shù)教室可以容納50名學(xué)生,其中每班30-40名學(xué)生,視頻采集設(shè)備的設(shè)置見(jiàn)表2。
表2 攝像頭主要參數(shù)
本研究采用人臉?lè)答佅禂?shù)測(cè)驗(yàn)方法,針對(duì)各班座位分配不同的情況,針對(duì)學(xué)生成績(jī)不高且無(wú)法核實(shí)的特殊情況,對(duì)100張圖像進(jìn)行人臉檢測(cè),如圖1所示。
圖1 不同圖像切割深度時(shí)人臉召回率
正如圖1所示,當(dāng)剪切深度急劇增加時(shí),人臉召回率顯著提高,當(dāng)剪切深度為5時(shí),反饋分?jǐn)?shù)可達(dá)99.8%,完全能滿(mǎn)足課堂控制的要求。
需要檢測(cè)人臉的圖像數(shù)量隨著圖像裁剪次數(shù)的增加呈指數(shù)增長(zhǎng)。如果切割深度是5時(shí),則需要檢測(cè)364個(gè)圖像。根結(jié)點(diǎn)的尺寸在這些圖像中是最大的。用OpenCV進(jìn)行人臉識(shí)別需要80ms左右,隨著切片深度的增加,圖像尺寸的減小,人臉檢測(cè)時(shí)間大大減少,第五部分后葉節(jié)圖像檢測(cè)時(shí)間減少到4ms,單圖像人臉識(shí)別總時(shí)間不到4S。通過(guò)人臉檢測(cè),通過(guò)使用“百度”軟件中的在線人臉識(shí)別界面進(jìn)行,在帶寬較好的情況下穩(wěn)定地實(shí)現(xiàn)每秒9—10次調(diào)用,對(duì)于約40人的班級(jí),人臉識(shí)別所需的總時(shí)間不到6S,時(shí)間的消耗完全符合課堂教學(xué)控制系統(tǒng)的要求。
伴隨著我國(guó)經(jīng)濟(jì)的發(fā)展和綜合實(shí)力的提高,我國(guó)在計(jì)算機(jī)領(lǐng)域取得了重大突破。本文設(shè)計(jì)并開(kāi)發(fā)了課堂教學(xué)人臉識(shí)別監(jiān)控系統(tǒng),該系統(tǒng)將作為課堂教學(xué)的一部分在將來(lái)逐步推廣,由于學(xué)生人數(shù)眾多,現(xiàn)場(chǎng)人員大量地檢查自己的臉,反饋率較低,這已成為一個(gè)主要問(wèn)題。針對(duì)多人場(chǎng)景識(shí)別中可見(jiàn)性不強(qiáng)的問(wèn)題,提出了一種基于圖像的遞歸剪裁與opencv人臉識(shí)別方法,通過(guò)對(duì)學(xué)生表情的識(shí)別,對(duì)課堂情況進(jìn)行分析。介紹了確定召回率的試驗(yàn)結(jié)果,并對(duì)人臉檢測(cè)與識(shí)別時(shí)間進(jìn)行了分析。經(jīng)過(guò)對(duì)系統(tǒng)的檢查,發(fā)現(xiàn)了一些有待改進(jìn)的地方。第一,如何感知學(xué)生在課堂上的分布,并對(duì)學(xué)生多的領(lǐng)域進(jìn)行更深層次的回歸,是一個(gè)值得研究的問(wèn)題。第二,場(chǎng)地的分布、照明等因素會(huì)對(duì)環(huán)境產(chǎn)生影響。