朱偉義, 喬琳霏
(1.國(guó)網(wǎng)山東省電力公司,山東 濟(jì)南 250000; 2.威海市實(shí)驗(yàn)中學(xué),山東 威海 264200)
隨著自助服務(wù)柜臺(tái)應(yīng)用的推廣,帶來(lái)了早期排隊(duì)問(wèn)題,其實(shí)質(zhì)是由公共服務(wù)的短缺及公共資源不均衡造成的。能否有效解決排隊(duì)問(wèn)題,不僅涉及廣大客戶的滿意度,還影響營(yíng)業(yè)廳的服務(wù)水平和競(jìng)爭(zhēng)力。
本文利用營(yíng)業(yè)廳已有監(jiān)控設(shè)備,以計(jì)算機(jī)模擬人的視覺(jué)功能,從圖像中提取信息,進(jìn)行處理并加以分析,最終用于實(shí)際人數(shù)的監(jiān)測(cè)和統(tǒng)計(jì),即采用圖像識(shí)別技術(shù)實(shí)現(xiàn)排隊(duì)人數(shù)監(jiān)測(cè)[1-2]。當(dāng)前基于圖像的人數(shù)識(shí)別已取得一定成果[3-5],且均在其特定應(yīng)用場(chǎng)景發(fā)揮其優(yōu)勢(shì)。本文利用已有監(jiān)控設(shè)備的基礎(chǔ)上,在不采用傳感器的條件下,對(duì)視頻圖像進(jìn)行處理及人數(shù)識(shí)別,從而實(shí)現(xiàn)設(shè)備及人員的智能調(diào)度,因此對(duì)數(shù)據(jù)準(zhǔn)確率和時(shí)效性要求較高,需采用合理的算法實(shí)現(xiàn)人數(shù)識(shí)別建模,從而提高整個(gè)營(yíng)業(yè)廳的服務(wù)智能性。
排隊(duì)監(jiān)測(cè)方法設(shè)計(jì)是為解決營(yíng)業(yè)廳人員與設(shè)備的智能調(diào)度問(wèn)題,通過(guò)視頻監(jiān)控設(shè)備所提供資源,構(gòu)建判別模型,實(shí)現(xiàn)排隊(duì)人數(shù)的監(jiān)測(cè)。
本文通過(guò)排隊(duì)監(jiān)測(cè)方法,對(duì)指定的排隊(duì)區(qū)域進(jìn)行排隊(duì)人數(shù)統(tǒng)計(jì),通過(guò)與背景圖像差分處理后得到待檢測(cè)目標(biāo),以樣本訓(xùn)練得到人像識(shí)別模型,基于此模型統(tǒng)計(jì)區(qū)域內(nèi)的人數(shù)。當(dāng)人數(shù)低于設(shè)定閾值時(shí),關(guān)閉部分自助服務(wù)設(shè)備,否則判定為排隊(duì)超額事件,存儲(chǔ)圖像,自助服務(wù)設(shè)備全開(kāi),并根據(jù)需求推送超額事件信息給工作人員,輔助其調(diào)度人工服務(wù)窗口開(kāi)放。運(yùn)行原理如圖1所示。
圖1 排隊(duì)監(jiān)測(cè)運(yùn)行原理圖
現(xiàn)有研究表明,運(yùn)用梯度方向直方圖統(tǒng)計(jì)目標(biāo)信息實(shí)現(xiàn)人數(shù)識(shí)別具有顯著優(yōu)勢(shì)[6]。如文獻(xiàn)[7]提出了針對(duì)俯視行人的識(shí)別算法,該算法基于俯視行人頭部圖像提取頭部梯度方向直方圖,并以支持向量機(jī)實(shí)現(xiàn)人數(shù)判別。本文所采用圖像亦為俯視圖像,受拍攝角度、人物本身特征等的影響,僅通過(guò)俯視人物頭部特征并不直觀,如圖2所示。
為滿足業(yè)務(wù)要求的精確性,避免誤檢事件的發(fā)生,采用人物整體圖像?;谝陨闲枨?,本文采用邏輯回歸算法實(shí)現(xiàn)識(shí)別模型的構(gòu)建。首先通過(guò)層次聚類算法將不同的特征參數(shù)合成完整的多維特征,包含目標(biāo)邊緣輪廓和同類紋理色彩塊,隨后將生成的多維特征作為輸入,采用邏輯回歸算法生成識(shí)別模型。
圖2 俯視行人識(shí)別圖像
由于視頻圖像人物識(shí)別實(shí)時(shí)性要求較高,數(shù)據(jù)處理計(jì)算量大,且本文所選用算法相對(duì)復(fù)雜,故方法以大數(shù)據(jù)處理集群實(shí)現(xiàn)海量數(shù)據(jù)處理,提高人物識(shí)別的可靠性與實(shí)時(shí)性。
本文首先對(duì)人物圖像的識(shí)別參數(shù)進(jìn)行篩選,隨后通過(guò)層次聚類算法生成人物圖像的多維特征,最后基于邏輯回歸算法生成識(shí)別模型,從而對(duì)自助服務(wù)柜臺(tái)的排隊(duì)情況進(jìn)行統(tǒng)計(jì),指導(dǎo)安排設(shè)備等資源的調(diào)度。
將灰度和灰度梯度角度作為識(shí)別參數(shù),同時(shí)基于灰度和灰度梯度角度的均值方差和均方誤差計(jì)算出其衍生識(shí)別參數(shù),并進(jìn)一步結(jié)合參數(shù)產(chǎn)生灰度方差、灰度均方誤差、灰度梯度角度方差和灰度梯度角度的均方誤差四個(gè)識(shí)別參數(shù)[8],各參數(shù)的計(jì)算方式及描述說(shuō)明如表1所示。
表1 各識(shí)別參數(shù)簡(jiǎn)介
將圖像提取的感興趣區(qū)域分割成小的連接區(qū)域稱為cells,每個(gè)cell含有9個(gè)梯度方向的bin,每個(gè)bin生成方向梯度直方圖,并根據(jù)表1計(jì)算cell的識(shí)別參數(shù),與HOG特征生成方式相同,通過(guò)識(shí)別參數(shù)串聯(lián)構(gòu)成識(shí)別參數(shù)直方圖作為多維度高維特征。隨后,通過(guò)層次聚類算法對(duì)多維度高維特征進(jìn)行綜合簡(jiǎn)化處理[9],首先將每個(gè)cell看作初始聚類簇,基于各類識(shí)別參數(shù),針對(duì)每一類識(shí)別參數(shù),分別在算法的每一步中找出距離最近的兩個(gè)聚類簇進(jìn)行合并,該過(guò)程不斷重復(fù),直至聚類簇距離超過(guò)預(yù)設(shè)值。本文選取兩個(gè)簇的所有cell共同確定類間的平均距離,如下式所示:
(1)
式中:dist()用于計(jì)算兩個(gè)樣本之間的距離;Ci、Cj為兩個(gè)聚類簇;| |為簇內(nèi)樣本個(gè)數(shù);x、z分別為其簇內(nèi)樣本。
通過(guò)層次聚類將具有相近參數(shù)值的cell構(gòu)成block,避免由于統(tǒng)一尺度block過(guò)大時(shí),標(biāo)準(zhǔn)化的作用被削弱而導(dǎo)致錯(cuò)誤率上升,block尺寸太小時(shí),有用信息被過(guò)濾掉,進(jìn)而提高了數(shù)據(jù)處理的實(shí)時(shí)性。由block特征組成圖像的八類特征向量,各類特征包含不同聚類簇個(gè)數(shù),以下標(biāo)k標(biāo)注,如下式所示:
(2)
基于多維特征邏輯回歸識(shí)別模型是本方法的核心內(nèi)容[10],主要包含模型訓(xùn)練與模型測(cè)試兩部分,具體構(gòu)建流程如下:
(1)將監(jiān)控視頻數(shù)據(jù)庫(kù)所提供的圖像數(shù)據(jù),按照特征提取規(guī)則獲取圖像的多維數(shù)據(jù)特征,并分別隨機(jī)抽取相應(yīng)比例的數(shù)據(jù)構(gòu)成訓(xùn)練集與測(cè)試集數(shù)據(jù)特征。
f(θ)=(θG)T×G+(θα)T×α+…+(θVIG)T×VIG
(3)
類別集合C={C1,C2},初始化迭代次數(shù)k=0,允許誤差ε>0,置海森矩陣H1為單位矩陣,在[-1,1]范圍內(nèi)對(duì)θ隨機(jī)賦值。
(3)進(jìn)入迭代求解過(guò)程,k=k+1,將訓(xùn)練樣本集數(shù)據(jù)、各θ值和迭代次數(shù)k等數(shù)據(jù)輸入大數(shù)據(jù)集群。
(4)采用擬牛頓法對(duì)目標(biāo)函數(shù)進(jìn)行最優(yōu)求解,大數(shù)據(jù)計(jì)算集群實(shí)現(xiàn)數(shù)據(jù)分割及并行計(jì)算,目標(biāo)函數(shù)的梯度:
(4)
計(jì)算海森矩陣Hk+1:
(5)
式中:p(k)=θ(k+1)-θ(k),q(k)=f(θ(k+1))-f(θ(k));pi1表示被正確分類為C1類的實(shí)例個(gè)數(shù);N1表示屬于C1類的實(shí)例個(gè)數(shù);pi2表示被正確分類為C2類的實(shí)例個(gè)數(shù)。目標(biāo)函數(shù)的梯度向量及海森矩陣計(jì)算中涉及向量間的點(diǎn)乘和相加,將高維的特征向量拆分成若干小的向量,將每個(gè)計(jì)算過(guò)程拆分成相互獨(dú)立的計(jì)算步驟,由不同的節(jié)點(diǎn)進(jìn)行獨(dú)立計(jì)算,然后歸并計(jì)算結(jié)果。
(5)接收大數(shù)據(jù)計(jì)算集群[11]傳遞的梯度數(shù)據(jù)進(jìn)行梯度合并得梯度下降方向d(k)=-Hkf,進(jìn)而從x(k)出發(fā),延方向d(k)搜索,求步長(zhǎng)λk,求解方程為
(6)更新特征權(quán)重向量θ=(θ1,θ2,θ3,…),θ(k+1)=θ(k)+λkd(k),并代入目標(biāo)函數(shù)f(θ),判斷是否滿足:‖f(θ(k+1))>ε‖;若是,則返回(4)繼續(xù)進(jìn)入迭代求解過(guò)程,若否,則進(jìn)入下一步。
(7)將最優(yōu)化目標(biāo)函數(shù)傳輸至模型測(cè)試環(huán)節(jié),形成識(shí)別模型,
(6)
式中:測(cè)試樣本數(shù)據(jù)為(1)的測(cè)試集數(shù)據(jù),對(duì)初始模型進(jìn)行樣本測(cè)試,進(jìn)行測(cè)試樣本分類。
(8)計(jì)算測(cè)試集數(shù)據(jù)的測(cè)試參數(shù)(正確率、召回率),判斷是否滿足模型識(shí)別要求,若否,則返回(2)更新θ隨機(jī)賦值;若是,則構(gòu)建完成基于多維特征邏輯回歸識(shí)別模型,并輸出本次更新模型。
圖3 試驗(yàn)環(huán)境圖
以國(guó)網(wǎng)某電力營(yíng)業(yè)廳為現(xiàn)場(chǎng)測(cè)試環(huán)境,采用側(cè)視俯視圖如圖3所示。實(shí)例圖片以試驗(yàn)人員圖像進(jìn)行說(shuō)明,試驗(yàn)數(shù)據(jù)以實(shí)際視頻監(jiān)測(cè)拍攝為準(zhǔn),本方法的應(yīng)用范圍為基于視頻圖像的人員數(shù)據(jù)統(tǒng)計(jì)。
將所提出的排隊(duì)監(jiān)測(cè)方法部署于營(yíng)業(yè)廳現(xiàn)有監(jiān)控系統(tǒng),采集排隊(duì)人員正樣本20 142張,負(fù)樣本(無(wú)排隊(duì)人員)19 976張,將正負(fù)樣本混合,以7∶3的比例構(gòu)建28 082張訓(xùn)練樣本集和12 036張測(cè)試樣本集。
圖4 兩類最大灰度梯度聚類特征圖例
基于訓(xùn)練樣本集數(shù)據(jù),通過(guò)層次聚類算法將相近的特征值聚類劃分,以最大灰度梯度直方圖為例進(jìn)行說(shuō)明,最終獲取14維行向量,以其中2類聚類距離閾值最大區(qū)別的特征為例進(jìn)行圖示,如圖4所示,右側(cè)圖片(聚類距離閾值為43),由于曝光現(xiàn)象頭部輪廓不明顯,可根據(jù)左側(cè)圖片(聚類距離閾值為368)對(duì)其補(bǔ)充。最終提取每個(gè)樣本的多維特征向量數(shù)為216個(gè),然后利用邏輯回歸算法對(duì)正負(fù)樣本的多維特征向量進(jìn)行訓(xùn)練獲取人員識(shí)別分類器。
基于已有的云計(jì)算平臺(tái),單數(shù)據(jù)中心有節(jié)點(diǎn)500臺(tái),管理50 PB,單臺(tái)2路服務(wù)器具備100萬(wàn)行/秒分析能力。將基于多維特征邏輯回歸識(shí)別模型對(duì)測(cè)試樣本集數(shù)據(jù)進(jìn)行試驗(yàn),結(jié)果如表2所示。
表2 基于多維特征邏輯回歸識(shí)別模型試驗(yàn)結(jié)果
根據(jù)試驗(yàn)結(jié)果得到基于多維特征邏輯回歸識(shí)別模型的正確率和召回率,如下所示:
如表2所示,所建模型在預(yù)測(cè)正確率、召回率及運(yùn)算時(shí)間均具有明顯優(yōu)勢(shì),且處理速度平緩上升,不會(huì)由于處理數(shù)據(jù)的增多而導(dǎo)致處理速度的延緩。在測(cè)試數(shù)據(jù)較多時(shí),在時(shí)間性能方面,本文算法優(yōu)勢(shì)更顯著。究其原因,一方面基于多維度對(duì)圖像的識(shí)別特征進(jìn)行提取,并以層次聚類簡(jiǎn)化特征[12],即保障了圖像識(shí)別的準(zhǔn)確性,又避免特征屬性繁多,提高數(shù)據(jù)處理速度;另一方面基于邏輯回歸算法對(duì)人像進(jìn)行判別,算法處理數(shù)據(jù)速度快,可部署于大數(shù)據(jù)處理集群實(shí)現(xiàn)并行處理,且對(duì)數(shù)據(jù)中小噪聲的魯棒性好,在部分?jǐn)?shù)據(jù)缺失時(shí)仍可保證數(shù)據(jù)的準(zhǔn)確性。以上數(shù)據(jù)顯示,本方法可有效識(shí)別人物圖像,滿足實(shí)時(shí)在線對(duì)人數(shù)統(tǒng)計(jì)需求。
本文構(gòu)建了一種基于多維特征邏輯回歸識(shí)別模型的排隊(duì)監(jiān)測(cè)方法,圖像以營(yíng)業(yè)廳原有攝像設(shè)備進(jìn)行采集,首先對(duì)圖像各類識(shí)別參數(shù)進(jìn)行匯總生成多維度高維特征,隨后以層次聚類算法對(duì)人物圖像特征進(jìn)行提取,最后以邏輯回歸算法構(gòu)建人物識(shí)別分類器,從而實(shí)現(xiàn)對(duì)排隊(duì)人數(shù)的統(tǒng)計(jì),輔助人員完成對(duì)自助柜臺(tái)機(jī)和人工窗口的資源調(diào)度,并對(duì)二者的開(kāi)放數(shù)目和時(shí)間進(jìn)行反饋調(diào)整優(yōu)化,進(jìn)一步提高營(yíng)業(yè)廳的整體服務(wù)水平,也可對(duì)整個(gè)服務(wù)業(yè)的發(fā)展提供借鑒和參考價(jià)值。