周銀祥
(電子科技大學(xué)成都學(xué)院 四川省成都市 611731)
在校園生活中,我們經(jīng)常需要排隊(duì)等待,例如去學(xué)校食堂、到圖書(shū)館借書(shū)或者還書(shū),或者參加校園招聘等活動(dòng)。通常情況下,我們會(huì)根據(jù)自己的經(jīng)驗(yàn)來(lái)選擇最佳的排隊(duì)時(shí)機(jī)。然而,由于這些場(chǎng)所通常離教室、宿舍比較遠(yuǎn),我們很難直接觀察到現(xiàn)場(chǎng)情況,也就無(wú)法了解實(shí)時(shí)和準(zhǔn)確的排隊(duì)等待時(shí)間,從而容易導(dǎo)致人群擁堵,浪費(fèi)時(shí)間。
因此,本文設(shè)計(jì)了一種基于人工智能的排隊(duì)信息識(shí)別和查詢(xún)系統(tǒng),以計(jì)算和預(yù)估排隊(duì)等待的實(shí)時(shí)性和準(zhǔn)確性,并提供最佳的排隊(duì)時(shí)機(jī)建議。
智能排隊(duì)信息系統(tǒng)采用人工智能圖像識(shí)別的人群計(jì)數(shù)和計(jì)算與預(yù)測(cè)技術(shù),系統(tǒng)包括采集模塊、識(shí)別模型、計(jì)算模塊、存儲(chǔ)模塊、預(yù)測(cè)模塊和查詢(xún)模塊等,如圖1所示。
圖1:排隊(duì)信息查詢(xún)系統(tǒng)框圖
采集模塊用于獲取當(dāng)前排隊(duì)通道的照片或視頻,并通過(guò)識(shí)別模型來(lái)確定排隊(duì)隊(duì)列的人數(shù)。計(jì)算模塊則用于計(jì)算隊(duì)列的前進(jìn)速度、排隊(duì)時(shí)間、隊(duì)伍人數(shù)變化速度和平均排隊(duì)人數(shù)。存儲(chǔ)模塊用于記錄和保存識(shí)別模型的計(jì)算結(jié)果,而預(yù)測(cè)模塊則可以預(yù)測(cè)當(dāng)天的最佳排隊(duì)時(shí)段、總排隊(duì)時(shí)間和總排隊(duì)人數(shù)。最后,查詢(xún)模塊用于向用戶提供排隊(duì)信息,包括隊(duì)列人數(shù)、隊(duì)列前進(jìn)速度、排隊(duì)時(shí)間、隊(duì)伍人數(shù)變化速度、平均排隊(duì)人數(shù)、最佳排隊(duì)時(shí)間段、總排隊(duì)時(shí)間、總排隊(duì)人數(shù)和用戶自身的排隊(duì)記錄。通過(guò)整個(gè)系統(tǒng)的自動(dòng)排隊(duì)信息估計(jì),用戶可以及時(shí)了解最佳的排隊(duì)時(shí)機(jī)[1]。
采集模塊,用于采集當(dāng)前排隊(duì)通道的照片或者視頻,可以采用攝像頭進(jìn)行拍攝,在拍攝時(shí),需錄入整個(gè)隊(duì)伍,保證圖像能覆蓋隊(duì)伍的起點(diǎn)和終點(diǎn)。
識(shí)別模型,用于識(shí)別采集模塊中排隊(duì)隊(duì)列的人數(shù)。
排隊(duì)隊(duì)列的人數(shù)即人群計(jì)數(shù),利用目前研究成果。
Viresh Ranjan,Hieu Le 和Minh Hoai 在2018年IEEE 計(jì)算機(jī)視覺(jué)和模式識(shí)別會(huì)議(CVPR)上,提出了一種基于迭代的人群計(jì)數(shù)方法,該方法通過(guò)將高分辨率的密度估計(jì)器與低分辨率的分類(lèi)器相結(jié)合,反復(fù)迭代更新密度圖,以改善人群計(jì)數(shù)的準(zhǔn)確性[2]。
在該論文中,作者還提出了一種新的基于反向傳播的密度估計(jì)器訓(xùn)練方法,該方法能夠自適應(yīng)地學(xué)習(xí)人群密度分布的多尺度特征。此外,該論文還提出了一種新的密度合成技術(shù),該技術(shù)利用多個(gè)密度圖進(jìn)行信息融合,進(jìn)一步提高了計(jì)數(shù)的準(zhǔn)確性。
通過(guò)大量的實(shí)驗(yàn)驗(yàn)證,該方法在多個(gè)數(shù)據(jù)集上都取得了優(yōu)于現(xiàn)有方法的計(jì)數(shù)性能,證明了該方法的有效性和可行性。
Iterative crowd counting(迭代式人群計(jì)數(shù))是一種用于人群計(jì)數(shù)的算法。與傳統(tǒng)的人群計(jì)數(shù)算法相比,迭代式人群計(jì)數(shù)可以處理密集人群場(chǎng)景,并且具有更高的準(zhǔn)確性。
迭代式人群計(jì)數(shù)算法的基本思路是:首先通過(guò)一些基本的計(jì)數(shù)算法(如HaarCascade、HOG+SVM)估計(jì)出人群數(shù)量的大致范圍,然后使用一個(gè)逐步迭代的過(guò)程來(lái)精細(xì)估計(jì)人群數(shù)量。在每一輪迭代中,算法會(huì)對(duì)圖像進(jìn)行分割,將圖像分為多個(gè)區(qū)域,并對(duì)每個(gè)區(qū)域進(jìn)行計(jì)數(shù)。計(jì)數(shù)的結(jié)果將被用來(lái)更新下一輪迭代的估計(jì)結(jié)果。
迭代式人群計(jì)數(shù)算法的主要優(yōu)點(diǎn)是能夠處理密集人群場(chǎng)景,并且在處理非均勻分布的人群時(shí)也具有良好的效果。此外,該算法能夠自適應(yīng)地調(diào)整計(jì)數(shù)的分辨率,從而提高計(jì)數(shù)的準(zhǔn)確性。
迭代式人群計(jì)數(shù)算法在人群計(jì)數(shù)領(lǐng)域具有廣泛的應(yīng)用。例如,在公共交通站點(diǎn)、廣場(chǎng)、體育場(chǎng)館等人員密集場(chǎng)所中,迭代式人群計(jì)數(shù)算法可以用于計(jì)算實(shí)時(shí)人群數(shù)量,從而指導(dǎo)公共安全和服務(wù)管理。
Yuan Yuanhao,Wen Longyin,Lu,Xiaoqiang 和Meng Deyu 在2019 IEEE 國(guó)際圖像處理大會(huì)(ICIP)上發(fā)表了“迭代人群計(jì)數(shù)”[3]。
Zhang Zhong,Zhang Lefei,Du Yuhang 和Sun Xing,在2020 IEEE 聲學(xué)、語(yǔ)音和信號(hào)處理國(guó)際會(huì)議(ICASSP),發(fā)表了“具有自監(jiān)督和超分辨特征的迭代人群計(jì)數(shù)”[4]。
Ma Zhaoyi,Li Wei,Ouyang Wanli,Liu Hong 和Zhang Xuelong,在2019 IEEE/CFF 計(jì)算機(jī)視覺(jué)和模式識(shí)別會(huì)議(CVPR)上發(fā)表了“用于人群計(jì)數(shù)的具有反向和分層橫向連接的迭代多列網(wǎng)絡(luò)”[5]。
Wang Limin,Zhang Lian,LiXiaobai,Zhang Tong和Jin Xiaolong 在2019 IEEE/CFF 計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(CVPR)發(fā)表了“學(xué)習(xí)用于人群計(jì)數(shù)的深度監(jiān)督多密度網(wǎng)絡(luò)”[6]。
蔡建宇,潘英偉,牛叢,嚴(yán)嚴(yán)和張宏偉在2018 IEEE 國(guó)際多媒體與博覽會(huì)(ICME),上“使用迭代訓(xùn)練策略學(xué)習(xí)深度人群計(jì)數(shù)網(wǎng)絡(luò)”[7]。
Zhenxing Zhang,Jianlong Tan,Jiaxing Huang 和Jie Yang 于2019年IEEE 國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)的會(huì)議上發(fā)表論文“基于人工智能的智能排隊(duì)系統(tǒng):零售業(yè)的案例研究”。該論文介紹了一種利用人工智能技術(shù)設(shè)計(jì)的智能排隊(duì)系統(tǒng),以零售業(yè)為例進(jìn)行了案例研究。系統(tǒng)使用攝像頭進(jìn)行實(shí)時(shí)監(jiān)控,利用圖像處理技術(shù)來(lái)識(shí)別排隊(duì)人數(shù)、排隊(duì)時(shí)間等信息,并根據(jù)這些信息進(jìn)行智能調(diào)度,從而提高排隊(duì)效率。論文還詳細(xì)介紹了系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),以及實(shí)驗(yàn)結(jié)果和分析[8]。
使用IC-CNN(Improved Cascaded Convolutional Neural Network)是一種用于人群計(jì)數(shù)的深度學(xué)習(xí)模型。ICCNN 模型采用級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),由兩個(gè)級(jí)聯(lián)的卷積神經(jīng)網(wǎng)絡(luò)組成。第一個(gè)級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)用于檢測(cè)和定位人群,第二個(gè)級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)用于計(jì)數(shù)。
IC-CNN 模型的優(yōu)點(diǎn)是能夠處理密集和復(fù)雜的人群場(chǎng)景,同時(shí)減少了誤差率。該模型可以自動(dòng)地從輸入圖像中提取特征,而無(wú)需人工提取特征。此外,IC-CNN模型在訓(xùn)練時(shí)可以利用大量的樣本數(shù)據(jù),以提高準(zhǔn)確性。
IC-CNN 模型的訓(xùn)練包括兩個(gè)階段。在第一個(gè)階段,第一個(gè)級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)被訓(xùn)練用于檢測(cè)和定位人群。在第二個(gè)階段,第二個(gè)級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)被訓(xùn)練用于計(jì)數(shù)。在訓(xùn)練過(guò)程中,IC-CNN 模型使用回歸損失函數(shù)來(lái)優(yōu)化網(wǎng)絡(luò)參數(shù)。
IC-CNN 模型在人群計(jì)數(shù)領(lǐng)域具有廣泛的應(yīng)用。例如,在公共交通站點(diǎn)、廣場(chǎng)、體育場(chǎng)館等人員密集場(chǎng)所中,IC-CNN 模型可以用于計(jì)算實(shí)時(shí)人群數(shù)量,從而指導(dǎo)公共安全和服務(wù)管理。
識(shí)別模型的訓(xùn)練方法包括:
(1)將采集模塊采集到的圖像輸入識(shí)別模型,生成低分辨率的密度圖;
(2)將生成的低分辨率的密度圖和非低分辨率的密度圖再次輸入識(shí)別模型,生成高分辨率的密度圖;
(3)通過(guò)生成的高分辨率的密度圖獲取圖像中隊(duì)列的人數(shù)。
主要可以分為兩個(gè)部分:
LR-CNN:生成低分辨率的密度圖;HR-CNN:將低分辨率的密度圖和其他特征圖一起送入網(wǎng)絡(luò),生成高分辨率的密度圖。
從排隊(duì)隊(duì)列中選取某一人作為特定對(duì)象,計(jì)算特定對(duì)象與隊(duì)列終點(diǎn)之間的人數(shù)差N,間隔時(shí)間T 內(nèi)連續(xù)多次計(jì)算特定對(duì)象與隊(duì)列終點(diǎn)之間的人數(shù)差分別為N1、N2、…、Nn,隊(duì)列的前進(jìn)速率V 的計(jì)算公式為:
其中,n 的取值比總拍照數(shù)少1。
從排隊(duì)隊(duì)列中選取某一人作為特定對(duì)象,計(jì)算特定對(duì)象與隊(duì)列終點(diǎn)之間的人數(shù)差,利用特定對(duì)象與隊(duì)列終點(diǎn)之間的人數(shù)差除以隊(duì)列的前進(jìn)速率得到該特定對(duì)象預(yù)計(jì)的排隊(duì)時(shí)長(zhǎng)。
連續(xù)多次等時(shí)間間隔T′提取并計(jì)算每張照片中的人數(shù)S,一共收集m 張照片,隊(duì)伍人數(shù)變化速度V′的公式為:
其中,V′表示隊(duì)伍人數(shù)變化速度;Sm表示第m 張照片中的人數(shù),Sm-1表示第m-1 張照片中的人數(shù),……,S1表示第1 張照片中的人數(shù);T′表示連續(xù)多次等時(shí)間間隔。
其中,隊(duì)伍人數(shù)變化速度V′的結(jié)果為正則表示隊(duì)伍人數(shù)在該時(shí)間段內(nèi)增加且速度為V′,隊(duì)伍人數(shù)變化速度V′的結(jié)果為負(fù)則表示隊(duì)伍人數(shù)在該段時(shí)間內(nèi)減少且速度為 |V′|。
其中,N′表示平均排隊(duì)人數(shù),P1表示第1 張照片中的人數(shù),……,P2表示第j 張照片中的人數(shù)。
當(dāng)隊(duì)伍人數(shù)變化速度為負(fù)且此時(shí)隊(duì)列的人數(shù)小于平均排隊(duì)人數(shù)時(shí),被認(rèn)定為最優(yōu)時(shí)間段。
其中,n′的取值比總拍照數(shù)少1;
預(yù)測(cè)排隊(duì)總?cè)藬?shù)L 的計(jì)算公式為:
其中,Vi′′表示第i 分段時(shí)間平均速度,ti表示第i分段時(shí)間總時(shí)長(zhǎng),bi表示第i 分段時(shí)間的隊(duì)列的人數(shù)修正數(shù);
預(yù)測(cè)總排隊(duì)時(shí)長(zhǎng)的公式為:
存儲(chǔ)模塊用于記錄、保存識(shí)別模型的結(jié)果以及計(jì)算模塊、預(yù)測(cè)模塊的結(jié)果,包括隊(duì)列人數(shù)、隊(duì)伍前進(jìn)速率、平均排隊(duì)人數(shù)等信息。存儲(chǔ)模塊可以使用數(shù)據(jù)庫(kù)技術(shù)實(shí)現(xiàn),將每次識(shí)別和計(jì)算的結(jié)果保存在數(shù)據(jù)庫(kù)中,方便后續(xù)查詢(xún)和分析。
系統(tǒng)可以應(yīng)用在例如校園、游樂(lè)場(chǎng)、公園景區(qū)、汽車(chē)站以及火車(chē)站等公共場(chǎng)所,利用該查詢(xún)模塊提供用戶查詢(xún)數(shù)據(jù)的網(wǎng)絡(luò)接口,可以是分布式邊緣網(wǎng)絡(luò)服務(wù)器,也可以是集中式網(wǎng)絡(luò)服務(wù)器,用戶可以使用手機(jī)、電腦等設(shè)備進(jìn)行訪問(wèn),獲取排隊(duì)信息,包括查詢(xún)隊(duì)列的人數(shù)、隊(duì)列的前進(jìn)速率、排隊(duì)時(shí)長(zhǎng)、隊(duì)伍人數(shù)變化速度、平均排隊(duì)人數(shù)、最優(yōu)時(shí)間段、預(yù)測(cè)總排隊(duì)時(shí)長(zhǎng)、預(yù)測(cè)排隊(duì)總?cè)藬?shù)和用戶自身排隊(duì)記錄等信息。與此同時(shí),可在此類(lèi)公共場(chǎng)所新增顯示屏和引導(dǎo)屏,顯示排隊(duì)的狀況,以及推薦的排隊(duì)隊(duì)伍。
與現(xiàn)有技術(shù)相比,智能排隊(duì)信息系統(tǒng)的有益效果是:使用采集模塊連續(xù)定時(shí)的時(shí)間間隔采集排隊(duì)隊(duì)列,在使用大量排隊(duì)關(guān)鍵數(shù)據(jù)的訓(xùn)練后,可以計(jì)算出當(dāng)前時(shí)間段排隊(duì)隊(duì)列的多種關(guān)鍵信息,用戶可以通過(guò)服務(wù)器實(shí)時(shí)獲取自己想要知道的數(shù)據(jù)信息,可以做出優(yōu)化排隊(duì)時(shí)間的選擇,減少浪費(fèi)在排隊(duì)上的時(shí)間。
總之,智能排隊(duì)信息系統(tǒng)可以利用人工智能技術(shù),通過(guò)圖像識(shí)別、計(jì)算、預(yù)測(cè)和存儲(chǔ)等模塊,自動(dòng)預(yù)估排隊(duì)信息,為用戶提供實(shí)時(shí)、準(zhǔn)確的排隊(duì)信息,幫助用戶節(jié)省排隊(duì)時(shí)間,提高效率。該系統(tǒng)可以應(yīng)用于校園生活、旅游景點(diǎn)等各種排隊(duì)場(chǎng)景,有著廣泛的應(yīng)用前景。