王倩 樂山職業(yè)技術學院 王大衛(wèi) 四川民族學院
隨著國家工業(yè)化程度的提升,城市建設、運營在國家發(fā)展過程中發(fā)揮越來越重要的作用[1]。人民對美好生活的需求對城市建設、治理智能化水平提出了更高的要求。2021年3月,國家十四五規(guī)劃對智慧城市建設提出了明確要求,也是未來一段時間智慧城市建設的重要指導方向。智慧城市基于物聯(lián)網(wǎng)、云計算等新一代信息技術等工具和方法的應用,營造了有利于創(chuàng)新涌現(xiàn)的生態(tài)。更為重要的是,智慧城市利用信息和通信技術讓城市生活更加智能,通過高效利用資源,節(jié)約成本、能源,提升生活質量,減少對環(huán)境的負面影響,推動了低碳經(jīng)濟的發(fā)展,助力國家“碳達峰、碳中和”行動。近年來,智慧城市建設引起了越來越多城市管理者的重視,很多城市也開展了建設實踐。
智慧安防、智慧治理是智慧城市的重要應用場景,支撐智慧城市高效運行,有助于提升城市安全和社會治理水平。視頻監(jiān)控是實現(xiàn)智慧安防和智慧治理的重要手段之一。隨著城市規(guī)模的增加,智慧城市建設、運營過程中產生的視頻容量越來越大,已經(jīng)突破PB級。如何更高效的存儲,并利用海量視頻數(shù)據(jù)實現(xiàn)高效、快速搜索、識別,提升城市治理反應能力,是智慧城市建設后期必須面對的問題。作為視頻處理技術之一,視頻結構化技術既能提取海量視頻數(shù)據(jù)中的重要、關鍵信息,降低存儲空間,還有助于提升視頻應用實時性。為了研究探討視頻結構化技術的應用,本文從視頻結構化關鍵技術和應用場景出發(fā),分析視頻結構化技術在智慧城市中的應用前景。
視頻結構化關鍵技術主要包括特征建模、圖像分割、目標識別等。
特征建模是對視頻圖像中的淺層、深層、場景屬性特征進行建模,為后續(xù)圖像分割、目標識別奠定基礎。淺層特征主要是指視頻圖像中的顏色、紋理信息,利用顏色分量或者幾何算子可以提取、建模。深層特征是指視頻圖像中各種人、車輛、建筑、動物等目標屬性、目標運動軌跡,此類特征可基于深度學習方法進行提取建模。場景屬性是指視頻圖像中現(xiàn)場場景屬性,例如現(xiàn)場是屋內、屋外,還是河邊、冰場,人員情緒,屬于憤怒、還是高興等。
在特征建模的基礎上,將不同特征的區(qū)域進行分割,有助于后續(xù)目標識別。圖像分割是將具有相同特征額區(qū)域作為一個子區(qū)域,與具有不同特征的區(qū)域區(qū)分開來,不同區(qū)域對應不同的目標及屬性。
目標識別是在圖像分割的基礎上,識別每個分割區(qū)域內的目標屬性。例如利用人臉特征識別分割區(qū)域內的人臉目標。基于車輛的幾何特征信息識別分割區(qū)域內的車輛,標定為車輛。在車輛識別基礎上,還可以利用顏色、車輛幾何特征等信息,利用深度學習方法識別車輛顏色、車型、車的長寬高、車牌號等更多信息?;谏疃葘W習,還可以識別車輛所處環(huán)境屬性,例如車輛屬于前行還是倒車,識別人的情緒。
隨著神經(jīng)網(wǎng)絡和計算機計算能力的提升,深度學習技術是實現(xiàn)特征建模、圖像分割、目標識別的關鍵技術。常用的深度學習方法有卷積神經(jīng)網(wǎng)絡、循環(huán)神經(jīng)網(wǎng)絡、對抗神經(jīng)網(wǎng)絡。目前神經(jīng)網(wǎng)絡的層數(shù)越來越多,對計算能力的要求也越來越高,效果也是越來越好。神經(jīng)網(wǎng)絡分為輸入層、隱藏層和輸出層。輸入的特征向量通過隱含層變換達到輸出層,在輸出層得到學習的結果。在深度學習訓練階段,參數(shù)調節(jié)是最難的,涉及神經(jīng)網(wǎng)絡的層數(shù)、權重調節(jié)等。目前,人工智能各大廠商也針對性的開發(fā)了一些自動調參的輔助工具,減少調參的工作量。但是,從實用化效果看,還存在一定差距。參數(shù)調節(jié)主要還是基于經(jīng)驗,從中找到合適的參數(shù)。
視頻結構化的應用場景非常廣泛,在智慧城市領域主要由視頻存儲、以圖搜圖、軌跡跟蹤等。
視頻結構化處理以后,非關鍵信息就無須存儲,只存儲核心關鍵目標信息即可,大大降低視頻存儲所需要的空間。當智慧城市中攝像頭太多,視頻數(shù)據(jù)達到海量時,結構化處理以后的數(shù)據(jù)節(jié)省的存儲容量非??捎^,有助于減少存儲設備的開支,也可以增加視頻數(shù)據(jù)的存儲時間。
以圖搜圖在城市治理中發(fā)揮了很大作用,特別是案件偵破過程。利用嫌疑人照片,可以在海量監(jiān)控視頻中查清嫌疑人的身份信息、活動區(qū)域。車輛丟失案件,交警可以將丟失車輛的照片作為輸入,從城市海量監(jiān)控視頻以較快的速度查找到的丟失車輛行駛路線等,以最快速度鎖定嫌疑人。在以上應用場景中,視頻結構化相當遠提前對視頻數(shù)據(jù)進行了預處理,對視頻中的目標進行了初步識別。在實際應用中,可以提升應用的時效性,提升應用效果。
本文針對智慧城市建設中的視頻結構化技術進行了分析研究,分析了視頻結構化關鍵技術,研究了視頻結構化在智慧城市領域的應用場景。未來,視頻結構化還需要解決目標識別準確性、處理實時性問題,解決實時性與計算成本之間的矛盾。