□ 文/夏廷玥
大華股份潘石柱談如何“深度見識(shí)”
□ 文/夏廷玥
▲大華股份副總裁兼國內(nèi)營(yíng)銷中心總經(jīng)理張偉
2017年3月,“人工智能”首次寫進(jìn)政府工作報(bào)告??梢哉f,人工智能已達(dá)到促進(jìn)經(jīng)濟(jì)發(fā)展的新高度,多只人工智能概念股在兩會(huì)期間也表現(xiàn)亮眼。而早在2016年10月中旬,烏鎮(zhèn)智庫聯(lián)合網(wǎng)易科技發(fā)布了《全球人工智能發(fā)展報(bào)告(2016)》。報(bào)告提到了人工智能將在七大領(lǐng)域率先應(yīng)用,安防行業(yè)赫然在列。
然而縱觀人工智能60年的發(fā)展歷史,經(jīng)歷了多次“寒冬”,其中一個(gè)很重要的原因就是算法效果和實(shí)際使用的差距或神經(jīng)網(wǎng)絡(luò)無法繼續(xù)深入下去。直到深度學(xué)習(xí)取得突破,直接推動(dòng)了人工智能的蓬勃發(fā)展。深度學(xué)習(xí)同樣在安防行業(yè)得到應(yīng)用,尤其是視頻監(jiān)控領(lǐng) 域 ,如 何 做 到“ 深 度 見 識(shí) ”成 為 安 防 廠 商 所 要 面 臨的問題。近日,本網(wǎng)記者就有關(guān)問題采訪到了大華股份先進(jìn)技術(shù)研究院院長(zhǎng)潘石柱博士。
現(xiàn) 階 段 ,我 們 之 所 以 能 夠 談 數(shù) 據(jù) 的 提 取 、談 智 能分析,這一切的基礎(chǔ)就是高清技術(shù)得到了快速發(fā)展。如果沒有高清,如果我們還是在D1或者是更低的分辨率之下,數(shù)據(jù)的提取和分析是沒有任何意義的,也是沒有辦法做到的。簡(jiǎn)言之,連看都看不清,如何“看得懂”、“看得懂”又有什么意義?所以,從D1到720P、1 0 8 0 P 再 到 4 K ,從 C C D 到 C M O S ,從 紅 外 補(bǔ) 光 到 星 光 級(jí)技術(shù)的發(fā)展,這樣一個(gè)演進(jìn)的過程,它表面上解決了目標(biāo)清晰度的問題,但它真正深層次的變化是為我們后面的 深度分析做 足了鋪 墊。
當(dāng)深度學(xué)習(xí)的算法融合到視頻監(jiān)控系統(tǒng)的前后端 ,才 能 真 正 地 說“ 深 度 智 能 ”。 在 這 里 ,前 端 我 們 舉例 簡(jiǎn) 單 說 明 一下,重 點(diǎn) 說 一下 后 端 。
前端:在應(yīng)用層面上,以2016年的G20峰會(huì)安保為 例 ,大 華 提 供 的 諸 多 監(jiān) 控 攝 像 機(jī) ,除 了 能 夠 支 持 峰會(huì)安保需要的絆線入侵、區(qū)域入侵、穿越圍欄、徘徊檢測(cè)等諸多智能分析功能外,還支持針對(duì)視頻監(jiān)控范圍的疑點(diǎn)盲區(qū)、重要路線、高密場(chǎng)所、復(fù)雜光線等目標(biāo)區(qū)域的30 0 個(gè)預(yù)置點(diǎn)、自動(dòng)巡跡、自動(dòng)巡航等空閑動(dòng)作,攝像機(jī)可按照事先設(shè)置好的預(yù)置點(diǎn)位進(jìn)行多條路線的自動(dòng)巡航監(jiān)控。巡航監(jiān)控定位精準(zhǔn)無偏差,一旦有目標(biāo)觸發(fā)設(shè)定的規(guī)則,立刻聯(lián)動(dòng)報(bào)警。
后端:在3月7日,大華股份聯(lián)合NVIDIA發(fā)布了一款極高計(jì)算性能的智能視頻結(jié)構(gòu)化服務(wù)器“Deep Sense睿智”系列。這款服務(wù)器有兩個(gè)需要我們注意的地方:一是Tesla P4 GPU,二是結(jié)構(gòu)化分析。
大華的“Deep Sense睿智”系列是全球智能視頻分析行業(yè)第一個(gè)使用Tesla P4 GPU的服務(wù)器產(chǎn)品,也是Tesla P4首次應(yīng)用于智能視頻分析行業(yè)的推演。
在談Tesla P4之前,我們先來說一說GPU和CPU的區(qū)別。由于CPU在圖像渲染方面的能力不足,GPU被發(fā)明出來分擔(dān)這部分工作,此后就成了專門搞這方面的硬件。所以,有了上千個(gè)并行的計(jì)算核心,GPU能高效地處理讓CPU十分吃力的任務(wù)。GPU的強(qiáng)大性能,不只來源于增加的核心數(shù)量,還必須有更快的內(nèi)存相配合才能發(fā)揮。今天,GPU的內(nèi)存帶寬相比CPU已經(jīng)有數(shù)量級(jí)上的領(lǐng)先,這使得GPU在處理和讀取數(shù)據(jù)上都有巨大優(yōu)勢(shì)。
所以,Tesla P4具備了一般GPU都有的特性。除此之外,Tesla P4外形小巧,功耗極低,初始功率只有50瓦特,處理推理應(yīng)用的能效比與CPU相比提高了40倍。這也促使“睿智”系列能夠同時(shí)對(duì)多達(dá)192路的高清視頻流進(jìn)行實(shí)時(shí)解碼和分析。同時(shí),對(duì)于視頻推理的工作負(fù)載,一臺(tái)配備單個(gè)Tesla P4 GPU的服務(wù)器可以取代13 臺(tái)CPU服務(wù)器,因此,從商業(yè)價(jià)值上來說,Tesla P4讓總體擁有成本(包括服務(wù)器成本和電力成本)節(jié)省了超 過8 0 0 %。
據(jù)潘石柱博士介紹,“睿智”服務(wù)器把實(shí)時(shí)視頻進(jìn) 行 結(jié) 構(gòu) 化 分 析 后 ,能 將 復(fù) 雜 場(chǎng) 景 中 的 人 、機(jī) 動(dòng) 車 、非機(jī)動(dòng)車分離,全方位提取車輛特征,如車牌號(hào)碼識(shí)別、主副駕駛是否系安全帶、是否打電話、有無遮陽板 、有 無 年 檢 標(biāo) 、有 無 掛 墜 、有 無 紙 巾 盒 ; 針 對(duì) 行 人 ,“睿智”服務(wù)器可以多方面分析其相關(guān)特征,包括性別、表情、年齡段、服飾特征(上下衣著顏色、眼鏡)、攜帶物特征(背包、打傘)、運(yùn)動(dòng)特征等。
經(jīng)過結(jié)構(gòu)化處理之后的視頻數(shù)據(jù),可以進(jìn)行長(zhǎng)期保存,用戶按照尋找目標(biāo)的特征,對(duì)人、機(jī)動(dòng)車、非機(jī)動(dòng)車的各種特征條件進(jìn)行組合篩選,快速精確檢索 目 標(biāo) ,提 高 查 詢 效 率 。
由此,我們也可以清楚看到結(jié)構(gòu)化處理所帶來的優(yōu)勢(shì):
首先,是視頻查找速度得到極大的提升。視頻結(jié)構(gòu) 化 之 后 ,從 百 萬 級(jí) 的 目 標(biāo) 庫 中 ( 對(duì) 應(yīng) 成 千 上 萬 小 時(shí) 的高 清 視 頻 ) 查 找 某 張 截 圖 上 的 行 人 嫌 疑 目 標(biāo) ,數(shù) 秒 即可完成;千萬級(jí)目標(biāo)的庫中查找,幾分鐘即可完成(如果 實(shí) 現(xiàn) 云 化 ,速 度 會(huì) 更 快 ) 。在 結(jié) 構(gòu) 化 基 礎(chǔ) 上 進(jìn) 行 檢索 查 詢 ,可 以 解 決 快 速 目 標(biāo) 查 找 問 題 。
其次,是存儲(chǔ)容量極大的降低,經(jīng)過結(jié)構(gòu)化后的視頻,存儲(chǔ)人的結(jié)構(gòu)化檢索信息和目標(biāo)數(shù)據(jù)不到視頻數(shù)據(jù)量的2%;對(duì)于車輛,不到1%;對(duì)于行為降得更多。存儲(chǔ)容量極大地降低,可以解決有效視頻長(zhǎng)期存儲(chǔ)的問題。
最后,視頻結(jié)構(gòu)化可以盤活視頻數(shù)據(jù),可作為大數(shù)據(jù)挖掘的基礎(chǔ),視頻經(jīng)過結(jié)構(gòu)化處理后,存入相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)倉庫,對(duì)各類的數(shù)據(jù)倉庫可以進(jìn)行深度的數(shù)據(jù)挖掘,充分發(fā)揮大數(shù)據(jù)作用,提升視頻數(shù)據(jù)的應(yīng)用價(jià)值,提高視頻數(shù)據(jù)的分析和預(yù)測(cè)功能。
總之,無論是芯片還是視頻結(jié)構(gòu)化,都是為了給視頻數(shù)據(jù)的智能化提供強(qiáng)有力的支持,從而真正實(shí)現(xiàn)大數(shù)據(jù)的價(jià)值,使主動(dòng)式防控系統(tǒng)成為可能。