李長(zhǎng)杰,徐 亮,宋明星,陳 鵬,喻成武,朱 霓
(1.湖北交投智能檢測(cè)股份有限公司,湖北 武漢 430051;2.湖北省協(xié)誠(chéng)交通環(huán)保有限公司,湖北 武漢 430051;3.武漢智造物聯(lián)網(wǎng)技術(shù)有限公司,湖北 武漢 430047)
根據(jù)《國(guó)家公路網(wǎng)規(guī)劃(2013年—2030年)》的方案,我國(guó)高速公路網(wǎng)的建設(shè)向著放射線與縱橫網(wǎng)格相結(jié)合的布局高速發(fā)展,伴隨高速公路網(wǎng)的急劇增延,隨之而來(lái)的基礎(chǔ)設(shè)施監(jiān)測(cè)運(yùn)維以及關(guān)聯(lián)的環(huán)境保護(hù)監(jiān)測(cè)問(wèn)題日趨復(fù)雜,對(duì)資產(chǎn)管理和環(huán)保工作的要求日益提高[1-2]。當(dāng)前環(huán)保監(jiān)測(cè)的發(fā)展集中在規(guī)?;?、系統(tǒng)化的監(jiān)測(cè)管理和總體化、近似化的分析,并探討各種細(xì)分化成分對(duì)于生態(tài)環(huán)境的具體影響[3-7]。Hoffmann等[3]根據(jù)高收入國(guó)家現(xiàn)狀,討論了當(dāng)前面向城市的水資源管理方式,以及中長(zhǎng)期科研重點(diǎn)和架構(gòu)模式,強(qiáng)調(diào)了基于監(jiān)控網(wǎng)絡(luò)的水質(zhì)監(jiān)測(cè)的重要性。在江湖環(huán)境下,Nong等[4]對(duì)我國(guó)南水北調(diào)中線工程3年間的實(shí)際水質(zhì)情況進(jìn)行了研究,從27個(gè)監(jiān)測(cè)站大范圍收集了16項(xiàng)水質(zhì)指標(biāo)數(shù)據(jù),并進(jìn)一步探討了各項(xiàng)細(xì)節(jié)監(jiān)測(cè)指標(biāo)及水質(zhì)評(píng)估的方法,指出了潛在污染源風(fēng)險(xiǎn);Hu等[6]根據(jù)35年的水質(zhì)監(jiān)測(cè)數(shù)據(jù),探究了人為磷輸入對(duì)于長(zhǎng)江水環(huán)境的影響。然而,當(dāng)前的研究和應(yīng)用主要停留在對(duì)歷史記錄進(jìn)行分析,存在環(huán)保安全監(jiān)測(cè)的時(shí)效性和前瞻性不足問(wèn)題,更不能在污染事件發(fā)生前就及時(shí)預(yù)測(cè)到環(huán)保安全風(fēng)險(xiǎn),進(jìn)而提前采取防控措施杜絕污染事故的發(fā)生。
隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能、智能化、云計(jì)算等前沿技術(shù)的強(qiáng)勢(shì)加入,給環(huán)保監(jiān)控管理領(lǐng)域帶來(lái)了變革和機(jī)遇[8-15]。2018年中央經(jīng)濟(jì)工作會(huì)議以及2019年全國(guó)兩會(huì)上的政府工作報(bào)告明確提出要加強(qiáng)人工智能、工業(yè)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等新型基礎(chǔ)設(shè)施建設(shè)和融合應(yīng)用。為此,本文利用一系列的數(shù)字信息智能技術(shù),為高速公路網(wǎng)環(huán)保監(jiān)控管理提供一套創(chuàng)新的解決方案。此解決方案摒棄了當(dāng)前傳統(tǒng)環(huán)保監(jiān)測(cè)的黑匣子記錄模式,采取高粒度實(shí)時(shí)環(huán)保監(jiān)測(cè),及時(shí)且持續(xù)地對(duì)各項(xiàng)環(huán)保監(jiān)測(cè)指標(biāo)做未來(lái)趨勢(shì)預(yù)測(cè),對(duì)污染事故風(fēng)險(xiǎn)進(jìn)行提前預(yù)警,在超標(biāo)排放污染事件大概率發(fā)生之前就預(yù)警提示,可使相關(guān)職能部門采取運(yùn)維措施提前應(yīng)對(duì),極大地強(qiáng)化了環(huán)保安全風(fēng)險(xiǎn)控制。尤其在新基建需求的大形勢(shì)下,可為高速公路網(wǎng)中環(huán)保和路橋隧基礎(chǔ)設(shè)施等資產(chǎn)的安全監(jiān)控、運(yùn)維及管理的數(shù)字轉(zhuǎn)型和智能升級(jí)提供依據(jù)。
面對(duì)基礎(chǔ)設(shè)施和高速公路網(wǎng)快速發(fā)展帶來(lái)的環(huán)保壓力,以及各級(jí)政府和民眾對(duì)環(huán)境監(jiān)控的高度關(guān)注,在環(huán)保監(jiān)控管理系統(tǒng)的建設(shè)中,我國(guó)當(dāng)前的解決方案主要存在以下幾個(gè)痛點(diǎn)和瓶頸:
(1) 數(shù)據(jù)碎片化和業(yè)務(wù)豎井。目前所建立的環(huán)保監(jiān)測(cè)系統(tǒng)多為單一環(huán)境檢測(cè)項(xiàng)系統(tǒng),例如污水監(jiān)測(cè)、大氣監(jiān)測(cè)、環(huán)保設(shè)備工況監(jiān)測(cè)等,并使用不同供應(yīng)商的設(shè)備和系統(tǒng),各自形成獨(dú)立的業(yè)務(wù)豎井、數(shù)據(jù)孤島,造成數(shù)據(jù)碎片化,難以實(shí)現(xiàn)統(tǒng)一的環(huán)保監(jiān)控管理。
(2) 監(jiān)測(cè)粒度低和存在監(jiān)測(cè)盲區(qū)。當(dāng)前水質(zhì)檢測(cè)設(shè)備對(duì)環(huán)境的要求高,需技術(shù)人員定期頻繁出勤,運(yùn)維復(fù)雜,且檢測(cè)粒度低,至少需數(shù)小時(shí)才出一組有效監(jiān)測(cè)數(shù)據(jù)。眾多監(jiān)測(cè)點(diǎn)由于地處邊遠(yuǎn)地區(qū),空間跨度大,運(yùn)維難度高,存在監(jiān)測(cè)弱區(qū)和盲區(qū),達(dá)不到在線環(huán)保監(jiān)測(cè)全覆蓋[16-19],也無(wú)法實(shí)現(xiàn)不間斷實(shí)時(shí)遠(yuǎn)程信息監(jiān)測(cè),且獲取的環(huán)保監(jiān)測(cè)數(shù)據(jù)的粒度和實(shí)時(shí)性更無(wú)法滿足人工智能機(jī)器學(xué)習(xí)模型訓(xùn)練的數(shù)據(jù)要求。
(3) 補(bǔ)救型環(huán)保運(yùn)維不可逆。環(huán)保監(jiān)測(cè)通常是在污染事故和運(yùn)維事件已經(jīng)發(fā)生后發(fā)出報(bào)警,此時(shí)不可逆的環(huán)境破壞污染事故(例如超標(biāo)排放)已經(jīng)發(fā)生,需要付出代價(jià)高昂的補(bǔ)救和運(yùn)維投入,且負(fù)面影響不可逆。
人工智能物聯(lián)網(wǎng)(Artificial Intelligence and Internet of Things,AIoT)是將人工智能(AI)技術(shù)與物聯(lián)網(wǎng)(IoT)系統(tǒng)充分融合、交互作用,即運(yùn)用人工智能技術(shù)分析物聯(lián)網(wǎng)系統(tǒng)所提供的感知數(shù)據(jù),挖掘數(shù)據(jù)中的價(jià)值,輸出前瞻性的服務(wù)。
針對(duì)上述我國(guó)高速公路網(wǎng)環(huán)保監(jiān)測(cè)發(fā)展現(xiàn)狀中存在的問(wèn)題,本文運(yùn)用AIoT技術(shù),為高速公路網(wǎng)智能環(huán)保監(jiān)控管理提供了一套完整的解決方案,來(lái)突破其現(xiàn)有瓶頸。此解決方案由兩個(gè)重要部分組成:①智能環(huán)保物聯(lián)網(wǎng)系統(tǒng),構(gòu)建全面的環(huán)保大數(shù)據(jù)監(jiān)測(cè)網(wǎng)絡(luò),實(shí)現(xiàn)跨業(yè)務(wù)豎井的信息采集、整合并分享,以及高粒度實(shí)時(shí)監(jiān)測(cè)、微運(yùn)維和無(wú)人值守;②定制化研發(fā)的人工智能大數(shù)據(jù)分析平臺(tái),對(duì)物聯(lián)網(wǎng)構(gòu)建的大數(shù)據(jù)做統(tǒng)計(jì)分析和趨勢(shì)預(yù)測(cè)深度應(yīng)用,支持按需運(yùn)維和提供前瞻性管理。該解決方案的總體設(shè)計(jì)架構(gòu)見(jiàn)圖1,具體設(shè)計(jì)如下:
圖1 基于AIoT的高速公路網(wǎng)智能環(huán)保監(jiān)控管理解決方案總體設(shè)計(jì)架構(gòu)Fig.1 Architecture of the AIoT-based smart highway network environment monitoring management solution
在感知層中,現(xiàn)場(chǎng)部署各類新一代傳感器,對(duì)環(huán)保指標(biāo)、環(huán)保設(shè)備工況等資產(chǎn)運(yùn)維檢測(cè)項(xiàng),以及其他業(yè)務(wù)豎井的監(jiān)測(cè)信息(如路橋隧基礎(chǔ)設(shè)施健康狀態(tài))進(jìn)行采集、數(shù)字化和數(shù)據(jù)預(yù)處理。
在傳輸層中,傳感器感知的數(shù)據(jù)通過(guò)物聯(lián)網(wǎng)匯集和回傳,利用新一代無(wú)線低功耗傳感網(wǎng)LPWAN(Low-Power Wide Area Network)技術(shù)組網(wǎng),將感知層獲取的數(shù)據(jù)無(wú)線遠(yuǎn)距離傳送至連接互聯(lián)網(wǎng)的物聯(lián)網(wǎng)網(wǎng)關(guān),回傳至云資源池的平臺(tái)層。
在平臺(tái)層中,在云平臺(tái)上設(shè)立遠(yuǎn)程監(jiān)控?cái)?shù)據(jù)中心,部署管理系統(tǒng),對(duì)前端數(shù)據(jù)進(jìn)行匯接和儲(chǔ)存,并在“一張圖”上進(jìn)行業(yè)務(wù)呈現(xiàn)。系統(tǒng)預(yù)留接口供外部(環(huán)保)子系統(tǒng)對(duì)接,實(shí)現(xiàn)對(duì)非本項(xiàng)目部署的系統(tǒng)的集成和統(tǒng)一呈現(xiàn)。
在應(yīng)用層中,適配人工智能大數(shù)據(jù)分析功能體,賦能環(huán)保大數(shù)據(jù),對(duì)匯集的環(huán)保大數(shù)據(jù)做充分挖掘、融合、分析和深度應(yīng)用,進(jìn)而輸出前瞻性環(huán)保和運(yùn)維服務(wù)。
此外,本文選取京珠高速公路湖北境內(nèi)某高速服務(wù)區(qū)為試點(diǎn),對(duì)該解決方案進(jìn)行了可行性分析。
智能環(huán)保物聯(lián)網(wǎng)系統(tǒng)提供了該AIoT技術(shù)解決方案中端到端的IoT物聯(lián)網(wǎng)系統(tǒng)基礎(chǔ)設(shè)施,用以采集、傳輸、融合、構(gòu)建全面的環(huán)保監(jiān)測(cè)大數(shù)據(jù)。首期建設(shè)的智能環(huán)保物聯(lián)網(wǎng)部署了模塊,包括智能水質(zhì)監(jiān)測(cè)、水流量監(jiān)測(cè)、大氣監(jiān)測(cè)、污水處理設(shè)備工況監(jiān)測(cè)等多個(gè)物聯(lián)網(wǎng)節(jié)點(diǎn),覆蓋整個(gè)服務(wù)區(qū)及周邊區(qū)域的物聯(lián)網(wǎng)網(wǎng)關(guān),以及物聯(lián)網(wǎng)平臺(tái)中間件(Middleware)適配層。
為了防止環(huán)保監(jiān)測(cè)數(shù)據(jù)碎片化,在智能環(huán)保物聯(lián)網(wǎng)系統(tǒng)中,通過(guò)智能傳感監(jiān)測(cè)節(jié)點(diǎn)提供了豐富的SCADA工業(yè)標(biāo)準(zhǔn)接口,將各種監(jiān)測(cè)設(shè)備或傳感器無(wú)縫集成到系統(tǒng)中,系統(tǒng)多維度實(shí)時(shí)地采集傳感器的環(huán)保監(jiān)測(cè)數(shù)據(jù),包括高速公路網(wǎng)服務(wù)區(qū)排放的污水水質(zhì)、污水排放狀況、空氣質(zhì)量、微氣象以及污水處理設(shè)備工況等監(jiān)測(cè)指標(biāo)數(shù)據(jù),見(jiàn)表1。
表1 項(xiàng)目環(huán)境監(jiān)測(cè)指標(biāo)
當(dāng)前高速公路網(wǎng)環(huán)保監(jiān)測(cè)中普遍使用的在線水質(zhì)檢測(cè)方法,主要是依托化學(xué)水質(zhì)分析技術(shù),通過(guò)分光光度法、比色滴定法或重量分析法等獲取水質(zhì)指標(biāo)的計(jì)量結(jié)果[20-22]。其分析速度不可能快于分析時(shí)所用各種化學(xué)反應(yīng)所需的總時(shí)間(通常大于100 min數(shù)量級(jí)),產(chǎn)生每組有效數(shù)據(jù)通常需要2~4 h,實(shí)際每個(gè)檢測(cè)指標(biāo)每天最多只能提供12組有效監(jiān)測(cè)讀數(shù),這就造成了監(jiān)測(cè)粒度低。因此,在部署智能水質(zhì)監(jiān)測(cè)點(diǎn)時(shí),采取了從污水排放口自動(dòng)抽取水樣到小型監(jiān)測(cè)控制一體化箱,由在一體化箱中集成的新一代多參數(shù)光譜分析法水質(zhì)檢測(cè)傳感器檢測(cè)污水指標(biāo),檢測(cè)完的污水自動(dòng)排放出去。該檢測(cè)結(jié)果經(jīng)由第三方檢驗(yàn)機(jī)構(gòu)驗(yàn)證,無(wú)論高低量程測(cè)試結(jié)果的實(shí)際誤差率均在3.78%~6.58%之間,表明檢測(cè)方法具有良好的準(zhǔn)確度。水流量監(jiān)測(cè)點(diǎn)使用明渠流量?jī)x和高精度超聲波水位計(jì),實(shí)時(shí)監(jiān)測(cè)污水排放流量。大氣類監(jiān)測(cè)點(diǎn)采用新一代微型電化學(xué)大氣傳感器,集成入智能監(jiān)測(cè)物聯(lián)網(wǎng)節(jié)點(diǎn),對(duì)服務(wù)區(qū)的空氣質(zhì)量提供實(shí)時(shí)安全監(jiān)測(cè)(如油氣殘留、泄漏監(jiān)測(cè))。監(jiān)測(cè)指標(biāo)數(shù)據(jù)預(yù)處理后,實(shí)時(shí)通過(guò)物聯(lián)網(wǎng)連接回傳,將監(jiān)測(cè)粒度大幅提升至分鐘級(jí)別上傳一組有效的檢測(cè)數(shù)據(jù),每天每個(gè)檢測(cè)指標(biāo)至少能提供3 700組監(jiān)測(cè)數(shù)據(jù),可滿足大數(shù)據(jù)分析和人工智能機(jī)器學(xué)習(xí)模型訓(xùn)練的數(shù)據(jù)要求。
針對(duì)數(shù)量眾多的高速公路網(wǎng)監(jiān)測(cè)點(diǎn)地處邊遠(yuǎn)地區(qū)且分布地域跨度大的特點(diǎn),以及考慮存在移動(dòng)信號(hào)覆蓋不到或者網(wǎng)絡(luò)狀況不佳的情況,為了克服傳統(tǒng)監(jiān)測(cè)方式存在一定比例的監(jiān)測(cè)盲點(diǎn)問(wèn)題[19-23],不同于普遍使用的GPRS/GSM/3G回傳數(shù)據(jù)技術(shù),使用了新一代無(wú)線低功耗傳感網(wǎng)LPWAN組網(wǎng)技術(shù),由組網(wǎng)遠(yuǎn)距離無(wú)線傳輸至具有互聯(lián)網(wǎng)接入功能的嵌入式物聯(lián)網(wǎng)網(wǎng)關(guān),即使在移動(dòng)網(wǎng)絡(luò)信號(hào)微弱和不穩(wěn)定的區(qū)域,所有監(jiān)測(cè)點(diǎn)都無(wú)需依賴移動(dòng)通信基站網(wǎng)絡(luò)信號(hào)的覆蓋度和健壯度,就可將高粒度測(cè)量的多維度實(shí)時(shí)感知數(shù)據(jù)回傳至數(shù)據(jù)中心。
監(jiān)測(cè)點(diǎn)的硬件模塊整體封裝在IP67標(biāo)準(zhǔn)的防水防潮箱體中,適用于野外惡劣環(huán)境或室內(nèi)使用,免去了環(huán)保監(jiān)測(cè)站房占地和建設(shè)成本,集成到傳感器的小型監(jiān)測(cè)控制一體化箱,無(wú)需改造現(xiàn)有基礎(chǔ)設(shè)施,即插即用快速部署。物聯(lián)網(wǎng)監(jiān)測(cè)節(jié)點(diǎn)具有獨(dú)立性、小型化、低功耗的特點(diǎn),可以在不影響當(dāng)前設(shè)備的情況下獨(dú)立運(yùn)作,無(wú)須對(duì)被監(jiān)控實(shí)體做改造;其采用低功耗的硬件模塊和底層固件,賦予子系統(tǒng)智能節(jié)能模式,整個(gè)子系統(tǒng)可由充電蓄電池和太陽(yáng)能清潔能源聯(lián)合供電,部署地點(diǎn)不受電源條件限制,部署后可超長(zhǎng)時(shí)間運(yùn)作,無(wú)須人員進(jìn)入維護(hù)。
物聯(lián)網(wǎng)系統(tǒng)中間件適配層賦予物聯(lián)網(wǎng)平臺(tái)兼容性、安全性、交互性和拓展性,主要由以下幾個(gè)適配層實(shí)現(xiàn):
(1) 數(shù)據(jù)聚合適配層。該層將監(jiān)測(cè)數(shù)據(jù)從不同的子系統(tǒng)和其他數(shù)據(jù)源以不同的數(shù)據(jù)格式匯集到數(shù)據(jù)中心。
(2) 數(shù)據(jù)安全適配層。該層在原始數(shù)據(jù)使用權(quán)上應(yīng)用用戶授權(quán)的方式保證數(shù)據(jù)使用安全,該適配層也是整個(gè)物聯(lián)網(wǎng)端對(duì)端數(shù)據(jù)加密/解密功能的組成部分。
(3) 交互控制適配層。該層可提供預(yù)設(shè)的應(yīng)用程序接口(API),例如在物聯(lián)網(wǎng)系統(tǒng)和數(shù)據(jù)中心,或物聯(lián)網(wǎng)系統(tǒng)和人工智能/機(jī)器學(xué)習(xí)功能體,或物聯(lián)網(wǎng)系統(tǒng)和平臺(tái)的其他模塊間,實(shí)現(xiàn)雙向通信、交互式監(jiān)測(cè)和控制。
(4) 拓展適配層。該層實(shí)現(xiàn)平臺(tái)的物聯(lián)網(wǎng)系統(tǒng)的可拓展性,并在平臺(tái)投入部署運(yùn)行后,還可以集成新的(物聯(lián)網(wǎng))監(jiān)測(cè)子系統(tǒng)到平臺(tái)上來(lái),增加新的業(yè)務(wù)數(shù)據(jù)集和服務(wù)項(xiàng)。
智能環(huán)保物聯(lián)網(wǎng)系統(tǒng)的優(yōu)勢(shì)主要表現(xiàn)在以下幾個(gè)方面:
(1) 該系統(tǒng)將多個(gè)單一的環(huán)保監(jiān)測(cè)的獨(dú)立系統(tǒng)(例如污水水質(zhì)監(jiān)測(cè)系統(tǒng)、污水排放量監(jiān)測(cè)系統(tǒng)、空氣質(zhì)量監(jiān)測(cè)系統(tǒng)、微氣象監(jiān)測(cè)系統(tǒng)、污水處理設(shè)備工況監(jiān)測(cè)系統(tǒng)等)集成到一個(gè)平臺(tái)上來(lái),消除了環(huán)保安全數(shù)據(jù)孤島,整合了數(shù)據(jù)碎片,為實(shí)現(xiàn)在一個(gè)平臺(tái)上的高速公路網(wǎng)環(huán)保監(jiān)測(cè)數(shù)據(jù)統(tǒng)一呈現(xiàn)、集中監(jiān)控管理和數(shù)據(jù)融合應(yīng)用打下了堅(jiān)實(shí)的基礎(chǔ)。
(2) 該系統(tǒng)同時(shí)具有拓展性,能夠集成新的環(huán)保監(jiān)測(cè)子系統(tǒng)到這個(gè)統(tǒng)一的平臺(tái)上來(lái),解決了日常工作中必須面對(duì)不同設(shè)備和服務(wù)供應(yīng)商管理系統(tǒng)的難題,規(guī)避了企業(yè)過(guò)度依賴多個(gè)第三方SaaS平臺(tái)的風(fēng)險(xiǎn),也避免了體系架構(gòu)中部分功能的重復(fù)建設(shè)和成本負(fù)擔(dān)。
(3) 該系統(tǒng)全面提升了在線環(huán)保監(jiān)控的粒度和實(shí)時(shí)性,實(shí)現(xiàn)了高粒度檢測(cè)、無(wú)漏檢,真正意義上可實(shí)時(shí)全局掌握高速公路網(wǎng)環(huán)保安全監(jiān)測(cè)和資產(chǎn)運(yùn)維狀態(tài),同時(shí)提供了滿足大數(shù)據(jù)分析和人工智能機(jī)器學(xué)習(xí)模型訓(xùn)練所需的數(shù)據(jù)集。
(4) 該系統(tǒng)從根本上消除了環(huán)保監(jiān)測(cè)盲區(qū)和弱區(qū),實(shí)現(xiàn)了環(huán)保監(jiān)測(cè)無(wú)盲區(qū)全覆蓋、微運(yùn)維、無(wú)人值守、按需運(yùn)維,相較于通常輪詢機(jī)制的定期頻繁運(yùn)維,該智能環(huán)保物聯(lián)網(wǎng)系統(tǒng)的使用能夠減少高達(dá)80%的出勤。
(5) 該系統(tǒng)實(shí)現(xiàn)了高速公路網(wǎng)環(huán)保監(jiān)控的快速部署,且無(wú)需改造現(xiàn)有基礎(chǔ)設(shè)施。
通過(guò)自主研發(fā)的人工智能大數(shù)據(jù)分析平臺(tái),實(shí)現(xiàn)了該AIoT技術(shù)解決方案中的人工智能功能部分,賦能“全面環(huán)保大數(shù)據(jù)”,對(duì)環(huán)保監(jiān)測(cè)的實(shí)時(shí)和歷史數(shù)據(jù)進(jìn)行處理、挖掘和分析的深度應(yīng)用。
人工智能大數(shù)據(jù)分析平臺(tái)設(shè)計(jì)架構(gòu)見(jiàn)圖2。根據(jù)高速公路網(wǎng)環(huán)保監(jiān)測(cè)指標(biāo)變化趨勢(shì)預(yù)測(cè)預(yù)判的需求任務(wù),以及面向物聯(lián)網(wǎng)構(gòu)建的環(huán)保數(shù)據(jù)集的特點(diǎn),來(lái)設(shè)計(jì)定制化的機(jī)器學(xué)習(xí)模型,并在運(yùn)行環(huán)境下,無(wú)縫對(duì)接環(huán)保物聯(lián)網(wǎng)系統(tǒng)、企業(yè)數(shù)據(jù)倉(cāng)庫(kù)、智能環(huán)保監(jiān)控管理系統(tǒng)和數(shù)據(jù)/服務(wù)發(fā)布系統(tǒng)。
圖2 人工智能數(shù)據(jù)分析平臺(tái)設(shè)計(jì)架構(gòu)圖Fig.2 Design architecture of the AI-enabled data analysis platform
該平臺(tái)主要功能模塊如下:
(1) 數(shù)據(jù)檢索及對(duì)接模塊?;跀?shù)據(jù)倉(cāng)庫(kù)給定的數(shù)據(jù)存儲(chǔ)方案和數(shù)據(jù)庫(kù)環(huán)境的API下,數(shù)據(jù)檢索及對(duì)接模塊可進(jìn)行最簡(jiǎn)化的數(shù)據(jù)檢索及操作,具有最高效的檢索效率,從而減少整體系統(tǒng)的冗余信息操作,實(shí)現(xiàn)其性能的最大化。
(2) 原始數(shù)據(jù)處理模塊。近乎全部的人工智能模型均對(duì)其輸入的數(shù)據(jù)有固定的格式要求(如向量形式),經(jīng)典的機(jī)器學(xué)習(xí)方法要求對(duì)數(shù)據(jù)本身進(jìn)行一定程度上的特征值提取,以便于適應(yīng)不同模型所做出的數(shù)據(jù)分布上的假設(shè)。原始數(shù)據(jù)處理模塊的核心功能有針對(duì)模型的數(shù)據(jù)格式匹配、標(biāo)準(zhǔn)化特征值的計(jì)算與儲(chǔ)存。
(3) 統(tǒng)計(jì)建模及擬合模塊。作為整個(gè)人工智能數(shù)據(jù)分析平臺(tái)的機(jī)器學(xué)習(xí)功能體的核心,統(tǒng)計(jì)建模及擬合模塊是實(shí)現(xiàn)使用數(shù)據(jù)并將其價(jià)值最大化的重點(diǎn)。該模塊包括兩個(gè)子模塊,即針對(duì)于預(yù)測(cè)性問(wèn)題的監(jiān)督學(xué)習(xí)模塊和針對(duì)于非預(yù)測(cè)性問(wèn)題的無(wú)監(jiān)督學(xué)習(xí)模塊。整體模塊囊括了常用的幾大模型類型:邏輯類模型(如決策樹(shù))、概率類模型(如樸素貝葉斯)、距離類模型(如支持向量機(jī))、人工神經(jīng)網(wǎng)絡(luò)類模型(如卷積神經(jīng)網(wǎng)絡(luò))以及其他模型。
(4) 分布式計(jì)算模塊。由于本環(huán)保監(jiān)測(cè)項(xiàng)目是典型的大數(shù)據(jù)問(wèn)題(即數(shù)據(jù)量大、數(shù)據(jù)類型復(fù)雜以及潛在數(shù)據(jù)應(yīng)用居多),意味著項(xiàng)目中各類模型的擬合和訓(xùn)練需要進(jìn)行額外的分布式計(jì)算,以保證部分輸出結(jié)果的即時(shí)性。在既有的分布計(jì)算框架(如Spark及Hadoop)的基礎(chǔ)上,該模塊的具體設(shè)計(jì)將會(huì)高度取決于具體模型本身的計(jì)算量,以及對(duì)模型輸出時(shí)效性的需求。
(5) 數(shù)據(jù)語(yǔ)義化可視模塊。該模塊將數(shù)據(jù)分析和預(yù)測(cè)的結(jié)果語(yǔ)義化呈現(xiàn)給用戶,是將人工智能數(shù)據(jù)分析模型處理后的復(fù)雜信息進(jìn)行高度的濃縮化和語(yǔ)義化。根據(jù)業(yè)務(wù)的需求和針對(duì)不同的用戶類別,數(shù)據(jù)語(yǔ)義化可視化模塊的輸出將以時(shí)間長(zhǎng)度上和數(shù)據(jù)維度上便于用戶理解的信息呈現(xiàn),非數(shù)據(jù)專業(yè)人員亦可讀懂復(fù)雜信息輸出的結(jié)果。
在該環(huán)保監(jiān)測(cè)項(xiàng)目中,運(yùn)用了人工智能的深度學(xué)習(xí)技術(shù),針對(duì)環(huán)保監(jiān)測(cè)進(jìn)行統(tǒng)計(jì)建模及預(yù)測(cè),重點(diǎn)采用了概率類模型,通過(guò)貝葉斯統(tǒng)計(jì)(Bayesian Statistics)的方式,實(shí)現(xiàn)對(duì)目標(biāo)變量的不確定性校準(zhǔn)(Uncertainty Calibration)。貝葉斯統(tǒng)計(jì)近些年在氣象模擬、疾病傳播預(yù)測(cè)、基因序列分析等領(lǐng)域取得了諸多進(jìn)展,同時(shí)展現(xiàn)出與當(dāng)下主流深度學(xué)習(xí)模型之間具有較好的兼容度[24-26]。然而在當(dāng)前高速公路網(wǎng)環(huán)保監(jiān)測(cè)數(shù)據(jù)的規(guī)模下,貝葉斯統(tǒng)計(jì)經(jīng)典算法在目前任何商業(yè)計(jì)算服務(wù)器上難以達(dá)到可接受的計(jì)算效率,無(wú)法即時(shí)輸出環(huán)保監(jiān)測(cè)指標(biāo)預(yù)測(cè)結(jié)果。
該環(huán)保監(jiān)測(cè)項(xiàng)目中積累的環(huán)保數(shù)據(jù)集的時(shí)間序列和數(shù)據(jù)量隨時(shí)間呈線性增長(zhǎng),具有明顯的周期性,當(dāng)污染事件發(fā)生時(shí),個(gè)別時(shí)間序列可觀測(cè)到明顯的分布改變點(diǎn)。根據(jù)數(shù)據(jù)集的這些特點(diǎn),定制化研發(fā)了一種優(yōu)化的稀疏變分法推論算法 (Sparse Variational Inference)。通過(guò)該算法,可以使用極低的近似數(shù)量級(jí),便能準(zhǔn)確擬合之前數(shù)量級(jí)的變化趨勢(shì),解決了經(jīng)典貝葉斯統(tǒng)計(jì)算法不能適配于大規(guī)模物聯(lián)網(wǎng)環(huán)境建模的問(wèn)題。稀疏變分法推論算法的數(shù)學(xué)表達(dá)式如下:
logp(y)≥Eq(u)[logp(y|u)]-KL[q(u)||p(u)]
(1)
式中:y為全部觀測(cè)到的歷史變量(例如某一監(jiān)測(cè)項(xiàng)的全部讀數(shù));u為稀疏化表達(dá)的歷史時(shí)間點(diǎn)(數(shù)目遠(yuǎn)小于觀測(cè)到的總時(shí)間點(diǎn));p(u)為單位高斯分布的先驗(yàn)概率;q(u)為需要擬合的近似后驗(yàn)概率;p(y|u)為針對(duì)每種讀數(shù)類型的定制概率分布;KL為Kullback-Leibler散度。
基于此算法建立的優(yōu)化深度學(xué)習(xí)模型,可在不過(guò)量損失模型精度的條件下保持模型的可擴(kuò)充性。圖3中枚舉出了其中3項(xiàng)環(huán)保監(jiān)測(cè)指標(biāo)在給定一個(gè)短周期(min)中的讀數(shù)擬合值,其中藍(lán)色曲線為監(jiān)測(cè)項(xiàng)的實(shí)際讀數(shù),紅色曲線為擬合值,而紅色虛線則為擬合的標(biāo)準(zhǔn)差,超出藍(lán)線范圍的部分則為模型對(duì)于未來(lái)趨勢(shì)的預(yù)測(cè),即對(duì)未來(lái)幾分鐘內(nèi)污水排放的氨氮、瞬時(shí)流量、累計(jì)流量的預(yù)測(cè)值。如果預(yù)測(cè)值超過(guò)排放標(biāo)準(zhǔn)或預(yù)設(shè)的門限值,管理部門則在排放超標(biāo)或超量事件發(fā)生前就采取針對(duì)性的運(yùn)維措施,實(shí)現(xiàn)按需運(yùn)維和前瞻性響應(yīng)。
圖3 環(huán)保數(shù)據(jù)擬合及預(yù)測(cè)示例(分鐘級(jí))Fig.3 Cases of environment data fitting and prediction (on the order of minutes)
由圖3可見(jiàn),該模型在此情況下可以濾除原數(shù)據(jù)中的大部分浮動(dòng)噪聲,并準(zhǔn)確地識(shí)別出數(shù)值背后的主要趨勢(shì);模擬擬合的標(biāo)準(zhǔn)差范圍則可以進(jìn)一步地定量給出數(shù)據(jù)的浮動(dòng)分布。在此基礎(chǔ)上,將研發(fā)的該模型應(yīng)用于各個(gè)監(jiān)測(cè)項(xiàng),并指定了如下的模型周期:分鐘級(jí)、小時(shí)級(jí)、4小時(shí)級(jí)、日級(jí)、周級(jí)以及月級(jí),可提供即時(shí)的所有環(huán)保監(jiān)測(cè)指標(biāo)預(yù)測(cè)結(jié)果更新,滿足對(duì)各種環(huán)保安全預(yù)警情況的潛在需求。相對(duì)于采取既有的非概率化方法,針對(duì)環(huán)保安全檢測(cè)和資產(chǎn)管理的需求,根據(jù)當(dāng)前收集的環(huán)保數(shù)據(jù)集,自主定制化研發(fā)的基于稀疏變分法推論算法的深度學(xué)習(xí)模型達(dá)到了預(yù)期效果。
為了進(jìn)一步比較本文所提出的稀疏變分法推論算法與經(jīng)典貝葉斯統(tǒng)計(jì)算法[27]的區(qū)別,在表2中針對(duì)每一個(gè)監(jiān)測(cè)指標(biāo)進(jìn)行了橫向比較。具體實(shí)驗(yàn)設(shè)置如下:選擇某一日中午12時(shí)至當(dāng)日24時(shí)的數(shù)據(jù)作為模型訓(xùn)練集,然后由所訓(xùn)練的模型來(lái)預(yù)測(cè)當(dāng)日24時(shí)到次日凌晨1時(shí)的監(jiān)測(cè)指標(biāo),并記錄所需的運(yùn)行時(shí)間(s)和預(yù)測(cè)誤差(均方根誤差)。
表2 經(jīng)典貝葉斯統(tǒng)計(jì)算法與稀疏變分法推論算法運(yùn)行時(shí)間和預(yù)測(cè)誤差的比較
由表2可知,盡管在較小數(shù)據(jù)規(guī)模(如SO2,70數(shù)據(jù)點(diǎn))下,稀疏變分法推論算法在運(yùn)行時(shí)間和預(yù)測(cè)誤差上并不能取得優(yōu)勢(shì),然而隨著數(shù)據(jù)量增長(zhǎng)之后(如COD,2 056數(shù)據(jù)點(diǎn)),稀疏變分法推論算法則可以在保持同一預(yù)測(cè)誤差的前提下,極大地縮短模型運(yùn)行時(shí)間 (在COD下,運(yùn)行時(shí)間由24 s縮短至6 s)。與此同時(shí),在全部感知數(shù)據(jù)集上,均可以觀測(cè)到稀疏變分法推論算法本身的運(yùn)行時(shí)間并不會(huì)隨著數(shù)據(jù)量的增大而增加,這對(duì)于相應(yīng)的周級(jí)別、月級(jí)別,乃至年級(jí)別的建模極為重要,從根本上解決了傳統(tǒng)算法無(wú)法有效應(yīng)用到環(huán)保大數(shù)據(jù)上并即時(shí)輸出監(jiān)測(cè)指標(biāo)預(yù)測(cè)結(jié)果的問(wèn)題。
本文充分運(yùn)用AIoT物聯(lián)網(wǎng)與人工智能數(shù)據(jù)分析融合技術(shù),實(shí)現(xiàn)了高速公路網(wǎng)環(huán)保監(jiān)控快速部署、無(wú)盲區(qū)全覆蓋、微運(yùn)維和無(wú)人值守,提升了在線環(huán)保監(jiān)控的實(shí)時(shí)性和粒度,并整合了碎片化數(shù)據(jù),打破了數(shù)據(jù)孤島,實(shí)現(xiàn)了跨業(yè)務(wù)豎井的信息整合、分享和利用。本文構(gòu)建的基于AIoT技術(shù)的智能環(huán)保監(jiān)控管理系統(tǒng),在人工智能和大數(shù)據(jù)分析賦能下,可為環(huán)保監(jiān)測(cè)、運(yùn)維、資產(chǎn)管理等整體業(yè)務(wù)提供基于數(shù)據(jù)的統(tǒng)計(jì)分析和預(yù)測(cè)預(yù)判,提供對(duì)監(jiān)測(cè)指標(biāo)做未來(lái)趨勢(shì)預(yù)測(cè)和環(huán)保事故風(fēng)險(xiǎn)預(yù)警的前瞻性智能增值服務(wù),大幅提高了環(huán)保安全系數(shù),進(jìn)而降低其環(huán)保成本并加強(qiáng)了運(yùn)維效力,更能規(guī)避環(huán)境污染事件造成的負(fù)面社會(huì)影響,為提升交通行業(yè)環(huán)保管理智能化水平做出了有益的探索。