吳 俊 王杰藝 金耀輝 WU Jun, WANG Jieyi, JIN Yaohui
工業(yè)革命以后,城市化的速度呈指數(shù)形式的增長(zhǎng),城市中每天都有數(shù)以千計(jì)的新住宅建成,全球范圍內(nèi)每周有數(shù)百萬(wàn)的人口遷入城市??焖俪鞘谢瘞?lái)了經(jīng)濟(jì)發(fā)展的同時(shí)出現(xiàn)了許多問(wèn)題,例如城市人口密度過(guò)高、交通堵塞、嚴(yán)重的環(huán)境污染等。
原有的人工管理方式已經(jīng)無(wú)法覆蓋飛速增加的城市面積與城市問(wèn)題,需要引入更加智能化的方式對(duì)城市進(jìn)行管理,智慧城市的概念應(yīng)運(yùn)而生。智慧城市是城市使用先進(jìn)的信息與通信手段采集多種數(shù)據(jù),通過(guò)對(duì)數(shù)據(jù)進(jìn)行分析處理以對(duì)城市管理與資源配置提供有效的支持[1]。
智慧城市的主要應(yīng)用領(lǐng)域集中在城市公共安全、城市基礎(chǔ)設(shè)施、城市交通、能源及公共事業(yè)、環(huán)境保護(hù)、智慧治理等方面。本文的研究?jī)?nèi)容屬于智慧治理范疇。政府推進(jìn)信息通信技術(shù)的構(gòu)建,提高公民決策的參與程度,提高公共社會(huì)服務(wù)的效率,實(shí)現(xiàn)透明治理,更加有效的管理城市資源,這就是“智慧治理”[2]??紤]到城市管理的重要性以及各利益相關(guān)方協(xié)作以達(dá)到理想的城市發(fā)展水平、經(jīng)濟(jì)增長(zhǎng)率以及城市的宜居性,智慧治理是智慧城市研究發(fā)展的重要方向之一[3]。
當(dāng)前在智慧城市和智慧治理領(lǐng)域國(guó)內(nèi)外已有了一系列的研究工作,網(wǎng)格化管理是城市管理的電子化平臺(tái),將整個(gè)城市分區(qū)按照一定的規(guī)則劃分成網(wǎng)格,由專門的網(wǎng)格中心監(jiān)管人員對(duì)所管轄范圍內(nèi)的網(wǎng)格進(jìn)行巡查,當(dāng)發(fā)現(xiàn)所管轄區(qū)域內(nèi)出現(xiàn)問(wèn)題后上報(bào)網(wǎng)格中心。同時(shí),網(wǎng)格中心也收集來(lái)自于市民的投訴或建議,并統(tǒng)一上報(bào)處置。網(wǎng)格化管理的核心功能主要包括:基礎(chǔ)數(shù)據(jù)的采集與存儲(chǔ)、各類數(shù)據(jù)的智能化匯總統(tǒng)計(jì)與分析、各組織機(jī)構(gòu)績(jī)效的考核與評(píng)比等。
表1 時(shí)間序列分析算法比較
城市各類問(wèn)題事件都在不同程度上影響了人們的正常生活或財(cái)產(chǎn)安全,導(dǎo)致城市各類問(wèn)題發(fā)生的影響因素可能眾多而復(fù)雜。本文主要圍繞時(shí)空行為信息學(xué),充分利用互聯(lián)網(wǎng)、大數(shù)據(jù)等創(chuàng)新技術(shù),基于網(wǎng)格化管理系統(tǒng)中采集得到的各類投訴數(shù)據(jù),重點(diǎn)挖掘城市中各類問(wèn)題事件的發(fā)生規(guī)律、可能的影響因素,全面、精確、實(shí)時(shí)地掌握各類風(fēng)險(xiǎn)動(dòng)態(tài),同時(shí)基于挖掘結(jié)果建立預(yù)測(cè)與預(yù)警模型。一方面能夠?qū)Ω黝愂录谖磥?lái)一段時(shí)間內(nèi)最可能發(fā)生的時(shí)間進(jìn)行預(yù)測(cè),提前預(yù)防、控制可能發(fā)生的危險(xiǎn)事故和突發(fā)事件。另一方面能夠?qū)Ω黝愂录l(fā)生和演化過(guò)程進(jìn)行監(jiān)控和預(yù)警,因此能夠在危機(jī)事件發(fā)生后,做到有效的信息共享和協(xié)調(diào)聯(lián)動(dòng)。核心目標(biāo)是基于城市網(wǎng)格化管理數(shù)據(jù),旨在推進(jìn)智慧城市與智慧治理建設(shè)過(guò)程中,從城市與社區(qū)管理角度出發(fā),有效地掌握數(shù)據(jù)采集、分析、預(yù)測(cè)的方法,實(shí)現(xiàn)人與技術(shù)的充分融合,在危機(jī)發(fā)生前及發(fā)生后均能做出有效的決策或行動(dòng),使城市與社區(qū)的管理更智慧、更高效、更安全。
本文研究包含了數(shù)據(jù)采集、數(shù)據(jù)分析、事件預(yù)測(cè)與預(yù)警等整套挖掘過(guò)程。從網(wǎng)格化管理系統(tǒng)中采集相應(yīng)數(shù)據(jù),并對(duì)包含居民投訴建議及各類基礎(chǔ)設(shè)施的基本信息建立多級(jí)數(shù)據(jù)倉(cāng)庫(kù),對(duì)多源數(shù)據(jù)進(jìn)行數(shù)據(jù)關(guān)聯(lián)與融合;針對(duì)各類問(wèn)題相關(guān)事件,結(jié)合基礎(chǔ)設(shè)施基本信息等多源數(shù)據(jù),詳細(xì)分析導(dǎo)致每類事件發(fā)生的觸發(fā)因素,以及導(dǎo)致各類事件嚴(yán)重程度增加的演化因素;基于觸發(fā)因素關(guān)聯(lián)分析結(jié)果,建立多維度融合預(yù)測(cè)模型,對(duì)各類事件在未來(lái)一段時(shí)間的發(fā)展進(jìn)行預(yù)測(cè);基于演化因素關(guān)聯(lián)分析結(jié)果,對(duì)各類事件在發(fā)生和演化過(guò)程進(jìn)行監(jiān)控,并在事件急速惡化之前及時(shí)預(yù)警。
巴布爾[4]認(rèn)為市政府對(duì)解決全球性問(wèn)題至關(guān)重要,并指出“市長(zhǎng)統(tǒng)治世界”。目前,對(duì)城市智慧治理的行政重視已經(jīng)與學(xué)術(shù)關(guān)注相平行。城市治理已經(jīng)發(fā)展成為一個(gè)相對(duì)成熟的學(xué)術(shù)領(lǐng)域[5]。但是最近,電子政務(wù)和創(chuàng)新研究正在與它聯(lián)系起來(lái),制定可使城市更加智能的方法[6]。吉爾[7]指出,智慧治理是一種新型電子治理形式,其利用先進(jìn)的信息技術(shù)互聯(lián)和整合信息、流程、機(jī)構(gòu)和物質(zhì)基礎(chǔ)設(shè)施,使政府可以更好地為公民和社區(qū)服務(wù)。
KORTUEM G等[8]研究了智慧治理中公共服務(wù)以及社會(huì)管理方面的內(nèi)容,在日常生活中,對(duì)于群眾的投訴、求助、社會(huì)事務(wù)等方面的處理可以鑲嵌在全市智慧管理和市場(chǎng)運(yùn)作的社會(huì)服務(wù)體系之中,并在此基礎(chǔ)上為城市綜合規(guī)劃、應(yīng)急響應(yīng)、社區(qū)管理提供基礎(chǔ)平臺(tái)服務(wù),實(shí)現(xiàn)政府一站式服務(wù)體系。在這種情況下,政府可以收集和分析城市各個(gè)地區(qū)的實(shí)時(shí)數(shù)據(jù),為公眾提供更快捷、更靈活的服務(wù)。公眾可以通過(guò)手機(jī)、個(gè)人電腦等方式上傳信息,實(shí)現(xiàn)對(duì)事件的實(shí)時(shí)查詢。
現(xiàn)有的大多數(shù)時(shí)間序列預(yù)測(cè)方法是不考慮不同城市事件之間關(guān)系的單一模型。小波變換、傅立葉變換和AutoPlait[9]可以檢測(cè)季節(jié)性,但是它們不能預(yù)測(cè)未來(lái)的事件。AR、ARIMA++、PLif[10]和Trimine[11]能夠挖掘時(shí)間序列的發(fā)展模式和預(yù)測(cè)未來(lái)的發(fā)展情況,但是由于它們使用線性模型,因此無(wú)法處理非線性情況。FUNNEL[12]、TBATS[13]可以捕獲單變量時(shí)間序列方法的所有模式,但是它們不能捕捉不同時(shí)間序列事件之間的關(guān)系。EcoWeb[14]是一種多元時(shí)間序列方法,但它只能處理競(jìng)爭(zhēng)關(guān)系,而不能處理其他類型的關(guān)系。深度學(xué)習(xí)算法如LSTM等模型不具有可解釋性,無(wú)法解釋時(shí)間序列發(fā)展的內(nèi)在原因,對(duì)實(shí)踐應(yīng)用的幫助不大。表1展現(xiàn)了RBTA模型與其他時(shí)間序列分析模型的對(duì)比結(jié)果。
上海市徐匯區(qū)網(wǎng)格中心打造了具有徐匯特色的城區(qū)綜合治理體系,即1+13+X體系。1個(gè)區(qū)級(jí)平臺(tái):在網(wǎng)格化管理的基礎(chǔ)上,融入12345市民服務(wù)熱線、聯(lián)動(dòng)聯(lián)勤、應(yīng)急處置等職能,拓展社會(huì)管理和公共服務(wù)事項(xiàng),構(gòu)建一體化運(yùn)行的綜合樞紐。13個(gè)街鎮(zhèn)中心:通過(guò)重心下移、資源下沉和權(quán)力下放,讓最靠近服務(wù)對(duì)象的管理主體真正有職有權(quán)有人有物,使街道鎮(zhèn)成為城區(qū)管理和社會(huì)治理的重要平臺(tái)。延伸X個(gè)工作站:306個(gè)居民區(qū)、5個(gè)園區(qū)、1個(gè)地下軌交設(shè)立工作站,做到管理空間全覆蓋。徐匯區(qū)通過(guò)上述的體系標(biāo)準(zhǔn),形成了一套行之有效的城市綜合管理方法,配套信息化手段,提升了智慧城市的能力水平。在推進(jìn)過(guò)程中發(fā)現(xiàn),傳統(tǒng)的信息化手段能夠提高網(wǎng)格化工作的效率,起到了事中事后監(jiān)管的作用,但是把握不準(zhǔn)城市管理事件發(fā)展的基本趨勢(shì)、周期性、異常事件和不同事件之間關(guān)系,僅能通過(guò)個(gè)人經(jīng)驗(yàn)對(duì)一些問(wèn)題進(jìn)行預(yù)測(cè),存在較大的錯(cuò)誤率。
本文使用徐匯區(qū)網(wǎng)格中心的實(shí)際業(yè)務(wù)數(shù)據(jù)來(lái)評(píng)估我們提出的模型RBTA,本次使用的徐匯區(qū)網(wǎng)格中心業(yè)務(wù)數(shù)據(jù)跨度從2016年1月1日到2016年12月31日,事件記錄93萬(wàn)條,事件記錄數(shù)據(jù)包括發(fā)生的時(shí)間、事件所
圖1 公共設(shè)施損壞在全年內(nèi)的發(fā)生次數(shù)資料來(lái)源:作者自繪。
圖2 RBTA時(shí)間序列分析模型框架資料來(lái)源:作者自繪。
表2 城市問(wèn)題事件的分類及其所占比例
資料來(lái)源:作者自制。歸屬的類別、事件發(fā)生的地點(diǎn)(城建地理坐標(biāo)系、所在街道、所在社區(qū))等。
圖1描述了公共設(shè)施損壞這一問(wèn)題事件在全年內(nèi)的發(fā)生發(fā)展情況,橫軸是以天為單位的時(shí)間變化,縱軸是公共設(shè)施損壞發(fā)生的歸一化次數(shù)。
徐匯區(qū)的網(wǎng)格數(shù)據(jù)被人工分為6個(gè)一級(jí)分類和46個(gè)小類,表2描述了6個(gè)一級(jí)分類以及他們所占的比例。從中我們可以看出,市容市貌所占的比例最高,達(dá)到了50%以上,說(shuō)明上海市徐匯區(qū)所受的最大困擾是市容市貌問(wèn)題。
本文提出名為RBTA的多元時(shí)間序列模型,其框架如圖2所示。RBTA是基于一元時(shí)間序列模型TBATS,增加了不同事件間相互影響的因子。該模型背后的直覺(jué)邏輯是,不同的問(wèn)題事件并不是相互獨(dú)立的,它們會(huì)影響一些事件的發(fā)生,同時(shí)受到其他事件的影響。例如,垃圾問(wèn)題和涂鴉問(wèn)題經(jīng)常同時(shí)出現(xiàn)在一些整潔程度較差的街道上。同時(shí)一些事件之間存在競(jìng)爭(zhēng)性的關(guān)系,比如街邊的違法設(shè)攤和非法停車,街邊的位置有限,當(dāng)違法設(shè)攤被清除后會(huì)出現(xiàn)非法停車的情況。如圖3所示的事件間的競(jìng)爭(zhēng)關(guān)系。
RBTA通過(guò)對(duì)來(lái)自于上海市徐匯區(qū)網(wǎng)格中心的實(shí)際數(shù)據(jù)進(jìn)行評(píng)估,結(jié)果表明RBTA具有以下優(yōu)點(diǎn):
(1)該算法可以很好地獲取單個(gè)事件時(shí)間序列發(fā)展的全部規(guī)律,包括其發(fā)展的基本趨勢(shì),即共同演化的非線性動(dòng)態(tài)、季節(jié)性和特異事件,以及不同事件間的相互影響。算法所提取的時(shí)間序列發(fā)展規(guī)律是符合人類理解和邏輯的,相對(duì)于其他深度學(xué)習(xí)算法如LSTM等算法具有很強(qiáng)的可解釋性,強(qiáng)大的算法可解釋性可以為業(yè)務(wù)部門帶來(lái)對(duì)數(shù)據(jù)更深入的理解。算法的擬合均方根誤差是0.12,比現(xiàn)存的其他算法的誤差小。
(2)該算法可用于時(shí)間序列的長(zhǎng)期預(yù)測(cè),結(jié)果準(zhǔn)確度相對(duì)于其他算法有明顯的提升。預(yù)測(cè)的均方誤差為0.15,比現(xiàn)有的最好算法準(zhǔn)確率提高4.9%。
本文模型RBTA的數(shù)學(xué)公式如下所示[13]。
3.1.1 基本趨勢(shì)
在圖4中,觀測(cè)數(shù)據(jù)(圖中紅色的線條)是原始數(shù)據(jù)經(jīng)過(guò)Box-Cox變換后的結(jié)果,Box-Cox變換的主要作用是將非穩(wěn)態(tài)數(shù)據(jù)標(biāo)準(zhǔn)化以方便處理。圖中黑色的線條為RBTA模型從問(wèn)題事件中所提取出的發(fā)展趨勢(shì),綜合觀測(cè)數(shù)據(jù)和基本趨勢(shì)圖,可以看出RBTA模型很好地捕獲了問(wèn)題事件協(xié)同演化發(fā)展中的長(zhǎng)期和短期趨勢(shì),從圖中可以看出在上半年問(wèn)題事件出現(xiàn)小的波動(dòng)但整體變化不劇烈,下半年問(wèn)題事件發(fā)生的次數(shù)出現(xiàn)指數(shù)式增長(zhǎng)。
3.1.2 季節(jié)性和特殊情況
圖3 事件間的相互影響資料來(lái)源:作者自繪。
圖5 問(wèn)題事件的季節(jié)性和特異事件資料來(lái)源:作者自繪。
圖4 問(wèn)題事件的原始數(shù)據(jù)和基本趨勢(shì)資料來(lái)源:作者自繪。
圖6 不同事件間的相互關(guān)系資料來(lái)源:作者自繪。
圖5 中,綠色線條描述了RBTA模型從問(wèn)題事件中所提取出的季節(jié)性特征,可以看出該季節(jié)性特征是以7天為周期,受工作日劃分的影響較大,在工作日時(shí)問(wèn)題事件的發(fā)生較多而非工作日時(shí)問(wèn)題事件發(fā)生的數(shù)目較少。圖中紅色線條描述了問(wèn)題事件發(fā)生的特異情況,相對(duì)于其他時(shí)間序列模型假設(shè)誤差服從高斯白噪聲分布,RBTA模型描述了噪聲的ARMA過(guò)程。
3.1.3 事件間的耦合關(guān)系
圖6描述了不同問(wèn)題事件間的相互關(guān)系,由于問(wèn)題事件的種類過(guò)多,為方便展示這里只選取了9類問(wèn)題事件研究它們之間的相互影響,并設(shè)時(shí)間窗口l=1。圖中的c1對(duì)應(yīng)于環(huán)衛(wèi)環(huán)保類事件,c2對(duì)應(yīng)于園林綠化類事件,c3對(duì)應(yīng)于廢棄車輛類事件,c4對(duì)應(yīng)于暴露垃圾類事件,c5對(duì)應(yīng)于道路保潔類事件,c6對(duì)應(yīng)于亂設(shè)戶外設(shè)施類事件,c7對(duì)應(yīng)于墻面污損類事件,c8對(duì)應(yīng)于跨門營(yíng)業(yè)類事件,c9對(duì)應(yīng)對(duì)于亂晾曬類事件。
圖6中橫軸的事件是受影響事件,縱軸的事件是影響因素,顏色越深表示縱軸的事件對(duì)橫軸事件的正向促進(jìn)作用越大,即縱軸事件發(fā)生會(huì)很大程度上導(dǎo)致橫軸事件發(fā)生,顏色越淺說(shuō)明兩個(gè)事件間的影響關(guān)系很小,當(dāng)顏色淺至白色時(shí)說(shuō)明縱軸事件對(duì)橫軸事件的抑制作用越大,即縱軸事件的發(fā)生會(huì)抑制橫軸事件的發(fā)生。從圖中可以看出,顏色并不是呈對(duì)稱分布的,這說(shuō)明在多數(shù)情況下事件間的相互影響并不是堆成的。事件a會(huì)促進(jìn)事件b的發(fā)生,但事件b并不能促使事件a發(fā)生。圖中對(duì)角線上的顏色也并不都呈現(xiàn)深色,這是因?yàn)橐粋€(gè)事件的發(fā)展受其他事件影響的程度多于其自身過(guò)去的發(fā)展。這也是合理的,當(dāng)今社會(huì)是一個(gè)十分復(fù)雜的結(jié)構(gòu),一個(gè)事件的發(fā)展受眾多因素的影響,不同事件間的關(guān)系呈現(xiàn)復(fù)雜的分布。
圖7 RBTA模型擬合結(jié)果資料來(lái)源:作者自繪。
圖9 RBTA預(yù)測(cè)模型資料來(lái)源:作者自繪。
圖8 擬合結(jié)果對(duì)比資料來(lái)源:作者自繪。
圖10 RBTA擬合結(jié)果資料來(lái)源:作者自繪。
另外,還可以看出c8對(duì)c1有促進(jìn)作用,即跨門營(yíng)業(yè)類事件會(huì)促使環(huán)衛(wèi)環(huán)保類問(wèn)題的出現(xiàn),跨門營(yíng)業(yè)是占用經(jīng)營(yíng)場(chǎng)所外的公共空間進(jìn)行擺攤、放置貨物的行為,街道上如果很多商家都跨門經(jīng)營(yíng),會(huì)在公共空間產(chǎn)生很多垃圾,并且因?yàn)榻值辣簧碳艺加煤茈y及時(shí)清理,在一段時(shí)間后會(huì)演化成嚴(yán)重的環(huán)衛(wèi)環(huán)保類問(wèn)題。c5對(duì)c7也有促進(jìn)作用,即道路保潔問(wèn)題會(huì)對(duì)墻面污損問(wèn)題有促進(jìn),可以理解為當(dāng)城市某條街道的道路保潔出現(xiàn)問(wèn)題,即該街道整體干凈衛(wèi)生情況較差,會(huì)繼續(xù)催生街道墻面的污損情況。c3、c7、c8是受其他事件影響較大,但自身過(guò)去的發(fā)展影響較小的事件,對(duì)于這一類事件未來(lái)發(fā)展情況的預(yù)測(cè)需要投入更多的精力研究其他事件的發(fā)展情況,而調(diào)低其自身過(guò)去發(fā)展的權(quán)重。c8對(duì)c7的發(fā)生發(fā)展存在抑制作用,而c7的發(fā)生對(duì)c8的影響作用不大。
3.1.4 擬合
圖7展示了RBTA模型的擬合結(jié)果,擬合的均方誤差(RMSE)是0.094,圖中淺色的線條是原始數(shù)據(jù),深色的線條是RBTA的擬合結(jié)果,可以看出RBTA模型很好的抓住了原始數(shù)據(jù)的基本趨勢(shì)、季節(jié)性和特異情況,擬合的結(jié)果和原始數(shù)據(jù)相差很小。
為了證明RBTA算法的擬合結(jié)果強(qiáng)于現(xiàn)有的其他算法,我們將RBTA與其他算法進(jìn)行比較,比較的算法包括TBATS算法、SARIMA算法以及Holt-Winters算法(圖8)。對(duì)比試驗(yàn)的數(shù)據(jù)集在上海市徐匯區(qū)的網(wǎng)格數(shù)據(jù)中選取6個(gè)類型的數(shù)據(jù)作為展示,并在所有的共計(jì)46種類型的數(shù)據(jù)上進(jìn)行擬合,將結(jié)果取平均值作為最終的結(jié)果。6個(gè)作為展示的問(wèn)題事件類型分別是c1公共設(shè)施損壞事件,c2道路交通問(wèn)題事件,c3園林綠化問(wèn)題事件,c4垃圾問(wèn)題事件,c5道路保潔問(wèn)題事件,c6墻面亂涂寫問(wèn)題事件。可以看出RBTA在這6類事件以及所有事件的均值結(jié)果上的均方擬合誤差都最小,擬合效果比TBATS、SARIMA和Holt-Winters的結(jié)果都好。
預(yù)測(cè)算法的框架如圖9所示,在獲取RBTA的各項(xiàng)參數(shù)后,我們可以對(duì)不同的城市管理事件未來(lái)的發(fā)展情況進(jìn)行預(yù)測(cè)。
圖11 預(yù)測(cè)結(jié)果對(duì)比資料來(lái)源:作者自繪。
圖10 展示了問(wèn)題事件發(fā)展的預(yù)測(cè)結(jié)果,其中淡紅色的線條是真實(shí)數(shù)據(jù),深紅色的線條是RBTA模型的預(yù)測(cè)結(jié)果,綠色的線條是TBATS模型的預(yù)測(cè)結(jié)果,橙色的線條是SARIMA模型的預(yù)測(cè)結(jié)果??梢钥闯?,相對(duì)于其他算法的預(yù)測(cè)結(jié)果,RBTA模型的預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)最接近,預(yù)測(cè)誤差較小。且RBTA模型很好地捕獲了問(wèn)題事件未來(lái)發(fā)展的趨勢(shì)、季節(jié)性以及特異情況,達(dá)到了很好的預(yù)測(cè)結(jié)果。TBATS模型在建模期間獲取了單個(gè)事件的發(fā)展規(guī)律,但對(duì)之后的發(fā)展趨勢(shì)預(yù)測(cè)有誤,導(dǎo)致預(yù)測(cè)結(jié)果與真實(shí)數(shù)據(jù)相差較大。SARIMA算法對(duì)于這種波動(dòng)性較大的非平穩(wěn)序列,傾向于使用最近幾次觀測(cè)值的平均值作為預(yù)測(cè)值以消除噪聲,尤其在預(yù)測(cè)時(shí)間較長(zhǎng)時(shí),SARIMA的預(yù)測(cè)誤差會(huì)更差。
圖11展現(xiàn)了不同時(shí)間序列預(yù)測(cè)模型對(duì)于上海市徐匯區(qū)網(wǎng)格中心的問(wèn)題事件數(shù)據(jù)預(yù)測(cè)的均方誤差,我們將RBTA與其他算法的預(yù)測(cè)結(jié)果進(jìn)行比較,比較的算法包括TBATS算法、SARIMA算法以及Holt-Winters算法。與擬合實(shí)驗(yàn)類似,對(duì)比試驗(yàn)的數(shù)據(jù)集在上海市徐匯區(qū)的網(wǎng)格數(shù)據(jù)中選取6個(gè)類型的數(shù)據(jù)作為展示,并在所有的共計(jì)46種類型的數(shù)據(jù)上進(jìn)行擬合,將結(jié)果取平均值作為最終的結(jié)果。6個(gè)作為展示的問(wèn)題事件類型分別是c1公共設(shè)施損壞事件,c2道路交通問(wèn)題事件,c3園林綠化問(wèn)題事件,c4垃圾問(wèn)題事件,c5道路保潔問(wèn)題事件,c6墻面亂涂寫問(wèn)題事件。可以看出RBTA在這6類事件以及所有事件的均值結(jié)果上的預(yù)測(cè)誤差都最小,預(yù)測(cè)效果比TBATS、SARIMA和Holt-Winters的結(jié)果都好。
本文研究了時(shí)間序列的模式挖掘與預(yù)測(cè)問(wèn)題,創(chuàng)新性的提出了一個(gè)新的時(shí)間序列挖掘與預(yù)測(cè)的模型RBTA,該模型是在TBATS模型的基礎(chǔ)上引入不同時(shí)間序列相互影響的因素。RBTA具有很強(qiáng)的可解釋性,可以完整地獲取時(shí)間序列發(fā)展的基本趨勢(shì)、季節(jié)性、特異情況以及不同時(shí)間序列間的相互關(guān)系,并根據(jù)這些獲取的模式進(jìn)行準(zhǔn)確的擬合和預(yù)測(cè),準(zhǔn)確度優(yōu)于現(xiàn)存的時(shí)間序列分析模型。本文用上海市徐匯區(qū)網(wǎng)格中心的真實(shí)業(yè)務(wù)數(shù)據(jù)對(duì)我們提出的模型RBTA進(jìn)行評(píng)估,擬合與預(yù)測(cè)的誤差都小于現(xiàn)存的其他算法,預(yù)測(cè)的均方誤差為0.15,比現(xiàn)存最好的算法準(zhǔn)確率提高了4.9%。
參考文獻(xiàn) References
[1]HAMBLEN M. Just what is a smart city?[EB/OL]. (2015-10-01) [2018-03-06]. https://www.computerworld.com/article/2986403/internet-ofthings/just-what-is-a-smart-city.html.
[2]GIFFINGER R, FERTNER C, KRAMAR H, et al.City-ranking of European medium-sized cities[R].2014.
[3]DEAKIN M. Smart cities: governing, modeling,and analyzing the transition[M]. Oxford: Routledge,2013.
[4]BARBER B R. If mayors ruled the world:dysfunctional nations, rising cities[M]. New Haven:Yale University Press, 2013: 186.
[5]PIERRE J. Models of urban governance: the institutional dimension of urban politics[J]. Urban Affairs Review, 1999, 34(3): 372-396.
[6]NAM T, PARDO T A. Smart city as urban innovation:focusing on management, policy, and context[C]//Proceedings of the International Conference on Theory and Practice of Electronic Governance.Tallinn, Estonia, September, 2011: 185-194.
[7]GIL-GARCIA J R. Enacting electronic government success: an integrative study of governmentwide websites, organizational capabilities, and institutions[J]. Integrated, 2012, 22(21): 3144-3150.
[8]KORTUEM G, KAWSAR F, SUNDRAMOORTHY V, et al. Smart objects as building blocks for the Internet of things[J]. IEEE Internet Computing, 2009,14(1): 44-51.
[9]MATSUBARA Y, SAKURAI Y, FALOUTSOS C. AutoPlait: automatic mining of co-evolving time sequences[C]//ACM SIGMOD International Conference on Management of Data. 2014: 193-204.
[10]LI L, PRAKASH B A, FALOUTSOS C.Parsimonious linear fi ngerprinting for time series[J].Proceedings of the Vldb Endowment, 2010, 3(1-2):385-396.
[11]MATSUBARA Y, SAKURAI Y, FALOUTSOS C,et al. Fast mining and forecasting of complex timestamped events[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2012: 271-279.
[12]MATSUBARA Y, SAKURAI Y, PANHUIS W G V, et al. FUNNEL: automatic mining of spatially coevolving epidemics[C]//Proceedings of the 20th ACM SIGKDD Conference, New York City, August 24-27, 2014: 105-114.
[13]LIVERA A M D, HYNDMAN R J, SNYDER R D. Forecasting time series with complex seasonal patterns using exponential smoothing[J]. Monash Econometrics & Business Statistics Working Papers,2011, 106(496): 1513-1527.
[14]MATSUBARA Y, SAKURAI Y, FALOUTSOS C.The web as a jungle: non-linear dynamical systems for co-evolving online activities[J]. 2015, 24(3): 721-731.