王元鵬 楊樹峰
摘要:本文基于2007-2017年的火災統(tǒng)計數(shù)據(jù),引用“社群”概念和相關算法,挖掘火災社區(qū)之間拓撲關系的分析模型,同時獲取火災統(tǒng)計數(shù)據(jù),地址網(wǎng)格化后,根據(jù)使用算法計算火災網(wǎng)格并發(fā)特征,形成制定周期的火災并發(fā)社區(qū)。計算結果呈現(xiàn)方式為,當某一網(wǎng)格發(fā)生火災,在制定計算周期中,顯示與其同在一個社群的其他網(wǎng)格作“高風險區(qū)域”預警。
關鍵詞:“社群”概念; 算法; 火災風險分析
1 ? 引言
為探討該市火災的規(guī)律,從行政區(qū)角度劃分過去十年的火災記錄。如圖1所示,縱觀十年的火災數(shù)據(jù)變化發(fā)現(xiàn),并沒有火災數(shù)呈現(xiàn)常規(guī)突出的區(qū)域。以LG區(qū)為例,既有三年火災數(shù)居全市之首,也有某些年份呈現(xiàn)出與火災數(shù)變化大趨勢相反的現(xiàn)象,如2009和2012-2016年的連年下跌。經(jīng)調研,發(fā)現(xiàn)LG區(qū)在2013年一分為三 (LG、DP和PS),所以有可能是LG區(qū)域在2012-2016年火災數(shù)反常下跌的原因。但進一步挖掘發(fā)現(xiàn),LG區(qū)的火災數(shù)加上被劃分出去兩個區(qū)的火災數(shù)總和,也呈下降趨勢。筆者由此得到啟發(fā),類似的反常趨勢并非可以通過常規(guī)的信息判斷來挖掘,需要使用算法手段,從數(shù)學角度進行挖掘分析。同時也提出猜測,在“市-區(qū)”的層級,火災數(shù)量變化趨勢相似的區(qū)之間,是否存在某種可以從社群角度識別的特征(如被拆分后的LG、DP和PS區(qū),有可能是在“市-區(qū)”層級的一個社群),而這種特征甚至還可以通過從層級的再次細分具體體現(xiàn)。經(jīng)過一番調研,筆者決定引入社會學的“社群”概念,采用社群發(fā)現(xiàn)算法,結合城市管理網(wǎng)格數(shù)據(jù)和火災統(tǒng)計數(shù)據(jù),研究和描述火災的并發(fā)特征。
2 ? 算法識別火災社區(qū)規(guī)律
2.1 ?社群概念
在社會學概念中,社群,廣義而言是指在某些邊界線、地區(qū)或領域內發(fā)生作用的一切社會關系。同時,Worsley 曾提出社群的廣泛含義可被解釋為地區(qū)性的社區(qū),以及一個交互的網(wǎng)絡。以微博這種社交網(wǎng)絡為例,每個賬號就是一個點,賬號之間通過關注或者點贊構成了整個網(wǎng)絡結構,當中有些賬號關系密切,有些疏遠。其中一群聯(lián)系頻繁的賬號可以視作一個社區(qū),而聯(lián)系稀疏的兩個群體則可以視作兩個社區(qū),定義為社團結構。
在對火災的分析當中,引入社群概念,將城市管理網(wǎng)格視作點,周期內并發(fā)火災的特征,作為這些點在火災事件上的交互,構成關系網(wǎng)絡,劃分社群。通過進一步對社群的調查研究,可以捕捉到同區(qū)域是否存在同隱患或者類似人類生態(tài)學的結構。
2.2 ?算法思路
為了評價社區(qū)劃分的優(yōu)劣,Newman等人提出了模塊度的概念,用模塊度來衡量社區(qū)劃分的好壞。模塊度越大,則社區(qū)劃分的效果越好 。
模塊度Q公式的簡化形式
其中,∑in表示的是社群C內部的權重,∑tot表示的是與社群C內部的點連接的邊的權重,包括社區(qū)內部的邊以及社區(qū)外部的邊。模塊度(modularity)指的是網(wǎng)絡中連接社區(qū)結構內部定點的邊所占的比例,減去在同樣的社團結構下任意連接這兩個節(jié)點的比例的期望值。
2.4 ?遷移應用
在應用時,首先需要做單元網(wǎng)格的區(qū)分工作。需要導入城市管理信息系統(tǒng)中的網(wǎng)格數(shù)據(jù),根據(jù)不同的分析緯度導入不同的層級,以某城市為例:市-區(qū)-街道-社區(qū)-警格-一平方公里網(wǎng)格。
獲取火災統(tǒng)計數(shù)據(jù),根據(jù)地址網(wǎng)格化后,使用算法計算火災網(wǎng)格并發(fā)特征,形成制定周期的火災并發(fā)社區(qū)。計算結果呈現(xiàn)方式為,當某一網(wǎng)格發(fā)生火災,在制定計算周期中,顯示與其同在一個社群的其他網(wǎng)格作“高風險區(qū)域”預警。 例:社群A為例。經(jīng)過計算,編號為#15、#16、#17、#18的四個網(wǎng)格被劃分A社群。 當9月1日A社群中,編號#15網(wǎng)格發(fā)生一起火災,那么在未來七天(9月1日-9月7日),同屬A社群的其他網(wǎng)格—— #16、#17、#18都被定義為“高風險網(wǎng)格區(qū)域”。這其中要注意,并不是所有網(wǎng)格都會被分到并發(fā)社群,只有特定并發(fā)特征的網(wǎng)格參與其中。
3 ? 應用社群算法對某城市的風險分析
3.1 ? 待分析數(shù)據(jù)樣本
a)中間展示結果
分析過程由python代碼實現(xiàn),結果范例如 表3-2
其中“并發(fā)區(qū)域”含義是每個所劃分社群的獨立編號,“網(wǎng)格ids”代表的是該社群里面包含的城市管理網(wǎng)格編號。
b)結果分析
針對LG區(qū)2007-2017年數(shù)據(jù)的社群分析結果,用于2018年第一季度的數(shù)據(jù)做對比。
4 ? 結論與展望
本文針對火災中的并發(fā)規(guī)律進行分析,將社群的概念引入火災分析中,再結合數(shù)據(jù)挖掘方法用于火災事故分析理論,為消防風險管理、消防資源配置提供了決策基礎。另外,本文構建了社群概念的框架,而對于分析結果——所分類的社群,可以從以下兩方面結合深入研究,一是添加分析步驟對預測模型優(yōu)化,二是結合更多社會調查此類社群的共同之處。
參考文獻:
[1] ? ?M Canovan(1982) Two Strategies for the Study of Populism.
[2] ? ?M. Girvan and M. E. J. Newman. (2002) Community structure in social and biological networks.
[3] ? ?Vincent ?D Blondel,Jean-Loup Guillaume,Renaud Lambiotte,Etienne Lefebvre,F(xiàn)ast unfolding of communities in large networks, in Journal of Statistical Mechanics:Theory and Experiment 2008 (10), P1000.