王騰飛?李宏
摘要:在大數據時代,建立用 Python 預測公共安全事件發(fā)展研究,可實現對公共安全事件防控全面、客觀的感知和認識,為做出符合實際的科學決策提供實證支撐。另一方面,大數據不僅是一項具有革命性的信息技術,也是一種思維、資源和能力。在新冠肺炎公共安全事件防控的大背景下,面對突發(fā)性公共衛(wèi)生事件,如何運用大數據提升政府治理能力,增強治理效能,進行科學決策、思想引導和精準施策,需要相關人員深入研究并提出相關措施。
關鍵詞:Python 預測;公共安全事件;發(fā)展研究
基金項目:本文系“可視化計算與虛擬現實四川省重點實驗室”單位項目《大數據在重大疫情防控中的應用研究》 (課題編號:SCVCVR2021.04VS);課題所取得的研究成果受“可視化計算與虛擬現實四川省重點實驗室”資助。
王騰飛(1986.11-),男,漢族,重慶開州,碩士學位,助教,研究方向:大數據技術與應用;
李宏(1964.04-),男,漢族,重慶開州,學士學位,教授,研究方向:計算機應用技術。
一、背景
突發(fā)性公共事件,是現代社會風險治理的重要課題。其中重點包括了“防范化解重大風險體制機制不斷健全,突發(fā)公共事件應急能力顯著增強”。
在大數據時代,建立用 Python 預測公共安全事件發(fā)展研究,可實現對公共安全事件防控全面、客觀的感知和認識,為做出符合實際的科學決策提供實證支撐。另一方面,大數據不僅是一項具有革命性的信息技術,也是一種思維、資源和能力。
二、原則及方法
①運用大數據實時數據治理,促進公共安全事件防控治理網絡化、制度化和規(guī)范。在大數據時代,社會結構和治理模式正在發(fā)生變革,如社會構成復雜化、權力機制扁平化、社會治理多元化等。
②運用大數據實施整體性治理,提升公共安全事件防控把控能力和科學決策力。需要建立公共安全事件防控中利用大數據“采集——分析——反饋”的制度規(guī)范,確保和提高行政運行效率。
③運用大數據實施精準治理,提升應對公共安全事件防控的態(tài)勢感知力、資源匹配供給力和差異化服務能力。
既能體現以人民為中心的根本立場,又能在應急處置中激發(fā)人們主動參與,減少治理成本,增強治理效能,提升廣大民眾對黨和政府的信任感和信賴度[3]。
三、案例
(一)Python 預測案例
作為TF-IDF結果的一個例子,來看看這些句子。"Im traveling to Paris this week","There will be so many journeys to Paris next week","Paris is supposed to receive a lot of tourists"。實際案例簡單的案例,使用TF-IDF來識別。數據集從2009年至2020年的英文文本中抽取了一組新聞和觀點 [1]。數據集包含了日期、標題、新聞正文和被提及的關鍵詞。
將該詞還原為詞根同義詞。由于De輸入 "POS",詞根是來自形容詞、動詞還是名詞。刪除常見的詞,如Wall street、 Market、Stock、Share等。
模型是創(chuàng)建符合目的的模型。因此,使用Python中的Sklearn庫。由于想知道每個日期的關鍵信息,使用 TfidfVectorizer模型,可以幫助識別每個日期的關鍵信息??梢栽O置關鍵特征的數量來控制輸出結果的數量,設置為8個特征。
from sklearn.feature_extraction.text importTfidfVectorizer
tf_idf_model = TfidfVectorizer(max_features=8)
processed_text_tf = tf_idf_model.fit_transform(preprocessed_texts)
tf_idf_values = tf_idf_model.idf_
tf_idf_names = tf_idf_model.get_feature_names()
接下來,用當天數據集中的新聞片段來應用這個模型。通過這種方式,得到一組8個代表當天關鍵信息的詞,每個詞都有一個TF-IDF值,表示在當天的重要性。
(二)用Python預測公共安全事件發(fā)展
首先對SIR模型做一個簡單的介紹,SIR全稱就是Susceptible—Infected—Recovered,易感—感染—康復,即易感人群Susceptible有α概率被某種疾病感染,成為感染人群Infected,而感染人群Infected又有β概率康復,成為康復人群Recovered。這次用到的圖論方面的庫是networkx,這是Python中最常用的圖論分析的庫。下面還是直接用代碼來具體說明一下。先導入各種包。
import matplotlib.pyplot as plt
import numpy.random as rdm
import networkx as nx
接下來定義兩個變量n和g。n是總人數,nx.erdos_renyi_graph則是一種隨機網絡圖,著名的E-R隨機圖理論(Random graph theory),復雜網絡拓撲結構的系統性分析。而這個E-R圖也是本文應用的基礎[2]。而nx.erdos_renyi_graph(n, 0.01)的意思就是以概率0.01來連接100個節(jié)點。然后是三個string類型的變量susceptible、infected和recovered,分別代表“易感”“感染”和“康復”人群。
第一個函數Onset,在這里把每個節(jié)點的狀態(tài)都設置為“S”,也就是易感狀態(tài),感染函數是Infect_prop,Prop是Proportion,這個函數是感染比例,這里用到了Numpy.Random.Random方法,也就是返回一個均勻分布,數值大小在0-1之間,不包含1,當Rdm.random()<= Proportion時,就讓這樣的人群變?yōu)楦腥救巳?,這樣讓感染人群更加均勻一些。第三個函數是Build_model,是一個嵌套函數,有兩個參數,PInfect和PRecover,分別代表感染概率和康復概率,而這里的G.Neighbors(I)的意思是節(jié)點I的相鄰的節(jié)點,而G是生成的圖(Graph),是Class。在這些感染人群中,相鄰節(jié)點的狀態(tài)是 “Susceptible”時,讓這些節(jié)點(人群)以概率PInfect來進行感染;感染人群中,以PRecover的概率進行康復。這就是感染—康復過程。而后面的兩個函數Model_Run和Model_Iter則是將這個模型運行多次,分別用來模擬一個循環(huán)和多個循環(huán)。
fig, ax= plt.subplots(figsize=(12, 10))
ax.set_xticks([])
ax.set_yticks([])
pos = nx.spring_layout(g, k=0.2)
nx.draw_networkx_edges(g, pos, alpha=0.5, width = 1)
nx.draw_networkx_nodes(g, pos, node_size=80)
plt.show()
首先設置圖片的大小,并去掉坐標軸,然后設置網絡圖的位置,Nx.Spring_layout設置網絡圖的位置的方法,其中參數K是節(jié)點間的最佳距離,這個可以隨意設置,值越大節(jié)點越分散,接下來繪制節(jié)點和連線,Nx.draw_Networkx_Nodes(G, POS,Node_Size=80)用來繪制節(jié)點,POS就是剛才設置的位置參數,再設置一下節(jié)點的大小,而Nx.Draw_Networkx_Edges(G, POS,Alpha=0.5,Width = 1)用來繪制連線,同樣要傳入位置參數,再設置透明度和線寬。
Networkx使用的繪圖算法是隨機的,同時使用的參數也是隨機的,所以這個圖每次生成的結果都不同,可以看到這里面已經有部分節(jié)點相連,疾病也就是通過他們開始傳播,最后就是計算感染率。
n = 100onset(g)
infect_prop(g, 0.05)
model = build_model(0.2, 0.8)
model_iter(g, model, 10)
infected = [ v for (v, attr) in g.nodes(data = True)
if attr['state'] == recovered ]
infection_rate = len(infected)/n
print(infection_rate)
這當中Onset(g)中的G就是前面用G = Nx.erdos_renyi_graph(n, 0.01)生成的圖,這是一個類的實例,Infect_prop(g, 0.05)中的0.05就是設置人群初始感染率為0.05,Model = Build_model(0.2, 0.8)中的感染概率和康復概率分別設置為0.2和0.8,而Model_iter(g, model, 10)中讓這個模擬過程重復10次,最后計算出感染人數,并得出最終穩(wěn)定的感染率Infection_rate。
新冠肺炎公共安全事件是對國家治理體系和治理能力的一次大考,既考察著國家政治、經濟等各方面工作的應急能力和處置水平,也檢驗著國家大數據、人工智能、云計算等新技術的應用程度和社會成效。
四、結束語
公共安全事件防控既需要大數據技術支持,也需要新時代公民的大局意識和擔當意識。自覺服從黨和國家實施的管理規(guī)定與制度,服從大局、團結一心,戰(zhàn)勝公共安全事件。
作者單位:王騰飛 四川化工職業(yè)技術學院數字經濟學院
李宏 可視化計算與虛擬現實四川省重點實驗室
參? 考? 文? 獻
[1]王曉飛.新冠疫情下消費券政策效應測度研究——基于Python軟件獲取新浪微博發(fā)博量與關注度數據的分析[J].價格理論與實踐,2020(11):61-63.
[2]王思遠,譚瀚霖,李東杰.基于改進傳染病動力學易感-暴露-感染-恢復(SEIR)模型預測新型冠狀病毒肺炎疫情[J].第二軍醫(yī)大學學報,2020,41(06):637-641.
[3]耿輝,徐安定,王曉艷等.基于SEIR模型分析相關干預措施在新型冠狀病毒肺炎疫情中的作用[J].暨南大學學報(自然科學與醫(yī)學版),2020,41(02):175-180.
[4]趙明靜. 基于公共安全視角的城市物流風險分析及預測研究[D].北京交通大學,2021.
[5]邱凌峰,胡嘯峰, 周睿,等. 基于機器學習的典型社會安全事件發(fā)生規(guī)律研究及對雄安新區(qū)的啟示[J].中國安全生產科學技術,2018,14(10):11-17.
[6]丁晴.基于Python的人臉識別技術應用研究[J].數字技術與應用, 2021,39(5):75-78.
[7]范維澄,劉奕,翁文國.公共安全科技的幾點思考[C]// 中國突發(fā)公共事件防范與快速處置2008優(yōu)秀成果選編.2008:54.
[8]夏冰冰.基于Python的安全檢測的研究與實現[J].現代信息科技,2019,3(10):155-157.
[9]孫宗緣,馬秀峰,李奇.突發(fā)公共安全事件網絡輿情演化分析——基于文本挖掘與情感分析兩個視角[J].河北科技圖苑,2021,34(05):65-75.
[10]于路遙,宋瑾鈺.基于Python的天氣信息可視化分析系統的設計與實現[J].軟件工程與應用,2022,11(6):1394-1403.