胡少波
(榆林學(xué)院馬克思主義學(xué)院,陜西榆林 719000)
目前,政府的角色應(yīng)該逐漸由一個管理者變成一個服務(wù)者,而且隨著互聯(lián)網(wǎng)的快速發(fā)展,公民對于政府信息公開等訴求日趨強(qiáng)烈,對政府治理的模式和治理能力都有了新的要求,中國政府正在積極發(fā)展基于新技術(shù)的政府治理體系[1]。在此過程中,許多技術(shù)正在實(shí)施階段,其中蘊(yùn)含了大量的信息。利用大數(shù)據(jù)技術(shù)對該信息進(jìn)行分析,挖掘分析出其中有益于政府管理和城市治理的信息[2]。文中研究了基于大數(shù)據(jù)的政府治理現(xiàn)代化特征指標(biāo)神經(jīng)系統(tǒng)模型,首先詳細(xì)介紹了大數(shù)據(jù)技術(shù)的原理、特點(diǎn)和神經(jīng)網(wǎng)絡(luò)模型算法,然后基于決策樹技術(shù),介紹了其在政府治理現(xiàn)代化的指標(biāo)分析中的整個應(yīng)用過程,建立了指標(biāo)預(yù)測模型,并利用BP 神經(jīng)網(wǎng)絡(luò)模型對各個指標(biāo)進(jìn)行了評估和測試,研究結(jié)果可有效指導(dǎo)政府治理,提高政府服務(wù)體制現(xiàn)代化程度。
大數(shù)據(jù)技術(shù)為從隨機(jī)的、不完全的、大量的、模糊的客觀數(shù)據(jù)中提取出難以發(fā)現(xiàn)的、不為人知的、有規(guī)律信息的過程[3]。大數(shù)據(jù)技術(shù)包括聚類規(guī)則、關(guān)聯(lián)規(guī)則和分類規(guī)則等多種方法,其中提取和挖掘知識最重要的方法之一為分類計數(shù),而數(shù)據(jù)挖掘憑借其效率高、直觀性強(qiáng)、準(zhǔn)確性高等特點(diǎn)應(yīng)用最為廣泛。
人工神經(jīng)網(wǎng)絡(luò)通常是復(fù)雜的非線性系統(tǒng)模型[4],其中BP 神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層構(gòu)成,其本質(zhì)是從沒有規(guī)則和順序的事例中,從數(shù)學(xué)上推斷神經(jīng)網(wǎng)絡(luò)對于時間序列預(yù)測的有效性。其中,輸入層為向神經(jīng)網(wǎng)絡(luò)系統(tǒng)的數(shù)據(jù)輸入,隱含層對數(shù)據(jù)進(jìn)行處理,輸出層輸出最后的預(yù)測結(jié)果。文中選用BP 神經(jīng)網(wǎng)絡(luò)算法模型,其算法具有結(jié)構(gòu)簡單、計算量小、準(zhǔn)確性高、穩(wěn)定性高等優(yōu)點(diǎn)[5]。BP 神經(jīng)網(wǎng)絡(luò)算法的理論基礎(chǔ)是,正向傳播時,輸入從輸入層經(jīng)過隱含層逐層處理,并轉(zhuǎn)向到輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)[6]。期望的輸出值連續(xù)接近實(shí)際輸出值,從而最小化均方誤差。BP 算法的隱含層具有自學(xué)習(xí)能力[7],其訓(xùn)練過程包括信號前向傳播和誤差反向傳播[8],直到調(diào)整權(quán)重達(dá)到最大迭代次數(shù)。其算法流程圖如圖1 所示。
圖1 BP神經(jīng)網(wǎng)絡(luò)算法流程圖
其簡化網(wǎng)絡(luò)圖如圖2 所示。
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡化圖
假設(shè)數(shù)據(jù)樣本集合為S,q為輸入樣本數(shù),輸出神經(jīng)元數(shù)為m,中間的節(jié)點(diǎn)數(shù)為p,將S劃分為不同的樣本類Si,其中i=1,…,q,Ti為對應(yīng)的輸出樣本,Ai為網(wǎng)絡(luò)的實(shí)際輸出樣本,利用誤差來改變權(quán)值,目的是使兩者的誤差達(dá)到最小[9],神經(jīng)元連接的權(quán)值為w,閾值為b,那么中間神經(jīng)元j的輸出H表示如下:
其中,f為激勵函數(shù)。設(shè)定,則利用上述計算結(jié)果,樣本輸出結(jié)果為可以將網(wǎng)絡(luò)輸出的數(shù)據(jù)與實(shí)際數(shù)據(jù)進(jìn)行比較,樣本集合的誤差設(shè)為e,根據(jù)網(wǎng)絡(luò)預(yù)測的輸出結(jié)果Ai和目標(biāo)期望的輸出Ti計算預(yù)測誤差,即e=Ti-Ai,然后利用誤差e進(jìn)行反向傳播,同時利用誤差e調(diào)整各個網(wǎng)絡(luò)層的連接權(quán)值。設(shè)學(xué)習(xí)速率為η,神經(jīng)網(wǎng)絡(luò)的連接權(quán)值wj+1,p+1可以表示為:
其中,當(dāng)預(yù)測的誤差值通過迭代達(dá)到預(yù)期的設(shè)定結(jié)果時,結(jié)束權(quán)重值的更新,否則重新從隱含層的計算輸出開始,進(jìn)行循環(huán)操作。
對于網(wǎng)絡(luò)的效果采用Pearson 相關(guān)系數(shù)r和均方根誤差RMSE來進(jìn)行評價[10],均方根越接近0,模型效果越好,系數(shù)r值越趨近于1,模型準(zhǔn)確率越高[11-12],其計算公式如式(3)所示。
其中,數(shù)據(jù)樣本集合S的測試屬性選擇信息誤差最低的屬性,基于其創(chuàng)建神經(jīng)元,然后對對應(yīng)屬性的各個值進(jìn)行創(chuàng)建處理,并作為劃分樣本的依據(jù)。
結(jié)合歐式幾何的狀態(tài)模型[13],用“治理度”表征治理指標(biāo),用Zr表示,其表達(dá)式如式(5)所示。
其中,r代表城市治理的現(xiàn)代化指標(biāo),|Mr|為各個影響因素指標(biāo)的空間矢量的模,為各個指標(biāo)在狀態(tài)空間的坐標(biāo)值,q為指標(biāo)數(shù),wi為軸的權(quán)重值。當(dāng)Zr>1 時,政府治理能力不合格;當(dāng)Zr<1 時,政府治理能力合格;當(dāng)Zr=1 時,政府治理能力處于合格與不合格的臨界狀態(tài)。政府現(xiàn)代化治理能力會在臨界狀態(tài)的20%左右浮動,系統(tǒng)容差為40%,所以對應(yīng)的劃分等級為5 個,分別為優(yōu)秀、良好、中等、及格、不及格,用于體現(xiàn)治理能力的好壞,診斷的劃分依據(jù)如表1 所示。
表1 治理指標(biāo)能力劃分
文中數(shù)據(jù)來源為某省市的經(jīng)濟(jì)和基礎(chǔ)設(shè)施調(diào)查數(shù)據(jù),對該城市治理指標(biāo)采用2000~2008 年共計9 年的城市信息數(shù)據(jù),其中所選的城市主要信息為城市發(fā)展必需的各類基本信息(經(jīng)濟(jì)、資源、環(huán)境、人口)[14],考慮了對中國社會發(fā)展有重大影響以及政府的重點(diǎn)關(guān)注領(lǐng)域。首先最重要的指標(biāo)就是人口,人口會影響到社會勞動力、消費(fèi)能力[15]。人口總量多意味著該地方的勞動力豐富,人口是政府治理現(xiàn)代化中不可或缺的重要部分。其次是經(jīng)濟(jì)實(shí)力,經(jīng)濟(jì)實(shí)力強(qiáng)大會導(dǎo)致政府治理的資金支持充足,經(jīng)濟(jì)發(fā)達(dá)可以保證治理工作的順利進(jìn)行[16]。然后是資源與環(huán)境,資源指標(biāo)是政府治理的發(fā)展基礎(chǔ),是現(xiàn)代化產(chǎn)業(yè)的基礎(chǔ),而環(huán)境是現(xiàn)代化政府必須要考慮的特征指標(biāo)。上述特征指標(biāo)為治理現(xiàn)代化的實(shí)現(xiàn)提供強(qiáng)大的保證。
為了提供數(shù)據(jù)預(yù)處理的質(zhì)量和效率,提高模型處理信息的準(zhǔn)確性,需要對數(shù)據(jù)進(jìn)行清理,例如某些城市信息的缺失等[17]。隨后需要進(jìn)行數(shù)據(jù)集成,基于數(shù)據(jù)庫技術(shù),根據(jù)城市的治理指標(biāo)分別計算,對政府治理的特征參數(shù)進(jìn)行匹配,將其合并在一起。緊接著需要進(jìn)行數(shù)據(jù)歸一化,從而減少模型訓(xùn)練的工作量,提高效率。
根據(jù)BP 算法在MatLab 支持下采用滾動方式預(yù)測出2012~2019 年經(jīng)濟(jì)、資源、環(huán)境及人口因素的變化趨勢:先用各因素層前三年歸一化數(shù)據(jù)預(yù)測第四年的歸一化數(shù)據(jù)。反復(fù)直至滿足預(yù)測精度,即以2000 年到2008 年9 個樣本作為輸入,以2003 年到2011 年的數(shù)據(jù)作為網(wǎng)絡(luò)輸出。為保證訓(xùn)練的可靠性,采用2003 年到2011 年的數(shù)據(jù)進(jìn)行交叉檢驗。經(jīng)過數(shù)據(jù)收集和篩選后,以2000 年到2008 年9 個樣本作為有效的數(shù)據(jù)輸入,通過交叉檢驗,使誤差達(dá)到較為滿意的水平。在訓(xùn)練的過程中,隱含層的激勵函數(shù)為tansig,輸出層的激勵函數(shù)是logsig,訓(xùn)練函數(shù)則采用trainrp。為了加快整體速度,學(xué)習(xí)速率設(shè)置為0.1,訓(xùn)練誤差為0.001%,訓(xùn)練過程中的動態(tài)參數(shù)以及sigmoid 參數(shù)設(shè)置為默認(rèn)值,以此城市治理現(xiàn)代化指標(biāo)的評價及預(yù)測結(jié)果進(jìn)行分析。
根據(jù)BP 神經(jīng)網(wǎng)絡(luò)模型分析結(jié)果可知,城市治理的特征指標(biāo)受人口因素的指標(biāo)影響最大。但是只按照人口這個單一因素指導(dǎo)政府治理現(xiàn)代化,并不會達(dá)到十分有效的結(jié)果,因為造成政府治理現(xiàn)代化較差的因素很多。影響政府治理現(xiàn)代化的第二大因素為經(jīng)濟(jì)因素。參考城市總體4 種指標(biāo)的實(shí)際值,接下來對分析模型進(jìn)行圖形評價,說明該量化模型的指標(biāo)水平,各因素指標(biāo)的神經(jīng)網(wǎng)絡(luò)模型預(yù)測檢驗結(jié)果分別如表2~5 所示。
表2 經(jīng)濟(jì)因素特征指標(biāo)神經(jīng)網(wǎng)絡(luò)模型預(yù)測檢驗表
表3 資源因素特征指標(biāo)神經(jīng)網(wǎng)絡(luò)模型預(yù)測檢驗表
表4 環(huán)境因素特征指標(biāo)神經(jīng)網(wǎng)絡(luò)模型預(yù)測檢驗表
表5 人口因素特征指標(biāo)神經(jīng)網(wǎng)絡(luò)模型預(yù)測檢驗表
根據(jù)分析結(jié)果可知,總體上,該城市的治理結(jié)果較差。其中,應(yīng)該重點(diǎn)關(guān)注環(huán)境保護(hù)問題,可以在城市污水處理、工業(yè)節(jié)能、廢棄物循環(huán)利用等方面進(jìn)行監(jiān)督,從城市環(huán)境治理問題等基礎(chǔ)方面進(jìn)行夯實(shí),并督促相關(guān)部門進(jìn)行合理整改,爭取在一年或兩年內(nèi)提升城市現(xiàn)代化程度。
為了測試該BP 神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性,將剩余的部分?jǐn)?shù)據(jù)作為測試數(shù)據(jù),用于檢驗該決策模型的準(zhǔn)確率。
根據(jù)測試結(jié)果可知,在進(jìn)行模型構(gòu)建的過程中,相比于實(shí)際城市管理因素的發(fā)展,政府治理現(xiàn)代特征指標(biāo)的預(yù)測正確率高達(dá)87.53%,因此該模型的準(zhǔn)確率較高,可以用于指導(dǎo)政府對于城市經(jīng)濟(jì)、環(huán)境等問題的治理,提高政府決策的高效性。
文中介紹了大數(shù)據(jù)技術(shù)和BP 神經(jīng)網(wǎng)絡(luò)模型的原理。利用數(shù)據(jù)處理技術(shù)對某城市的城市治理特征指標(biāo)進(jìn)行了分析研究,首先通過對數(shù)據(jù)的搜集和預(yù)處理,得到了適應(yīng)于數(shù)據(jù)分析和模型構(gòu)建的政府城市治理的指標(biāo),并將其整理成數(shù)據(jù)表[18];同時,對其進(jìn)行了分類研究,建立了BP 網(wǎng)絡(luò)神經(jīng)模型,定性定量地對城市治理特征指標(biāo)做出動態(tài)預(yù)測。最后,利用剩余的測試數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性進(jìn)行了測試,結(jié)果表明,其準(zhǔn)確度高達(dá)87.53%,準(zhǔn)確率較高,可用于對政府治理現(xiàn)代化特征指標(biāo)的預(yù)測。