亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于分型插值模型與BP神經(jīng)網(wǎng)絡(luò)模型的輿情預(yù)測(cè)對(duì)比分析

        2021-02-07 11:13:24李藍(lán)汐
        無(wú)線(xiàn)互聯(lián)科技 2021年22期
        關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò)微博輿情

        李藍(lán)汐

        摘 要:文章分別運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型對(duì)水污染微博數(shù)量的年變化過(guò)程和一次事件的變化過(guò)程進(jìn)行預(yù)測(cè)研究,分析和比較兩種方法的適用性。研究表明,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)全年輿情變化的精度高于分形插值模型,而分形插值模型預(yù)測(cè)一次輿情過(guò)程的精度高于BP神經(jīng)網(wǎng)絡(luò)模型,在微博輿情預(yù)測(cè)上各有優(yōu)劣。分形插值模型的輿情預(yù)測(cè)結(jié)果具有預(yù)測(cè)誤差率較小、預(yù)測(cè)結(jié)果偏低和預(yù)測(cè)后一個(gè)時(shí)間點(diǎn)數(shù)值的準(zhǔn)確率比預(yù)測(cè)長(zhǎng)期輿情規(guī)律要準(zhǔn)確的特性,適用于預(yù)測(cè)突發(fā)隨機(jī)事件的輿情。

        關(guān)鍵詞:輿情;微博;預(yù)測(cè);BP神經(jīng)網(wǎng)絡(luò);分形插值

        1 研究背景

        預(yù)測(cè)是指在對(duì)預(yù)測(cè)對(duì)象的過(guò)去和現(xiàn)在進(jìn)行相應(yīng)調(diào)查和分析之后,找出對(duì)象發(fā)展變化的實(shí)質(zhì),根據(jù)找出的實(shí)質(zhì)來(lái)預(yù)測(cè)對(duì)象將來(lái)的發(fā)展變化情況[1]。預(yù)測(cè)分析是在對(duì)事物未來(lái)科學(xué)分析的基礎(chǔ)上,對(duì)事物發(fā)展和變化的規(guī)律性的調(diào)查和研究[2]。

        輿情預(yù)測(cè)的研究可以分為兩大類(lèi):一類(lèi)是以數(shù)理統(tǒng)計(jì)和微積分等傳統(tǒng)的數(shù)學(xué)物理方法為基礎(chǔ)的預(yù)測(cè)模型,如:微分方程模型、時(shí)間序列模型、參數(shù)回歸模型;另一類(lèi)是基于智能機(jī)器學(xué)習(xí)算法的預(yù)測(cè)模型,如:灰色理論模型、支持向量機(jī)模型、神經(jīng)網(wǎng)絡(luò)模型、馬爾科夫模型,這些方法各有優(yōu)缺點(diǎn)。

        1986年Barnsley 基于自相似性原理和迭代函數(shù)系理論提出了分形插值方法,適合于具有分形特征的曲線(xiàn)、曲面或非平穩(wěn)數(shù)據(jù)的擬合,為函數(shù)逼近理論和計(jì)算機(jī)圖形學(xué)提供了新思想、新工具,已廣泛應(yīng)用于自然科學(xué)、社會(huì)科學(xué)和工程技術(shù)的眾多領(lǐng)域。

        本文以水污染網(wǎng)絡(luò)輿情(微博數(shù)量)為研究對(duì)象,運(yùn)用分形插值模型和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)水污染微博數(shù)量的年變化過(guò)程和一次事件的變化過(guò)程進(jìn)行預(yù)測(cè)研究,分析比較兩種方法的適用性。

        2 水污染微博輿情預(yù)測(cè)方法與功能

        2.1 水污染微博輿情預(yù)測(cè)方法概述

        考慮到水污染微博輿情既有日常的話(huà)題討論,又有水污染事件發(fā)生時(shí)的微博輿情突然增大到減少的過(guò)程,因此選擇具有學(xué)習(xí)訓(xùn)練能力的BP神經(jīng)網(wǎng)絡(luò)模型和具有擬合非線(xiàn)性、不光滑、非平穩(wěn)過(guò)程的分形插值模型。

        BP神經(jīng)網(wǎng)絡(luò)模型通過(guò)數(shù)據(jù)訓(xùn)練,即確定兩組數(shù)組:一組為輸入數(shù)組,一組為輸出數(shù)組。當(dāng)輸入某一數(shù)組后,對(duì)數(shù)據(jù)進(jìn)行反復(fù)迭代使輸出的結(jié)果與既定輸出數(shù)組值接近,以確定各神經(jīng)節(jié)點(diǎn)的權(quán)重,并根據(jù)該神經(jīng)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)未來(lái)的數(shù)據(jù)。如以2015年的水污染微博輿情時(shí)間分布變化為輸入數(shù)組,2016年的水污染微博輿情時(shí)間分布變化為輸出數(shù)組,反復(fù)進(jìn)行迭代以確定神經(jīng)節(jié)點(diǎn)的權(quán)重。確定權(quán)重后可根據(jù)該神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)其他時(shí)間段的微博輿情時(shí)間變化分布。其優(yōu)勢(shì)體現(xiàn)在方法成熟,非線(xiàn)性擬合能力良好,目前BP神經(jīng)網(wǎng)絡(luò)是輿情預(yù)測(cè)技術(shù)中最為常見(jiàn)的技術(shù),已有現(xiàn)有研究證明,BP神經(jīng)網(wǎng)絡(luò)模型與其他的時(shí)間序列模型、微分方程模型相比具有更好的穩(wěn)定性和優(yōu)越性。

        分形插值是分形幾何理論及其應(yīng)用研究中的一個(gè)重要內(nèi)容,它能很好地刻畫(huà)現(xiàn)實(shí)中存在的復(fù)雜的曲線(xiàn)或曲面[3]。由于分形插值函數(shù)具有很強(qiáng)的靈活性和穩(wěn)定性[4],只要適當(dāng)調(diào)整其參數(shù),所形成的插值曲線(xiàn)的維數(shù)就能取到1和2之間的任意值,因此它既可以擬合光滑曲線(xiàn)和平穩(wěn)數(shù)據(jù),更是在不光滑曲線(xiàn)和非平穩(wěn)數(shù)據(jù)的擬合中顯示出獨(dú)特的優(yōu)勢(shì)。此外,利用分形插值的外延特性,即可以根據(jù)過(guò)去的規(guī)律預(yù)測(cè)未來(lái)時(shí)間點(diǎn)的數(shù)值。

        3 水污染微博輿情時(shí)間變化預(yù)測(cè)的比較

        微博作為網(wǎng)民高活躍度、信息高透明化的平臺(tái),對(duì)日常輿情和突發(fā)輿情反應(yīng)敏感,本文以2015年1月1日至2017年12月31日微博平臺(tái)上涉及的“水污染”輿情的微博數(shù)量隨時(shí)間變化作為研究對(duì)象,分別采用BP神經(jīng)網(wǎng)絡(luò)模型和分形插值方法進(jìn)行實(shí)驗(yàn)和預(yù)測(cè)研究。

        為了比較兩種預(yù)測(cè)模型對(duì)水污染微博輿情時(shí)間變化的預(yù)測(cè)精度,分別對(duì)1年和一次事件(10天左右)的預(yù)測(cè)結(jié)果進(jìn)行比較分析。

        3.1 一年微博輿情過(guò)程預(yù)測(cè)比較

        采用BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型對(duì)2017年每日微博數(shù)預(yù)測(cè)與實(shí)際值比較如圖1所示。仍采用計(jì)算值與實(shí)際值之差的絕對(duì)值作為誤差,對(duì)累計(jì)誤差平均值進(jìn)行統(tǒng)計(jì),得BP神經(jīng)網(wǎng)絡(luò)模型的累積平均誤差為49,分形插值模型的累積平均誤差為52。由此可見(jiàn),對(duì)于一年這樣長(zhǎng)時(shí)間的水污染微博輿情預(yù)測(cè),BP神經(jīng)網(wǎng)絡(luò)模型經(jīng)過(guò)2015和2016年兩年的數(shù)據(jù)訓(xùn)練,其預(yù)測(cè)值與實(shí)際值的累積平均誤差小于分形插值模型;但從圖形上看,BP神經(jīng)網(wǎng)絡(luò)模型對(duì)峰值的預(yù)測(cè)能力不如分形插值模型,不過(guò)由于分形插值法預(yù)測(cè)的微博峰值與實(shí)際峰值之間存在著相位差,因此統(tǒng)計(jì)的累積誤差還是比BP神經(jīng)網(wǎng)絡(luò)模型大。

        3.2 一次微博輿情過(guò)程預(yù)測(cè)比較

        一次微博輿情從開(kāi)始增加-到達(dá)峰值-然后下降的整個(gè)發(fā)展過(guò)程也是十分關(guān)心的問(wèn)題。從2017年微博數(shù)變化可以看出,單日微博數(shù)超過(guò)500條的有4次,即2017年1月6日、6月3日、8月 15日和9月7日,下面分別針對(duì)其中3個(gè)高微博數(shù)輿情過(guò)程,比較兩種模型的預(yù)測(cè)結(jié)果,預(yù)測(cè)時(shí)所用方法和參數(shù)均與一年微博輿情過(guò)程預(yù)測(cè)相同。

        3.2.1 事件一

        2017年1月1日至13日是由柴靜霧霾調(diào)查引發(fā)的一次水污染話(huà)題微博突然增加的過(guò)程,在13天里共有微博2077條,每日平均約159.8條,單日最少微博數(shù)49條,單日最多538條(1月6日)(見(jiàn)圖2)。從BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型的預(yù)測(cè)結(jié)果(見(jiàn)圖3)看,兩個(gè)模型預(yù)測(cè)的峰值都比實(shí)際發(fā)生時(shí)間滯后1天,且都沒(méi)有達(dá)到實(shí)際的峰值,相對(duì)而言,分形插值模型預(yù)測(cè)的峰值比BP神經(jīng)網(wǎng)絡(luò)模型要高一點(diǎn);分形插值模型預(yù)測(cè)的日最小微博數(shù)也與實(shí)際值更接近,但分形插值模型預(yù)測(cè)的日平均微博數(shù)不如BP神經(jīng)網(wǎng)絡(luò)模型與實(shí)際值接近;BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型預(yù)測(cè)的總微博數(shù)均較實(shí)際值小10%和20%。具體特征值比較如表1所示。

        3.2.2 事件二

        2017年6月1日至9日是由兒童飲用水引發(fā)的關(guān)于水污染話(huà)題微博突增的過(guò)程,9天內(nèi)共有微博1 550條,每日平均約172.2條,單日最少微博48條,單日最多687條(6月3日)。從BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型預(yù)測(cè)的結(jié)果看,分形插值模型預(yù)測(cè)的峰值比實(shí)際發(fā)生時(shí)間滯后1天、峰值達(dá)到實(shí)際的58%、日最少微博數(shù)也與實(shí)際值相同;BP神經(jīng)網(wǎng)絡(luò)模型沒(méi)有預(yù)測(cè)出峰值,日均微博數(shù)與分形插值模型預(yù)測(cè)值接近,但都小于實(shí)際值。BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型預(yù)測(cè)的總微博數(shù)較實(shí)際值分別小36.8%和32%。具體特征值比較如表2所示。

        3.2.3 事件三

        2017年8月12日至20日是由雄安新區(qū)治理水污染政策發(fā)布引發(fā)的關(guān)于水污染話(huà)題微博突增的過(guò)程,9天里共有微博2376條,每日平均約264條,單日最少微博105條,單日最多947條(8月15日)。從BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型預(yù)測(cè)的結(jié)果看,BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型預(yù)測(cè)的峰值均比實(shí)際發(fā)生時(shí)間滯后1天,兩者預(yù)測(cè)的峰值分別是實(shí)際峰值的32%和62.3%;分形插值模型預(yù)測(cè)的日最小微博數(shù)小于實(shí)際值、但大于BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)值;BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的日均微博數(shù)與實(shí)際值接近,分形插值模型預(yù)測(cè)的日均微博數(shù)比實(shí)際值大34%;BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型預(yù)測(cè)的總微博數(shù)較實(shí)際值分別小26.3%和14.5%。具體特征值比較如表3所示。

        3.3 水污染微博輿情時(shí)空變化預(yù)測(cè)結(jié)果分析討論與啟示

        3.3.1 分形插值模型預(yù)測(cè)結(jié)果的原因分析

        (1)預(yù)測(cè)誤差率較小。分形插值模型因?yàn)橛袇?shù)的隨機(jī)性,因而在預(yù)測(cè)不確定事件中顯示出一定的優(yōu)勢(shì),因此預(yù)測(cè)準(zhǔn)確性較高。

        (2)預(yù)測(cè)結(jié)果偏低。筆者認(rèn)為原因在于預(yù)測(cè)過(guò)程中對(duì)于預(yù)測(cè)點(diǎn)yN+1采用了以步長(zhǎng)ε=0.01從0到1進(jìn)行逐步搜索方法,找到最小均方差對(duì)應(yīng)的yB。因此在預(yù)測(cè)累計(jì)微博數(shù)的時(shí)候就會(huì)出現(xiàn)低于實(shí)際值的情況。

        (3)預(yù)測(cè)后一個(gè)時(shí)間點(diǎn)數(shù)值的準(zhǔn)確率比預(yù)測(cè)長(zhǎng)期輿情規(guī)律要準(zhǔn)確。由于分形插值模型的外延性特征,適用于預(yù)測(cè)后一個(gè)未知時(shí)間點(diǎn)的數(shù)值,但預(yù)測(cè)后若干個(gè)時(shí)間點(diǎn)結(jié)果精度較低。若將較長(zhǎng)的輿情序列分成多個(gè)部分進(jìn)行預(yù)測(cè),分形插值模型的參數(shù)將有所變化,會(huì)有效提高預(yù)測(cè)結(jié)果的準(zhǔn)確度。

        3.3.2 BP神經(jīng)網(wǎng)絡(luò)模型與分形插值模型的預(yù)測(cè)結(jié)果差異及原因分析

        在水污染輿情變化預(yù)測(cè)過(guò)程中,其預(yù)測(cè)結(jié)果上BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)長(zhǎng)時(shí)間輿情更為準(zhǔn)確,分形插值模型預(yù)測(cè)一次微博突增的事件更為準(zhǔn)確。

        對(duì)于長(zhǎng)時(shí)間(一年)的水污染輿情預(yù)測(cè),BP神經(jīng)網(wǎng)絡(luò)模型的累積平均誤差小于分形插值模型;對(duì)于一次微博數(shù)突增的事件過(guò)程,分形插值模型在每日最多微博數(shù)、微博總數(shù)和日均微博數(shù)上的平均誤差小于BP神經(jīng)網(wǎng)絡(luò)模型。

        上述預(yù)測(cè)結(jié)果差異的根本原因在于BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型的原理不同。BP神經(jīng)網(wǎng)絡(luò)模型是一種以數(shù)據(jù)樣本進(jìn)行訓(xùn)練為基礎(chǔ)的基于智能機(jī)器算法的預(yù)測(cè)模型,而分形插值模型預(yù)測(cè)是根據(jù)分形理論所特有的隨機(jī)性和不確定性進(jìn)行預(yù)測(cè)的模型,基于傳統(tǒng)統(tǒng)計(jì)學(xué)理論。

        4 結(jié)語(yǔ)

        本文基于微博平臺(tái),對(duì)水污染輿情進(jìn)行分析并設(shè)計(jì)水污染輿情預(yù)測(cè)的實(shí)驗(yàn)方案對(duì)水污染微博輿情進(jìn)行預(yù)測(cè)。得到以下結(jié)論:

        (1)水污染微博輿情根據(jù)時(shí)空變化特征分為一般水污染微博輿情和水污染突發(fā)事件微博輿情,以一般水污染微博輿情數(shù)量較少、波動(dòng)較小,水污染突發(fā)事件微博輿情迅猛增長(zhǎng)、波動(dòng)大為特征。

        (2)本文運(yùn)用BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型對(duì)水污染微博輿情時(shí)間分布進(jìn)行預(yù)測(cè)。根據(jù)2015年1月1日至2016年12月31日水污染微博輿情時(shí)間分布,建立上述兩種模型預(yù)測(cè)2017年全年時(shí)間分布,并與2017年全年實(shí)測(cè)微博輿情分布情況進(jìn)行比較。由于分形模型預(yù)測(cè)是基于分形理論所特有的隨機(jī)性和不確定性,在預(yù)測(cè)不確定事件中顯示出一定的優(yōu)勢(shì)。通過(guò)兩種方法的對(duì)比可知,對(duì)于全年輿情,BP神經(jīng)網(wǎng)絡(luò)模型所預(yù)測(cè)的2017年微博數(shù)比分形插值模型預(yù)測(cè)的精度要高一些;對(duì)于一次微博數(shù)量徒增的峰值預(yù)測(cè),而分形插值模型的預(yù)測(cè)結(jié)果比BP神經(jīng)網(wǎng)絡(luò)模型更接近實(shí)際峰值,分形插值模型預(yù)測(cè)的每日最少微博數(shù)、最多微博數(shù)和平均誤差比BP神經(jīng)網(wǎng)絡(luò)模型更接近實(shí)際值,日平均微博數(shù)不如BP神經(jīng)網(wǎng)絡(luò)模型的接近實(shí)際值。此外,由于分形插值理論的特性,該理論在更適用于連續(xù)的非線(xiàn)性曲線(xiàn)的預(yù)測(cè)中,因此對(duì)于大量的連續(xù)時(shí)間區(qū)間內(nèi)的輿情,分形插值理論的預(yù)測(cè)方法可以得到更加連貫的預(yù)測(cè)結(jié)果。通過(guò)BP神經(jīng)網(wǎng)絡(luò)模型和分形插值模型對(duì)水污染微博輿情時(shí)間分布的預(yù)測(cè)實(shí)驗(yàn)顯示出兩種模型由于其理論不同,在微博輿情預(yù)測(cè)上各有優(yōu)勢(shì)。

        [參考文獻(xiàn)]

        [1]GLYNN C J. The spiral of silence: public opinion--our social skin. by Elisabeth Noelle-Neumann University of Chicago Press[J]. Social Forces,1986(3):828-829.

        [2]張華. 基于優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的微博輿情預(yù)測(cè)模型研究[D].武漢:華中師范大學(xué),2014.

        [3]BARNSLEY M F. Fractal functions and interpolation[J].Constructive Approximation,1986(2):303-329.

        [4]WANG H Y, YU J S. Fractal interpolation functions with variable parameters and their analytical properties[J].Journal of Approximation Theory,2013(175):1-18.

        (編輯 姚 鑫)

        Comparison and analysis of microblog public opinion prediction of water pollution based on type interpolation model and BP neural network model

        Li Lanxi

        ( Business School, Hohai University , Nanjing 210000, China)

        Abstract:This paper takes the quantitative characteristics of micro blog public opinion of water pollution as the research object, obtains micro blog data related to water pollution through crawler tools, uses BP neural network model and fractal interpolation model respectively to predict the annual change process of water pollution micro blog number and the change process of an event, analyzes and compares the applicability of the two methods. The research shows that the accuracy of BP neural network model is higher than that of fractal interpolation model, while the accuracy of fractal interpolation model is higher than that of BP neural network model. There are advantages and disadvantages in microblog public opinion prediction. The results of the model are low and the error rate is small, and the accuracy rate of the last time point is more accurate than that of the long-term public opinion, so it is suitable to predict the public opinion of the unexpected random events.

        Key words:public opinion; microblog; prediction; BP neural network; fractal interpolation

        猜你喜歡
        BP神經(jīng)網(wǎng)絡(luò)微博輿情
        青少年數(shù)字素養(yǎng)的社會(huì)與文化內(nèi)涵及其教育啟示
        基于BP神經(jīng)網(wǎng)絡(luò)的旅行社發(fā)展方向研究
        商情(2016年39期)2016-11-21 09:30:36
        復(fù)雜背景下的手勢(shì)識(shí)別方法
        BP神經(jīng)網(wǎng)絡(luò)在軟件質(zhì)量評(píng)價(jià)中的應(yīng)用研究 
        事實(shí)與流言的博弈
        人間(2016年26期)2016-11-03 18:19:04
        BP神經(jīng)網(wǎng)絡(luò)算法在數(shù)值預(yù)報(bào)產(chǎn)品釋用中的應(yīng)用
        科技視界(2016年20期)2016-09-29 14:15:12
        輿情
        輿情
        輿情
        微博的輿情控制與言論自由
        国产精品黄色片在线看| 国产女高清在线看免费观看| 囯产精品无码一区二区三区AV| 国产视频在线播放亚洲| 国产麻豆久久av入口| 成人精品视频一区二区| 天码av无码一区二区三区四区 | 全部孕妇毛片| 精品999日本久久久影院| 日本老熟欧美老熟妇| 国产精品久久这里只有精品| 国产91极品身材白皙| 内射口爆少妇麻豆| 成人国产精品免费视频| 青榴社区国产精品| 亚洲丰满熟女乱一区二区三区| 欧美黑人又大又粗xxxxx| 精品人妻系列无码人妻免费视频| 免费国产h视频在线观看86| 91国产熟女自拍视频| 97久人人做人人妻人人玩精品| 欧美巨大xxxx做受中文字幕| 久久精品国产只有精品96| 国产精品女同一区二区软件| 一女被多男玩喷潮视频| 亚洲熟女少妇一区二区| 人妻少妇喷水意淫诱惑| 日本一区三区三区在线观看| 亚洲综合色区另类av| 欧美日韩亚洲成色二本道三区 | 中文字幕av一区二区三区人妻少妇 | 深夜爽爽动态图无遮无挡| 亚洲一区av无码少妇电影| 欧美亚洲日韩国产人成在线播放| 日本一区二区在线免费看| 国产好大好硬好爽免费不卡| 无码人妻少妇久久中文字幕蜜桃| 自拍偷拍亚洲视频一区二区三区| 无套中出丰满人妻无码| 大地资源中文第三页| 久久麻豆精亚洲av品国产蜜臀|