張云開 華 維 劉雨潤 劉美希 張峻鎧 張琪龍
(1.成都信息工程大學大氣科學學院/高原大氣與環(huán)境四川省重點實驗室/四川省氣象災害預測預警工程實驗室,四川 成都 610225;2.中國科學院大氣物理研究所竺可楨-南森國際研究中心,北京 100029)
網絡媒體傳播所具有的相對自由開放、及時廣泛的特點使之成為一種重要的輿情反映[1]。近年來,隨著互聯(lián)網技術的快速發(fā)展以及網民數(shù)量的不斷增加,越來越多的民眾利用互聯(lián)網搜索功能查詢所需信息。大量網民的網絡搜索形成了海量行為數(shù)據(jù),而互聯(lián)網平臺則以相關搜索數(shù)據(jù)為基礎形成了各類網絡搜索指數(shù),通過網絡搜索指數(shù)即可獲取關鍵詞搜索特征與趨勢、網民興趣和需求、輿情動向,以及定位受眾特征等信息[2]。在各類互聯(lián)網搜索引擎中,百度搜索作為全球最大的中文搜索引擎,具有搜索功能強大、信息獲取方式便捷等特點,被廣泛應用于生產生活中。許多學者基于百度指數(shù)分析了公眾對不同信息的關注程度。如張繼德等[3]基于百度指數(shù)研究了投資者關注度對股市的影響。熊麗芳等[4]采用百度指數(shù)研究了長三角核心城市網絡特征。吳湘華等[5]探討了百度指數(shù)在期刊網絡影響力評價中的應用。劉璐等[6]采用氣溫、降水、相對濕度等氣候資料和百度指數(shù)對山東蓬萊氣候舒適度與旅客網絡關注度的關系進行了分析,并發(fā)現(xiàn)旅客網絡關注度年內改變在一定程度上受氣候影響。
隨著中國經濟社會的快速發(fā)展以及全球變暖引起的極端天氣氣候事件不斷增加,天氣狀況及氣象災害對經濟社會和民眾生活的影響愈加明顯,而民眾也越來越傾向于利用互聯(lián)網查詢和了解實時及未來天氣變化信息。因此,不少學者開始利用百度指數(shù)等網絡搜索指數(shù)分析用戶氣象網絡關注度的時空分布特征,從而了解用戶和民眾的氣象信息需求和偏好。馬麗君等[7]基于海量城市氣候舒適度和游客網絡關注度數(shù)據(jù)對中國30個城市氣候舒適度和游客網絡關注度進行了時空變化分析,并建立了氣候舒適度與游客網絡關注度時空相關模型。張春慧等[8]利用相對濕度和氣溫指數(shù)研究了東中西部代表性古城烏鎮(zhèn)、鳳凰和麗江網絡關注度時空分布及其與氣候變化間的聯(lián)系。公眾往往通過互聯(lián)網獲取某地氣象信息以方便生活和工作。因此,天氣預報網絡關注度可視為公眾對氣象信息需求狀況的一種直觀表現(xiàn)。謝慷等[9]以氣象災害防御為主題進行了網絡公眾調查,并根據(jù)網絡調查結果總結了氣象災害防御改進方法。周威等[10]利用逐日氣象觀測資料和百度指數(shù),采用多種統(tǒng)計方法分析了長沙市氣溫、降水、相對濕度和日照時數(shù)等氣象因子與當?shù)厝蚵糜魏袜l(xiāng)村旅游的關系,并指出游客人數(shù)受氣象條件影響明顯。
天氣預報是公眾關注的社會熱點,因此了解民眾對天氣預報的關注度有利于氣象行業(yè)提高公共氣象服務水平,但以往研究多集中于天氣預報準確度、氣候變化、天氣診斷分析等領域,而對天氣預報網絡關注度的分析還較少涉及。因此,本文將“天氣預報”作為檢索詞,以百度指數(shù)為工具,通過獲取公眾對“天氣預報”的整體搜索量、地區(qū)搜索量、年均搜索量信息,并結合經濟社會統(tǒng)計數(shù)據(jù)分析中國天氣預報網絡關注度的時空變化特征及其影響因素。
所用資料包括:(1)網絡搜索指數(shù)。使用百度指數(shù)進行天氣預報關注度研究,該搜索指數(shù)以網民在百度網站進行的搜索行為數(shù)據(jù)為基礎,以搜索關鍵詞為統(tǒng)計對象計算特定關鍵詞在百度網站中搜索頻次的加權綜合,從而能夠直觀地對網民網絡關注度的時空分布和變化特征進行分析。百度指數(shù)以省級行政區(qū)為單位,將“天氣預報”作為關鍵詞檢索中國31個省級行政區(qū)(不含港澳臺地區(qū))的天氣預報關注度數(shù)據(jù),檢索時段為2011年1月-2019年12月。根據(jù)網民使用的百度搜索終端差異,指數(shù)可為PC端搜索指數(shù)和移動端搜索指數(shù),其中2011年1月-2013年5月百度指數(shù)僅包括PC端數(shù)據(jù),不含移動端數(shù)據(jù),自2013年6月起包含PC端和移動端兩部分搜索數(shù)據(jù)。(2)《中國統(tǒng)計年鑒》[11]提供的2011-2019年中國31個省級行政區(qū)(不含港澳臺地區(qū))的經濟和自然災害損失等統(tǒng)計數(shù)據(jù)。
采用變異系數(shù)分析不同地區(qū)網民天氣預報關注度的時空差異特征。該參數(shù)可用于分析數(shù)據(jù)序列的變異程度,并被廣泛應用于對網絡關注度的差異分析中[12-15]。變異系數(shù)計算公式如下:
式中,Cv為變異系數(shù),yi為第i個月天氣預報關注度,為yi的平均值。變異系數(shù)越大,代表不同月份間的天氣預報網絡關注度差異越明顯。
基尼系數(shù)是一種定量測定收入分配差異程度的指標,主要用于評估某一國家或地區(qū)內的居民收入差距[16-17]。引入基尼系數(shù)計算不同省份以及東、中和西部地區(qū)間天氣預報關注度的空間差異,其計算公式如下:
式中,G為基尼系數(shù),W為N個省級行政區(qū)的天氣預報關注度總和,Qi和Qj分別代表第i和j個省級行政區(qū)的天氣預報關注度,N=31為省級行政區(qū)數(shù)量?;嵯禂?shù)越大,代表省際或區(qū)域間的天氣預報關注度越大。
采用相關系數(shù)[18]探討天氣預報網絡關注度與區(qū)域經濟發(fā)展水平、居民人均可支配收入及自然災害損失等影響因素的關系,其計算公式如下:
2011-2019年全國日均天氣預報網絡關注度如圖1所示。由圖可知,2011-2019年,歷年搜索指數(shù)年均值分別為 129201、115508、167814、308796、458614、531357、523101、463425和 506379次,整體呈上升趨勢,但也存在明顯的年際變化,其中2011和2012年的天氣預報關注度相對較低,2013-2014年天氣預報關注度開始呈現(xiàn)迅速增長的趨勢,2016年之后天氣預報關注度略有減少,但變化幅度相對較小。中國天氣預報網絡關注度的年際變化與諸多因素有關。一方面,隨著中國經濟社會快速發(fā)展,公眾對天氣預報服務的需求不斷提高,導致近十年間“天氣預報”這一關鍵詞的搜索次數(shù)整體呈上升趨勢[10];另一方面,2013-2015年天氣預報網絡關注度的快速增加可能與智能手機的快速普及有關,公眾更多趨于使用智能手機進行移動搜索替代PC端固定搜索[19]。此外,2016年之后天氣預報關注度減少可能與智能手機自帶有或用戶自行有安裝天氣預報軟件,公眾通過軟件已能便捷獲取某地區(qū)天氣預報信息,而無需再使用搜索引擎進行搜索有關,因而該時間段內的天氣預報關注度主要表現(xiàn)為波動減少的特點。
進一步對天氣預報網絡關注度的年內變化(圖2)進行分析,可以發(fā)現(xiàn),2011-2019年歷年天氣預報網絡關注度的年內變化差異較為明顯,其中2011-2012年年內變化總體表現(xiàn)為春季(3-5月)和夏季(7-8月)關注度相對較高,而秋季(9-10月)和冬季(12-次年1月)較低的特點,且這兩年的關注度最低,其原因可能與2011-2012年百度搜索指數(shù)僅包含PC端數(shù)據(jù),而并未包含移動端搜索數(shù)據(jù)有關。2013年關注度數(shù)據(jù)相對特殊,其原因為當年百度搜索指數(shù)在1-5月期間僅包含PC端數(shù)據(jù),而6-12月則含有PC端和移動端兩部分數(shù)據(jù),不具備代表性,故本文不對其進行深入分析。2014-2019年,天氣預報網絡關注度的年內逐月變化曲線總體為雙峰型結構,即春季和秋末關注度較高,冬末和初秋關注度較低??傮w來看,天氣預報關注度與所處季節(jié)及季節(jié)轉換存在一定聯(lián)系,春季4月天氣狀況并不穩(wěn)定,且公眾出行意愿較強,而11月為秋末和初冬之間的季節(jié)轉換期,因而公眾尤其是兒童和老年人對天氣預報需求較大,故其網絡關注度最高。2月和9月盡管處于季末的季節(jié)轉換期,但因其天氣狀況相對穩(wěn)定,故公眾對天氣預報的關注度的最低。
利用變異系數(shù)計算2011-2019年各年天氣預報網絡關注度的差異程度,見表1,由于2013年數(shù)據(jù)存在一定特殊性,故該年為變異系數(shù)最大,但并不具備代表性。其余年份變異系數(shù)在0.151~0.251,表現(xiàn)出一定的波動趨勢,表明盡管天氣預報網絡關注度的月際差異相對穩(wěn)定,但天氣預報關注度的季節(jié)性差異仍十分明顯。
表1 2011-2019年各月天氣預報網絡關注度(單位:萬次)及變異系數(shù)
公眾對于天氣預報的需求取決于未來天氣狀況及生活和工作安排,因而天氣預報對公眾合理安排日程具有重要作用。圖3為2011-2019年天氣預報網絡關注度的周內分布,可以發(fā)現(xiàn),周內天氣預報網絡關注度差異的年際變化并不明顯,但各年的周內差異十分顯著,主要表現(xiàn)為周一關注度最高,之后緩慢下降,周六下降至最低,而周日關注度又明顯升高的特點。這一特征可能與公眾的生活和工作方式有關,周一為周內首個工作日,相較其余時間而言,公眾對天氣預報的關注度可能更高。隨著時間的推移,公眾對天氣預報的關注度開始下降,而周日關注度增加的可能原因是由于次日(下周一)為下周首個工作日,人們通常希望對次日天氣情況有所了解,因而關注度有所增加。總體來看,天氣預報關注度存在一定的周內差異,但差異并不明顯。
每年春節(jié)、“五一”和“十一”是中國主要的法定節(jié)假日,也被人們稱為“黃金周”。選取春節(jié)、“五一”和“十一”三個主要節(jié)假日數(shù)據(jù)分析其天氣預報網絡關注度特點(圖4)。鑒于節(jié)假日期間公眾對天氣預報的關注具有一定前兆性,故統(tǒng)計時段包括節(jié)假日前、后各3天。
對于“五一”假期(圖4a),2011-2013年主要特點表現(xiàn)為節(jié)假日前3天天氣預報關注度最高,之后逐漸降低直至假期結束,表明為方便出行,公眾在假期之前1~3天已開始通過網絡搜索出行目的地天氣信息。而在2014-2018年,各年“五一”假期前3天天氣預報網絡關注度均呈迅速增加趨勢,且一般在5月1日或2日達到最高,之后開始下降。這一特征與2011-2013年有所差異,其原因可能與近年來私家車數(shù)量迅速增加,民眾出行方式更多變?yōu)椤罢f走就走”的自駕出行,導致公眾在出發(fā)當日才進行天氣預報查詢。2019年變化趨勢與2011-2013年較為類似,關注度在假期前3天達到最高,之后迅速下降。
就“十一”假期而言(圖4b),天氣預報網絡關注度一般在假期前1~3天內達到最高,之后迅速降低,并在假期中段的10月3-4日將至最低,之后逐漸增加,并在假期結束后1~3天內再次達到峰值,總體上表現(xiàn)出假期前后高,而假日期間低的特點。
春節(jié)期間天氣預報關注度變化特征如圖4(c)所示。2014年春節(jié)前3天天氣預報網絡關注度異常偏高,其原因可能與當年春節(jié)前出現(xiàn)的北方干旱、中東部大范圍霧霾天氣,以及南方地區(qū)低溫雨雪天氣等過程有關[1]。其余各年春節(jié)假期前3天天氣預報網絡關注度均高于假期內,尤其假期第1天(除夕)關注度最低,第2天(大年初一)略有增長,之后主要表現(xiàn)為較平緩的變化趨勢。
總體而言,公眾多在假期之前即開始利用網絡搜索天氣預報信息,而假期期間的關注度反而相對較低。此外,近十年間,“五一”期間的天氣預報網絡關注度最高,春節(jié)次之,而“十一”最低,其關注度平均值分別為425865、335734和329758次。此外,三大主要節(jié)假日期間天氣預報網絡關注度的時間差異可能與節(jié)假日期間出行習慣有關,“五一”假期因僅有3天,公眾更趨向在假日期間集中出游,故假期內關注度降低,“十一”假期則有相當部分民眾選擇在假期中段錯峰出行,故中段關注度有所提升,而春節(jié)期間公眾更趨于選擇在家或短途旅行,故關注度變化不大。
以省級行政區(qū)為單位,利用百度指數(shù)分析2011-2019年天氣預報網絡關注度的區(qū)域差異,見圖5,2011-2019年,年均天氣預報網絡關注度排名前十位的省級行政區(qū)依次為北京、山東、河南、江蘇、河北、廣東、浙江、上海、遼寧和湖北,且相關省份均為中國經濟相對發(fā)達地區(qū),同時也是人口密集省份。中國西部地區(qū)以及北方部分省份天氣預報網絡關注度相對較低,其排位多在后十位中。可見,盡管造成不同區(qū)域天氣預報關注度差異的原因眾多,但總體而言,區(qū)域經濟發(fā)展水平和人口數(shù)量是主要的影響因素。
為進一步對比不同省際間以及中國東、中和西部地區(qū)之間公眾天氣預報網絡關注度的空間非均衡性,本文計算了2011-2019年省際和三大地區(qū)間天氣預報網絡關注度基尼系數(shù)(表2)。對于地區(qū)的定義,西部地區(qū)包括四川、云南、貴州、重慶、陜西、甘肅、寧夏、廣西、西藏、新疆和內蒙古;中部地區(qū)包括湖北、湖南、安徽、河南、山西和江西;東部地區(qū)包括北京、天津、上海、江蘇、浙江、山東、廣東、河北、福建和海南。鑒于當?shù)厣鐣洕l(fā)展狀況,參考何小芊等[20]的研究將黑龍江、吉林和遼寧納入中部地區(qū)進行分析。
表2 不同省級行政區(qū)和地區(qū)間天氣預報網絡關注度基尼系數(shù)
由表2可知,不同省際間和東、中和西部區(qū)域內及三大區(qū)域間天氣預報網絡關注存在較為明顯的區(qū)域差異,其中省際間的基尼系數(shù)表現(xiàn)為持續(xù)減小的變化趨勢,基尼系數(shù)最高的年份為2012年,達到0.5147,而最低年份為2019年,僅有0.4363,這表明公眾對天氣預報信息的關注度在持續(xù)增加,各省之間的差異在不斷縮小。進一步由中國三大地區(qū)區(qū)域內天氣預報網絡關注度基尼系數(shù)計算結果可知,東部地區(qū)基尼系數(shù)相對最小,表明其內部差異最小,且總體上表現(xiàn)出隨時間下降的變化趨勢,其中2019年基尼系數(shù)最小,而2016年最大;中部地區(qū)基尼系數(shù)在多數(shù)年份均要高于東部地區(qū),但同樣表現(xiàn)出較明顯的減小趨勢,其基尼系數(shù)由2011年的最高值0.392減小至2019年的最低值0.2644;西部地區(qū)各年基尼系數(shù)在三大區(qū)域中均最大,表明西部地區(qū)內部差異最大,且變化趨勢與東部和中部相反,整體表現(xiàn)出振蕩上升的變化趨勢。此外,三大地區(qū)之間天氣預報網絡關注度差異的變化趨勢與省際間的變化趨勢較為一致,總體呈現(xiàn)逐年下降的變化趨勢,表明盡管中國不同區(qū)域間公眾對天氣預報的關注程度存在明顯差異,但區(qū)域間的差異在不斷減小。
經濟發(fā)展水平在很大程度上決定了公眾對現(xiàn)代氣象服務水平要求的差異,這也是造成不同地區(qū)公眾對天氣預報需求存在明顯差異的重要原因,而與氣象密切相關的自然災害同樣對天氣預報網絡關注度有所影響。表3給出了各省級行政區(qū)天氣預報年均網絡關注度、地區(qū)生產總值、城鎮(zhèn)居民人均可支配收入以及自然災害損失情況多年平均值。由表3可見,各省天氣預報網絡關注度基本與本省的地區(qū)生產總值和城鎮(zhèn)居民人均可支配收入存在較好的對應關系,但自然災害損失則受地域、地形、天氣氣候條件和行政面積等因素影響,各省間天氣預報網絡關注度與自然災害損失的關系存在明顯差異。
表3 各省天氣預報網絡關注度、地區(qū)生產總值、居民人均可支配收入和自然災害損失多年平均值
進一步對天氣預報網絡關注度與不同影響因子間的關系(表4)進行分析。由天氣預報網絡關注度與地區(qū)生產總值、城鎮(zhèn)居民人均可支配收入以及自然災害損失的相關系數(shù)可知,天氣預報網絡關注度與地區(qū)生產總值之間為顯著的正相關關系,相關系數(shù)達到0.773,通過0.01的顯著性水平檢驗;與城鎮(zhèn)居民人均可支配收入間的相關系數(shù)也達到了0.619,同樣通過0.01的顯著性水平檢驗;而與自然災害損失間則為較弱的正相關關系,相關系數(shù)僅為0.086,未通過0.01的顯著性水平檢驗。地區(qū)生產總值與城鎮(zhèn)居民人均可支配收入和自然災害損失間均為顯著的正相關關系。此外,城鎮(zhèn)居民人均可支配收入與自然災害損失間也為負相關關系,這也間接表明天氣預報網絡關注度與不同地區(qū)經濟的發(fā)展和居民收入狀況,以及自然災害損失之間存在較為密切的聯(lián)系。
表4 各省年均網絡關注度、地區(qū)生產總值、居民人均可支配收入和自然災害損失間的相關系數(shù)
本文基于百度搜索指數(shù)和經濟社會統(tǒng)計數(shù)據(jù),采用多種統(tǒng)計分析方法對中國天氣預報網絡關注度的時空特征及影響因素進行分析,得到以下主要結論:
(1)中國公眾天氣預報網絡關注度較高,總體呈現(xiàn)逐年上升的年際變化趨勢。同時,天氣預報網絡關注度的月際變化曲線為雙峰型結構,即春季和秋末較高,而冬末和秋初較低。天氣預報網絡關注度的周內差異并不明顯,主要表現(xiàn)出周一關注度最高,之后緩慢下降,周六下降至最低,而周日關注度又明顯升高的特點;此外,主要節(jié)假日期間天氣預報網絡關注度主要為假日之前較高,而假期期間較低的特點。
(2)中國天氣預報網絡關注度的空間差異明顯,關注度較高的區(qū)域主要是東部經濟發(fā)達地區(qū),而西部較低。天氣預報網絡關注度的省際間差異明顯,但基尼系數(shù)總體呈現(xiàn)下降趨勢。“東—中—西”三大區(qū)域內部差異也十分明顯,西部地區(qū)差異遠大于東、中部地區(qū),中部地區(qū)次之,東部地區(qū)最小;三大區(qū)域間的差異與省際間較為一致,表現(xiàn)為逐年下降的趨勢。
(3)天氣預報網絡關注度與不同省份的地區(qū)生產總值和城鎮(zhèn)居民人均可支配收入存在顯著的正相關關系,此外也與自然災害損失存在一定的正相關關系,表明天氣預報網絡關注度的空間差異是區(qū)域經濟發(fā)展水平、居民收入水平高低和自然災害共同作用的結果。
根據(jù)天氣預報網絡關注度在月際變化、周內分布以及節(jié)假日期間的不同特點,氣象部門可因地制宜為民眾提供更詳細的特色氣象服務,從而滿足不同人群的個性化需求。同時,由于天氣預報網絡關注度的時空分布與區(qū)域經濟發(fā)展狀況之間存在較高的關聯(lián)性,因此應結合當?shù)亟洕l(fā)展實際對氣象服務發(fā)展提出建議和要求,以使氣象服務實踐與當?shù)亟洕鸂顩r相協(xié)調,從而更高效、合理地提高全國各地區(qū)的氣象服務發(fā)展水平。應指出的是,本文在分析天氣預報網絡關注度與各影響因子關系時僅使用了相關分析等統(tǒng)計方法,缺乏對天氣預報網絡關注度與影響因子間關系的深入探索。對自然災害損失與天氣預報網絡關注度間的內在關系仍缺少深入探索,這是未來應進一步完善的問題。此外,由于網絡指數(shù)具有易獲取性和高可信度等特點,使其在各研究領域中均具有明顯優(yōu)勢,但網絡指數(shù)也存在時間序列較短,網絡用戶數(shù)量變化會明顯影響網絡指數(shù)的數(shù)據(jù)質量等問題,故將網絡指數(shù)運用于氣象與經濟和社會領域聯(lián)系還需更長時間序列的數(shù)據(jù)累積并采用多種網絡指數(shù)進行綜合驗證。
致謝:感謝成都信息工程大學創(chuàng)新創(chuàng)業(yè)訓練計劃項目(202010621015)對本文的資助