徐 萍
【關(guān)鍵字】百度指數(shù);網(wǎng)絡(luò)關(guān)注度;時空特征;螺螄粉
隨著網(wǎng)絡(luò)信息科技的高速發(fā)展,互聯(lián)網(wǎng)已經(jīng)逐漸成為人們信息獲取的主要渠道。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(China Internet Network Information Center,CNNIC)統(tǒng)計,截至2020年12月,我國網(wǎng)民規(guī)模達(dá)到9.89億,較2020年3月新增網(wǎng)民8540萬,互聯(lián)網(wǎng)普及率達(dá)70.4%,較2020年3月提升5.9個百分點,這為廣大網(wǎng)民利用網(wǎng)絡(luò)搜索獲得商品信息提供了方便快捷的途徑。
近些年,國內(nèi)外學(xué)者基于網(wǎng)絡(luò)搜索引擎數(shù)據(jù),大量應(yīng)用到旅游與商品研究中。Onder通過谷歌趨勢數(shù)據(jù)以及圖像指數(shù)數(shù)據(jù),對兩個國家和兩座城市的旅游需求進(jìn)行比較研究。Clark等利用谷歌趨勢數(shù)據(jù),建立美國國家公園的客流量模型,并與傳統(tǒng)的自回歸模型進(jìn)行對比分析等。馬莉研究發(fā)現(xiàn),近距離旅游流量與游客網(wǎng)絡(luò)關(guān)注度在時間和地理空間上存在很強(qiáng)的關(guān)聯(lián)性。Li等提出了一種基于百度指數(shù)的旅游客流量的預(yù)測模型,并驗證了該模型的有效性。
程慧等人基于百度指數(shù),研究了雪峰山旅游景區(qū)網(wǎng)絡(luò)關(guān)注度的時空特征。丁鑫、杜夢珽等基于百度指數(shù),研究了廈門市、重慶洪崖洞旅游目的地網(wǎng)絡(luò)關(guān)注度的時空特征與影響因素。魏衍增基于百度指數(shù),對大眾汽車銷量建立機(jī)器學(xué)習(xí)模型,證明了搜索指數(shù)數(shù)據(jù)與汽車銷量存在相關(guān)性,與基于單一銷量數(shù)據(jù)的ARMA模型相比,加入百度指數(shù)的LSTM模型具有更好的預(yù)測能力。黃婭碰基于百度指數(shù)與電商評論數(shù)據(jù),研究九芝堂營銷策略。
綜上所述,國內(nèi)外學(xué)者利用搜索引擎數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,對各地旅游需求以及商品銷售進(jìn)行精確地預(yù)測分析。螺螄粉作為這幾年剛興起的網(wǎng)紅食品,怎樣擺脫網(wǎng)紅食品“短命”的命運?本文將基于百度搜索平臺,爬取以“螺螄粉”關(guān)鍵詞2015—2020年每日網(wǎng)絡(luò)關(guān)注度數(shù)據(jù),通過對關(guān)注度數(shù)據(jù)的時空分布、搜索人群的年齡與性別分布分析,旨在挖掘潛在的客戶群體,豐富螺螄粉銷售數(shù)據(jù)分析研究。
百度作為國內(nèi)最大的中文搜索引擎,百度指數(shù)是以百度海量網(wǎng)民行為數(shù)據(jù)為基礎(chǔ)的數(shù)據(jù)分享平臺。在這里,你可以研究關(guān)鍵詞搜索趨勢、洞察網(wǎng)民興趣和需求、監(jiān)測輿情動向、定位受眾特征。因此,采用其中的數(shù)據(jù)研究,具有一定的普遍性和可信度,本文利用百度指數(shù)分析平臺,以“螺螄粉”作為關(guān)鍵詞,爬取2015—2020年34個省級行政區(qū)域每天關(guān)鍵詞搜索次數(shù),采用地理空間分析及數(shù)理統(tǒng)計方法,從時間和空間兩個維度分別分析螺螄粉網(wǎng)絡(luò)關(guān)注特征與差異。
季節(jié)性集中指數(shù):季節(jié)性集中指數(shù)(I),又稱季節(jié)性時間強(qiáng)度指數(shù),可對商品網(wǎng)絡(luò)關(guān)注度的季節(jié)集中程度加以定量分析,計算公式為:
式(1)中, 表示每月網(wǎng)絡(luò)關(guān)注度占全年關(guān)注度總數(shù)的比重。指數(shù)值越大,表明網(wǎng)絡(luò)關(guān)注度的季節(jié)集中程度越高,季節(jié)性差異越大;相反,指數(shù)值越趨于0,表明關(guān)注度的季節(jié)集中程度越低,季節(jié)分布越均勻。本文將用其測算螺螄粉2015—2020年這6年網(wǎng)絡(luò)關(guān)注度的季節(jié)集中程度。
STL(Seasonal and Trend decomposition using Loess)是以魯棒局部加權(quán)回歸作為平滑方法的時間序列分解方法。對螺螄粉網(wǎng)絡(luò)關(guān)注度數(shù)據(jù)進(jìn)行STL分解為趨勢項(trend component)、季節(jié)項(seasonal component)和余項(remainder component)。由于趨勢項和季節(jié)項的穩(wěn)健性,STL分解不會被異常值所影響。本文將采用STL分解,以探討螺螄粉關(guān)注度的季節(jié)效應(yīng)與趨勢效應(yīng)。
通過爬取的每天關(guān)注度數(shù)據(jù),計算各年、各月份關(guān)注度均值,并計算出增長率、標(biāo)準(zhǔn)差、變異系數(shù)、季節(jié)性集中指數(shù)等結(jié)果(表1)。
?
從表1可以看出,螺螄粉網(wǎng)絡(luò)關(guān)注度年度變化具有以下幾個特征:
(1)從搜索指數(shù)日均值和增長率可以看出,2015—2020年螺螄粉的網(wǎng)絡(luò)關(guān)注度整體上呈增長趨勢,在2018年有小幅的回落;其中2016年、2019年、2020年增長率超過30%,2020年增長率最高達(dá)到57.41%,在新冠肺炎疫情下,直播經(jīng)濟(jì)快速發(fā)展,出現(xiàn)了大量吃播帶貨,其中不乏也有線上螺螄粉帶吃,這使得螺螄粉的關(guān)注度在疫情沖擊全球經(jīng)濟(jì)的情況下不減反增。
(2)從標(biāo)準(zhǔn)差可以看出,2015—2018年螺螄粉的每日網(wǎng)絡(luò)關(guān)注度比較集中,2019—2020年其差異性陡然上升。
(3)從變異系數(shù)與月度集中指數(shù)上看,2016—2018年,變異系數(shù)及季節(jié)性集中指數(shù)比較小,說明螺螄粉網(wǎng)絡(luò)關(guān)注度年內(nèi)分布比較分散。而2019年、2020年受短視頻、直播帶貨的影響,使得螺螄粉網(wǎng)絡(luò)關(guān)注度年內(nèi)分布比較集中。
通過計算獲得螺螄粉2015—2020年各月份的平均網(wǎng)絡(luò)關(guān)注度,并繪制成折線圖(如圖1)。從圖1可以看出,螺螄粉網(wǎng)絡(luò)關(guān)注度月季變化具有以下特征:①2015—2020年,同月份的每日平均關(guān)注度呈逐年遞增的趨勢;其中2020年增長最為明顯,除1月外,其他月份增幅與往年同期相比都達(dá)到最大,說明螺螄粉的知名度正在逐步擴(kuò)大。②2015—2019年的網(wǎng)絡(luò)關(guān)注度折線圖均呈現(xiàn)出雙峰的特征,其第一個峰值出現(xiàn)在每年的3月和4月,即這個時候為春節(jié)假期結(jié)束返崗時段以及學(xué)生的主要開學(xué)時間,開學(xué)季以及上班潮拉動了螺螄粉的消費需求;第二個峰值也是出現(xiàn)在秋季開學(xué)季的9月和10月,這也從側(cè)面反映出螺螄粉的消費人群大多為年輕人群。③除雙峰特征外,每年的關(guān)注最低點集中在每年的1月和2月,這個時段主要是歲末年初,大家都在忙碌,從而導(dǎo)致螺螄粉的關(guān)注度較低。
圖1 2015—2020年螺螄粉日平均網(wǎng)絡(luò)關(guān)注度月度變化圖
為了探討關(guān)注度數(shù)據(jù)的發(fā)展趨勢,采用STL時間序列分解方法對數(shù)據(jù)進(jìn)行分解。圖2從上到下分別是2015—2020年螺螄粉網(wǎng)絡(luò)關(guān)注度數(shù)據(jù)的觀測項、趨勢項、季節(jié)項和余項。從圖2季節(jié)性變化圖可以看出,關(guān)注度確實存在一個春節(jié)前低谷,節(jié)后高峰的情況。從整體的趨勢變化可以看出,2015—2020螺螄粉網(wǎng)絡(luò)關(guān)注度在逐漸上升。具體來看,2015—2018年螺螄粉緩慢地進(jìn)入人們的視野,平均每年增長21%;2018年后隨著小視頻以及美食主播行業(yè)的興起,關(guān)注度得到快速拉升,平均每年增長43%,即使2020年新冠肺炎疫情的暴發(fā)也沒有影響到人們對螺螄粉的關(guān)注,這體現(xiàn)了食品的強(qiáng)大韌性。
圖2 2015—2020螺螄粉STL時間序列分解圖
不同地方存在不同的飲食習(xí)慣,螺螄粉最受哪些地方的喜愛呢?通過百度指數(shù)搜索地域分析,獲取2015—2020年對“螺螄粉”關(guān)鍵詞搜索人群在全國各省份的關(guān)注度日平均值給出前10名(表2),由表2可以看出:①2015—2020年,各省級行政區(qū)對螺螄粉的網(wǎng)絡(luò)關(guān)注度呈上升趨勢,且在2018—2020年增長速率最大,說明小視頻、吃播等行業(yè)興起擴(kuò)大了螺螄粉的知名度。②各個區(qū)域?qū)β菸嚪坳P(guān)注度存在較大的差異,其中關(guān)注度最高的10個省份分別為廣東、北京、山東、浙江、廣西、江蘇、上海、河南、四川以及河北,主要集中在兩廣、長三角經(jīng)濟(jì)發(fā)達(dá)省份以及北京和一些飲食喜辣的四川、河南、河北,統(tǒng)計6年來前10名省份網(wǎng)絡(luò)關(guān)注度的比重發(fā)現(xiàn),其比重總和超過了51.57%,進(jìn)一步說明了省份分布的差異較大,集中程度比較高。
表2 各省份網(wǎng)絡(luò)關(guān)注度日均值
不同的年齡段對不同食品的需求也不同,螺螄粉是一種比較油辣酸爽的食品,在一些中老年人眼中可能會被視為“垃圾視頻”,然而這種酸辣可口的感覺卻深受年輕人的喜愛。根據(jù)百度指數(shù)平臺2015—2020年“螺螄粉”關(guān)鍵詞搜索人群分布比例進(jìn)行分析,得到搜索人群平均年齡與網(wǎng)民年齡分布對比圖(見圖3)。
圖3 螺螄粉網(wǎng)絡(luò)關(guān)注度年齡分布圖
圖3中紅色條形圖表示不同年齡段螺螄粉網(wǎng)絡(luò)關(guān)注度在總?cè)巳旱恼急龋G色為網(wǎng)民不同年齡段分布。從圖3可以知道,螺螄粉的關(guān)注人群主要集中在20~39歲人群中,占總?cè)藬?shù)的67%左右,說明青年人是螺螄粉網(wǎng)絡(luò)關(guān)注度的主要人群。對比網(wǎng)絡(luò)年齡分布來看,螺螄粉口感油辣鮮美受到許多30歲以下青年人的喜愛,而大于30歲的群體關(guān)注螺螄粉的人群比例較低。
根據(jù)百度指數(shù)平臺2015—2020年“螺螄粉”關(guān)鍵詞搜索人群性別數(shù)據(jù)進(jìn)行分析,得到搜索人群性別占比圖(見圖4)。關(guān)鍵字搜索螺螄粉的性別,女性達(dá)到56.7%,高于男性??赡芘允羌彝ナ巢牡馁徺I者,導(dǎo)致螺螄粉網(wǎng)絡(luò)關(guān)注度中女性比例較大。
圖4 螺螄粉網(wǎng)絡(luò)關(guān)注度性別分布圖
本文基于百度指數(shù),從不同層次分析了螺螄粉網(wǎng)絡(luò)關(guān)注度的時空分布特征,根據(jù)分布特征得到結(jié)論與建議如下:①螺螄粉網(wǎng)絡(luò)關(guān)注度年際變化正在快速提升,且各年整體變化趨勢具有較高的一致性,全年中網(wǎng)絡(luò)關(guān)注度最高一般在3月和4月,返校以及復(fù)工上班潮拉動了人們對螺螄粉的需求,關(guān)注度最低點一般在前一年的11月到后一年的2月。針對這種規(guī)律性強(qiáng)的現(xiàn)象,我們可以在關(guān)注度地點、時期加大產(chǎn)品研發(fā),豐富不同年齡段、不同地域人群的口味,在春節(jié)過后大家返校、返崗期間,開展老客戶新品免費試吃等,通過老客戶的飲食習(xí)慣改進(jìn)新品,提高品質(zhì)。②地域分布上,螺螄粉網(wǎng)絡(luò)關(guān)注度人群存在明顯的地域差異,其主要分布在兩廣、長三角、北京、山東等經(jīng)濟(jì)發(fā)達(dá)省份,以及一些飲食喜辣的四川、河南、河北省份,針對這些省份,我們可以加大螺螄粉在各地的宣傳,舉行免費試吃等活動,讓大家真實體會口感;對于東北、西北等關(guān)注度較低的省份,可以根據(jù)當(dāng)?shù)仫嬍沉?xí)慣,研發(fā)適合當(dāng)?shù)厝说穆菸嚪劭谖丁"勐菸嚪劬W(wǎng)絡(luò)關(guān)注度女性高于男性,我們可以設(shè)置情侶套餐、閨蜜套餐等,挖掘已有客戶身邊的潛在客戶群體,或者通過購買獲取積分領(lǐng)取增值服務(wù)等。
本研究依然存在不足之處,百度指數(shù)解析的數(shù)據(jù)來源于網(wǎng)民百度搜索行為,數(shù)據(jù)廣度存在局限性。同時,螺螄粉的銷量數(shù)據(jù)不易統(tǒng)計,不能客觀地分析螺螄粉網(wǎng)絡(luò)關(guān)注度數(shù)據(jù)與真實銷量間的關(guān)系。