吳濤,張立敏
(1.嶺南師范學院信息工程學院,湛江 524048;2.廣東省數(shù)字化學習工程技術開發(fā)中心,湛江 524048)
《國家教育事業(yè)發(fā)展十三五規(guī)劃》專門一章提出了“互聯(lián)網(wǎng)+教育”的推進和發(fā)展問題,指出繼續(xù)開展“網(wǎng)絡學習空間人人通”,形成線上、線下有機結合的網(wǎng)絡化泛在學習新模式,并引導學校與教師依托網(wǎng)絡學習空間記錄學生學習過程[1]。剛剛召開的中國共產(chǎn)黨十九大也指出要以教育信息化推動教育現(xiàn)代化。某種意義上說,隨著網(wǎng)絡基礎設施的完備和現(xiàn)代信息技術的發(fā)展,網(wǎng)絡學習已經(jīng)并將繼續(xù)深刻變革著人們的學習方式。盡管如此,網(wǎng)絡學習研究方興未艾[2-4]。在這樣的背景下,社會大眾需要全面了解網(wǎng)絡學習的概念、原理、技術和系統(tǒng),并采用不同形式開展網(wǎng)絡學習,網(wǎng)絡學習本身作為關鍵詞也必定逐漸成為網(wǎng)民關注的搜索對象之一。因此,針對網(wǎng)絡學習的網(wǎng)絡關注度研究具有非常重要的現(xiàn)實意義。
百度指數(shù)是以百度搜索中網(wǎng)民互聯(lián)網(wǎng)行為數(shù)據(jù)為基礎的數(shù)據(jù)分享平臺[5],目前以被廣泛應用于新聞傳播、圖書情報、旅游營銷、公共管理等方面[6-10],并展示出一定的特色優(yōu)勢。本文選取“網(wǎng)絡學習”作為研究關鍵詞,以百度指數(shù)為研究工具,利用中文網(wǎng)民互聯(lián)網(wǎng)行為大數(shù)據(jù)對網(wǎng)絡學習的時空關注度進行了相關分析。本文的研究期望在某種程度上窺探我國網(wǎng)民的網(wǎng)絡學習關注情況,為網(wǎng)絡學習空間的建設、網(wǎng)絡學習資源的共享、網(wǎng)絡學習領域的發(fā)展等方面提供一定的參考和借鑒。
互聯(lián)網(wǎng)流量測量服務提供商StatCounter[11]每個月更新一次各種類型的統(tǒng)計報告以及網(wǎng)站流量統(tǒng)計結果。根據(jù)StatCounter公司在2017年10月公布的最新數(shù)據(jù)顯示,百度一直以來都是全球最流行的中文搜索引擎,占全球中文搜索引擎市場份額約78.71%,其中近一年的詳細數(shù)據(jù)如圖1所示,百度穩(wěn)居前列,占有2/3以上的市場份額,此外,360好搜、神馬搜索、搜狗搜索等也占有一定的市場份額。
圖1 搜索引擎市場份額圖
基于上述占絕對優(yōu)勢的市場份額,百度研發(fā)了百度指數(shù)這一數(shù)據(jù)分享產(chǎn)品,提供從2006年至今的相關搜索關鍵詞的網(wǎng)絡關注度,包括用戶關注度、媒體關注度兩方面。其中用戶關注度主要以海量網(wǎng)民的互聯(lián)網(wǎng)搜索行為為基礎,利用自然語言理解、數(shù)學統(tǒng)計等方法分析出關鍵詞的搜索加權頻次和,以各種維度可視化顯示,可選設備有PC端、移動端,也可以從地域分布、人群屬性等維度分別分析具體的搜索行為數(shù)據(jù),默認包括的時間跨度有7天、30天、90天、半年和全部,當然,也可以自定義時間跨度。
鑒于以上兩點原因,本文利用百度指數(shù)平臺(網(wǎng)址:http://index.baidu.com),以“網(wǎng)絡學習”為主關鍵詞,“網(wǎng)上學習”、“在線學習”為輔助組合關鍵詞,以“MOOC”、“遠程教育”為對比關鍵詞,獲得了2011年1月1日至2017年10月25日的逐日網(wǎng)絡關注度數(shù)據(jù),進行了以下四個方面的特征分析。
(1)時間特征演化分析:本文首先生成了網(wǎng)絡學習的網(wǎng)絡關注度在全時段的整體演化趨勢,其實,截取部分時段進行了有針對性的挖掘,包括近90天、近半年三個時間跨度,最后,還研究了在特殊時間段的網(wǎng)絡關注度演化趨勢,選取近30天、2017年春節(jié)作為例子進行了探討。此外,在各個時間維度上都與“MOOC”、“遠程教育”等對比關鍵詞進行了比較分析。
(2)人群特征演化分析:百度根據(jù)用戶搜索數(shù)據(jù),采用數(shù)據(jù)挖掘方法,對關鍵詞的人群屬性進行聚類分析,本文由此生成了在網(wǎng)絡上關注網(wǎng)絡學習的用戶人群所屬的年齡及性別分布情況,結合網(wǎng)絡學習研究的相關成果,對該人群分布進行了檢驗解析。同時,在各個人群特征維度上都與“MOOC”、“遠程教育”等對比關鍵詞進行了比較分析。
(3)設備特征演化分析:鑒于數(shù)據(jù)來源的不同,百度將搜索指數(shù)分為PC搜索指數(shù)和移動搜索指數(shù)。根據(jù)這一特點,生成了關注網(wǎng)絡學習的設備入口分布情況,并剖析了PC端和移動端的演化趨勢異同點。
(4)空間特征演化分析:百度根據(jù)用戶搜索數(shù)據(jù),采用數(shù)據(jù)挖掘方法,對關鍵詞的人群屬性進行聚類分析,本文由此生成了在網(wǎng)絡上關注網(wǎng)絡學習的用戶人群所屬的省份、城市及城市級別的分布及排名,結合網(wǎng)絡學習的實際開展狀態(tài),對該結果進行了深入分析。
從2011年1月1日至2017年10月25日這個時間段,用戶關注度的時間特征演化趨勢如圖2所示,圖中縱坐標為網(wǎng)絡學習的網(wǎng)絡用戶關注度,橫坐標為時間序列??傮w上,網(wǎng)絡學習的關注度相對比較平穩(wěn),整體搜索的平均值為776,用戶搜索大多在850附近徘徊,但在細節(jié)上也存在很多毛刺,并非光滑曲線。此外,在2016年7月以來的一年多時間內,用戶搜索行為呈現(xiàn)出較大幅度的波動,峰值約2000、谷值僅600。在全時段,近7天整體搜索指數(shù)880、同比下降30%,環(huán)比下降2%,近30天整體搜索指數(shù)823、同比下降29%、環(huán)比上升1%。
考慮到網(wǎng)民先驗知識和認知水平的影響因素,選取“MOOC”、“遠程教育”,在相同的時間段內進行了對比分析。為了便于比較,相關曲線也附在圖2中。很顯然,在三組關鍵詞中,MOOC的整體關注度明顯占優(yōu)。相比而言,MOOC的概念提出相對較晚,大約在2013年初期正式有用戶行為的記錄,但是,直到2013年中期,MOOC的關注度開始高于網(wǎng)絡學習、遠程教育,雖有小范圍的波動,并一直占有穩(wěn)居三者中的首位。MOOC作為網(wǎng)絡學習的一種方式,逐日關注度的指數(shù)均值達到了1700,遠遠高于網(wǎng)絡學習的平均指數(shù)。某種程度上說明,網(wǎng)民對純粹的網(wǎng)絡學習概念、原理和技術的關注度并不高,大多數(shù)人更樂意使用網(wǎng)絡學習形式,但缺乏對其本身的了解和認知。與之相反,雖然遠程教育的平均指數(shù)高于網(wǎng)絡學習,但整體趨勢比較相似,考慮到遠程教育的范圍更大,提出時間更早,關注度更廣泛也是情理之中。
圖2 網(wǎng)絡關注度的整體趨勢
為了進一步窺探短期內的用戶關注度,根據(jù)百度數(shù)據(jù)統(tǒng)計的近90天、近半年逐日搜索指數(shù),獲得了相關的時間特征演化趨勢如圖3所示。2017年7月25日至2017年10月25日,三者的指數(shù)變化趨勢都比較類似,前期平穩(wěn)、后期劇烈震蕩,在10月初期呈現(xiàn)局部谷值。將時間跨度擴大,即開始時間提前到2017年4月25日,如圖3(b)所示,如前所述的趨勢更加顯著,區(qū)別僅在于前期穩(wěn)定的區(qū)間更大。因此,當三者的搜索關注度同時出現(xiàn)總體上先下行、后上揚的局部特點時,這非常有必要深入挖掘其中的原因。
圖3 分時段的網(wǎng)絡關注度趨勢
基于前述分析,將時間跨度縮小到近30天,放大局部視角,對比結果如圖4(a)所示,正如前文所述,2017年9月25日至2017年10月25日,所有三個指數(shù)的波動曲線均在10月3~4日形成峰谷。事實上,容易注意到10月3日前后正好是國慶節(jié)放假期間,因此,本次研究的近30天實際上是一個特殊節(jié)假日時段,也就是不難解釋全部演化曲線都呈現(xiàn)極大谷值的原因。
為了進一步驗證上述直覺和論斷,本文還選取了2017年春節(jié)作為例子,結果如圖4(b)所示,無獨有偶,兩者展示出了驚人的相似。在兩個不同的節(jié)假日時段,網(wǎng)絡學習、MOOC、遠程教育三個關鍵詞均具有相似的網(wǎng)絡關注度趨勢。因此,可以在特殊節(jié)假日時段組織大規(guī)模的在線活動,適當采用外力干預和引導公眾了解網(wǎng)絡學習并開展網(wǎng)絡學習,推進網(wǎng)絡學習概念、原理和系統(tǒng)平臺的普及化。
圖4 特殊時段的網(wǎng)絡關注度趨勢
網(wǎng)絡學習的關注人群年齡分布包括19歲以下1%、20~29歲 12%、30~39歲為 54%、40~49歲為 31%、50歲以上為2%,這一現(xiàn)象與遠程教育的關注人群分布基本相似。相對而言,MOOC的關注用戶群年齡結構更加合理,20~49歲均約占1/3,這與網(wǎng)絡學習、遠程教育顯著不同。此外,關注最多的人群中,網(wǎng)絡學習、遠程教育均為30~39歲年齡段,MOOC則是20~29歲,這就表明,MOOC作為后來居上的新生事物,更容易受到年輕人的關注。因此,在終身學習、學習型社會建設的大背景下,如何探索針對年長者開發(fā)合適的產(chǎn)品、開展相應的宣傳等顯得更具迫切性。
另外,網(wǎng)絡學習的關注人群性別情況為男性56%、女性44%,與遠程教育近似(男性51%、女性49%),MOOC則是男性顯著多于女性,關注的男女用戶人數(shù)比約為7:3。據(jù)不完全統(tǒng)計,目前的人口性別結構為117:100,從這個意義上說,更多男性用戶使用百度搜索MOOC,網(wǎng)絡學習如何引導女性用戶的關注,并提供針對女性用戶的特色產(chǎn)品,值得網(wǎng)絡學習領域進一步研究和探討。
圖5 網(wǎng)絡關注度的人群
將來源于PC端、移動端的數(shù)據(jù)區(qū)分開來,相關結果如圖6所示,總體上PC端的演化趨勢基本保持平穩(wěn)并伴隨小范圍的波動,移動端在整個統(tǒng)計時間跨度的前期保持穩(wěn)中有升,但后期相對波動較大。
圖6 不同設備入口的網(wǎng)絡關注度整體趨勢
在全時段,近7天移動搜索指數(shù)406,整體同比下降29%、環(huán)比下降17%,近30天移動搜索指數(shù)378,同比下降17%、環(huán)比下降6%,2015年以來,隨著移動網(wǎng)絡技術的發(fā)展,移動端逐漸占據(jù)絕對性優(yōu)勢,均值高于PC端,而且這種優(yōu)勢有進一步擴大的趨勢。另外,對比圖2(a)的整體演化曲線,網(wǎng)絡關注度受到移動端的影響更大,換句話說,整體演化曲線與移動端演化曲線在趨勢上更加相似。這就要求網(wǎng)絡學習的相關部署可以順應網(wǎng)民的需求,加強移動學習的開發(fā)和應用力度。與用戶關注度類似,圖7也列出了全時段的媒體指數(shù)演化趨勢,與其他關鍵詞相比,網(wǎng)絡學習的媒體關注度極小,幾乎沒有有影響力的媒體事件。事實上,媒體關注度一定程度上必然會影響到網(wǎng)民的用戶關注度。從這個角度上說,有必要適度利用媒體吸引用戶關注網(wǎng)絡學習,并利用網(wǎng)絡開展各種在線學習。
圖7 網(wǎng)絡關注度的媒體指數(shù)趨勢
以省份分布為基礎的空間關注度情況如圖8所示,浙江省獨占鰲頭,廣東、北京緊隨其后,不分伯仲,傳統(tǒng)意義上的經(jīng)濟群,如京津冀、長三角、珠三角,是省份排名前十的主要組成部分,整個西北、東北地區(qū)都沒有省份進入前十,在國家不斷推進教育公平均衡化的大背景下,以網(wǎng)絡學習為基礎,打破時間空間的限制,非常有利于學習資源的共建共享,相關研究任重而道遠。
為了便于進一步分析空間關注度,將用戶群所在地的各種分布詳細情況列在表1中,如表1所示,從城市分布上看,北京、上海占據(jù)前兩位,與省份排名對應的杭州、廣州緊隨其后。值得注意的是,深圳也排名進入前十,說明廣東省的網(wǎng)絡學習關注度地域分布極不均衡,類似的情況也包括浙江、四川兩省。此外,山東排名省份第4,但濟南僅進入城市第9,這就表明,相對其他城市群,山東的網(wǎng)絡關注度更均衡。在地區(qū)分布上,華南片區(qū)除廣東省外,其他省份和城市的網(wǎng)絡學習關注度也不高,當然,從另外一個角度理解,這些地區(qū)的網(wǎng)絡學習開展的潛力和市場都很大。
圖8 按省份的網(wǎng)絡關注情況示意圖(此圖非地圖)
總體上,表1的結果表明,不管從哪個維度上理解,從網(wǎng)絡學習的百度搜索指數(shù)所反映的情況來看,網(wǎng)絡學習的發(fā)展尚不均衡,被寄望于改善資源均衡、教育公平的網(wǎng)絡學習手段,仍然嚴格依賴于經(jīng)濟地理位置,形式并不樂觀,未來勢必影響到等相關產(chǎn)業(yè)的發(fā)展,制約終身學習、學習型社會的建設。
表1 網(wǎng)絡關注度的空間分布情況
通過百度指數(shù)研究了網(wǎng)絡學習的時空關注度,主要的特征如下:(1)網(wǎng)絡學習的時間特征基本穩(wěn)定,但在節(jié)假日期間關注度急劇下降;(2)網(wǎng)絡學習的空間特征分布不均衡,與用戶所在地區(qū)的經(jīng)濟地理條件嚴格相關;(3)關注網(wǎng)絡學習的年輕人遠少于中年人,女性少于男性;(4)越來越多的移動端設備關注網(wǎng)絡學習。鑒于這些特征,在節(jié)假日開展若干網(wǎng)絡學習的公開活動,利用媒體適度加大不發(fā)達、欠發(fā)達地區(qū)的網(wǎng)絡學習宣傳力度,合理利用移動媒介,有效引導年輕用戶或女性用戶,提供針對特定用戶群的特色產(chǎn)品等,都需要網(wǎng)絡學習領域進一步研究和探討。