謝 輝
近年省級(jí)公共圖書(shū)館(以下簡(jiǎn)稱(chēng)“省館”)紛紛開(kāi)通微信公眾號(hào)服務(wù)平臺(tái)(以下簡(jiǎn)稱(chēng)“微信公眾號(hào)”),學(xué)者開(kāi)始研究圖書(shū)館微信公眾號(hào)運(yùn)營(yíng)情況。張正等[1]認(rèn)為,微信為擴(kuò)展圖書(shū)館服務(wù)范圍、方式和內(nèi)容提供了新途徑。郭春俠等[2]調(diào)查31家省館微信公眾號(hào)現(xiàn)狀,指出服務(wù)功能設(shè)置和服務(wù)水平良莠不齊。整體而言,關(guān)于省館微信公眾號(hào)的研究側(cè)重于應(yīng)用現(xiàn)狀、功能等方面;而關(guān)于微信公眾號(hào)服務(wù)情況及數(shù)據(jù)分析等定量研究較少。為此,本研究采集2016年5月1日至2017年5月1日各省館微信公眾號(hào)推送的文章、文章閱讀量、發(fā)布時(shí)間等作為研究數(shù)據(jù),構(gòu)建微信傳播指數(shù)WCI評(píng)價(jià)指標(biāo)體系,并針對(duì)試驗(yàn)數(shù)據(jù),從宏觀和實(shí)例角度探討省館微信公眾號(hào)服務(wù)現(xiàn)狀及存在問(wèn)題。
本研究數(shù)據(jù)來(lái)自清博指數(shù)。清博指數(shù)是我國(guó)最大的第三方新媒體搜索引擎、微信數(shù)據(jù)庫(kù),其收錄的數(shù)據(jù)包括頭條閱讀量、發(fā)布時(shí)間、總閱讀量、詳細(xì)內(nèi)容、總點(diǎn)贊數(shù)、最多閱讀文章、圖文消息鏈接、當(dāng)日閱讀量、最近一周閱讀量等。依托該平臺(tái),本研究統(tǒng)計(jì)分析各省館微信公眾號(hào)推送文章的傳播量、覆蓋度、賬號(hào)成熟度和影響力等。
網(wǎng)絡(luò)爬蟲(chóng)(Web Crawler)是一種用于自動(dòng)提取網(wǎng)絡(luò)信息的工具,主要利用C/C++、Java、Python、Perl等程序語(yǔ)言撰寫(xiě),自動(dòng)抽取網(wǎng)頁(yè)并保存在數(shù)據(jù)庫(kù)中,以作為分析或數(shù)據(jù)探勘使用。網(wǎng)絡(luò)爬蟲(chóng)基本架構(gòu)見(jiàn)圖1[3]:首先提取程序(Fetcher)抓取HTML文件,并將HTML文件內(nèi)容放進(jìn)控制器(Controller)分析;當(dāng)超鏈接被搜尋到后,將被鏈接提取程序抽取出來(lái)建立增加新節(jié)點(diǎn)到網(wǎng)絡(luò)爬蟲(chóng)的工作量中,可視為數(shù)據(jù)結(jié)構(gòu)的隊(duì)列方式;然后將抽取的HTML文件或想獲得的信息通過(guò)匯總程序存入數(shù)據(jù)庫(kù),直到網(wǎng)絡(luò)爬蟲(chóng)工作量?jī)?nèi)沒(méi)有要接入的節(jié)點(diǎn)之后結(jié)束。一般而言,網(wǎng)頁(yè)搜尋策略方式有4種:IP地址搜尋方法、廣度優(yōu)先、深度優(yōu)先和最佳優(yōu)先策略。
圖1 網(wǎng)絡(luò)爬蟲(chóng)系統(tǒng)架構(gòu)圖
為方便采集各館微信公眾號(hào)推送文章及相關(guān)數(shù)據(jù),以Python語(yǔ)言為基礎(chǔ),構(gòu)建微信公眾號(hào)爬蟲(chóng)系統(tǒng),主要步驟:(1)統(tǒng)計(jì)各館微信公眾號(hào)開(kāi)通情況。通過(guò)網(wǎng)上搜索查詢(xún)和篩選,獲得32個(gè)省館微信公眾號(hào)。(2)通過(guò)微信公眾號(hào)爬蟲(chóng)系統(tǒng)搜尋2016年5月1日至2017年5月1日32個(gè)館微信公眾號(hào)推送的文章、閱讀量、點(diǎn)贊率、鏈接地址等數(shù)據(jù),將其放到非關(guān)系型數(shù)據(jù)庫(kù)MongoDB的URL_list集合中進(jìn)行存儲(chǔ),通過(guò)爬蟲(chóng)系統(tǒng)搜尋推送文章的鏈接地址、文章標(biāo)題和內(nèi)容,同樣存儲(chǔ)在URL_list集合中。(3)導(dǎo)出文件。從數(shù)據(jù)庫(kù)中導(dǎo)出推送文章鏈接地址和文本內(nèi)容數(shù)據(jù),以URL.CSV和INFO.CSV格式進(jìn)行分析使用。
利用EXCEL中COUNTIF函數(shù)篩選重復(fù)的文章鏈接地址,將其刪除。浙江省館和云南省館均開(kāi)通微信訂閱號(hào)和服務(wù)號(hào),因此,將其鏈接地址及內(nèi)容數(shù)據(jù)合并在同一個(gè)賬號(hào)下。由于URL.CSV文件中有24條被發(fā)布者刪除或內(nèi)容被舉報(bào)而無(wú)法查看的記錄數(shù)據(jù),將其進(jìn)行刪除,剩余8065條微信公眾號(hào)推送文章的鏈接地址記錄,INFO.CSV文件做相應(yīng)的刪除修改,導(dǎo)出數(shù)據(jù)8065條鏈接地址,包含文本內(nèi)容、標(biāo)題、摘要、點(diǎn)贊數(shù)、推送時(shí)間等數(shù)據(jù)。
Tableau是一款可視化數(shù)據(jù)分析產(chǎn)品。本研究將篩選后的數(shù)據(jù)導(dǎo)入Tableau中進(jìn)行分析,結(jié)合WCI對(duì)各館微信公眾號(hào)推送文章位置、日期、時(shí)間、傳播指數(shù)排名、推送時(shí)間、推送內(nèi)容等指標(biāo)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。部分?jǐn)?shù)據(jù)見(jiàn)圖2。
為直觀地展示各館地理位置及其推送文章情況,利用EXCEL工具將各館微信公眾號(hào)推送文章數(shù)量在地圖相應(yīng)位置上進(jìn)行標(biāo)記。從圖3可以看出,江蘇、湖南、黑龍江等省館微信公眾號(hào)推送文章數(shù)量最多,分別達(dá)1325篇、1103篇、850篇。分區(qū)域看,東部和南部省館微信公眾號(hào)推送文章數(shù)量明顯較西部和北部多,表明各館微信平臺(tái)運(yùn)行狀況與當(dāng)?shù)亟?jīng)濟(jì)水平有直接的關(guān)系。
圖2 各省館公眾號(hào)采集數(shù)據(jù)(部分)
圖3 省館微信公眾號(hào)文章推送量分布
根據(jù)爬蟲(chóng)遍歷得到的文章推送日期和數(shù)量,得出各館微信公眾號(hào)推送文章數(shù)量隨月份變化情況,見(jiàn)圖4。2016年12月推送最多,可能逢元旦假期,活動(dòng)增多;其次是9月、11月推送較多;10月出現(xiàn)低谷,可能與國(guó)慶假期有關(guān),影響微信管理人員推送文章。2016年與2017年上半年和對(duì)應(yīng)的下半年相比,上半年微信平臺(tái)活躍度不如下半年。2.1.3 時(shí)間選擇
圖4 各省館月均推送數(shù)量
根據(jù)爬蟲(chóng)搜尋得到各館推送文章及其推送時(shí)間段,以24小時(shí)為橫坐標(biāo),各時(shí)間段所有館推送文章數(shù)量的平均數(shù)作為縱坐標(biāo)軸,數(shù)據(jù)計(jì)算結(jié)果見(jiàn)圖5。由圖5可見(jiàn),各館0-6點(diǎn)推送文章最少,與工作人員作息保持一致。在上午和下午工作時(shí)間段推送數(shù)量隨時(shí)間推移增多,分別在12時(shí)和17時(shí)達(dá)到高峰。13時(shí)、14時(shí)推送數(shù)量出現(xiàn)低谷,這與午休時(shí)間相符。在晚上時(shí)間段,各館平均推送文章的數(shù)量出現(xiàn)隨時(shí)間推移而遞減趨勢(shì),23時(shí)達(dá)到最低點(diǎn),這和作息時(shí)間相符。
截至2017年5月1日,32家省館全部開(kāi)通微信平臺(tái)且完成認(rèn)證,見(jiàn)表1。其中首都圖書(shū)館、天津圖書(shū)館、河北省圖書(shū)館、黑龍江省圖書(shū)館、山東省圖書(shū)館、湖南圖書(shū)館、浙江圖書(shū)館、上海圖書(shū)館等8家開(kāi)通了兩個(gè)微信平臺(tái)。山東省圖書(shū)館只有一個(gè)公眾號(hào)“山東省圖書(shū)館資訊平臺(tái)”通過(guò)認(rèn)證,另一個(gè)公眾號(hào)是“山東省圖書(shū)館”,顯示尚未認(rèn)證。
表1 省館微信平臺(tái)開(kāi)通情況
圖5 各時(shí)段推送數(shù)量統(tǒng)計(jì)
圖6 省館微信平均閱讀量、平均點(diǎn)贊數(shù)統(tǒng)計(jì)
圖7 省館微信推文數(shù)量統(tǒng)計(jì)
整理分析2016年5月1日至2017年5月1日各館微信公眾號(hào)推送文章的數(shù)量、平均閱讀量、平均點(diǎn)贊量(見(jiàn)圖6和圖7)。鑒于數(shù)據(jù)完整及公眾號(hào)的穩(wěn)定性、可查詢(xún)性等原因,剔除無(wú)效的公眾號(hào)數(shù)據(jù),本文最終選取了27個(gè)公眾號(hào)進(jìn)行研究。推送數(shù)量前4位是湖南圖書(shū)館、黑龍江省圖書(shū)館、甘肅省圖書(shū)館和浙江圖書(shū)館,均超過(guò)400篇,湖南圖書(shū)館更達(dá)到1103篇。各館微信公眾號(hào)平均閱讀量是指所有文章閱讀量總和除以文章推送數(shù)量求得的平均值,平均閱讀量超過(guò)1000次的包括湖南、湖北和山東3個(gè)省館,湖南圖書(shū)館平均閱讀量達(dá)5734次。平均點(diǎn)贊數(shù)是指各館微信公眾號(hào)推送文章的點(diǎn)贊總數(shù)除以文章數(shù)量所求得的平均值,湖南、四川、山東、吉林4個(gè)省館推送文章的平均點(diǎn)贊數(shù)最高,均超過(guò)1000個(gè),其中湖南圖書(shū)館達(dá)5734個(gè)。
選取湖南、四川、黑龍江、甘肅、浙江5個(gè)省館微信平臺(tái)服務(wù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,得到圖8??v坐標(biāo)用于說(shuō)明各館推送文章時(shí)間段的選擇和平均閱讀量,橫坐標(biāo)為一天內(nèi)各時(shí)段。5家省館微信公眾平臺(tái)推送文章均在12時(shí)和15時(shí)達(dá)到高峰,且12時(shí)推送數(shù)量遠(yuǎn)高于其他時(shí)段,其中浙江圖書(shū)館12時(shí)推送文章數(shù)量?jī)H次于湖南圖書(shū)館,17時(shí)甘肅省圖書(shū)館推送文章數(shù)量排名第二。
圖8 各省館各時(shí)段推送文章數(shù)量及閱讀量均值統(tǒng)計(jì)
雖然湖南圖書(shū)館將12點(diǎn)作為推送文章的首選時(shí)間段,但平均閱讀量并非處于全天最高峰,全天閱讀最高峰出現(xiàn)在16-20時(shí),說(shuō)明用戶(hù)在下午及晚上時(shí)段的關(guān)注度更高。甘肅省圖書(shū)館與黑龍江省圖書(shū)館的平均閱讀量均較低,說(shuō)明微信平臺(tái)推送文章數(shù)量與閱讀量并非正相關(guān),但與推送時(shí)間關(guān)系較密切,且閱讀量較大的時(shí)間段集中在下午及晚上時(shí)間段。因此,各館微信管理人員應(yīng)在考慮讀者閱讀時(shí)間選擇的基礎(chǔ)上,提高文章推送效率,選擇更加合適的時(shí)間進(jìn)行推送。
對(duì)湖南、四川、黑龍江、甘肅、浙江等5家省館推送文章的閱讀量進(jìn)行排名,選擇排名前4的文章,排名結(jié)果見(jiàn)表2。
表2 微信號(hào)高閱讀量文章統(tǒng)計(jì)
湖南圖書(shū)館微信公眾號(hào)排名前五的文章閱讀量均遠(yuǎn)高于其他館。其中,排名第一的《父母尚在茍且,你卻炫耀詩(shī)和遠(yuǎn)方》閱讀量超過(guò)11萬(wàn),該文受到如此大的關(guān)注,主因是標(biāo)題和內(nèi)容觸動(dòng)了各年齡段人們的情感;排名第二的《他是買(mǎi)下十套學(xué)區(qū)房卻一天也沒(méi)住過(guò)的任性買(mǎi)房者,也是一個(gè)你完全想象不到的童話(huà)大王》與熱點(diǎn)話(huà)題緊密相關(guān);其余文章也與熱門(mén)話(huà)題相關(guān),閱讀量均超過(guò)5萬(wàn)。
四川省圖書(shū)館上榜4篇文章中,3篇與南海軍事熱門(mén)話(huà)題密切相關(guān)。甘肅省圖書(shū)館上榜的4篇文章以心靈雞湯為主,引導(dǎo)人們樂(lè)觀向上,這與人們壓力過(guò)大,需要給予開(kāi)導(dǎo)有關(guān)。黑龍江省圖書(shū)館和浙江圖書(shū)館推送的文章大多為通知、寫(xiě)作,較少涉及熱點(diǎn)話(huà)題,關(guān)注度不高,閱讀量較低。
微信傳播指數(shù)(Wechat Communication Index,WCI)由清博新媒體指數(shù)團(tuán)隊(duì)開(kāi)發(fā),全面反映微信公眾平臺(tái)推送文章的覆蓋度、傳播范圍及其影響力,具有權(quán)威性和可靠度。WCI常用指標(biāo)架構(gòu)系統(tǒng)及標(biāo)準(zhǔn)化得分的計(jì)算公式(見(jiàn)圖9)。系統(tǒng)抓取時(shí)間一般為系統(tǒng)每日更新賬號(hào)前一天發(fā)布的文章及其閱讀數(shù)。閱讀數(shù)量在每日12:00左右更新,統(tǒng)計(jì)數(shù)據(jù)在每天15左右更新,日榜數(shù)據(jù)采用文章發(fā)布第二天的數(shù)據(jù)進(jìn)行計(jì)算,每天14點(diǎn)左右發(fā)布日榜,周榜數(shù)據(jù)通常為清博指數(shù),設(shè)定周日到周六為一周的統(tǒng)計(jì)周期。頭條總閱讀數(shù)為某賬號(hào)當(dāng)期所有頭條文章閱讀數(shù)總和,總閱讀數(shù)為某賬號(hào)當(dāng)期所有文章閱讀數(shù)總和。平均閱讀數(shù)為總閱讀數(shù)除以某賬號(hào)當(dāng)期發(fā)布文章數(shù),總點(diǎn)贊數(shù)為某賬號(hào)當(dāng)期所有文章點(diǎn)贊數(shù)總和,平均點(diǎn)贊數(shù)為總點(diǎn)贊數(shù)除以某賬號(hào)當(dāng)期發(fā)布文章數(shù),最大閱讀數(shù)為某賬號(hào)當(dāng)期最高閱讀數(shù),最大點(diǎn)贊數(shù)為某賬號(hào)當(dāng)期最高點(diǎn)贊數(shù),點(diǎn)贊率為總點(diǎn)贊數(shù)除以總閱讀數(shù)。圖9R為評(píng)估時(shí)間段內(nèi)所有文章(n)的閱讀總數(shù);Z為評(píng)估時(shí)間段內(nèi)所有文章(n)的點(diǎn)贊總數(shù);d為評(píng)估時(shí)間段所含天數(shù)(一般周取7天,月度取30天,年度取365天,其他時(shí)間段以真實(shí)天數(shù)計(jì)算);n為評(píng)估時(shí)間段內(nèi)賬號(hào)所發(fā)文章數(shù);Rt和Zt為評(píng)估時(shí)間段內(nèi)賬號(hào)所發(fā)頭條的總閱讀數(shù)和總點(diǎn)贊數(shù);Rmax和Zmax為評(píng)估時(shí)間段內(nèi)賬號(hào)所發(fā)文章的最高閱讀數(shù)和最高點(diǎn)贊數(shù)。
圖9 WCI通用指標(biāo)體系架構(gòu)及計(jì)分方式
為綜合評(píng)價(jià)各館微信公眾號(hào)整體服務(wù)水平和質(zhì)量,選取2016年5月1日至2017年5月1日的統(tǒng)計(jì)數(shù)據(jù)作為實(shí)驗(yàn)樣本,采用總閱讀數(shù)R、總點(diǎn)贊數(shù)Z、發(fā)布文章數(shù)N、各省館微信平臺(tái)當(dāng)期最高閱讀數(shù)Rmax、該賬號(hào)最高點(diǎn)贊數(shù)Zmax等作為評(píng)價(jià)各館微信公眾平臺(tái)綜合服務(wù)水平的指標(biāo)數(shù)據(jù)來(lái)源,構(gòu)建微信傳播指數(shù)WCI評(píng)價(jià)指標(biāo)體系,詳見(jiàn)圖10。
圖10 微信傳播指數(shù)WCI評(píng)價(jià)指標(biāo)體系
借鑒WCI權(quán)重分配標(biāo)準(zhǔn)[8]來(lái)確定WCI評(píng)價(jià)指標(biāo)體系中的權(quán)重系數(shù),選擇總閱讀數(shù)≥1000、<小于1000兩種情況,確定不同條件下各指標(biāo)權(quán)重系數(shù)(見(jiàn)表3、表4)。
表3 WCI計(jì)算公式(總閱讀數(shù)≥1000)
表4 WCI計(jì)算公式(總閱讀數(shù)<1000)
結(jié)合實(shí)際情況,得出微信傳播指數(shù)WCI的計(jì)算公式。
從表5看出,湖南圖書(shū)館微信傳播指數(shù)遠(yuǎn)遠(yuǎn)高于其他館;四川省圖書(shū)館、甘肅省圖書(shū)館排名第二、第三,且與其剩余館微信傳播指數(shù)相差較大,說(shuō)明微信平臺(tái)服務(wù)水平和質(zhì)量較高。黑龍江省圖書(shū)館、浙江圖書(shū)館推送文章數(shù)量排名第二、第四,但微信傳播指數(shù)排名第八、第十,排名相對(duì)靠后。
各館微信平臺(tái)平均推送文章數(shù)量差異較大,其中湖南圖書(shū)館以1136篇高居榜首,黑龍江省圖書(shū)館、甘肅省圖書(shū)館和浙江圖書(shū)館均超過(guò)500篇,遠(yuǎn)超其他館。通過(guò)線(xiàn)下調(diào)研,發(fā)現(xiàn)各館微信運(yùn)用人力資源分配不均衡。統(tǒng)計(jì)分析各館微信平臺(tái)推送文章數(shù)量和推送時(shí)間,各館推送數(shù)量最多的月份為2016年12月,其次為9月和11月;上半年推送數(shù)量明顯低于下半年。由于用戶(hù)對(duì)微信平臺(tái)的關(guān)注度主要依賴(lài)文章更新以及文章高熱點(diǎn)性,因此應(yīng)重視微信平臺(tái)人力資源建設(shè),提升用戶(hù)對(duì)微信平臺(tái)的依賴(lài)性。
綜合考量各館微信公眾號(hào)推送文章數(shù)量、閱讀數(shù)、點(diǎn)贊數(shù)等各指標(biāo),可知各館微信平臺(tái)服務(wù)水平和質(zhì)量存在差異性,說(shuō)明各館微信平臺(tái)運(yùn)行能力良莠不齊,不同館面臨的問(wèn)題以及急需改進(jìn)的問(wèn)題均不相同。因此,有必要建立科學(xué)的微信平臺(tái)服務(wù)水平評(píng)價(jià)指標(biāo)體系,通過(guò)評(píng)價(jià)結(jié)果來(lái)指導(dǎo)各館改進(jìn)微信平臺(tái)服務(wù)質(zhì)量。
表5 省館微信WCI統(tǒng)計(jì)
通過(guò)對(duì)湖南、四川、黑龍江、甘肅、浙江等5家省館微信傳播指數(shù)、文章推送時(shí)間段、推送內(nèi)容等分析發(fā)現(xiàn),獲得讀者閱讀量最多的文章有兩個(gè)共性:實(shí)時(shí)性和原創(chuàng)性。湖南圖書(shū)館憑借對(duì)熱點(diǎn)、趣聞等信息掌握的實(shí)時(shí)性,吸引大量用戶(hù),奠定微信平臺(tái)多項(xiàng)指標(biāo)均穩(wěn)居第一的位置;四川省圖書(shū)館憑借對(duì)熱點(diǎn)新聞的深入解讀而提升了影響力。因此,各館可發(fā)揮自身優(yōu)勢(shì),加強(qiáng)原創(chuàng)性。
各館微信公眾號(hào)推送頻次普遍不高,需要提高推送次數(shù),通過(guò)完善功能并開(kāi)通對(duì)應(yīng)接收,使訪(fǎng)問(wèn)者與圖書(shū)館管理者實(shí)現(xiàn)實(shí)時(shí)互動(dòng),及時(shí)將書(shū)目等信息推送給用戶(hù),通過(guò)公眾號(hào)對(duì)應(yīng)的接口開(kāi)發(fā)特色程序,包含二維碼圖書(shū)在線(xiàn)掃描,實(shí)現(xiàn)圖書(shū)查詢(xún)和借閱,替代或完成圖書(shū)館APP功能。
對(duì)社交網(wǎng)絡(luò)軟件來(lái)說(shuō),多渠道擴(kuò)大影響是重中之重。圖書(shū)館可以將公眾號(hào)置于網(wǎng)頁(yè)最醒目的地方,或在圖書(shū)館大廳、閱覽室設(shè)置微信號(hào)二維碼掃描區(qū)域,或在微信公眾號(hào)中加強(qiáng)與讀者的互動(dòng),舉辦有獎(jiǎng)?wù)魑暮透?jìng)技類(lèi)活動(dòng),從而提高微信公眾號(hào)的影響力。
[1]張正.圖書(shū)館微信公眾平臺(tái)的構(gòu)建[J].國(guó)家圖書(shū)館學(xué)刊,2014,23(2):26-31.
[2]郭春俠,李詩(shī)琪.國(guó)內(nèi)省級(jí)公共圖書(shū)館微信平臺(tái)服務(wù)探析[J].現(xiàn)代情報(bào),2016,36(4):128-133.
[3]石恩名,肖曉軍.基于云平臺(tái)的分布式高性能網(wǎng)絡(luò)爬蟲(chóng)的研究與設(shè)計(jì)[J].電信科學(xué),2017,43(8):180-186.