王一華
博客分組織博客、個(gè)人博客。博客評(píng)價(jià)可促進(jìn)寫(xiě)博的積極性,提高博客的質(zhì)量。在CNKI進(jìn)行以主題“博客”+主題“評(píng)價(jià)”檢索,采用當(dāng)時(shí)武漢大學(xué) (目前在清華大學(xué)任教) 沈陽(yáng)博士的ROST軟件進(jìn)行語(yǔ)義網(wǎng)絡(luò)分析。
語(yǔ)義網(wǎng)絡(luò)分析是“博客評(píng)價(jià)”的概念地圖,能刻畫(huà)出“博客評(píng)價(jià)”的內(nèi)涵。如圖1所示,主要詞簇是“模型”、“方法”、“用戶”、“影響力”,它們圍繞“評(píng)價(jià)”分布。中文比較有代表性的文獻(xiàn)有:朱麗、呂本富、彭賡采用AHP法對(duì)個(gè)人博客影響力從博客日志質(zhì)量、博客作者權(quán)威性、博客的互動(dòng)性進(jìn)行評(píng)價(jià)[1]。邱均平、徐蓓、李江基于PageRank算法從實(shí)質(zhì)性鏈接的角度對(duì)博客進(jìn)行評(píng)價(jià)[2]。邱均平、于長(zhǎng)福、馬瑞敏采用社會(huì)網(wǎng)絡(luò)法探求圖林博客圈中的核心博客[3]。張曉陽(yáng)、李曉亮采用類(lèi)h指數(shù)對(duì)科學(xué)網(wǎng)博客影響力進(jìn)行評(píng)價(jià)[4]。常娥、魏彬以圖情博客為例構(gòu)建了網(wǎng)絡(luò)原生數(shù)字資源評(píng)價(jià)指標(biāo)體系,包括文章總數(shù)、瀏覽次數(shù)、回帖數(shù)、鏈接情況、發(fā)文頻率等8個(gè)指標(biāo)[5]。嚴(yán)煒煒采用9個(gè)維度25個(gè)指標(biāo)構(gòu)建微博客服務(wù)質(zhì)量評(píng)價(jià)模型[6]。
對(duì)外文文獻(xiàn)采用以主題“Blog evaluation”在Web of Knowledge檢索,采用ROST英語(yǔ)詞頻統(tǒng)計(jì)軟件進(jìn)行詞頻統(tǒng)計(jì),然后以ROST CM標(biāo)簽云的形式展現(xiàn)。
標(biāo)簽云 (Tag Cloud) 字號(hào)的大小一般是根據(jù)單詞的出現(xiàn)頻率相關(guān),單詞的出現(xiàn)頻率越高則字號(hào)越大。從上述標(biāo)簽云圖2可知,博客評(píng)價(jià)的熱點(diǎn)在于retrieval(檢索) 、extract(抽取) 、internet(因特網(wǎng)) 、software(軟件) 、cluster(聚類(lèi)) 、semantic(語(yǔ)義的) 、wiki(維基) 、algorithm(算法) 、splog(垃圾博客) 、spam(垃圾信息) 、blogosphere(博客圈) 、rss(信息聚合) 、forum(論壇) 、criteria(標(biāo)準(zhǔn)) 、vlog(視頻博客) 。也就是說(shuō),主要圍繞博客評(píng)價(jià)的標(biāo)準(zhǔn)、博客評(píng)價(jià)的算法、博客評(píng)價(jià)的工具而展開(kāi)的。
圖1 中文博客評(píng)價(jià)的語(yǔ)義網(wǎng)絡(luò)分析
圖2 英文博客評(píng)價(jià)詞頻標(biāo)簽云
外文比較有代表性的文獻(xiàn)有:Li Jianjiang基于文本觀點(diǎn)分析構(gòu)建博客熱度模型。該模型不僅考慮了博客主題的有關(guān)綜述和評(píng)論的數(shù)量以及出版時(shí)間,而且還側(cè)重于評(píng)論的傾向[7]。Tan Luke Kien - Weng、Na Jin -Cheon、Theng Yin-Leng通過(guò)博客特征分析,內(nèi)容分析和社區(qū)標(biāo)識(shí)檢測(cè)帖子在博客圈的影響[8]。Nakajima Shinsuke基于博客的知識(shí)水平進(jìn)行以信譽(yù)為本的博客排名[9]。Juffinger Andreas、Granitzer Michael、Lex Elisabeth通過(guò)利用已驗(yàn)證的內(nèi)容對(duì)博客按可信度排名。具體做法是首先比較博客和參考語(yǔ)料集的數(shù)量結(jié)構(gòu);然后,分析每一個(gè)單獨(dú)的博客內(nèi)容,檢查與核實(shí)的新聞?wù)Z料的相似性。根據(jù)內(nèi)容相似值的差異,作者對(duì)博客進(jìn)行排名[10]。
e線圖情是北京雷速科技有限公司的產(chǎn)品,是面向圖情界和個(gè)人提供集數(shù)據(jù)庫(kù)服務(wù)、深度研究、專業(yè)咨詢于一體的專業(yè)網(wǎng)站,下設(shè)海外、國(guó)內(nèi)、學(xué)者、熱點(diǎn)、專題、論文等多個(gè)版塊,欄目?jī)?nèi)容豐富,有20多個(gè),如風(fēng)云人物、行業(yè)聚焦、國(guó)際動(dòng)態(tài)、圖情要聞、e線速遞、行業(yè)協(xié)會(huì)、圖情機(jī)構(gòu)、理論技術(shù)、研究報(bào)告、圖書(shū)館建設(shè)等 (http:∥www.chinalibs.net/jieshao.aspx) 。筆者從“e線圖情”中博客導(dǎo)航 (http:∥www.chinalibs.net/bkjh/Index.aspx) 選擇部分有代表性的個(gè)人博客,并參考有關(guān)專家的建議,最終確定圖書(shū)情報(bào)圈子里的32個(gè)博客作為分析樣本 (參見(jiàn)表1) 。這些圖情博客的博主大部分是圖情教師或圖書(shū)館工作人員。這些比較有名的博客來(lái)自于新浪博客 (http:∥blog.sina.com.cn/) 、科學(xué)網(wǎng)博客 (http:∥blog.sciencenet.cn/) 、百度空間 (http:∥hi.baidu.com/) 、博客網(wǎng) (http:∥www.bokee.com/) 。其中,新浪網(wǎng)博客是2005年開(kāi)放,是全國(guó)主流、人氣頗高的博客頻道之一 (http:∥baike.baidu.com/) ,其上的圖林博客圈非常有名 (http:∥q.blog.sina.com.cn/library/) ;科學(xué)網(wǎng)博客是中國(guó)科學(xué)報(bào)社主辦的綜合性科學(xué)網(wǎng)站科學(xué)網(wǎng) (http:∥www.sciencenet.cn) 下屬的一個(gè)頻道,主要是針對(duì)科學(xué)家的實(shí)名博客 (http:∥bbs.sciencenet.cn/) ;百度空間是一個(gè)輕松記錄、分享生活的內(nèi)容社區(qū);博客網(wǎng)是方興東發(fā)起成立的知識(shí)門(mén)戶網(wǎng)站,因成立于2002年時(shí)間早,號(hào)稱“中國(guó)博客的發(fā)源地”。
本文以圖書(shū)情報(bào)圈子里的這些個(gè)人博客為例,探討圖書(shū)情報(bào)博客的情況,以便促進(jìn)圖書(shū)情報(bào)界博主博客寫(xiě)作的積極性,提高博客的質(zhì)量。以當(dāng)年還在寫(xiě)博文的博客、有訪問(wèn)量統(tǒng)計(jì)的博客為例研究,因此一些名博如平凡博客、圖謀不軌、老槐因關(guān)博而未進(jìn)行統(tǒng)計(jì)。
表1 博客列表
因?yàn)?個(gè)指標(biāo)的“量綱不同”,因此需要進(jìn)行歸一化處理。某指標(biāo)得分歸一值=該指標(biāo)得分值/該類(lèi)數(shù)據(jù)中該指標(biāo)的最大值。
基本原理:
(1) 熱度值=總訪問(wèn)數(shù)/博文數(shù)
(2) 中心度[11-12]:程度中心性 (Degree Centrality) 與中介中心性 (Betweenness Centrality) 是計(jì)算一個(gè)人在一個(gè)團(tuán)體網(wǎng)絡(luò)中最重要的兩項(xiàng)指標(biāo)。程度中心性衡量一個(gè)人作為中心人物的能力,中介中心性衡量一個(gè)人作為中介性的能力。
標(biāo)準(zhǔn)化程度中心度:
Xji是0或1的數(shù)值,代表i與j是否有關(guān)系。g代表此網(wǎng)絡(luò)中的人數(shù)。
標(biāo)準(zhǔn)化中介中心性:
gjk代表j達(dá)到k的捷徑數(shù),gjk(ni) 代表j達(dá)到k的快捷方式上有i的快捷方式數(shù),g代表此網(wǎng)絡(luò)中的人數(shù)。
本文使用 Ucinet(http:∥faculty.ucr.edu/~ hanneman/net) 進(jìn)行社會(huì)網(wǎng)絡(luò)分析,分析圖情博客各個(gè)博主之間的社會(huì)網(wǎng)絡(luò)關(guān)系。分析結(jié)果見(jiàn)圖3。
(3) 聚類(lèi)分析
采用SPSS進(jìn)行聚類(lèi)分析。最后聚類(lèi)4類(lèi):許培揚(yáng)、趙星各一類(lèi)、武夷山、圖謀、滄浪水為一類(lèi)、其余為另一類(lèi)(見(jiàn)圖4) 。
圖3 圖情博客社會(huì)網(wǎng)絡(luò)分析
圖4 聚類(lèi)圖
說(shuō)明:①有的博客搬了幾次家,以新家為準(zhǔn)。所以,統(tǒng)計(jì)數(shù)據(jù)僅供參考。②有的博主有幾個(gè)博客,這里以其中的一個(gè)進(jìn)行介紹。比如,在本文僅對(duì)圖謀的博客網(wǎng)上的(http:∥libseeker.bokee.com/) 進(jìn)行了分析。③把某博客與其他博客直接鏈接的,規(guī)定為1,否則為0。④這是以這些博客為例計(jì)算的中心度,如果樣本數(shù)不同,也許結(jié)果會(huì)有所差異。⑤這些博客服務(wù)商分別為新浪博客 (http:∥blog.sina.com.cn/) 、科學(xué)網(wǎng)博客 (http:∥blog.sciencenet.cn/) 、百度空間 (http:∥hi.baidu.com/) 、博客網(wǎng) (http:∥www.bokee.com/) 。
第一,鏈接工具對(duì)于博客評(píng)價(jià)非常重要。在評(píng)價(jià)博客甚至網(wǎng)站時(shí),如果有一個(gè)或者一些好的評(píng)價(jià)工具,這對(duì)評(píng)價(jià)而言實(shí)用而高效。在文獻(xiàn)調(diào)研中,發(fā)現(xiàn)以前一些文獻(xiàn)中采用的鏈接工具如AllTheWeb已不存在 (雅虎于2011年4月4日關(guān)閉搜索引擎AlltheWeb) ,有的軟件如測(cè)試可訪問(wèn)性的Bobby軟件因?yàn)檠邪l(fā)該軟件的公司被兼并,它現(xiàn)在已經(jīng)消失了。此外,現(xiàn)存的自動(dòng)評(píng)價(jià)工具還不完善,結(jié)果不很穩(wěn)定,效果也不太理想??傊容^穩(wěn)定可靠的搜索引擎對(duì)于博客評(píng)價(jià)是非常重要的。
第二,本文僅是起一個(gè)拋磚引玉之作用。本文未考慮如下因素:博客評(píng)論、博客留言、鏈接訪問(wèn)、鏈接篇數(shù)、文章訪問(wèn)、反向鏈接 (是指其他網(wǎng)站指向本網(wǎng)站的鏈接) 、被推薦貼等等因素。再者,未分原創(chuàng)還是轉(zhuǎn)載。將來(lái)還可從內(nèi)容、利用等方面進(jìn)行綜合評(píng)價(jià),綜合采用人工評(píng)價(jià)與自動(dòng)評(píng)價(jià)相結(jié)合。并可用百葉窗圖進(jìn)行可視化顯示,某博客的某一優(yōu)劣勢(shì)一目了然。比如分析幾個(gè)博客內(nèi)容如武夷山與許培揚(yáng)、書(shū)間道與圖謀等等。
第三,本文以博文數(shù)、總訪問(wèn)數(shù)、熱度值、程度中心度、中介中心度五項(xiàng)指標(biāo)采用聚類(lèi)評(píng)價(jià),也就是說(shuō),運(yùn)用社會(huì)網(wǎng)絡(luò)分析的一些指標(biāo)和傳統(tǒng)的一些指標(biāo)來(lái)評(píng)價(jià)博客的績(jī)效,是一次有益的嘗試和探索。評(píng)價(jià)是一個(gè)“仁者見(jiàn)仁、智者見(jiàn)智”的問(wèn)題。在參考有關(guān)文獻(xiàn)的基礎(chǔ)上[13-15],可以說(shuō)比較好的方法是定性方法和定量方法相結(jié)合。如何更科學(xué)合理的評(píng)價(jià)博客還有很大的探索空間,尚有許多方面有待在今后的深入研究中繼續(xù)補(bǔ)充和完善。
[1]朱麗,呂本富,彭賡.基于AHP法的個(gè)人博客影響力評(píng)價(jià)方法研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2008,(15) :109-117.
[2]邱均平,徐蓓,李江.BlogRank算法及其在圖書(shū)館博客中的應(yīng)用[J].圖書(shū)情報(bào)知識(shí),2008,(1) :68-71,77.
[3]邱均平,于長(zhǎng)福,馬瑞敏.圖林博客的社會(huì)網(wǎng)絡(luò)分析[J].圖書(shū)情報(bào)工作,2008,(11) :6-9.
[4]張曉陽(yáng),李曉亮.科學(xué)家博客h指數(shù)評(píng)價(jià)及其相關(guān)性分析[J].圖書(shū)情報(bào)工作,2010,(2) :66-69.
[5]常娥,魏彬.網(wǎng)絡(luò)原生數(shù)字資源優(yōu)選與評(píng)價(jià)研究[J].情報(bào)雜志,2012,(2) :163-167.
[6]嚴(yán)煒煒.用戶滿意度視角下微博客服務(wù)質(zhì)量評(píng)價(jià)模型研究[J].圖書(shū)情報(bào)工作,2011,(18) :53-56.
[7]Li Jianjiang;Zhang Xuechun;Weng Yu;等.Blog Hotness E-valuation Model Based on Text Opinion Analysis[J].Eighth IEEE International Conference on Dependable,Autonomic and Secure Computing,Proceedings,2009:235 -240.
[8]Tan Luke Kien-Weng;Na Jin-Cheon;Theng Yin-Leng.Influence detection between blog posts through blog features,content analysis,and community identity[J].Online information review,2011,35(3) :425-442.
[9]Nakajima Shinsuke;Zhang Jianwei;Inagaki Yoichi et al.Blog Ranking Based on Bloggers' Knowledge Level for Providing Credible Information[J].Lecture Notes in Computer Science,2009,5802:227-234.
[10]Juffinger Andreas;Granitzer Michael;Lex Elisabeth.Blog Credibility Ranking by Exploiting Verified Content[J].WICOW 09,2009:51-58.
[11]Borgatti,S.P.,Everett,M.G.and Freeman,L.C.Ucinet for Windows:Software for Social Network Analysis[M].Harvard,MA:Analytic Technologies,2002.
[12]羅家德.社會(huì)網(wǎng)分析講義 (第2版) [M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2010.
[13]王一華.國(guó)內(nèi)外網(wǎng)站評(píng)價(jià)研究綜述[J].情報(bào)科學(xué),2013,(11) :125-132.
[14]王一華.基于超效率DEA的網(wǎng)站績(jī)效評(píng)價(jià)[J].情報(bào)科學(xué),2012,(9) :1371-1375,1384.
[15]郝曉玲,杜沁怡,黃海量.企業(yè)家微博影響力的綜合評(píng)價(jià)研究[J].情報(bào)科學(xué),2015,(3) :95-101.