摘 要〕作者以圖書情報(bào)圈子里的32個(gè)博客為例,選取博文數(shù)、總訪問(wèn)數(shù)、熱度值、程度中心度、中介中心度等指標(biāo),使用Ucinet軟件進(jìn)行社會(huì)網(wǎng)絡(luò)分析,并采用SPSS進(jìn)行聚類分析,以實(shí)證評(píng)價(jià)圖書情報(bào)博客的情況。這是運(yùn)用社會(huì)網(wǎng)絡(luò)分析的一些指標(biāo)和傳統(tǒng)的一些指標(biāo)評(píng)價(jià)博客績(jī)效。未來(lái)還可從內(nèi)容、利用等多方面,采用人工評(píng)價(jià)與自動(dòng)評(píng)價(jià)相結(jié)合的方式進(jìn)行綜合評(píng)價(jià)。
〔關(guān)鍵詞〕博客;評(píng)價(jià);社會(huì)網(wǎng)絡(luò)分析;發(fā)展趨勢(shì)
DOI:10.3969/j.issn.1008-0821.2015.11.002
〔中圖分類號(hào)〕G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2015)11-0013-05
Empirical Evaluation of Blog About Library and Information
Wang Yihua
(Institute of Scientific and Technical Information,Zhengzhou University,Zhengzhou 450001,China)
〔Abstract〕The paper selected 32 individual blogs in the LIS blogosphere as an example,used five indicators(post number,total number of visits,the heat value of the degree of centrality,betweenness centrality degree),and obtained an empirical evaluation of the performance of LIS blog using Ucinet software for social network analysis and using SPSS for cluster analysis.There is the use of social network analysis indicators and some traditional performance indicators to evaluate the blog.In the future,adding other aspects of blogs such as the content,the use in evaluating the blogs,the paper can make the best use of comprehensive evaluation combined with subjective evaluation and automatic evaluation.
〔Key words〕blog;evaluation;social network analysis;development trend
博客分組織博客、個(gè)人博客。博客評(píng)價(jià)可促進(jìn)寫博的積極性,提高博客的質(zhì)量。在CNKI進(jìn)行以主題“博客”+主題“評(píng)價(jià)”檢索,采用當(dāng)時(shí)武漢大學(xué)(目前在清華大學(xué)任教)沈陽(yáng)博士的ROST軟件進(jìn)行語(yǔ)義網(wǎng)絡(luò)分析。
語(yǔ)義網(wǎng)絡(luò)分析是“博客評(píng)價(jià)”的概念地圖,能刻畫出“博客評(píng)價(jià)”的內(nèi)涵。如圖1所示,主要詞簇是“模型”、“方法”、“用戶”、“影響力”,它們圍繞“評(píng)價(jià)”分布。中文比較有代表性的文獻(xiàn)有:朱麗、呂本富、彭賡采用AHP法對(duì)個(gè)人博客影響力從博客日志質(zhì)量、博客作者權(quán)威性、博客的互動(dòng)性進(jìn)行評(píng)價(jià)[1]。邱均平、徐蓓、李江基于PageRank算法從實(shí)質(zhì)性鏈接的角度對(duì)博客進(jìn)行評(píng)價(jià)[2]。邱均平、于長(zhǎng)福、馬瑞敏采用社會(huì)網(wǎng)絡(luò)法探求圖林博客圈中的核心博客[3]。張曉陽(yáng)、李曉亮采用類h指數(shù)對(duì)科學(xué)網(wǎng)博客影響力進(jìn)行評(píng)價(jià)[4]。常娥、魏彬以圖情博客為例構(gòu)建了網(wǎng)絡(luò)原生數(shù)字資源評(píng)價(jià)指標(biāo)體系,包括文章總數(shù)、瀏覽次數(shù)、回帖數(shù)、鏈接情況、發(fā)文頻率等8個(gè)指標(biāo)[5]。嚴(yán)煒煒采用9個(gè)維度25個(gè)指標(biāo)構(gòu)建微博客服務(wù)質(zhì)量評(píng)價(jià)模型[6]。
對(duì)外文文獻(xiàn)采用以主題“Blog evaluation”在Web of Knowledge檢索,采用ROST英語(yǔ)詞頻統(tǒng)計(jì)軟件進(jìn)行詞頻統(tǒng)計(jì),然后以ROST CM標(biāo)簽云的形式展現(xiàn)。
標(biāo)簽云(Tag Cloud)字號(hào)的大小一般是根據(jù)單詞的出現(xiàn)頻率相關(guān),單詞的出現(xiàn)頻率越高則字號(hào)越大。從上述標(biāo)簽云圖2可知,博客評(píng)價(jià)的熱點(diǎn)在于retrieval(檢索)、extract(抽?。?、internet(因特網(wǎng))、software(軟件)、cluster(聚類)、semantic(語(yǔ)義的)、wiki(維基)、algorithm(算法)、splog(垃圾博客)、spam(垃圾信息)、blogosphere(博客圈)、rss(信息聚合)、forum(論壇)、criteria(標(biāo)準(zhǔn))、vlog(視頻博客)。也就是說(shuō),主要圍繞博客評(píng)價(jià)的標(biāo)準(zhǔn)、
博客評(píng)價(jià)的算法、博客評(píng)價(jià)的工具而展開的。
外文比較有代表性的文獻(xiàn)有:Li Jianjiang基于文本觀點(diǎn)分析構(gòu)建博客熱度模型。該模型不僅考慮了博客主題的有關(guān)綜述和評(píng)論的數(shù)量以及出版時(shí)間,而且還側(cè)重于評(píng)論的傾向[7]。Tan Luke Kien-Weng、Na Jin-Cheon、Theng Yin-Leng通過(guò)博客特征分析,內(nèi)容分析和社區(qū)標(biāo)識(shí)檢測(cè)帖子在博客圈的影響[8]。Nakajima Shinsuke基于博客的知識(shí)水平進(jìn)行以信譽(yù)為本的博客排名[9]。Juffinger Andreas、Granitzer Michael、Lex Elisabeth通過(guò)利用已驗(yàn)證的內(nèi)容對(duì)博客按可信度排名。具體做法是首先比較博客和參考語(yǔ)料集的數(shù)量結(jié)構(gòu);然后,分析每一個(gè)單獨(dú)的博客內(nèi)容,檢查與核實(shí)的新聞?wù)Z料的相似性。根據(jù)內(nèi)容相似值的差異,作者對(duì)博客進(jìn)行排名[10]。endprint
1 實(shí)證研究
e線圖情是北京雷速科技有限公司的產(chǎn)品,是面向圖情界和個(gè)人提供集數(shù)據(jù)庫(kù)服務(wù)、深度研究、專業(yè)咨詢于一體的專業(yè)網(wǎng)站,下設(shè)海外、國(guó)內(nèi)、學(xué)者、熱點(diǎn)、專題、論文等多個(gè)版塊,欄目?jī)?nèi)容豐富,有20多個(gè),如風(fēng)云人物、行業(yè)聚焦、國(guó)際動(dòng)態(tài)、圖情要聞、e線速遞、行業(yè)協(xié)會(huì)、圖情機(jī)構(gòu)、理論技術(shù)、研究報(bào)告、圖書館建設(shè)等(http:∥www.chinalibs.net/jieshao.aspx)。筆者從“e線圖情”中博客導(dǎo)航(http:∥www.chinalibs.net/bkjh/Index.aspx)選擇部分有代表性的個(gè)人博客,并參考有關(guān)專家的建議,最終確定圖書情報(bào)圈子里的32個(gè)博客作為分析樣本(參見表1)。這些圖情博客的博主大部分是圖情教師或圖書館工作人員。這些比較有名的博客來(lái)自于新浪博客(http:∥blog.sina.com.cn/)、科學(xué)網(wǎng)博客(http:∥blog.sciencenet.cn/)、百度空間(http:∥hi.baidu.com/)、博客網(wǎng)(http:∥www.bokee.com/)。其中,新浪網(wǎng)博客是2005年開放,是全國(guó)主流、人氣頗高的博客頻道之一(http:∥baike.baidu.com/),其上的圖林博客圈非常有名(http:∥q.blog.sina.com.cn/library/);科學(xué)網(wǎng)博客是中國(guó)科學(xué)報(bào)社主辦的綜合性科學(xué)網(wǎng)站科學(xué)網(wǎng)(http:∥www.sciencenet.cn)下屬的一個(gè)頻道,主要是針對(duì)科學(xué)家的實(shí)名博客(http:∥bbs.sciencenet.cn/);百度空間是一個(gè)輕松記錄、分享生活的內(nèi)容社區(qū);博客網(wǎng)是方興東發(fā)起成立的知識(shí)門戶網(wǎng)站,因成立于2002年時(shí)間早,號(hào)稱“中國(guó)博客的發(fā)源地”。
本文以圖書情報(bào)圈子里的這些個(gè)人博客為例,探討圖書情報(bào)博客的情況,以便促進(jìn)圖書情報(bào)界博主博客寫作的積極性,提高博客的質(zhì)量。以當(dāng)年還在寫博文的博客、有訪問(wèn)量統(tǒng)計(jì)的博客為例研究,因此一些名博如平凡博客、圖謀不軌、老槐因關(guān)博而未進(jìn)行統(tǒng)計(jì)。
因?yàn)?個(gè)指標(biāo)的“量綱不同”,因此需要進(jìn)行歸一化處理。某指標(biāo)得分歸一值=該指標(biāo)得分值/該類數(shù)據(jù)中該指標(biāo)的最大值。
基本原理:
(1)熱度值=總訪問(wèn)數(shù)/博文數(shù)
(2)中心度[11-12]:程度中心性(Degree Centrality)與中介中心性(Betweenness Centrality)是計(jì)算一個(gè)人在一個(gè)團(tuán)體網(wǎng)絡(luò)中最重要的兩項(xiàng)指標(biāo)。程度中心性衡量一個(gè)人作為中心人物的能力,中介中心性衡量一個(gè)人作為中介性的能力。
標(biāo)準(zhǔn)化程度中心度:
CD(ni)=∑jXjig-1
(1)
Xji是0或1的數(shù)值,代表i與j是否有關(guān)系。g代表此網(wǎng)絡(luò)中的人數(shù)。
標(biāo)準(zhǔn)化中介中心性:
CB(ni)=2∑jkgjk(ni)/gjk(g-1)(g-2)
(2)
gjk代表j達(dá)到k的捷徑數(shù),gjk(ni)代表j達(dá)到k的快捷方式上有i的快捷方式數(shù),g代表此網(wǎng)絡(luò)中的人數(shù)。
本文使用Ucinet(http:∥faculty.ucr.edu/~hanneman/net)進(jìn)行社會(huì)網(wǎng)絡(luò)分析,分析圖情博客各個(gè)博主之間的社會(huì)網(wǎng)絡(luò)關(guān)系。分析結(jié)果見圖3。
(3)聚類分析
采用SPSS進(jìn)行聚類分析。最后聚類4類:許培揚(yáng)、趙星各一類、武夷山、圖謀、滄浪水為一類、其余為另一類(見圖4)。
說(shuō)明:①有的博客搬了幾次家,以新家為準(zhǔn)。所以,統(tǒng)計(jì)數(shù)據(jù)僅供參考。②有的博主有幾個(gè)博客,這里以其中的一個(gè)進(jìn)行介紹。比如,在本文僅對(duì)圖謀的博客網(wǎng)上的(http:∥libseeker.bokee.com/)進(jìn)行了分析。③把某博客與其他博客直接鏈接的,規(guī)定為1,否則為0。④這是以這些博客為例計(jì)算的中心度,如果樣本數(shù)不同,也許結(jié)果會(huì)有所差異。⑤這些博客服務(wù)商分別為新浪博客(http:∥blog.sina.com.cn/)、科學(xué)網(wǎng)博客(http:∥blog.sciencenet.cn/)、百度空間(http:∥hi.baidu.com/)、博客網(wǎng)(http:∥www.bokee.com/)。
2 小結(jié)與體會(huì)
第一,鏈接工具對(duì)于博客評(píng)價(jià)非常重要。在評(píng)價(jià)博客甚至網(wǎng)站時(shí),如果有一個(gè)或者一些好的評(píng)價(jià)工具,這對(duì)評(píng)價(jià)而言實(shí)用而高效。在文獻(xiàn)調(diào)研中,發(fā)現(xiàn)以前一些文獻(xiàn)中采用的鏈接工具如AllTheWeb已不存在(雅虎于2011年4月4日關(guān)閉搜索引擎AlltheWeb),有的軟件如測(cè)試可訪問(wèn)性的Bobby軟件因?yàn)檠邪l(fā)該軟件的公司被兼并,它現(xiàn)在已經(jīng)消失了。此外,現(xiàn)存的自動(dòng)評(píng)價(jià)工具還不完善,結(jié)果不很穩(wěn)定,效果也不太理想。總之,比較穩(wěn)定可靠的搜索引擎對(duì)于博客評(píng)價(jià)是非常重要的。
第二,本文僅是起一個(gè)拋磚引玉之作用。本文未考慮如下因素:博客評(píng)論、博客留言、鏈接訪問(wèn)、鏈接篇數(shù)、文章訪問(wèn)、反向鏈接(是指其他網(wǎng)站指向本網(wǎng)站的鏈接)、被推薦貼等等因素。再者,未分原創(chuàng)還是轉(zhuǎn)載。將來(lái)還可從內(nèi)容、利用等方面進(jìn)行綜合評(píng)價(jià),綜合采用人工評(píng)價(jià)與自動(dòng)評(píng)價(jià)相結(jié)合。并可用百葉窗圖進(jìn)行可視化顯示,某博客的某一優(yōu)劣勢(shì)一目了然。比如分析幾個(gè)博客內(nèi)容如武夷山與許培揚(yáng)、書間道與圖謀等等。
第三,本文以博文數(shù)、總訪問(wèn)數(shù)、熱度值、程度中心度、中介中心度五項(xiàng)指標(biāo)采用聚類評(píng)價(jià),也就是說(shuō),運(yùn)用社會(huì)網(wǎng)絡(luò)分析的一些指標(biāo)和傳統(tǒng)的一些指標(biāo)來(lái)評(píng)價(jià)博客的績(jī)效,是一次有益的嘗試和探索。評(píng)價(jià)是一個(gè)“仁者見仁、智者見智”的問(wèn)題。在參考有關(guān)文獻(xiàn)的基礎(chǔ)上[13-15],可以說(shuō)比較好的方法是定性方法和定量方法相結(jié)合。如何更科學(xué)合理的評(píng)價(jià)博客還有很大的探索空間,尚有許多方面有待在今后的深入研究中繼續(xù)補(bǔ)充和完善。
參考文獻(xiàn)
[1]朱麗,呂本富,彭賡.基于AHP法的個(gè)人博客影響力評(píng)價(jià)方法研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2008,(15):109-117.endprint
[2]邱均平,徐蓓,李江.BlogRank算法及其在圖書館博客中的應(yīng)用[J].圖書情報(bào)知識(shí),2008,(1):68-71,77.
[3]邱均平,于長(zhǎng)福,馬瑞敏.圖林博客的社會(huì)網(wǎng)絡(luò)分析[J].圖書情報(bào)工作,2008,(11):6-9.
[4]張曉陽(yáng),李曉亮.科學(xué)家博客h指數(shù)評(píng)價(jià)及其相關(guān)性分析[J].圖書情報(bào)工作,2010,(2):66-69.
[5]常娥,魏彬.網(wǎng)絡(luò)原生數(shù)字資源優(yōu)選與評(píng)價(jià)研究[J].情報(bào)雜志,2012,(2):163-167.
[6]嚴(yán)煒煒.用戶滿意度視角下微博客服務(wù)質(zhì)量評(píng)價(jià)模型研究[J].圖書情報(bào)工作,2011,(18):53-56.
[7]Li Jianjiang;Zhang Xuechun;Weng Yu;等.Blog Hotness Evaluation Model Based on Text Opinion Analysis[J].Eighth IEEE International Conference on Dependable,Autonomic and Secure Computing,Proceedings,2009:235-240.
[8]Tan Luke Kien-Weng;Na Jin-Cheon;Theng Yin-Leng.Influence detection between blog posts through blog features,content analysis,and community identity[J].Online information review,2011,35(3):425-442.
[9]Nakajima Shinsuke;Zhang Jianwei;Inagaki Yoichi etal.Blog Ranking Based on Bloggers Knowledge Level for Providing Credible Information[J].Lecture Notes in Computer Science,2009,5802:227-234.
[10]Juffinger Andreas;Granitzer Michael;Lex Elisabeth.Blog Credibility Ranking by Exploiting Verified Content[J].WICOW 09,2009:51-58.
[11]Borgatti,SP.,Everett,MG.and Freeman,LC.Ucinet for Windows:Software for Social Network Analysis[M].Harvard,MA:Analytic Technologies,2002.
[12]羅家德.社會(huì)網(wǎng)分析講義(第2版)[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2010.
[13]王一華.國(guó)內(nèi)外網(wǎng)站評(píng)價(jià)研究綜述[J].情報(bào)科學(xué),2013,(11):125-132.
[14]王一華.基于超效率DEA的網(wǎng)站績(jī)效評(píng)價(jià)[J].情報(bào)科學(xué),2012,(9):1371-1375,1384.
[15]郝曉玲,杜沁怡,黃海量.企業(yè)家微博影響力的綜合評(píng)價(jià)研究[J].情報(bào)科學(xué),2015,(3):95-101.
(本文責(zé)任編輯:孫國(guó)雷)endprint