張 顯等董 誠
(中國科學技術信息研究所,北京 100038)
國家科技基礎條件平臺網(wǎng)站影響力評價
張 顯等董 誠
(中國科學技術信息研究所,北京 100038)
通過用戶視角,從推廣宣傳的角度出發(fā),設定搜索引擎中結果排名、平臺官網(wǎng)的外鏈數(shù)量、平臺的學術論文貢獻情況等指標,探究了國家科技基礎條件平臺網(wǎng)站的影響力,得出搜索引擎影響力與論文產出貢獻率顯著正相關等相關結論,并提出相關的評價建議。
國家科技基礎條件平臺;網(wǎng)站;影響力;科研貢獻率;搜索引擎;評價
從互聯(lián)網(wǎng)發(fā)展至今,國內外關于網(wǎng)站影響力評價有不少的研究。1995年Allison woodruff通過爬蟲工具收集了大量網(wǎng)頁,分析頁面的鏈接,篩選出入鏈最高的網(wǎng)站,通過分析與實證表明,網(wǎng)頁的入鏈可以作為網(wǎng)站影響力的一個指標[1]。1998年Peter ingwersen提出網(wǎng)絡影響因子(Web-IF),他指出Web-IF是“在某一時間,來源于外部和自身內部指向特定國家或網(wǎng)站的頁數(shù)與該國家或網(wǎng)站中網(wǎng)頁頁數(shù)之比”引起和很大關注[2]。2002年,邱均平通過對42種工程類中文期刊網(wǎng)站的入鏈和Web-IF進行計量分析,發(fā)現(xiàn)這兩項指標與期刊影響因子有統(tǒng)計意義的相關關系[3]。2007年曾荷通過建立4個評價指標:一般訪問量、深度訪問量、可見度、鏈接指標來對電子政務信息資源網(wǎng)站影響力指數(shù)進行測評[4]。2009年陳斯杰通過對影響力內涵的探究,構建了包含外部變量和內生變量的影響力概念模型,其中外部變量包含信息質量、系統(tǒng)響應、服務可獲得性、交互性等;內生變量包含感知特性、可靠性、認可度、忠誠度及影響力[5]。2013年許東惠、呂志先等在國家科技基礎條件平臺績效概念界定的基礎上,對平臺運行服務績效評價方法和影響因子進行了系統(tǒng)分析,并構建了國家科技基礎條件平臺運行服務績效考核的指標體系[6]。
可以看出,國內外關于網(wǎng)站影響力的研究,定量的方法主要通過網(wǎng)站的入鏈以及Web-IF等與網(wǎng)站鏈接相關的指標來衡量,定性的方法則一般集中在資源的形式、內容建設、組織機構等方面,因此,評價主要集中在運行管理和服務績效等方面。
本研究在收集國家科技基礎條件平臺網(wǎng)絡調查數(shù)據(jù)的基礎上,從普通用戶的角度出發(fā),對23家科技基礎條件平臺網(wǎng)站的搜索引擎排名和分布情況進行分析,以期揭示出不同平臺的網(wǎng)絡可見性及其學術論文貢獻度,方便、完善平臺網(wǎng)站影響力的評估。
根據(jù)最小努力原則,人們的各種社會活動,總是想以最小的代價獲得最大的收益[7]。在Web2.0時代更是如此,搜索引擎成為了用戶的主要信息獲取渠道。所以,此次調查指標都建立在搜索引擎的基礎上,從平臺網(wǎng)站的可見性和易見性兩方面考慮,分別設立了平臺網(wǎng)站搜索引擎可見性和搜索結果TOP30分布等二級指標;同時通過知網(wǎng)學術搜索來了解各個平臺的學術產出貢獻度,探尋其和網(wǎng)站影響力之間的關系,并輔助佐證指標設定的有效性。根據(jù)美國最早的搜索引擎營銷專業(yè)服務商iProspect(www.iprospect.com)和市場研究公司Jupiter Research聯(lián)合調查:互聯(lián)網(wǎng)用戶使用搜索引擎越來越沒有耐心,越來越多的互聯(lián)網(wǎng)用戶僅關注搜索結果第一頁的內容,如果第一頁面沒有滿意的結果,立刻變換關鍵詞或者更換搜索引擎重新進行檢索,所以考慮官網(wǎng)出現(xiàn)排名情況時,只考慮第一頁的結果;同時,高達90%的搜索者只查看搜索結果前三頁,所以進行結果頁面分析時,只考慮前三頁也就是TOP30的結果[8]。在考慮學術產出影響力的時候,由于用戶引用習慣的不同,我們認為只要該平臺名字在論文中任何地方被提及,都算做該平臺對該論文有貢獻,所以我們選擇具有全文檢索的知網(wǎng)數(shù)據(jù)庫和檢索比較全的谷歌學術進行檢索。具體指標如表1所示。
3.1 評價原則
(1)以網(wǎng)站評價為起點和抓手。網(wǎng)站是科技資源信息對外揭示的主要的、最快捷的手段,因此,本評估的指標設計、評價過程安排等應緊密結合網(wǎng)站特點進行設計和部署。
(2)以用戶需求為導向??萍蓟A條件平臺是為了滿足用戶需求,本次所進行的平臺網(wǎng)站影響力評價就是從用戶角度出發(fā)的。
(3)以第三方立場為視角。本次所有調查和評價的參與者都是獨立于國家科技基礎條件平臺的第三方普通用戶,能夠更加客觀地研究和實施評價。評價基于網(wǎng)絡客觀數(shù)據(jù),從公眾用戶的角度出發(fā),符合科技基礎條件平臺的相關規(guī)定。
(4)指標設計應盡量簡單,易于量化和獲取。避免過于理論或者學術化,或者與科技資源信息開放共享無關的指標。
3.2 權重的設定
本研究中,主要采用層次分析法確定指標的權重。層次分析法是對人的主觀判斷作定量描述的一種方法,尤其適用于多目標的定性為主的決策[9]。使用這種定性分析和定量分析相結合的決策分析方法,我們首先要把評估的目標分解成若干層次,建立起有序的梯階層次結構(即層次結構模型),從而使人的經驗和判斷能用數(shù)量形式加以表達和處理。
3.3 數(shù)據(jù)獲取方式
(1)主要采用人工采集的方法,從搜索引擎入口調查數(shù)據(jù),調查內容按照評價指標進行分解,進而轉為對各平臺網(wǎng)站在搜索引擎中的收錄情況和科研引用情況進行調查。在此過程中,部分數(shù)據(jù)通過抽樣方式獲得,如在所有檢索結果中,僅挑選前3頁的內容進行分類分析。
(2)部分指標通過專用網(wǎng)站工具獲得。如對于各平臺網(wǎng)站的外部鏈接情況,使用open site explorer獲取。
3.4 信息的處理方法
(1)信息量化方法。該方法的主要功能是將定性信息進行量化。在本研究中,指標都是定量指標。
(2)信息的預處理方法。通過信息的預處理可以將不同種類、不同量綱的信息進行規(guī)范化處理,使之具有統(tǒng)一的標準。若各種信息不按統(tǒng)一的標準進行預處理,那么,有些信息可能會被其他的信息淹沒,致使評價結果沒有意義。本研究的信息預處理采用無量綱化和相對化技術。
(3)信息的計算方法。本研究采用線性加權模型[10],將經過預處理的信息進行綜合計算,并得出評價結果。計算公式如下:
其中,Xij為底層指標的評價值,Wij為底層指標權重,Wi為上一級指標權重。將每個底層指標進行分別評價,并將評價值量化,再將評價值與表述該指標相對重要性的權重系數(shù)相乘,同時對上一級指標求和,得到上一級指標的評價值。直至達到頂層指標,從而得到綜合評價結果。
4.1 總體評價
根據(jù)上述指標體系,通過調查和統(tǒng)計計算得到國家科技基礎條件平臺網(wǎng)站公眾影響力的評價結果??傮w得分情況如表2所示,分段統(tǒng)計結果如圖1所示。
通過表1、圖1可以看出,從搜索引擎的入口出發(fā),各個平臺的影響力表現(xiàn)整體一般,高分區(qū)90~100的沒有,80以上的也不多。原因可能是,各個平臺都把工作中心放在了資源的建設和平臺管理的完善上,而忽略了平臺的推廣,從而降低了平臺的搜索引擎可見性和影響力。
表2 國家科技基礎條件平臺得分情況匯總表
圖1 國家科技基礎條件平臺網(wǎng)站影響力得分分段統(tǒng)計結果
針對調查對象得分情況,我們做出二級指標平均得分以及得分率,結果如圖2所示。
由圖2可以看出,搜索結果TOP30分布得分率和學術產出影響力得分率比較低。這從一定程
圖2 國家科技基礎條件平臺網(wǎng)站影響力二級指標平均得分及得分率
圖3 國家科技基礎條件平臺網(wǎng)站搜索引擎影響力得分圖
4.2 搜索引擎影響力
搜索引擎影響力的各個平臺得分情況如圖3所示。圖3展現(xiàn)了各個平臺搜索引擎影響力的得分情況,反映的是用戶通過搜索引擎入口,找到平臺官方網(wǎng)站和獲得相關信息的難易程度,以及搜索結果TOP30的分布情況。這從一個側面反應了各個平臺網(wǎng)站在搜索引擎方面的影響力。從結果來看,各個平臺得分比較均衡,雖有高低之分,但沒有非常顯著的差異。
通過圖2可以發(fā)現(xiàn),一級指標搜索引擎影響力下的二級指標TOP30分布得分率比較低。通過分析該二級指標下的三級指標的平均得分與得分率,得到結果如圖4所示。
通過圖4可以發(fā)現(xiàn),社交類網(wǎng)站、百科類網(wǎng)站、導航類網(wǎng)站平均得分率低于60%,而這一類網(wǎng)站則主要是以用戶互動為主,有明顯的Web2.0特點??梢?,各個平臺在和用戶互動以及用戶之間互動方面的重視程度不夠。
圖4 國家科技基礎條件平臺搜索結果TOP30分布三級指標平均得分及得分率率
圖5 國家科技基礎條件平臺科研貢獻性評價得分
4.3 科研貢獻性
我們認為只要某一篇文章中出現(xiàn)了某平臺的名字,就算該平臺為該文章貢獻一次,而不去深入追究該文章是否真的使用了該平臺的資源。這樣,我們選取知網(wǎng)的全文檢索和谷歌學術,精確檢索每個平臺的名稱,得出每個平臺的數(shù)據(jù)值,在經過打分加權計算,得到最終結果,如圖5所示。
通過圖5可以看出,各個平臺的科研貢獻性差距很大,高低分差比較大。當然,這跟不同平臺的性質有關,也涉及學術誠信問題。在這里,我們不做進一步討論。
考慮到搜索引擎影響力和科研貢獻性之間的關系,我們在SPSS中對這兩個變量做了相關性檢驗,得到結果如表3所示。
通過表3可以看出,搜索引擎影響力和科研貢獻性顯著正相關,說明科技基礎條件平臺網(wǎng)站在搜索引擎里的排名以及搜索結果優(yōu)化等等會影響到該平臺資源的利用,進而影響到科研產出,同時也佐證了我們指標設定的合理性。
表3 國家科技基礎條件平臺網(wǎng)站搜索引擎影響力和科研貢獻性相關性結果表
5.1 結論
本次評價在理論上,繼承和發(fā)展了以往的評價體系,采取了傳統(tǒng)的連接數(shù)量方面的指標,并在其基礎上做了補充,加入搜索引擎排名以及搜索結果分布方面的指標,并且考慮到了學術方面的影響力,加設了相應的指標;摒棄了晦澀難懂的技術指標,而從普通用戶的角度出發(fā),具有一定的實踐指導價值;以用戶為中心是核心思路,可以擴展到其他領域。整體來看,就本次評價而言,有以下幾個方面關鍵結論:(1)國家科技基礎條件平臺網(wǎng)站影響力表現(xiàn)一般,平臺推廣、宣傳工作仍需加強。(2)平臺學術論文貢獻率和平臺網(wǎng)站搜索引擎影響力呈顯著性正相關關系。學術論文貢獻方面表現(xiàn)好的平臺,同樣網(wǎng)站的搜索引擎影響力也比較大,優(yōu)化平臺網(wǎng)站將是提高科研產出的另一途徑。(3)平臺網(wǎng)站涉及社交類網(wǎng)站、導航類網(wǎng)站、百科類網(wǎng)站的程度比較低。平臺網(wǎng)站在向Web2.0轉型中不成功,仍然是以單方的資源提供,另一方的資源接受,平臺與用戶、用戶與用戶間的互動較差。
本研究也有不足的地方,如搜索引擎選擇方面的用戶差異性沒有考慮到,學術產出影響力方面指標仍需要進一步優(yōu)化等。今后的研究將會集中在各個平臺用戶粘性以及平臺科研貢獻方面。
5.2 建議
針對研究中發(fā)現(xiàn)的問題,結合目前我國國家科技基礎條件平臺考核評價狀況,在改進和完善影響力評價進而提升服務績效方面,提出以下幾點建議。
(1)針對不同的用戶,如政府決策者、科研工作者、普通公眾等進行分類調查,制定符合不同用戶使用習慣的個性化影響力評估考核體系,有針對性地完善對不同用戶提供的服務。
(2)將網(wǎng)站影響力評價作為國家科技基礎條件平臺績效考核的主要內容之一。通過豐富完善已有的平臺考核指標體系,來加強平臺承建單位對網(wǎng)站優(yōu)化和開放共享的重視,提高平臺資源的利用率。
(3)分析用戶訪問記錄,了解用戶習慣,針對用戶偏好,不斷調整優(yōu)化相應指標權重,完善影響力評價體系,使其更加符合用戶的真實需求,進而提升平臺資源的利用率和服務績效。
在不斷完善和改進各平臺網(wǎng)站影響力評價的同時,各平臺承擔單位也可以通過其他手段來增加其平臺網(wǎng)站影響力,如設立網(wǎng)絡專員、開設有針對性的社交網(wǎng)絡賬戶或者社交平臺、建立與搜索引擎的合作等。
在數(shù)據(jù)時代,資源異常豐富,同時也增加了篩選和查找的難度。這就要求資源擁有方擴大影響力,更加方便、快捷地向用戶提供優(yōu)質資源。網(wǎng)站這一信息傳播通道將會變得更加重要。我們相信,在資源不斷建設和影響力不斷加強的背景下,我國科技事業(yè)必將得到更加健康全面的發(fā)展。
[1] Allison Woodruff. An Investigation of Documents from the World Wide Web[DB/OL]. [2014-01-17]. http:// db.cs.berkeley.edu/papers/www5-docs/www5-submit/ Overview.html.
[2] Peter Ingwersen. The Calculation of Web Impact Factors[J]. Journal of Documentation, 1998,54(2):236-243.
[3] 邱均平,安璐.中文期刊影響因子與網(wǎng)絡影響因子和外部鏈接數(shù)的關系研究[J].情報學報:2003,22(4):398-402.
[4] 曾荷.電子政務信息資源的網(wǎng)站影響力評價研究[D].上海:華東師范大學,2007.
[6] 陳斯杰.基于用戶視角的科技信息服務網(wǎng)站影響力評估研究[D].南京:南京理工大學,2009.
[6] 許東惠,呂先志,袁偉,等.國家科技基礎條件平臺運行服務績效考核指標體系研究[J].中國基礎科學,2013(1):40-43.
[7] 百度百科.最小努力原則[EB/OL].[2014-01-17]. http:// baike.baidu.com/link?url=-aEYqwXZZEbBXkN6CC-gPTCYN0rGlPO9Qrye4BpXSYlJ60PbwnIhoegJhime D9M8qLDmbTpMVpcnpS8YevLkhI.
[8] 新競爭力.多數(shù)互聯(lián)網(wǎng)用戶僅關注搜索結果第一頁的內容 [EB/OL]. [2014-01-17]. http://www.jingzhengli. cn/baogao/f20060413.htm.
[9] 朱茵,孟志勇,闞叔愚,等.用層次分析法計算權重[J].北方交通大學學報,1999,23(5):119-122.
[10] 趙煒,魏玲,許軍,等.線性加權評價與聚類分析理論及應用[J].純粹數(shù)學與應用數(shù)學,2002,18(2):121-125.
Study on the Inf l uence of National Science & Technology Infrastructure Website
Zhang Xian, Dong Cheng
(Institute of Scientif i c and Technical Information of China, Beijing 100038)
In this study, as a third party we based on the user’s real need, start from the perspective of propagandizing and popularizing, and set a series of indexes such as the rank of the website in search engine result, the number of incoming links, the academic contribution to study the influence of national science & technology infrastructure website. Finally, we came to the conclusion that website’s influence power and academic output were significantly positive correlation, and give some suggestions such as open network commissioner.
national science &technology infrastructure, website, influence, academic contribution, search engine, evaluation
G311
A
10.3772/j.issn.1674-1544.2014.03.013
張顯*(1991- ),男,中國科學技術信息研究所碩士研究生,研究方向:科技資源共享。董誠(1970- ),男,中國科學技術信息研究所研究員,研究方向:科技資源管理。
2013年12月25日。