肖敖夏,楊思洛
學(xué)術(shù)圖書是學(xué)術(shù)交流的重要途徑之一,尤其在人文社科和藝術(shù)領(lǐng)域[1]。相較于學(xué)術(shù)期刊,學(xué)術(shù)圖書的影響力評(píng)價(jià)并沒有受到學(xué)者的重視。一方面,當(dāng)前缺少一個(gè)針對(duì)學(xué)術(shù)圖書的可靠且全面的引文索引系統(tǒng),使得學(xué)術(shù)圖書的影響力分析較難適應(yīng)評(píng)價(jià)研究的發(fā)展[2];另一方面,不同于期刊論文一經(jīng)發(fā)表便成定稿的特征,學(xué)術(shù)圖書具有獨(dú)特的文件類型屬性,尤其當(dāng)涉及圖書的版本、翻譯、叢書等情況時(shí),對(duì)其進(jìn)行影響力分析更加復(fù)雜[3]。目前使用較為廣泛、基于引文的學(xué)術(shù)圖書評(píng)價(jià)工具,主要是Web of Science平臺(tái)推出的Book Citation Index(BKCI,圖書引文索引),能夠分別針對(duì)圖書和章節(jié),統(tǒng)計(jì)其被其他圖書、期刊或會(huì)議論文等引用的情況。BKCI 存在很多問題。比如,BKCI 收錄的圖書以英文為主,其他語種的圖書比例很??;BKCI圖書的出版時(shí)間集中在2005年至今,在回溯性上存在不足[4]。
近年來,學(xué)術(shù)圖書越來越多采用在線出版方式,為圖書提供了廣泛的傳播途徑,也為圖書評(píng)價(jià)提供了新角度。基于新環(huán)境帶來的新需求,在線評(píng)價(jià)指標(biāo)Altmetrics 被Jason Priem 等提出[5]。Altmetrics 是一種基于社交網(wǎng)絡(luò)的科學(xué)評(píng)價(jià)方法,它通過對(duì)科研成果的在線交流數(shù)據(jù)進(jìn)行實(shí)時(shí)追蹤與采集來實(shí)現(xiàn)評(píng)價(jià)。相較于傳統(tǒng)計(jì)量方法,Altmetrics 更加全面、精確與多樣[6],因而被迅速應(yīng)用于學(xué)術(shù)成果的評(píng)價(jià)。隨著Altmetrics的發(fā)展,基于在線交流的非引用型度量指標(biāo)被提出并用于學(xué)術(shù)圖書的評(píng)價(jià)。這一度量分為基于使用情況的指標(biāo)和基于社交媒體的指標(biāo)兩種,主要包括書籍在相關(guān)平臺(tái)的下載次數(shù)、讀者標(biāo)記數(shù)以及從社交媒體上收集的書籍被提及的頻率等[2]。Bookmetrix 正是順應(yīng)這一趨勢(shì)提出的,它是Springer Nature和Altmetric.com合作開發(fā)的圖書評(píng)價(jià)指標(biāo)平臺(tái),匯集了一系列性能指標(biāo),能夠幫助人們了解相關(guān)圖書在全球范圍內(nèi)的討論、引用和使用情況。Bookmetrix包括CrossRef引用數(shù)(Citations)、Altmetric.com 的在線提及數(shù)(Online Mentions)、 Mendeley 的 讀 者 標(biāo) 記 數(shù)(Readers)、 Springer 的 評(píng) 論 數(shù) (Book Reviews)、Springer 的下載量(Downloads)等 5 個(gè)指標(biāo)[7]。它對(duì)傳統(tǒng)的引文指標(biāo)以及基于在線交流的非引用指標(biāo)進(jìn)行收集整合,能夠從多維度對(duì)圖書的影響力進(jìn)行揭示。本研究的主要目的正是利用Bookmetrix 指標(biāo)對(duì)Springer 學(xué)術(shù)圖書影響力進(jìn)行評(píng)估,并分析Bookmetrix 指標(biāo)在多大程度上能對(duì)學(xué)術(shù)圖書的價(jià)值進(jìn)行評(píng)判。
利用Bookmetrix 平臺(tái),可以檢索Springer Link數(shù)據(jù)庫的書籍和書籍章節(jié)的各種評(píng)價(jià)指標(biāo),查找特定主題中最受歡迎的書籍和章節(jié),并探索每個(gè)度量標(biāo)準(zhǔn)類別的最佳表現(xiàn)者。此外,通過Bookmetrix 還能夠查看圖書的影響、用途和范圍。Bookmetrix 的詳細(xì)信息頁面顯示各種書籍及其章節(jié)的所有可用數(shù)據(jù),為每本書或每章節(jié)收到的引用數(shù)、讀者標(biāo)記數(shù)、在線提及數(shù)、評(píng)論數(shù)和下載量等5 大指標(biāo)數(shù)據(jù)提供全面的概述[8]。Bookmetrix從Springer和CrossRef中檢索書籍和章節(jié)元數(shù)據(jù),然后從各種數(shù)據(jù)源聚合相關(guān)書籍和章節(jié)的度量,各指標(biāo)說明詳見表1。
表1 Bookmetrix各指標(biāo)介紹[9]
筆者利用爬蟲工具,從Springer Link 數(shù)據(jù)庫平臺(tái)(https://link.springer.com/)爬取各學(xué)科類別下學(xué)術(shù)圖書的Bookmetrix 數(shù)據(jù)。為便于后續(xù)的分學(xué)科討論,參考《中國(guó)圖書館分類法》五大部類分類思想和《杜威十進(jìn)制圖書分類法》10個(gè)大類的分類準(zhǔn)則,將Springer 的24 個(gè)學(xué)科重新劃分為人文學(xué)科、社會(huì)科學(xué)、自然科學(xué)、應(yīng)用科學(xué)4個(gè)大類,并設(shè)置變量存儲(chǔ)劃分結(jié)果。以“1”表示人文學(xué)科,“2”表示社會(huì)科學(xué),“3”表示自然科學(xué),“4”表示應(yīng)用科學(xué),見表2。
表2 4個(gè)大類變量值及其對(duì)應(yīng)的Springer學(xué)科類別
由表3可見,截至2019年3月22日,本研究共爬取Springer Link學(xué)科分類體系下的24類學(xué)術(shù)圖書,并將其歸為4 個(gè)學(xué)科大類,共得到239,032種圖書。然后,將這些圖書的Citations、Readers、Book Reviews、Downloads 和 Online Mentions 等 5 個(gè) Bookmetrix 指標(biāo)數(shù)據(jù),導(dǎo)入SPSS Statistics軟件,開展后繼分析。
表3 學(xué)科數(shù)據(jù)量統(tǒng)計(jì)
對(duì)數(shù)據(jù)進(jìn)行因子分析:提取能充分解釋全部5個(gè)指標(biāo)的因子個(gè)數(shù),計(jì)算因子得分及其方差貢獻(xiàn)率;利用得到的因子及個(gè)案因子得分,對(duì)因子賦予因子旋轉(zhuǎn)后的方差貢獻(xiàn)率作為各自權(quán)重,從而得到因子綜合得分。通過計(jì)算因子綜合得分,對(duì)Springer學(xué)術(shù)圖書進(jìn)行直觀便捷的影響力綜合評(píng)價(jià),詳見圖1。
圖1 Bookmetrix綜合得分計(jì)算流程
(1)KMO樣本測(cè)度和巴特利特球度檢驗(yàn)。對(duì)數(shù)據(jù)進(jìn)行KMO 樣本測(cè)度和巴特利特球度檢驗(yàn),以判斷數(shù)據(jù)是否適合進(jìn)行因子分析。本研究中的KMO樣本充足度檢驗(yàn)值為0.601,大于適合因子分析的臨界值0.5,表明變量可以進(jìn)行因子分析。巴特利特球度檢驗(yàn)的統(tǒng)計(jì)量觀測(cè)值為44,794.875,對(duì)應(yīng)的概率P值為0.000,小于顯著性水平α,指標(biāo)間具有一定的相關(guān)性,存在共同因素,與KMO檢驗(yàn)結(jié)果一致。
(2)因子分析與提取。對(duì)原始變量進(jìn)行因子分析的目的并非削減變量個(gè)數(shù),而是在于給出一個(gè)計(jì)算綜合分值的辦法。本文數(shù)據(jù)僅有5個(gè)原始變量,因而考慮提取全部5個(gè)因子,以保證對(duì)原始變量的解釋程度。由于保留了全部因子,因此5個(gè)原始變量的共同度均為“1.00”,此時(shí)不存在信息丟失。導(dǎo)出各因子對(duì)應(yīng)的總方差解釋,詳見表4。表4第一組數(shù)據(jù)描述了因子分析初始解的情況,其中第1 個(gè)因子的初始特征值總計(jì)為1.527,解釋原有5 個(gè)變量總方差的30.544%(即:初始特征值÷5×100%),累計(jì)方差貢獻(xiàn)率為30.544%;其余數(shù)據(jù)含義類推。第二組數(shù)據(jù)描述了提取因子的具體情況——由于提取了全部5個(gè)因子,因而提取因子的具體情況同因子分析初始解一致。第三組數(shù)據(jù)展現(xiàn)的是旋轉(zhuǎn)后的最終因子解,此時(shí)得到的因子得分為最終因子得分。因子旋轉(zhuǎn)后,總的累計(jì)方差貢獻(xiàn)率沒有改變,但重新分配了各個(gè)因子解釋原有變量的方差,此時(shí)的因子方差貢獻(xiàn)率即是對(duì)應(yīng)因子的得分權(quán)重。
表4 因子分析總方差解釋
(3)綜合得分計(jì)算。將因子分析后所得各種圖書(本研究中稱為“個(gè)案”)的因子得分輸入SPSS中,生成對(duì)應(yīng)的SPSS變量,見表5。
表5 各因子對(duì)應(yīng)的SPSS變量及其權(quán)重
以旋轉(zhuǎn)后各因子的方差貢獻(xiàn)率作為其權(quán)重,計(jì)算最終的綜合評(píng)價(jià)得分。創(chuàng)建綜合得分變量“score”,使:
(4)歸一化處理和個(gè)案排序。為了使綜合得分更加直觀,對(duì)綜合得分變量score做歸一化處理,使得到的新數(shù)據(jù)位于[0,1]之間。設(shè)置變量“New_score”,用于存儲(chǔ)標(biāo)準(zhǔn)化后的觀測(cè)值。由歸一化公式對(duì)數(shù)據(jù)進(jìn)行歸一處理,公式如下:
x'=(x-min)/(max-min)
對(duì)所得New_score變量進(jìn)行基本描述統(tǒng)計(jì)(保留四位小數(shù)),見表6。
表6 New_score變量的基本描述統(tǒng)計(jì)
經(jīng)過標(biāo)準(zhǔn)化處理后,所有個(gè)案Bookmetrix指標(biāo)綜合得分變量score的最低值轉(zhuǎn)換為0,最高值轉(zhuǎn)換為1。將個(gè)案按照New_score變量值的降序排列,創(chuàng)建變量“sort”,表示New_score變量值由大到小的排序。設(shè)New_score觀測(cè)值最大的個(gè)案對(duì)應(yīng)的sort變量值為1,得分第二的個(gè)案對(duì)應(yīng)的sort變量值為2,以此類推。
因子綜合得分排名靠前的學(xué)術(shù)圖書Bookmetrix各指標(biāo)觀測(cè)值及相關(guān)學(xué)科分類統(tǒng)計(jì)情況見表7,僅列出排名前10的學(xué)術(shù)圖書信息。由表7可知,綜合得分高的圖書并不是傳統(tǒng)意義上學(xué)術(shù)價(jià)值高的圖書,即被引量高的圖書。實(shí)際上,排名首位的圖書被引量?jī)H為1次,排名第二的學(xué)術(shù)圖書被引量也僅有3 次。得分最高的學(xué)術(shù)圖書為A Survey of Radial Velocities in the ZodiacalDust Cloud,分值為1.00,作者布萊恩·哈羅德·梅(Brian Harold May)是英國(guó)著名搖滾樂隊(duì)皇后樂隊(duì)的成員,該書是其博士學(xué)位論文。該書的在線提及數(shù)達(dá)2,100 次,是統(tǒng)計(jì)中在線提及數(shù)指標(biāo)的最大值,顯然作者的身份使這本著作得到更多關(guān)注。排在第二位的是國(guó)際天文學(xué)聯(lián)合會(huì)(International Astronomical Union,IAU)的官方參考書,因較高的下載量(306,000次)及在線提及數(shù)(2,000次)獲得較高的綜合得分。
表7 綜合得分排名前10的個(gè)案及其統(tǒng)計(jì)信息
從圖書綜合得分排名前30來看,排名較高的圖書主要有3類:(1)學(xué)術(shù)價(jià)值較高、獲得較多被引量的專著,如排名第3、第9的作品。這類專著主要為專業(yè)類學(xué)術(shù)著作。(2)社會(huì)關(guān)注度較高、獲得較多在線提及數(shù)的圖書,如排名第1、第2 的作品。這類書籍可稱為明星類學(xué)術(shù)專著。(3)在Mendeley 獲得較高讀者(標(biāo)記)數(shù),有眾多學(xué)者進(jìn)行標(biāo)記閱讀的書籍。這類圖書在各個(gè)學(xué)科內(nèi)往往是重要的教學(xué)或基礎(chǔ)性參考書籍。比如,排名第6位的作品對(duì)11種神經(jīng)系統(tǒng)疾病的臨床試驗(yàn)設(shè)計(jì)進(jìn)行深入描述和討論,是神經(jīng)科臨床醫(yī)學(xué)的重要參考讀物;排名第8的作品輯錄了城市生態(tài)學(xué)領(lǐng)域的重要論文,提供有關(guān)城市生態(tài)學(xué)核心內(nèi)容的豐富背景,是該學(xué)科的重要參考讀物。這類著作主要為基礎(chǔ)參考類學(xué)術(shù)專著。
以“圖書綜合得分排序”變量為橫軸,“圖書綜合得分”變量為縱軸,繪制簡(jiǎn)單散點(diǎn)圖(見圖2)。由圖2可觀測(cè)到,圖書綜合得分具有顯著的馬太效應(yīng)和長(zhǎng)尾效應(yīng)。少數(shù)圖書的綜合得分較高(見散點(diǎn)圖左端),絕大多數(shù)圖書的綜合得分較低(見散點(diǎn)圖右端)。少數(shù)Bookmetrix綜合得分高的學(xué)術(shù)圖書獲得較多關(guān)注(下載、引用、評(píng)論、在線提及和讀者標(biāo)記),相關(guān)計(jì)量指標(biāo)呈現(xiàn)出更好的觀測(cè)值;計(jì)量指標(biāo)數(shù)據(jù)靚麗又吸引了更多的關(guān)注,體現(xiàn)出學(xué)術(shù)交流過程中的馬太效應(yīng)。同時(shí),大量學(xué)術(shù)圖書僅獲得較低的綜合得分,在散點(diǎn)圖中呈現(xiàn)出一條向右延伸的長(zhǎng)尾。
圖2 圖書綜合得分簡(jiǎn)單散點(diǎn)圖
以綜合得分排名前20%的圖書為一組,以綜合得分排名后80%的圖書為另一組,分別進(jìn)行計(jì)量統(tǒng)計(jì)。由表8可見,綜合得分前20%的圖書下載量占68.87%、被引量67.99%、評(píng)論數(shù)80.55% 、 在 線 提 及 數(shù) 77.38% 、 讀 者 數(shù)76.11%,呈現(xiàn)“二八分布”規(guī)律。Springer 評(píng)論數(shù)指標(biāo)、Altmetric 在線提及數(shù)指標(biāo)和Mendeley讀者數(shù)指標(biāo),相較Springer下載量指標(biāo)和CrossRef被引量指標(biāo),呈現(xiàn)出更顯著的聚集效應(yīng)。
表8 以綜合得分排名前20%為分界線的圖書分組統(tǒng)計(jì)情況
以4個(gè)學(xué)科大類作為獨(dú)立樣本,檢驗(yàn)各獨(dú)立樣本的綜合得分變量觀測(cè)值分布是否一致。由于數(shù)據(jù)不符合正態(tài)分布,須進(jìn)行非參數(shù)檢驗(yàn)。采用Kruskal-Wallis檢驗(yàn),對(duì)4個(gè)學(xué)科大類進(jìn)行兩兩之間的觀測(cè)值分布相似度檢驗(yàn),非參數(shù)檢驗(yàn)結(jié)果見表9??梢钥吹?,人文學(xué)科和社會(huì)科學(xué)之間的雙尾顯著性概率為0.066,大于0.05,表明這2個(gè)大類具有相似的數(shù)據(jù)分布情況。除此之外,其余樣本兩兩之間的雙尾顯著性概率為0.000,小于0.05。因此,應(yīng)拒絕原假設(shè),即綜合得分變量分布在其余學(xué)科大類上兩兩間各不相同。
表9 基于學(xué)科大類的獨(dú)立樣本Kruskal-Wallis檢驗(yàn)
繪制各學(xué)科大類綜合得分均值和中位數(shù)的折線圖,見圖3。由圖3可知,各學(xué)科大類綜合得分均值具有較大差別。自然科學(xué)綜合得分均值最大,為0.0080,社會(huì)學(xué)科綜合得分均值最小,為0.0054。自然科學(xué)和應(yīng)用科學(xué)綜合得分的中位數(shù)及平均數(shù)均大于人文學(xué)科和社會(huì)科學(xué),由此可見,自然科學(xué)和應(yīng)用科學(xué)的Bookmetrix 綜合得分較人文學(xué)科和社會(huì)科學(xué)高。
圖3 學(xué)科圖書綜合得分均值及中位數(shù)折線圖
(1)利用Bookmetrix指標(biāo)可以對(duì)學(xué)術(shù)圖書進(jìn)行精確評(píng)價(jià),對(duì)部分被引量不高但具有社會(huì)影響力的學(xué)術(shù)圖書進(jìn)行揭示和發(fā)現(xiàn),從多角度對(duì)學(xué)術(shù)圖書價(jià)值進(jìn)行分類評(píng)價(jià)。利用因子分析法,基于Bookmetrix 指標(biāo)數(shù)據(jù)構(gòu)建每種圖書的因子綜合得分,綜合得分高的圖書不僅僅是高被引圖書,獲得較高社會(huì)關(guān)注度(Altmetric.com在線提及數(shù)指標(biāo)表現(xiàn)較好)的明星類學(xué)術(shù)著作,以及讀者量較多(Mendeley讀者標(biāo)記數(shù)及Springer下載量較多)的基礎(chǔ)參考類學(xué)術(shù)著作在這一評(píng)價(jià)指標(biāo)體系中均能被更好地識(shí)別出來,使得對(duì)學(xué)術(shù)圖書的評(píng)價(jià)更加精確。而更加精確的分層分類評(píng)價(jià),正是包括Bookmetrix 指標(biāo)在內(nèi)的Altmetrics 指標(biāo)最重要的優(yōu)勢(shì)。這一研究結(jié)果也與眾多學(xué)者的發(fā)現(xiàn)一致。例如,楊思洛等[10]利用Altmetrics 指標(biāo)對(duì)PLOS中社會(huì)科學(xué)領(lǐng)域2015年發(fā)表的論文進(jìn)行綜合評(píng)價(jià),將論文分為名作類、明星類、專業(yè)類、明星-專業(yè)類和普通類5 個(gè)類別進(jìn)行多維度分析。本研究指出,學(xué)術(shù)價(jià)值高或具有一定明星效應(yīng),或具有學(xué)科基礎(chǔ)性參考價(jià)值的圖書(即專業(yè)類、明星類和基礎(chǔ)參考類學(xué)術(shù)著作)更容易獲得較高的綜合得分。究其原因,主要是學(xué)術(shù)價(jià)值高的專業(yè)類圖書往往獲得更高的被引量;明星類學(xué)術(shù)著作則由于其較高的社會(huì)關(guān)注度,具有較強(qiáng)的社會(huì)影響力;而基礎(chǔ)參考類著作則由于其獨(dú)特的學(xué)術(shù)參考價(jià)值,吸引更多的讀者。
(2)Bookmetrix 等指標(biāo)不能規(guī)避學(xué)術(shù)交流中馬太效應(yīng)對(duì)計(jì)量評(píng)價(jià)的影響,且Altmetrics指標(biāo)的馬太效應(yīng)較引文指標(biāo)更為顯著。傳統(tǒng)基于引文的計(jì)量數(shù)據(jù)中馬太效應(yīng)屢見不鮮,有學(xué)者進(jìn)行了研究[11-12]。由慶斌等[13]在Altmetrics相關(guān)研究中指出基于引文的傳統(tǒng)計(jì)量方法所面臨的馬太效應(yīng)等缺點(diǎn),希望Altmetrics 發(fā)展能彌補(bǔ)這一不足。然而, 本文利用Bookmetrix 指標(biāo)對(duì)Springer 學(xué)術(shù)圖書影響力進(jìn)行評(píng)價(jià)發(fā)現(xiàn),綜合得分排名前20%的圖書占據(jù)Springer 總評(píng)論數(shù)80.55%、Altmetric.com總在線提及數(shù)77.38%和Mendeley總讀者數(shù)76.11%,但在CrossRef引用量指標(biāo)上,僅占據(jù)總被引量67.99%。Altmetrics相關(guān)指標(biāo)較傳統(tǒng)被引量表現(xiàn)出更強(qiáng)的集中分布規(guī)律,該研究結(jié)果與邱均平等[14]、余厚強(qiáng)等[15]發(fā)現(xiàn)一致。前者指出,學(xué)術(shù)評(píng)價(jià)中影響力與知名度往往互相產(chǎn)生馬太效應(yīng);后者利用新浪微博數(shù)據(jù)進(jìn)行指標(biāo)分析后發(fā)現(xiàn),5.1%學(xué)術(shù)論文占據(jù)新浪微博關(guān)注量50%,呈現(xiàn)出顯著的離散和集中分布特點(diǎn)。利用Altmetrics指標(biāo)進(jìn)行學(xué)術(shù)評(píng)價(jià)要更加注意區(qū)別性分析,單純的頻次統(tǒng)計(jì)無法反應(yīng)真實(shí)的影響力和學(xué)術(shù)成果價(jià)值。
(3)基于Bookmetrix指標(biāo)的學(xué)術(shù)圖書評(píng)價(jià)具有較大的學(xué)科差異,不適用于跨學(xué)科比較。本研究數(shù)據(jù)顯示,自然科學(xué)和應(yīng)用科學(xué)的Bookmetrix指標(biāo)表現(xiàn)優(yōu)于人文學(xué)科和社會(huì)科學(xué)。這與匡登輝[16]、Erfanmanesh等[2]的研究結(jié)果一致。這是由于Bookmetrix 僅收錄Springer 出版的學(xué)術(shù)圖書,其中自然科學(xué)和應(yīng)用科學(xué)的圖書數(shù)量遠(yuǎn)多于人文學(xué)科和社會(huì)科學(xué)。Springer以出版科技圖書聞名,吸引了眾多用戶與讀者,從而使其圖書的Bookmetrix指標(biāo)表現(xiàn)突出。
總體而言,利用Bookmetrix相關(guān)指標(biāo)對(duì)(圖書的)學(xué)術(shù)成果進(jìn)行評(píng)價(jià)有其價(jià)值——可以對(duì)學(xué)術(shù)成果/價(jià)值進(jìn)行多維度揭示及更精確的分類評(píng)價(jià)。但相關(guān)Altmetrics指標(biāo)表現(xiàn)出較傳統(tǒng)引文指標(biāo)更強(qiáng)烈的馬太效應(yīng),離散和聚集現(xiàn)象更顯著,需要對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步識(shí)別與處理。Bookmetrix 指標(biāo)在學(xué)科之間的表現(xiàn)具有較大差異,針對(duì)不同學(xué)科的評(píng)價(jià)應(yīng)該區(qū)別考量。為此,學(xué)術(shù)成果的綜合評(píng)價(jià)應(yīng)當(dāng)以分層分類評(píng)價(jià)為發(fā)展方向,納入更多的指標(biāo)和數(shù)據(jù),開展更全面的分析。
本研究的不足在于數(shù)據(jù)分析主要基于圖書的現(xiàn)有數(shù)據(jù),并未考察數(shù)據(jù)隨時(shí)間推進(jìn)的發(fā)展情況。此外,本文未能對(duì)在線提及、評(píng)論等數(shù)據(jù)作更深的文本分析,而僅僅提取統(tǒng)計(jì)數(shù)據(jù)。社交媒體的在線提及與評(píng)論原因較為復(fù)雜,僅對(duì)其進(jìn)行統(tǒng)計(jì)數(shù)據(jù)分析不能準(zhǔn)確揭示著作的價(jià)值。