阮選敏,呂冬晴,張 培,成 穎,柯 青
學(xué)術(shù)文獻(xiàn)被引頻次作為輔助同行評(píng)議的重要手段[1],被廣泛應(yīng)用于科研評(píng)價(jià)工作中。但是,學(xué)界對(duì)引用頻次是否適合作為學(xué)術(shù)文獻(xiàn)質(zhì)量的評(píng)估指標(biāo)尚未形成統(tǒng)一意見(jiàn)。據(jù)此,探索學(xué)術(shù)文獻(xiàn)被引頻次的影響因素,理解引用的分布和意義就顯得尤為重要。學(xué)術(shù)論文(以下簡(jiǎn)稱(chēng)論文)作為學(xué)術(shù)文獻(xiàn)的重要類(lèi)型,其被引影響因素的研究已碩果累累。Tahamtan 等[2]對(duì)該主題進(jìn)行了綜述,發(fā)現(xiàn)28個(gè)影響因素,并將其分為三類(lèi):論文、期刊、作者相關(guān)因素。在眾多影響因素中,哪些因素在論文被引中起到主要的作用以及如何利用其預(yù)測(cè)被引成為一個(gè)新的研究問(wèn)題,負(fù)二項(xiàng)回歸[3-4]和線(xiàn)性回歸模型[5-7]是研究該問(wèn)題的常用方法。
學(xué)術(shù)圖書(shū)(以下簡(jiǎn)稱(chēng)“圖書(shū)”)也是重要的學(xué)術(shù)文獻(xiàn)類(lèi)型。目前已經(jīng)開(kāi)展了多項(xiàng)有關(guān)圖書(shū)被引的影響因素研究,研究者探討了開(kāi)放存取(Open Access)[8]、語(yǔ)言[8-9]、學(xué)科[8-10]、作者數(shù)量[11]、出版年份[9]、出版社[12]、是否為叢書(shū)[12]、是否為編著[9][12]等因素的影響。相較于論文,圖書(shū)被引影響因素研究的廣度和深度都有待進(jìn)一步發(fā)掘。
相較于自然科學(xué),圖書(shū)對(duì)人文社會(huì)科學(xué)具有更重要的學(xué)術(shù)價(jià)值[13-18],其被引在人文社科中的比例更高[15]。據(jù)此,本文開(kāi)展中文人文社科圖書(shū)被引影響因素的研究,具體內(nèi)容包括:(1)書(shū)名長(zhǎng)度、有無(wú)英文書(shū)名、有無(wú)叢書(shū)項(xiàng)、所屬學(xué)科、出版地和出版社等6個(gè)圖書(shū)相關(guān)因素對(duì)被引的影響;(2)作者數(shù)、機(jī)構(gòu)類(lèi)別、機(jī)構(gòu)所在地和基金資助4個(gè)作者相關(guān)因素對(duì)圖書(shū)被引的影響;(3)分析10個(gè)影響因素對(duì)圖書(shū)被引的預(yù)測(cè)能力。
目前對(duì)學(xué)術(shù)文獻(xiàn)被引頻次影響因素的研究以期刊論文為主,涉及論文、期刊、作者、參考文獻(xiàn)等特征,而有關(guān)圖書(shū)被引頻次的研究較少。
多項(xiàng)研究表明作者人數(shù)對(duì)學(xué)術(shù)文獻(xiàn)的被引有顯著影響。以論文為研究對(duì)象的大部分研究發(fā)現(xiàn)多作者論文能獲得更多的引用[11][19-20];不過(guò),Bornmann 等[21]的探究未發(fā)現(xiàn)二者間存在顯著的相關(guān)關(guān)系,也有研究發(fā)現(xiàn)了二者間的負(fù)效應(yīng)[22]。Thelwall 等[11]選擇BKCI 30個(gè)學(xué)科的圖書(shū)為數(shù)據(jù)源,采用Mann Whitney 檢驗(yàn),發(fā)現(xiàn)單作者和多作者圖書(shū)的被引不存在顯著差異。Abrizah 等[9]發(fā)現(xiàn)在高被引圖書(shū)中,單作者圖書(shū)的比例顯著高于多作者,從側(cè)面說(shuō)明多作者優(yōu)勢(shì)在圖書(shū)中不明顯甚至處于劣勢(shì)。
作者的地區(qū)差異對(duì)被引存在影響。Sin[19]以6種圖書(shū)情報(bào)學(xué)科的頂級(jí)期刊在1980-2008年發(fā)表的論文作為研究樣本,邏輯回歸結(jié)果顯示作者為北美及北歐的論文被引高于東亞、東南亞、南歐;作者來(lái)自中低收入國(guó)家的論文被引低于高收入國(guó)家。Peng 等[23]將作者機(jī)構(gòu)按照地理位置和文化相似度分成七個(gè)地區(qū),發(fā)現(xiàn)來(lái)自美國(guó)的論文比來(lái)自中國(guó)大陸、日本等地區(qū)的被引頻次要高,而與英國(guó)等地區(qū)沒(méi)有顯著差異。Willis 等[24]發(fā)現(xiàn)來(lái)自美國(guó)的作者被引頻次要高于亞洲地區(qū)的作者,歐洲在這方面的表現(xiàn)略遜于美國(guó)。
作者的機(jī)構(gòu)屬性也是影響被引的因素。作者機(jī)構(gòu)的聲望越高、大學(xué)的排名越靠前,論文的被引頻次也越高[25]。Griffiths[26]針對(duì)團(tuán)體作者的工作證實(shí)上述結(jié)論,其對(duì)聯(lián)合國(guó)、歐盟等國(guó)際組織的研究發(fā)現(xiàn),得益于良好的國(guó)際聲望,聯(lián)合國(guó)在國(guó)際研究領(lǐng)域的被引數(shù)量是其他國(guó)際組織的兩倍。
基金論文具備引用優(yōu)勢(shì)得到了很多實(shí)證研究的支持。Amara 等[25]對(duì)加拿大35個(gè)商學(xué)院學(xué)者的研究證實(shí)基金等級(jí)與被引和產(chǎn)出呈正相關(guān)關(guān)系。戚爾鵬等[27]對(duì)Web of Science 數(shù)據(jù)庫(kù)收錄的2010—2012年基礎(chǔ)學(xué)科論文數(shù)據(jù)進(jìn)行的實(shí)證研究表明,除邏輯學(xué)外,基礎(chǔ)學(xué)科的基金論文具備引用優(yōu)勢(shì)。董建軍[28]通過(guò)對(duì)《中國(guó)學(xué)術(shù)文獻(xiàn)出版總庫(kù)》中收錄的各類(lèi)基金論文和篇均被引頻次的分析,發(fā)現(xiàn)基金論文整體上能夠獲得更高的被引量;不過(guò),也有研究發(fā)現(xiàn)二者間的關(guān)系不顯著[24]。
圍繞作者數(shù)量的研究發(fā)現(xiàn),針對(duì)論文與圖書(shū)的結(jié)論存在明顯差異,有必要探討該變量對(duì)中文人文社會(huì)科學(xué)圖書(shū)的影響;作者的地區(qū)差異、機(jī)構(gòu)屬性以及基金資助信息對(duì)于被引的影響目前均僅見(jiàn)到針對(duì)論文的結(jié)論,這三個(gè)因素對(duì)圖書(shū),尤其是中文人文社科類(lèi)圖書(shū)被引的影響有必要通過(guò)實(shí)證研究予以揭示。
標(biāo)題是文獻(xiàn)的眼睛,是讀者最先接觸到的部分。不少研究分析了標(biāo)題長(zhǎng)度對(duì)論文被引的影響。一些研究發(fā)現(xiàn),標(biāo)題越長(zhǎng),被引頻次越低[29-30];但是在一些學(xué)科中,二者的關(guān)系正好相反。Van Wesel 等[20]發(fā)現(xiàn)全科醫(yī)學(xué)以及內(nèi)科學(xué)(General & Internal Medicine)文獻(xiàn)中,標(biāo)題長(zhǎng)度與論文被引呈現(xiàn)微弱的正相關(guān)。部分研究未發(fā)現(xiàn)二者的顯性相關(guān)關(guān)系[31-32]。
學(xué)術(shù)文獻(xiàn)的被引頻次在不同學(xué)科間差異明顯。Tang[10]隨機(jī)選擇宗教學(xué)、歷史學(xué)、心理學(xué)、社會(huì)學(xué)、數(shù)學(xué)和物理學(xué)6個(gè)學(xué)科750 本圖書(shū),方差分析結(jié)果表明圖書(shū)被引頻次、被引率和price 指數(shù)間有顯著學(xué)科差異,即使是同一學(xué)科,論文與圖書(shū)的被引差異也十分明顯。Miettunen 等[33]發(fā)現(xiàn)精神病學(xué)四個(gè)子學(xué)科間的論文被引存在顯著差異。
叢書(shū)和出版社是圖書(shū)的獨(dú)特特征,相關(guān)研究較少,僅有的研究表明[12]大學(xué)出版社出版的圖書(shū)被引頻次最高,而屬于叢書(shū)的圖書(shū)被引情況則因?qū)W科而異:工程技術(shù)和自然科學(xué)領(lǐng)域的叢書(shū)比非叢書(shū)圖書(shū)的被引頻次高;人文學(xué)科的結(jié)論正好相反,而社會(huì)科學(xué)未發(fā)現(xiàn)顯著差異。
上述研究表明,同一影響因素對(duì)論文和圖書(shū)被引的影響也存在一定差異;不論是從相關(guān)研究的數(shù)量來(lái)看,還是從已發(fā)掘的被引影響因素的數(shù)量來(lái)看,期刊論文的研究成果顯著多于圖書(shū);圖書(shū)作為學(xué)術(shù)交流的重要媒介,相較于論文,對(duì)其被引影響因素的研究明顯不足。
哪些特征是影響被引的主要因素,研究者常試圖利用負(fù)二項(xiàng)回歸和多元線(xiàn)性回歸予以回答;部分研究還利用回歸模型進(jìn)行被引的預(yù)測(cè)研究。
引文數(shù)據(jù)符合泊松分布,但存在過(guò)度分散問(wèn)題,負(fù)二項(xiàng)回歸模型適合處理該類(lèi)型的因變量。Bornmann 等[3]使用負(fù)二項(xiàng)回歸模型,用期刊影響因子(JIF)、作者人數(shù)及評(píng)審分?jǐn)?shù)等特征預(yù)測(cè)論文發(fā)表前十年的年被引頻次和累計(jì)被引頻次,發(fā)現(xiàn)JIF 影響最大,而表示論文質(zhì)量的同行評(píng)議分?jǐn)?shù)對(duì)被引頻次的影響較小。Didegah 等[4]利用負(fù)二項(xiàng)邏輯障礙模型(Negative Binomial-Logit Hurdle Model),以期刊和參考文獻(xiàn)等特征為自變量預(yù)測(cè)論文的被引頻次,發(fā)現(xiàn)JIF 的影響依然最大。Snijder[8]使用負(fù)二項(xiàng)回歸模型分析語(yǔ)種、學(xué)科和開(kāi)放存取對(duì)圖書(shū)被引的影響,發(fā)現(xiàn)三者均顯著。
線(xiàn)性回歸模型也是常用的模型之一。Yu 等[5]將論文作者、期刊及引用等24個(gè)特征作為自變量,線(xiàn)性回歸發(fā)現(xiàn)被引文獻(xiàn)數(shù)量、作者人數(shù)及期刊五年IF 等能夠預(yù)測(cè)論文的被引。Vanclay 等[6]將JIF、期刊自引頻次及論文類(lèi)型等作為自變量,結(jié)果發(fā)現(xiàn)JIF 仍然是最重要的影響因素,而作者的h 指數(shù)和作者人數(shù)等特征的影響低于預(yù)期。
回歸分析通過(guò)控制其他變量以觀察某一變量對(duì)因變量的影響,且多個(gè)變量對(duì)因變量的影響效果可以相互比較,因此,回歸分析的結(jié)果往往讓人信服。雖然負(fù)二項(xiàng)回歸模型加符合引文的偏態(tài)分布特征,但也有學(xué)者指出使用負(fù)二項(xiàng)回歸分析引文數(shù)據(jù)值得商榷[34]。故本文擬選擇線(xiàn)性回歸模型比較多個(gè)自變量對(duì)圖書(shū)被引的影響。
本文選擇CBKCI1999-2009年出版的2844冊(cè)圖書(shū)為數(shù)據(jù)源。CBKCI收錄了21個(gè)人文社會(huì)科學(xué)的圖書(shū),覆蓋范圍廣,收錄的圖書(shū)綜合了被引頻次以及專(zhuān)家意見(jiàn),具有原創(chuàng)性以及較高的學(xué)術(shù)水平。選取1999-2009年出版的圖書(shū)的原因是,本研究的因變量是圖書(shū)的被引頻次,發(fā)表時(shí)間較近的圖書(shū)被引的可能性很小,把這些圖書(shū)包含在分析數(shù)據(jù)中會(huì)削弱檢驗(yàn)結(jié)果的信度[11],選擇2009年作為截止年可以為圖書(shū)留足充裕的被引時(shí)間。
本研究沒(méi)有選擇CBKCI的被引數(shù)據(jù),原因是該數(shù)據(jù)庫(kù)的被引僅涉及為數(shù)不多的圖書(shū)被引信息,沒(méi)有圖書(shū)的期刊被引數(shù)據(jù),同時(shí)該數(shù)據(jù)庫(kù)在短暫試用之后暫未繼續(xù)開(kāi)放,考慮到中文社會(huì)科學(xué)引文索引(CSSCI)的引文數(shù)據(jù)較為規(guī)范,是國(guó)內(nèi)人文社科領(lǐng)域比較權(quán)威的數(shù)據(jù)庫(kù),同時(shí)引文數(shù)據(jù)的生產(chǎn)有一定時(shí)差,為確保數(shù)據(jù)的完整性,本文選擇1999-2014年的引文數(shù)據(jù)作為圖書(shū)被引的數(shù)據(jù)源。
為了獲取每一本圖書(shū)對(duì)應(yīng)的被引信息,本文借鑒蘇新寧[35]的數(shù)據(jù)處理方式,即用圖書(shū)的題名、作者、出版年和出版社四個(gè)字段在CSSCI 引文數(shù)據(jù)庫(kù)中查找對(duì)應(yīng)圖書(shū)的被引信息。因?yàn)镃SSCI數(shù)據(jù)庫(kù)部分?jǐn)?shù)據(jù)標(biāo)引方式與CBKCI 提供的圖書(shū)元數(shù)據(jù)不完全一致,同時(shí)存在部分錯(cuò)誤數(shù)據(jù),所以分兩個(gè)步驟確定圖書(shū)的被引頻次。第一步是精確匹配,即題名、作者、出版年和出版社四個(gè)字段能夠在CSSCI 中完全匹配,即認(rèn)為是該圖書(shū)的被引;第二步是模糊匹配,考慮到CSSCI 中存在各種原因引起的數(shù)據(jù)錯(cuò)誤,本文采取模糊匹配策略:(1)題名:CSSCI 中被引文獻(xiàn)的題名包含在CBKCI 提供的圖書(shū)題名中即匹配成功。(2)作者:CSSCI 中被引文獻(xiàn)的作者包含在CBKCI 提供的圖書(shū)作者中即匹配成功。(3)年代:CSSCI 中被引文獻(xiàn)的年代與CBKCI 提供的圖書(shū)出版年一致即匹配成功。(4)出版社:CSSCI 中被引文獻(xiàn)的出版社包含在CBKCI 提供的圖書(shū)出版社中或者CBKCI 提供的圖書(shū)的出版社包含在CSSCI 中被引文獻(xiàn)的出版社中即也認(rèn)為匹配成功。上述四個(gè)字段中有三個(gè)字段匹配成功,即納入備選數(shù)據(jù)集。隨之,對(duì)入選數(shù)據(jù)進(jìn)行人工篩選,去除所選2844 冊(cè)圖書(shū)之外的被引文獻(xiàn)。經(jīng)過(guò)上述兩步操作之后,保留的被引記錄有111693 條,平均每本圖書(shū)的被引頻次為39.27,年均被引頻次為3.66,零被引圖書(shū)有74 冊(cè)。
CBKCI 對(duì)收錄的圖書(shū)進(jìn)行標(biāo)引,元數(shù)據(jù)包括書(shū)名、所屬學(xué)科、作者名、作者機(jī)構(gòu)、出版地、出版社、出版年、圖書(shū)分類(lèi)號(hào)、叢書(shū)項(xiàng)、ISBN、CIP、資助項(xiàng)目類(lèi)型、圖書(shū)簡(jiǎn)介以及作者簡(jiǎn)介等??紤]到ISBN、CIP 以及作者名等對(duì)被引難覓潛在的影響,因此選擇可能影響圖書(shū)被引的10個(gè)特征作為自變量,其中作者機(jī)構(gòu)還包括高等院校與大陸高校類(lèi)型兩個(gè)子類(lèi)別(見(jiàn)表1)。
表1 自變量信息
相關(guān)研究多以被引頻次作為因變量,先前研究中出現(xiàn)過(guò)的指標(biāo)有總被引頻次、平均年被引頻次以及不同年份的被引頻次等。不同形式的被引頻次指標(biāo)僅僅考慮“量”,不能區(qū)分施引文獻(xiàn)的“質(zhì)”,因此,本文引入被引質(zhì)量指標(biāo)以實(shí)現(xiàn)從“質(zhì)”的方面完善測(cè)度。參考Thelwall等[11]的做法,引入總被引頻次作為因變量,類(lèi)似地引入總被引質(zhì)量指標(biāo);由于總被引頻次未考慮時(shí)間的影響,引入圖書(shū)的年均被引頻次;為了消除半衰期對(duì)圖書(shū)被引的影響,借鑒IF5 的思想,再進(jìn)一步引入五年被引頻次和五年被引質(zhì)量作為因變量(見(jiàn)表2)。
表2 因變量信息
首先,將CSSCI 的來(lái)源期刊劃分為三個(gè)等級(jí):第一級(jí)是南京大學(xué)評(píng)選出的各人文社會(huì)學(xué)科的31 種一流期刊;第二級(jí)是1998-2018年持續(xù)入選CSSCI 的來(lái)源期刊;剩下的期刊歸為第三級(jí)。依據(jù)施引文獻(xiàn)發(fā)表的期刊將其劃分為相應(yīng)的三個(gè)等級(jí),定義n1,n2,n3 分別為第一、二以及三級(jí)的施引文獻(xiàn)量。其次,賦予不同等級(jí)的施引文獻(xiàn)以不同的權(quán)重,參考李克特量表的反向編碼方法,給一、二和三級(jí)施引文獻(xiàn)分別賦予權(quán)重w1=3,w2=2,w3=1。最后,不同等級(jí)施引文獻(xiàn)數(shù)量乘以對(duì)應(yīng)的權(quán)重,求和之后即為被引質(zhì)量得分,總被引質(zhì)量(Qt)及5年被引質(zhì)量(Q5)的計(jì)算見(jiàn)公式(2)和(3)。
2.4.1 雙變量分析
首先分別對(duì)自變量和5個(gè)因變量進(jìn)行雙變量分析。對(duì)于分類(lèi)變量,采用非參數(shù)檢驗(yàn)完成,即分別使用Mann-Whitney U 和Kruskal Wallis 檢驗(yàn)兩組及多組圖書(shū)因變量間是否存在顯著差異。對(duì)于連續(xù)變量,使用Spearman 相關(guān)系數(shù)判定自變量與各因變量間是否顯著相關(guān)。
2.4.2 回歸分析
(1)多元線(xiàn)性回歸。表1中的變量為自變量,將類(lèi)別變量轉(zhuǎn)為虛擬變量(dummy variable),回歸策略采用進(jìn)入(enter);表2中的變量為因變量,考慮到引文數(shù)據(jù)的偏態(tài)分布,不適合直接應(yīng)用于線(xiàn)性回歸模型,參考Vanclay[6]的做法,對(duì)因變量進(jìn)行對(duì)數(shù)變換,ln(原因變量+1)。
(2)最優(yōu)尺度回歸。最優(yōu)尺度變換可以解決統(tǒng)計(jì)建模時(shí)分類(lèi)變量的量化問(wèn)題。由于本文的自變量以分類(lèi)變量為主,因此,擬采用最優(yōu)尺度回歸以比較不同測(cè)量尺度的自變量對(duì)因變量的影響,即將經(jīng)對(duì)數(shù)變換的因變量做離散處理,分別建立最優(yōu)尺度回歸模型。
作者人數(shù)為5的圖書(shū)僅1冊(cè),本文的檢驗(yàn)方法多要求樣本量在5以上,故去除該樣本。
對(duì)于研究問(wèn)題1和2的回答,本文采用描述性統(tǒng)計(jì)和雙變量分析完成,結(jié)果見(jiàn)表3和表4。考慮到篇幅,表4僅列出了其他研究中使用較多的5年被引頻次的均值。
表3 非參數(shù)檢驗(yàn)與相關(guān)分析結(jié)果
表4 分類(lèi)變量的均值表
3.1.1 作者相關(guān)因素
雙變量分析的結(jié)果顯示基金類(lèi)別、高等院校、大陸高校類(lèi)型以及作者機(jī)構(gòu)所在地4個(gè)自變量與5個(gè)因變量間都呈顯著的相關(guān)關(guān)系(p<0.001);除了與年均被引頻次的相關(guān)性未得到證實(shí)外,作者機(jī)構(gòu)類(lèi)別與其他四個(gè)因變量的相關(guān)關(guān)系顯著(p<0.01);作者人數(shù)與總被引頻次和總被引質(zhì)量為負(fù)相關(guān)(p<0.05),未發(fā)現(xiàn)其與年均被引頻次、五年被引質(zhì)量和五年被引頻次三個(gè)因變量間存在顯性的相關(guān)關(guān)系。
描述性統(tǒng)計(jì)發(fā)現(xiàn):(1)無(wú)基金資助圖書(shū)在所有因變量上的表現(xiàn)均高于有基金資助的圖書(shū);不同類(lèi)別基金資助的圖書(shū),5個(gè)因變量均值的表現(xiàn)一致,由高至低均為其他基金>國(guó)家級(jí)基金>省部級(jí)基金>市廳級(jí)基金。(2)作者機(jī)構(gòu)類(lèi)別在5年被引頻次上的表現(xiàn)依次為:政府機(jī)構(gòu)> 其他機(jī)構(gòu)>高等院校> 研究機(jī)構(gòu)。如果樣本僅考慮高校作者,則五個(gè)因變量由高至低均為非大陸地區(qū)高校>“985 工程”高校>“211 工程”高校>普通大陸高校。(3)第一作者的機(jī)構(gòu)所在地的被引表現(xiàn)依次是其他西方國(guó)家>美國(guó)>其他亞洲國(guó)家和地區(qū)>中國(guó)大陸。
3.1.2 圖書(shū)相關(guān)因素
雙變量分析結(jié)果顯示學(xué)科、出版地、叢書(shū)及出版社對(duì)5個(gè)因變量均存在顯著影響(p<0.001);英文名稱(chēng)在5個(gè)因變量上的表現(xiàn)存在較大差異,除對(duì)總被引質(zhì)量的影響不顯著外,其對(duì)另外4個(gè)因變量的影響均顯著,顯著性水平隨5年被引頻次、5年被引質(zhì)量、年均被引頻次、總被引頻次順序遞減;書(shū)名長(zhǎng)度與5個(gè)因變量均呈微弱的負(fù)相關(guān)。
描述性統(tǒng)計(jì)發(fā)現(xiàn):(1)圖書(shū)被引的地區(qū)差異顯著,根據(jù)因變量的均值,可將9個(gè)地區(qū)劃分為3個(gè)等級(jí),即北京、上海> 華南、華中、華北、華東地區(qū)> 西南、西北、東北地區(qū)。(2)在21個(gè)學(xué)科之中,圖書(shū)館情報(bào)與文獻(xiàn)學(xué)等6個(gè)學(xué)科的5年被引大于20,且基本穩(wěn)居前列;管理學(xué)等10個(gè)學(xué)科的5年被引頻次介于10~20;中國(guó)語(yǔ)言學(xué)等5個(gè)學(xué)科始終處于后5 位。(3)屬于百佳出版社的優(yōu)質(zhì)出版社,其所出版的圖書(shū)有突出的被引表現(xiàn)。(4)叢書(shū)中的圖書(shū)可以獲得更多的被引。(5)有英文名稱(chēng)的圖書(shū)被引高于書(shū)名僅為中文的圖書(shū)。
自變量中分類(lèi)變量多達(dá)8個(gè),進(jìn)行最優(yōu)尺度回歸分析是一個(gè)合適的選擇,為比較10個(gè)自變量對(duì)各因變量的影響程度,本文針對(duì)5個(gè)因變量分別構(gòu)建最優(yōu)尺度回歸方程。5個(gè)方程均通過(guò)了顯著性檢驗(yàn)(p=0.000),擬合優(yōu)度分別為:0.177、0.177、0.176、0.200、0.193,擬合效果較弱。各方程中所有變量的容差都在0.9 以上,遠(yuǎn)大于0.1(見(jiàn)表5),說(shuō)明變量之間的多重共線(xiàn)性低,最優(yōu)回歸方程結(jié)果準(zhǔn)確。
在10個(gè)自變量中,作者人數(shù)僅對(duì)被引頻次存在顯著影響,對(duì)其余4個(gè)因變量影響不顯著。有無(wú)英文名稱(chēng)對(duì)年均被引頻次和五年被引頻次的影響顯著,對(duì)另外3個(gè)因變量未見(jiàn)顯著影響。其余8個(gè)自變量對(duì)于5個(gè)因變量均存在顯著影響(見(jiàn)表6)。定距變量:書(shū)名長(zhǎng)度,以及兩個(gè)定序變量:出版社是否百佳、作者人數(shù),三者與因變量的系數(shù)均為負(fù)數(shù),即書(shū)名長(zhǎng)度越長(zhǎng)、出版社非百佳、作者人數(shù)越多的圖書(shū),其在五年被引頻次等5個(gè)因變量上的表現(xiàn)會(huì)越差。在5個(gè)方程中,學(xué)科、出版社是否百佳始終是重要性最高的2個(gè)自變量,而作者機(jī)構(gòu)類(lèi)別以及是否有英文名稱(chēng)的重要性始終徘徊在1%左右,居于重要性的后列。
表5 總體樣本最優(yōu)尺度回歸重要性與轉(zhuǎn)換后容差
表6 總體樣本最優(yōu)尺度回歸標(biāo)準(zhǔn)系數(shù)
表7 總體樣本多元線(xiàn)性回歸標(biāo)準(zhǔn)系數(shù)
張文彤[36]建議,由于最優(yōu)尺度回歸主要給出的是變換后評(píng)分的分析結(jié)果,許多有用的信息被隱含在變換過(guò)程中。使用者可以將最優(yōu)尺度分析作為一種預(yù)分析手段,通過(guò)它快速發(fā)現(xiàn)各類(lèi)別間的差異和聯(lián)系,然后回到常規(guī)的建模方法,用合并相似類(lèi)別、建立復(fù)雜的啞變量模型等方式得到更易于理解和應(yīng)用的分析結(jié)果。根據(jù)該建議,本文為比較不同組別圖書(shū)的被引情況,進(jìn)一步構(gòu)建包含虛擬變量的線(xiàn)性回歸方程。
采用進(jìn)入(enter)策略構(gòu)建線(xiàn)性回歸方程(見(jiàn)表7),5個(gè)回歸方程的自變量與因變量間均存在顯著的線(xiàn)性關(guān)系(p=0.000)。線(xiàn)性回歸方程和最優(yōu)尺度回歸方程的擬合優(yōu)度基本相同。三個(gè)非定類(lèi)變量:書(shū)名長(zhǎng)度、出版社是否百佳的線(xiàn)性回歸結(jié)果同最優(yōu)尺度回歸方程,作者人數(shù)對(duì)5個(gè)因變量均無(wú)顯著影響。定類(lèi)變量引入虛擬變量后發(fā)現(xiàn),有多個(gè)自變量對(duì)5個(gè)因變量的影響均顯著,相較于每個(gè)自變量的基準(zhǔn)組:(1)學(xué)科層面,法學(xué)、社會(huì)學(xué)、體育以及圖書(shū)館情報(bào)與文獻(xiàn)學(xué)的被引較高,藝術(shù)學(xué)、中國(guó)語(yǔ)言學(xué)、宗教學(xué)及歷史學(xué)的被引較低;(2)出版于北京、上海、華東、華南、華中的圖書(shū)被引較高,回歸系數(shù)依次遞減;(3)叢書(shū)中的圖書(shū)、機(jī)構(gòu)位于亞洲其他國(guó)家地區(qū)及其他西方國(guó)家作者編撰的圖書(shū)被引較高;(4)受到省部級(jí)和國(guó)家級(jí)資助圖書(shū)的被引較低。
除共性影響外,自變量對(duì)部分因變量也存在個(gè)性化的顯著影響:(1)被引頻次。調(diào)整后的R2=0.176,除上述共性的解釋變量外(下同),回歸模型中的馬克思主義理論及民族學(xué)學(xué)科、受到市廳級(jí)資助的圖書(shū)被引較低,而政治學(xué)學(xué)科、作者機(jī)構(gòu)位于美國(guó)以及機(jī)構(gòu)類(lèi)型為研究機(jī)構(gòu)的作者撰寫(xiě)的圖書(shū)被引較高。(2)年均被引頻次。調(diào)整后的R2=0.178,馬克思主義理論和民族學(xué)兩個(gè)學(xué)科及受到市廳級(jí)資助圖書(shū)的效應(yīng)同總被引頻次;有英文名稱(chēng)、政治學(xué)學(xué)科、華北與西南地區(qū)出版以及作者機(jī)構(gòu)位于美國(guó)的圖書(shū),被引較高。(3)總被引質(zhì)量。調(diào)整后的R2=0.17,與前兩個(gè)相比,該模型個(gè)性的自變量較少,馬克思主義理論學(xué)科以及受到市廳級(jí)資助的圖書(shū)的被引質(zhì)量偏低,出版地位于華北、作者機(jī)構(gòu)位于美國(guó)以及機(jī)構(gòu)類(lèi)型為研究機(jī)構(gòu)的圖書(shū),被引質(zhì)量較高。(4)五年被引頻次。調(diào)整后的R2=0.197,民族學(xué)圖書(shū)的五年被引較低,有英文名稱(chēng)、政治學(xué)學(xué)科以及西南地區(qū)出版的圖書(shū),五年被引較高。(5)五年被引質(zhì)量。調(diào)整后的R2=0.189,民族學(xué)圖書(shū)的五年被引質(zhì)量較低,有英文名稱(chēng)及政治學(xué)學(xué)科的圖書(shū)五年被引質(zhì)量較高。
在研究樣本中,作者來(lái)自高校的圖書(shū)有2298本,占全部樣本的80.83%,是數(shù)據(jù)集的主要組成部分,所以有必要探究不同類(lèi)型高校對(duì)學(xué)術(shù)圖書(shū)被引的可能影響。
按照約定俗成將高校類(lèi)型具體化為“985 工程”“211 工程”以及普通高校。非參數(shù)檢驗(yàn)的結(jié)果表明,作者來(lái)自不同類(lèi)型高校的圖書(shū)被引存在顯著差異(p=0.000)??傮w而言,最優(yōu)尺度回歸分析結(jié)果發(fā)現(xiàn),5個(gè)因變量的回歸方程調(diào)整后的R2都在0.22 以上,與全體樣本相比有明顯的提升,這說(shuō)明加入了高校類(lèi)型后,方程的整體解釋度更高。具體地,與全體樣本的最優(yōu)尺度回歸相比,高校的回歸結(jié)果不同之處有:(1)有無(wú)英文名稱(chēng)對(duì)5個(gè)自變量的影響均不顯著,說(shuō)明先前有無(wú)英文名稱(chēng)對(duì)因變量的影響可能是由于沒(méi)有控制高校類(lèi)型而產(chǎn)生,并非由于該自變量自身的差異形成;(2)按照重要性程度來(lái)看,學(xué)科仍然是影響圖書(shū)被引最重要的因素,高校類(lèi)型取代出版社成為對(duì)圖書(shū)被引影響的第二位因素,從而出版社是否百佳的影響效果被削弱。
為比較作者來(lái)自不同類(lèi)型高校圖書(shū)的被引差異,進(jìn)一步采用包含虛擬變量的線(xiàn)性回歸方程。分析發(fā)現(xiàn),各方程的擬合優(yōu)度與最優(yōu)尺度回歸方程的擬合優(yōu)度基本相同,相較于總體樣本的線(xiàn)性回歸方程擬合優(yōu)度有明顯提升。在控制其他變量后,“985 工程”院校與普通院校圖書(shū)的被引差異十分明顯,表現(xiàn)為:作者來(lái)自“985 工程”高校圖書(shū)的5個(gè)因變量均顯著高于大陸普通高校;“211 工程”高校與普通院校的圖書(shū)被引差異也較為顯著,具體而言,作者來(lái)自“211 工程”高校圖書(shū)的總被引質(zhì)量和總被引頻次顯著高于大陸普通院校,但是二者在其他3個(gè)因變量上沒(méi)有顯著區(qū)別。綜合上述分析可見(jiàn),高校類(lèi)型是影響圖書(shū)被引的重要因素,“985 工程”“211 工程”院校的學(xué)者所撰圖書(shū)容易獲得更多、更優(yōu)質(zhì)的引用。
4.1.1 書(shū)名長(zhǎng)度
書(shū)名是一本圖書(shū)的重要組成部分,體現(xiàn)了圖書(shū)的主題,是讀者判斷是否閱讀的最初依據(jù)之一。本文發(fā)現(xiàn)書(shū)名長(zhǎng)度與被引頻次和被引質(zhì)量呈現(xiàn)微弱的負(fù)相關(guān);Stremersch 等[29]以論文題名為分析對(duì)象的結(jié)果與本文的結(jié)論一致,得到類(lèi)似結(jié)論的研究還有林佳瑜[30]等??赡艿脑蛟谟?,論文或者圖書(shū)的題名越長(zhǎng),題名中所包含的獨(dú)立概念越多,則所研究的內(nèi)容就越具體、研究范圍越窄[37],被引用的受眾就越少。不過(guò),有關(guān)題名長(zhǎng)度對(duì)被引影響的結(jié)論并不一致,Rostami 等[31]、Jamali 等[32]的研究發(fā)現(xiàn)二者間相關(guān)關(guān)系不顯著;Van Wesel 等[20]發(fā)現(xiàn)學(xué)科對(duì)該關(guān)系具有調(diào)節(jié)效應(yīng),比如在內(nèi)科學(xué)論文中,長(zhǎng)題名對(duì)被引有利,而在社會(huì)學(xué)及應(yīng)用物理學(xué)中,則短標(biāo)題能夠獲得更多的被引。
4.1.2 地區(qū)差異
不同出版地的學(xué)術(shù)專(zhuān)著被引情況存在顯著差異,北京和上海地區(qū)出版的學(xué)術(shù)專(zhuān)著的被引頻次和質(zhì)量均較高,而西南、西北和東北的學(xué)術(shù)專(zhuān)著被引頻次和質(zhì)量偏低。一方面,地區(qū)間教育資源分配不均衡,比如西部地區(qū)的教育資源相對(duì)貧乏。根據(jù)2017年《中國(guó)統(tǒng)計(jì)年鑒》的數(shù)據(jù),北京和上海2016年教育經(jīng)費(fèi)分別為11171250萬(wàn)元、10131153 萬(wàn)元;西北、西南和東北地區(qū)平均每省(市)的教育經(jīng)費(fèi)分別為5395703.6 萬(wàn)元、9206546.8 萬(wàn)元和7265483 萬(wàn)元,西北、西南和東北三地的教育經(jīng)費(fèi)明顯少于其他地區(qū)。此外,在39 所“985 工程”高校中,北京、上海、西北、西南和東北地區(qū)的“985 工程”高校數(shù)量分別為8 所、4 所、4 所、3 所和4 所,優(yōu)質(zhì)教育資源的懸殊差距直接引發(fā)地區(qū)間人才的不均衡。另一方面,北京地區(qū)擁有53 家“百佳出版社”,上海地區(qū)有7 家,與之相對(duì)的東北地區(qū)有4家,西南與西北地區(qū)僅陜西、四川兩省有4 家百佳出版社,這說(shuō)明北京與上海地區(qū)出版事業(yè)發(fā)展繁榮,而西部與東北地區(qū)出版事業(yè)的發(fā)展則相對(duì)緩慢。地區(qū)之間教育資源的不均衡和出版事業(yè)的發(fā)展差異是造成不同地區(qū)出版的圖書(shū)影響力差異的重要原因。
4.1.3 學(xué)科差異
徐貴水等[38]的研究發(fā)現(xiàn),和生活越貼近、實(shí)用性越強(qiáng)、對(duì)人們的影響越大的學(xué)科,研究人數(shù)和學(xué)術(shù)成果也越多,可以吸引更多的被引;專(zhuān)業(yè)性與理論性強(qiáng)、離日常生活較遠(yuǎn),研究人數(shù)和學(xué)術(shù)成果則會(huì)相對(duì)較少,進(jìn)而得到被引也會(huì)相應(yīng)減少。本研究證實(shí)了這一發(fā)現(xiàn),不同學(xué)科圖書(shū)的被引差異明顯,兼具理論與應(yīng)用性的學(xué)科,如法學(xué)、社會(huì)學(xué)、體育學(xué)、圖書(shū)館情報(bào)與文獻(xiàn)學(xué)和政治學(xué)5個(gè)學(xué)科的圖書(shū)被引領(lǐng)先于其他學(xué)科;長(zhǎng)于理論的學(xué)科,如歷史學(xué)、藝術(shù)學(xué)、中國(guó)語(yǔ)言學(xué)、宗教學(xué)、馬克思主義理論等的圖書(shū)五年被引頻次等指標(biāo)較低。本文的發(fā)現(xiàn)在論文的被引影響因素研究中也得到了證實(shí),比如,Tang[10]以及Miettunen 等[33]的研究發(fā)現(xiàn),不同學(xué)科間的引用存在顯著差異,Bornmann 等[21]發(fā)現(xiàn)研究面較窄的學(xué)科獲得被引的概率相對(duì)較低;本文也發(fā)現(xiàn),歷史學(xué)大類(lèi)中的考古學(xué),作為一個(gè)研究較為專(zhuān)深的學(xué)科代表,其被引在所有學(xué)科中處于后列。
4.1.4 出版社質(zhì)量
國(guó)內(nèi)未見(jiàn)正規(guī)的出版社排名,所以本文僅采用是否為百佳出版社這一指標(biāo)區(qū)分出版社的質(zhì)量。由分析結(jié)果可知,百佳出版社出版的圖書(shū)在被引頻次和被引質(zhì)量上均顯著高于非百佳出版社,說(shuō)明優(yōu)秀出版社和高品質(zhì)圖書(shū)有強(qiáng)相關(guān)性。核心出版社具有信息密度高、文獻(xiàn)新穎、文獻(xiàn)利用率高和學(xué)術(shù)聲譽(yù)高等良好特征[39]。Torres-Salinas 等[12]的研究表明大學(xué)類(lèi)出版社出版圖書(shū)的被引頻次比其他出版社高,他將原因歸結(jié)于大學(xué)出版社的聲望高。本研究中的百佳出版社在國(guó)內(nèi)出版行業(yè)有著良好口碑,即證實(shí)了Torres-Salinas等[12]的研究結(jié)論。人文社科學(xué)者傾向于在該領(lǐng)域聲望最高的出版社出版自己的作品[9],從而優(yōu)質(zhì)圖書(shū)與高聲望出版社的有機(jī)結(jié)合實(shí)現(xiàn)了雙贏,帶動(dòng)了源于高質(zhì)量出版社圖書(shū)的高被引。反過(guò)來(lái),實(shí)踐中出版社的聲譽(yù)也用于圖書(shū)質(zhì)量的評(píng)估,比如作為圖書(shū)館員挑選圖書(shū)的標(biāo)準(zhǔn)之一[40]。
4.1.5 是否是叢書(shū)
Torres-Salinas 等[12]的研究表明人文藝術(shù)學(xué)科、非叢書(shū)圖書(shū)的被引頻次更高;社會(huì)學(xué)科,圖書(shū)是否具有叢書(shū)標(biāo)識(shí)對(duì)被引頻次未發(fā)現(xiàn)影響;工程技術(shù)與自然科學(xué)的結(jié)論與人文藝術(shù)正好相反。本文的研究顯示,叢書(shū)類(lèi)圖書(shū)的被引高于非叢書(shū)類(lèi)圖書(shū)。兩項(xiàng)研究結(jié)果的差異可能源自引文數(shù)據(jù)的不同,Torres-Salinas 等[12]研究使用的引文數(shù)據(jù)來(lái)自圖書(shū)引文(BKCI)和期刊引文(WOS)兩部分,本文的數(shù)據(jù)為CSSCI 的來(lái)源期刊對(duì)圖書(shū)的引用,不包括圖書(shū)之間的引用關(guān)系,因此得到的結(jié)果可能有所偏差。相較于非叢書(shū),叢書(shū)內(nèi)容具有更好的系統(tǒng)性和完整性,與獨(dú)立著作相比,其豐富的信息量更容易得到讀者的認(rèn)可進(jìn)而獲得更多的引用。
4.1.6 英文名稱(chēng)
非參數(shù)檢驗(yàn)結(jié)果表明,有英文名稱(chēng)的圖書(shū)的被引高于無(wú)英文名稱(chēng)的圖書(shū)。但在回歸方程中,控制了其他變量之后,有無(wú)英文名稱(chēng)僅對(duì)總被引頻次和總被引質(zhì)量有顯著影響,不過(guò)系數(shù)很小,在高校樣本的最優(yōu)尺度回歸結(jié)果中,有無(wú)英文名稱(chēng)對(duì)5個(gè)因變量的影響均不顯著,表明有無(wú)英文名稱(chēng)對(duì)被引的影響可以忽略。
4.2.1 基金資助
針對(duì)不同資助級(jí)別對(duì)被引的影響,Amara 等[25]對(duì)加拿大35個(gè)商學(xué)院學(xué)者的研究發(fā)現(xiàn)基金等級(jí)與被引和產(chǎn)出呈正相關(guān)關(guān)系,本文的研究也得到了類(lèi)似的結(jié)論,即受到市廳級(jí)、省部級(jí)、國(guó)家級(jí)基金資助的圖書(shū),其被引呈現(xiàn)遞增趨勢(shì)。對(duì)于有無(wú)基金資助對(duì)被引的影響,董建軍[28]發(fā)現(xiàn)基金論文從整體上能夠獲得更高的被引;趙星等[41]的研究也證實(shí)了基金資助對(duì)被引的正向影響;本文未能證實(shí)董建軍[28]和趙星等[41]在以論文為樣本的研究中發(fā)現(xiàn)的現(xiàn)象;本文發(fā)現(xiàn),無(wú)基金資助的圖書(shū)能夠獲得更多的被引,該發(fā)現(xiàn)出乎筆者的預(yù)料。
對(duì)論文來(lái)說(shuō),基金項(xiàng)目篩選過(guò)程嚴(yán)格[27],資助的經(jīng)費(fèi)能為研究提供外部支持,有助于提高論文的質(zhì)量[42],所以基金資助論文容易獲得更多的引用,可用于解釋趙星等[41]的研究結(jié)論。本文如果采集所有的人文社科圖書(shū),那么基金資助圖書(shū)的被引表現(xiàn)優(yōu)于非資助圖書(shū)值得期待;不過(guò),本文數(shù)據(jù)集來(lái)自CBKCI,來(lái)源圖書(shū)源于專(zhuān)家推薦及CSSCI 篩選的高被引圖書(shū),也就是說(shuō),總體而言本文數(shù)據(jù)集中的圖書(shū)均為高質(zhì)量,那么要思考的問(wèn)題是:在高質(zhì)量圖書(shū)中,非基金資助圖書(shū)的質(zhì)量是否會(huì)高于基金資助圖書(shū)?人文社科研究,尤其是人文科學(xué)與自然科學(xué)相比,對(duì)基金資助并沒(méi)有特別的依賴(lài),高質(zhì)量圖書(shū)的產(chǎn)出更多地依賴(lài)于學(xué)者對(duì)研究主題長(zhǎng)期的浸淫,而基金資助圖書(shū)有明確的研究時(shí)間要求,“十年磨一劍”難以體現(xiàn)。
4.2.2 作者人數(shù)
Thelwall 等[11]發(fā)現(xiàn)在12個(gè)學(xué)科中,單作者的圖書(shū)被引頻次高于多作者;Abrizah 等[9]研究證實(shí)在高被引圖書(shū)中,單作者圖書(shū)比例顯著高于多作者;本研究也發(fā)現(xiàn)了這一現(xiàn)象,即作者人數(shù)越多,圖書(shū)的總被引頻次和被引質(zhì)量越低。以論文為研究對(duì)象的工作中,發(fā)現(xiàn)多作者論文的被引往往高于單作者[43-45]。Van Dalen 等[46]認(rèn)為多作者合作能夠互相補(bǔ)充、取長(zhǎng)補(bǔ)短,合作帶來(lái)的專(zhuān)業(yè)化和分工優(yōu)勢(shì)是高引用的合理解釋。作者數(shù)對(duì)不同文獻(xiàn)類(lèi)型被引影響的差異,意味著合作的優(yōu)勢(shì)在短出版物中更加明顯,而隨著出版物篇幅的增加,到圖書(shū)這一類(lèi)型的出版物時(shí),合作的優(yōu)勢(shì)已經(jīng)不復(fù)存在[11],本研究甚至還發(fā)現(xiàn)了合作“劣勢(shì)”。
多作者合作對(duì)圖書(shū)與論文被引影響的差異可能源于合作方式的不同。論文的篇幅通常較短,合作更多地體現(xiàn)在研究過(guò)程中,能夠獲得Van Dalen 等[46]所說(shuō)“專(zhuān)業(yè)化和分工優(yōu)勢(shì)”,而論文初稿的寫(xiě)作通常由一人完成,其他研究者更多地參與修改,整個(gè)過(guò)程中不同作者互相取長(zhǎng)補(bǔ)短,收“1+1>2”之效,進(jìn)而顯著提升科研成果的質(zhì)量。圖書(shū)的篇幅遠(yuǎn)大于論文,科研合作的粒度顯著增大,在研究實(shí)施階段的科研分工也不同于細(xì)粒度的單篇論文,多數(shù)采用粗粒度模塊化的分工方式,在成文過(guò)程中,也基本按照章節(jié)的劃分由每個(gè)研究者獨(dú)立完成,從而相對(duì)于論文,作為科研成果的圖書(shū)存在科研合作與寫(xiě)作合作兩個(gè)階段,由于每位研究者研究能力與寫(xiě)作能力的差異,整體研究質(zhì)量與圖書(shū)質(zhì)量的保證有賴(lài)于項(xiàng)目負(fù)責(zé)人扎實(shí)、細(xì)致的工作,而這顯然有難度。經(jīng)濟(jì)學(xué)中的規(guī)模經(jīng)濟(jì)[47]理論可用于解釋論文中多作者合作帶來(lái)的被引提高,而規(guī)模不經(jīng)濟(jì)理論則可用于解釋圖書(shū)的多作者合作引發(fā)的被引降低現(xiàn)象。
4.2.3 作者機(jī)構(gòu)所在地
本研究發(fā)現(xiàn)作者來(lái)自美國(guó)等西方國(guó)家的圖書(shū)被引顯著高于大陸地區(qū),該結(jié)論與現(xiàn)有的以論文為對(duì)象的研究結(jié)果吻合。Leimu 等[48]發(fā)現(xiàn),相較于母語(yǔ)為非英語(yǔ)的國(guó)家,母語(yǔ)為英語(yǔ)國(guó)家的作者,其論文被引更高。Sin[19]證實(shí)作者位于北美和北歐地區(qū)的論文被引高于東亞等地區(qū)。Peng 等[23]發(fā)現(xiàn)作者來(lái)自美國(guó)和英國(guó)的論文比來(lái)自中國(guó)大陸、日本等地區(qū)的被引頻次高。Willis 等[24]也發(fā)現(xiàn)美國(guó)作者的被引頻次要高于亞洲地區(qū)。可見(jiàn)學(xué)術(shù)文獻(xiàn)的被引情況在地區(qū)分布上存在“馬太效應(yīng)”,現(xiàn)階段歐美等西方國(guó)家擁有的優(yōu)秀學(xué)者和學(xué)術(shù)資源領(lǐng)先于其他國(guó)家與地區(qū),優(yōu)秀學(xué)者集中度高的國(guó)家會(huì)產(chǎn)出更多優(yōu)秀的科研成果,吸引了更多的被引[19]。此外,收入水平等經(jīng)濟(jì)因素也是造成被引地區(qū)差異的原因。Sin[19]證實(shí)了作者來(lái)自中、低收入國(guó)家的論文被引要低于高收入國(guó)家;Tahamtan 等[2]認(rèn)為不同國(guó)家的科研水平、基金支持力度不同,造成了論文質(zhì)量的差異,從而引起被引的不同。
4.2.4 研究機(jī)構(gòu)類(lèi)別
本研究發(fā)現(xiàn),作者來(lái)自中國(guó)大陸以外地區(qū)的高校,其圖書(shū)被引顯著高于大陸地區(qū),原因已在“作者機(jī)構(gòu)所在地”一節(jié)闡明。在大陸高校中,高校類(lèi)型對(duì)于圖書(shū)被引的影響十分顯著,作者來(lái)自“985 工程”“211 工程”及普通院校的圖書(shū)被引依次降低,即作者所屬的院校排名越靠前,圖書(shū)被引越高,這與多項(xiàng)研究不謀而合,例如Amara等[25]的研究。該結(jié)果合理的解釋是,與排名較低的大學(xué)相比,排名靠前的大學(xué)會(huì)提供更有利于培養(yǎng)學(xué)術(shù)生產(chǎn)力的物質(zhì)、智力和社會(huì)激勵(lì)措施等資源[25],從而吸引了更多的優(yōu)秀學(xué)者加盟,出現(xiàn)更多被引的優(yōu)質(zhì)成果則是水到渠成之事。
對(duì)樣本總體和高校樣本的最優(yōu)尺度回歸發(fā)現(xiàn),學(xué)科、高校類(lèi)型、出版社是否百佳是影響圖書(shū)被引最重要的3個(gè)因素。據(jù)此,學(xué)科對(duì)被引的影響應(yīng)引起科研管理部門(mén)的重視,在科研評(píng)價(jià)工作中,應(yīng)當(dāng)充分考慮絕對(duì)被引頻次受到學(xué)科等因素的影響,在學(xué)科間不能采用絕對(duì)值進(jìn)行比較[49]。馬太效應(yīng)提示人們不僅僅引用對(duì)自己有幫助的論文,還傾向于引用著名學(xué)者的成果[5],與這種效應(yīng)類(lèi)似,本研究發(fā)現(xiàn)了學(xué)者不僅會(huì)引用與自身研究相關(guān)的圖書(shū),還傾向于引用聲譽(yù)高的出版社、排名靠前高校產(chǎn)出的圖書(shū)。
最優(yōu)尺度回歸和線(xiàn)性回歸結(jié)果顯示,本文的10個(gè)自變量對(duì)圖書(shū)被引的擬合優(yōu)度較低,說(shuō)明本研究涉及的自變量尚不是影響圖書(shū)被引的主要因素。以論文為數(shù)據(jù)源的研究證實(shí)論文質(zhì)量是影響其被引的主要因素。Yu 等[5]采用論文前兩年的被引頻次等引用特征作為衡量論文質(zhì)量的指標(biāo),回歸分析結(jié)果證實(shí)了論文質(zhì)量是影響被引最重要的因素,在去除論文質(zhì)量的引用相關(guān)指標(biāo)后,模型的擬合優(yōu)度由0.674 迅速下降至0.177,說(shuō)明論文質(zhì)量對(duì)被引的重要性。目前一些研究表明圖書(shū)的內(nèi)在質(zhì)量和形式質(zhì)量是衡量圖書(shū)質(zhì)量的重要指標(biāo)[50-52]。相較于論文,圖書(shū)尚缺少類(lèi)似于JIF 等約定俗成的用于評(píng)價(jià)論文內(nèi)在質(zhì)量的相關(guān)指標(biāo)。
本文以CBKCI 收錄的1999-2009年出版的圖書(shū)為研究樣本,探討圖書(shū)被引的影響因素。非參數(shù)檢驗(yàn)和Spearman 相關(guān)分析表明,對(duì)五個(gè)因變量均有顯著影響的特征有:學(xué)科、作者機(jī)構(gòu)所在地、出版地、是否為叢書(shū)、出版社是否百佳、基金類(lèi)別、高等院校、大陸高校類(lèi)型和書(shū)名長(zhǎng)度;作者數(shù)僅對(duì)圖書(shū)的總被引頻次和總被引質(zhì)量有顯著影響;有無(wú)英文名稱(chēng)對(duì)除總被引質(zhì)量外的其余四個(gè)因變量有顯著影響;除了年均被引頻次之外,作者機(jī)構(gòu)類(lèi)別對(duì)其余的四個(gè)因變量均有顯著的影響。結(jié)合回歸分析的結(jié)果可以認(rèn)為有無(wú)英文名稱(chēng)對(duì)圖書(shū)被引的影響可以忽略。最優(yōu)尺度回歸和線(xiàn)性回歸結(jié)果說(shuō)明學(xué)科、出版社質(zhì)量和高校類(lèi)型是影響圖書(shū)被引最重要的因素。回歸方程顯示自變量對(duì)被解釋變量的擬合優(yōu)度較低,后繼工作擬進(jìn)一步探究圖書(shū)質(zhì)量、作者特征等因素對(duì)圖書(shū)被引的影響。本研究的不足之處是,選取的數(shù)據(jù)集源于CBKCI,屬于高質(zhì)量圖書(shū),沒(méi)有涵蓋人文社科圖書(shū);得到的基金資助圖書(shū)被引低于非基金資助圖書(shū)的結(jié)論有待于在全集中繼續(xù)檢驗(yàn);引文數(shù)據(jù)來(lái)源于CSSCI,缺乏圖書(shū)的引文數(shù)據(jù),待CBKCI 開(kāi)放后進(jìn)行補(bǔ)充研究。