劉 瑋 李 玲 沈奎林
基于性別因素的高校教師科研生產率實證研究*
——以圖情檔領域為例
劉 瑋 李 玲 沈奎林
論文以國內圖情檔領域五所著名院校的198名教師為研究對象,從數(shù)量和質量兩方面選擇計量指標,采用描述統(tǒng)計和信息計量中的引文分析方法,從性別角度對高校教師的科研生產率進行實證研究。結果表明,在中青年群體中,高校女性教師在人數(shù)和科研成果數(shù)量方面已經(jīng)超過或正在趕超男性,正在邁向科研質量方面的超越,但女性杰出人才群體的形成還需更多努力。最后,分析了該現(xiàn)象的存在原因。
科研生產率性別差異引文數(shù)量論文數(shù)量高校教師
學術評價是信息計量學和科學計量學研究的熱點之一,通常從數(shù)量和質量兩個角度進行評價。教師科研水平的高低與學科發(fā)展和人才培養(yǎng)密切相關。在高等教育機構的評價研究中,教師的科研數(shù)量和質量被賦予很高的權重,比如在USNEWS和QS中,學術能力占40%,引文指標占20%;在THE中,教學和科研占30%,引文指標占32%;在邱均平的大學評價中,科學研究占到45%;在武書連的排行榜中,教師學術水平和學術引用也占有相當比例。
從性別角度,高校教師由男性和女性兩大群體構成。這兩個群體之間的科研能力、科研成果是相同的,還是有差異的。Peas和Willett選擇圖書情報領域國際排名前列的5所高校,其中英國3所(拉夫堡大學、謝菲爾德大學和英國皇家圖書情報學院),美國2所(伊利諾伊大學香檳分校和印第安納大學),對圖書情報系的教師科研成果進行計量分析。研究發(fā)現(xiàn)男性教師在科研成果數(shù)量方面明顯高于女性教師;而引文數(shù)量表明,在科研質量方面,女性與男性無顯著差異[1]。
本文選取國內圖情檔領域知名高校進行研究,采用定量方法從數(shù)量和質量角度對本領域高校教師的科研產出進行分析,對于我國教師不同性別群體的科研生產力進行研究,并得到一些有意義的結論。
1.1 研究對象
選取國內5所圖情檔領域知名高校中的信息管理學院(系)教師為研究對象,分別為武漢大學信息管理學院、南京大學信息管理學院、中山大學資訊管理學院、中國人民大學信息資源管理學院和北京大學信息管理系。除中大外,其余4家高校都具有“圖書館、情報與檔案管理”一級學科博士學位授予權,武大、南大、北大具有該一級學科博士后流動站。
根據(jù)學校網(wǎng)站上提供的師資隊伍信息,并結合實際調查咨詢和主要研究領域,將所有教師進行分類,分為圖書館學、信息管理(情報)、檔案與電子政務和出版發(fā)行,共4類。極個別教師在CNKI和萬方數(shù)據(jù)中無記錄,予以刪除,最終選擇的有效研究對象有198名教師。
1.2 計量指標
(1)數(shù)量型指標
選擇發(fā)文量、年均發(fā)文量作為數(shù)量型指標。以第一篇論文年份與最后一篇論文年份之間的間隔為分母計算年均發(fā)文量。發(fā)文量是研究對象累積科研成果量,隨著從業(yè)年限而增長;而年均發(fā)文量體現(xiàn)了該對象持續(xù)的發(fā)文能力。
(2)質量型指標
在信息計量和科學評價領域,學術論文的被引數(shù)量通常作為評價論文質量高低的有效指標。一篇具有高被引數(shù)的論文往往是一篇學術影響力廣、質量高的論文。這里選擇總被引次數(shù)和篇均被引次數(shù)作為質量型計量指標??偙灰螖?shù)隨著時間增長;而篇均被引受到總引文次數(shù)和總論文量的影響,隨著時間有可能增長或下降,能體現(xiàn)研究對象發(fā)表論文的平均質量。
(3)H型指標
選擇經(jīng)典的H指數(shù)和G指數(shù)、R指數(shù)。H指數(shù)相同的學者,由于高被引論文的存在,形成不同的G指數(shù)。R指數(shù)同樣能區(qū)分高被引情況。高被引能有效區(qū)分論文的學術影響力。
H指數(shù):Hirsch在2005年提出H指數(shù)[2]。一名科學家的H指數(shù)是指其發(fā)表的Np篇論文中有h篇每篇至少被引用h次,而其余Np-h篇論文每篇的被引用數(shù)小于或等于h次。也就是說,一個學者的H指數(shù)表明其最多有h篇論文被引用了至少h次。H指數(shù)簡單、穩(wěn)健,容易獲取,能兼顧評價中的數(shù)量與質量。有學者將H指數(shù)擴展到評價期刊、機構、專利權人乃至國家[3-6]。
G指數(shù):Egghe在2006年提出G指數(shù)[7],即論文按照被引次數(shù)排序后相對排前的累積被引至少g2次的最大論文序次g,亦即第g+1序次論文對應的累積引文數(shù)將小于(g+1)2。對于某科學家,G指數(shù)大于或等于H指數(shù)。具有相同H指數(shù)的科學家,G指數(shù)的差異表示是否存在影響力大的高被引論文。葉鷹建議將g-h稱為學術差,將g/h稱為學術勢[8]5,這兩個指標能反映具有相同H指數(shù)的學者間存在的差異。
R指數(shù):Burrell在2007年提出了H核[9](Hirsch core,或h-core),即H指數(shù)內的論文集合,h核的大小等于某確定時刻h核內所有論文的引文數(shù)量之和。在此基礎上,金碧輝等在2007年提出了A、AR和R指數(shù)[10]。其中R指數(shù)定義為:
公式中,citj為h核內按降序排列的第j篇論文的被引次數(shù)。R指數(shù)較好地解決了H指數(shù)的敏感度和區(qū)分度問題,尤其是對高被引敏感。
2.1 獲取原始數(shù)據(jù)
圖情檔在學科上隸屬于管理學,教師的科研成果大多以期刊論文形式出現(xiàn)。因此,所有實證研究數(shù)據(jù)來自2012年11—12月的CNKI數(shù)據(jù)庫和萬方數(shù)據(jù)庫。主要通過CNKI數(shù)據(jù)庫提供的著者檢索功能,并結合作者單位進行檢索。由于CNKI對于《情報學報》刊物的收錄時間截止2002年底,而該刊物在圖書、情報領域是重要期刊,因此通過萬方數(shù)據(jù)庫對該刊2003年及以后發(fā)文情況進行統(tǒng)計。在實際檢索中,由于數(shù)據(jù)庫更新問題,某教師的發(fā)文數(shù)量和引文數(shù)量可能出現(xiàn)12月底檢索的數(shù)據(jù)較11月初檢索的數(shù)據(jù)略偏高。在實際數(shù)據(jù)收集工作完成后,我們對數(shù)據(jù)進行了抽樣重復檢索,檢索時間不同帶來的差異非常小。完成檢索的順序依次為武大,南大,北大,人大和中大。通過檢索可以直接獲得發(fā)文量、發(fā)文年份、每篇論文的引文數(shù)量。
2.2 數(shù)據(jù)預處理及說明
部分教師的研究領域跨度較大,比如工程領域、聲學領域。本文考慮的是高校教師科研生產率,所以沒有剔除。但是,對于非學術性論文予以剔除,對于教學型論文未做剔除。
部分教師英文論文較多,而中文論文相對較少,本文選擇的數(shù)據(jù)來源局限于中文期刊,因此存在極少部分優(yōu)秀教師在本文中的指標值偏低的情況。
合著者問題,沒有考慮合著的分配問題,對于多名著者的同一篇論文,每位作者分別計算一次。顯然,合著多的教師,指標偏高。從生產率角度,合著有利于科研產出;從社會網(wǎng)絡分析角度,合作越多的人越容易成為核心節(jié)點。
在檢索中,對同名者的處理主要依據(jù)教師履歷介紹。對于同一單位,名字相同者,通過論文內容予以區(qū)分。對于曾就職多個機構的教師,論文成果予以累計。
在獲取檢索結果基礎上,分別計算年均發(fā)文量、篇均被引量、H指數(shù)、G指數(shù)和R指數(shù)。
3.1 對數(shù)據(jù)分層
按照研究對象的內部屬性——年齡,予以分組。按照出生日期分為5組,分別對應60歲以上、50歲至60歲,40歲至50歲,30歲至40歲以及30歲以下,如第一組是1951年及以前出生,以此類推。女性人數(shù)分布為4、8、34、29、5,合計80人;男性人數(shù)分布為6、23、55、30、2,合計118人。
按照學術年齡分組(即第一篇論文至最近一篇論文之間的間隔):第一組(30年及以上),第二組(29-25),第三組(24-20),第四組(19-15),第五組(14-10),第六組(9-5),第七組(1-4)。女性人數(shù)分布為1、9、10、19、16、19、6;男性人數(shù)分布為8、17、17、26、34、13、3。在實際分析時,由于人數(shù)太少,第一組和第七組予以剔除,即剔除掉學術年齡小于5年的和大于30年的研究對象。
按照職稱分組:第一組(教授),第二組(副教授),第三組(講師)。女性人數(shù)分布為25、45、10;男性人數(shù)分布為63、40、15。
從教師數(shù)量角度,40到50歲之間、學術年齡在10到19年教師最多,是教師隊伍的主體;40歲以下、學術年齡10年以下的年輕教師中,女性已經(jīng)或正在超過男性數(shù)量。從職稱看,教授組,男性是女性組的2.5倍,而副教授組和講師組男女差異不大;女性組的職稱分布呈正態(tài),副教授是主體;而男性組教授數(shù)量超過副教授和講師數(shù)量之和,呈偏態(tài)分布。
3.2 描述統(tǒng)計分析
3.2.1 按照年齡分組的數(shù)據(jù)分析結果
(1)數(shù)量型指標的對比
本文針對不同性別群體進行比較研究,不關注個體的情況,因此以組內成員的平均值作為該組的值。整體上,不同性別組的數(shù)量差距在縮小。發(fā)文量和年均發(fā)文量在第一組中表現(xiàn)出的差異最大,男性到140為止,女性接近100,隨著年齡遞減,男女發(fā)文量也呈遞減。至第五組女性的數(shù)量型指標超越男性組,但都低于20。
(2)質量型指標的對比
整體上,不同性別組的質量型指標差距在縮小??傄脭?shù)之間的差異由第一組的766逐漸變小至第五組的-2。即最年長的一組研究對象,男性較女性的總被引次數(shù)平均多766次;最年輕的一組研究對象,女性組的總被引次數(shù)比男性平均多2次。篇均被引數(shù)男性組整體高于女性組,兩者最接近的是第三組。
(3)H型指數(shù)對比
H指數(shù)、G指數(shù)和R指數(shù),第一組差距最大,然后逐漸減少;第五組,女性組反超男性組;其他3組數(shù)據(jù)的變化趨勢類似??傮w上,隨著年齡遞減,此指數(shù)也呈遞減趨勢。
3.2.2 按照學術年齡分組的數(shù)據(jù)分析結果
按照學術年齡分組后,由于樣本量小,將第一組和第七組剔除。我們分析了第二到第六組的數(shù)據(jù),共180人。發(fā)文量、年均發(fā)文量和總被引數(shù)量均是第二組和第三組差異較大,男性大于女性;而第四組和第五組女性組接近或超越男性;第六組數(shù)據(jù)男性超過女性。篇均被引數(shù)女性組在兩次反超后,第六組數(shù)據(jù)又明顯低于男性組,論文數(shù)量和總被引數(shù)之間的微小反向差異被放大。
H指數(shù)和G指數(shù)、R指數(shù),從第四組反超后,第五、第六組值比較接近??傮w上,男女的H指數(shù)值呈遞減趨勢。
3.2.3 按照職稱分組的數(shù)據(jù)分析結果
按照職稱分為3組,對每組計算其均值。兩個數(shù)量型指標,均表現(xiàn)出男女差異變小,講師組女性反超男性的趨勢。年發(fā)文量第三組女性明顯高于男性。
總引用次數(shù),男女差異在第二組開始變得不明顯,男性保持微弱優(yōu)勢。由于數(shù)量上的反向差異,導致男性第三組在篇均被引方面顯著高于女性組。
H指數(shù)、G指數(shù)和R指數(shù),第一組差距最大,然后逐漸減少,副教授組男女最接近,講師組女性略低。
3.2.4 不同指標間關系的分析
(1)數(shù)據(jù)的變異性分析
變異系數(shù)是衡量資料中各觀測值變異程度的一個統(tǒng)計量。如果平均數(shù)不同,比較其變異程度就不能采用標準差,而需采用標準差與平均數(shù)的比值(相對值)來比較,即變異系數(shù)。
表1 樣本的變異系數(shù)
比較每組數(shù)據(jù)的變異系數(shù),觀察組內值的均勻分布情況。這里以年齡分組的第一組和第三組數(shù)據(jù)為例,如表1所示。其中第一組男性8人,女性4人,均為教授。第一組數(shù)據(jù)顯示,男性組中強者更強。第三組數(shù)據(jù)顯示,女性組中強者更強。考慮到第一組數(shù)據(jù)中,男性指標明顯高于女性指標,而第三組數(shù)據(jù)中,女性與男性指標很近似。在某種程度上,某性別群體的崛起必然有少數(shù)強大的個體出現(xiàn)。
而整體上,組內差異大,明顯符合洛特卡規(guī)律及二八定律,即生產率高的個體占總體的少數(shù)。男性組,共118人,其中發(fā)文最多的26人所共完成總論文數(shù)量的80%,圖像為正偏態(tài)分布,平均數(shù)48,中數(shù)33,見圖1。女性組,共80人,其中發(fā)文最多的17人貢獻了所有論文數(shù)量的80%,圖像呈正偏態(tài)分布,平均數(shù)31,中數(shù)24,見圖2。
圖1 論文數(shù)量分布直方圖(男性)
圖2 論文數(shù)量分布直方圖(女性)
(2)數(shù)量指標與質量指標的相關性分析
通過相關性分析,判斷發(fā)文數(shù)量和引用質量是否存在相關性。利用SPSS進行因子分析并得到各因素之間的相關性。
由主成分分析可知,論文總數(shù)和年均發(fā)文這兩個數(shù)量型指標之間屬于極強相關,總被引數(shù)與論文總數(shù)極強相關,與年均發(fā)文強相關;3個H型指數(shù)之間屬于極強相關,尤其是G指數(shù)和R指數(shù),相關性為0.999;H型指數(shù)與論文總數(shù)、年均發(fā)文和總被引之間屬于強或極強相關;而質量型指標之一的篇均被引,與論文總數(shù)和年均發(fā)文弱相關或極弱相關,與其他四個指標中等程度相關,與R相關性最明顯。在本文選擇的計量指標中,除了篇均被引,其余6項指標之間顯著相關;而篇均被引與H型指標中等程度相關。
表2是男性組數(shù)據(jù)的分析結果。女性組數(shù)據(jù)的分析結果類似。
表2 主成分分析的相關矩陣
3.2.5 杰出人才在不同性別組的分布
按照盧梭定律,用總人數(shù)的平方根簡單估算優(yōu)秀者人數(shù)。表3是男女按照年齡分組后(此處剔除了第五組),進入優(yōu)秀者行列的臨界H值和G值。比如,對于40歲到50歲之間的本領域高校女教師,成為女性群體中的優(yōu)秀者的必要條件可能是H值達到或超過11,即至少有11篇論文(每篇至少被引用11次);如果不考慮性別,要想成為本年齡群體的優(yōu)秀者,必要的條件可能是H值達到或者高于14,即至少有14篇論文(每篇至少被引用14次)。
表3 優(yōu)秀者H和G值
不分性別,按照年齡分組。在第一組中,優(yōu)秀者是武漢大學馬費成、邱均平和胡昌平,均為男性;第二組的優(yōu)秀者也沒有女性;第三組9名優(yōu)秀者中,R指數(shù)確定的女性為武大黃如花和司莉、人大周曉英,以G指數(shù)確定的為黃如花和南大陳雅;第四組7名優(yōu)秀者,H指數(shù)確定的女性為武大宋恩梅、北大的張久珍、人大劉越南,G指數(shù)確定的女性為張久珍和劉越南;第五組學術年齡較小,沒有做分析。優(yōu)秀者隸屬的機構,第一組均出自武大,后面逐漸分散。
g-h學術差和g/h學術勢是葉鷹在2007年提出這兩個指標[8],從這兩個指標分析,要想成為優(yōu)秀者,具備高被引論文,即影響力大的學術論文是必要條件。顯然,男性組的杰出者表現(xiàn)出更高的學術差,在男性組的杰出者與組內其他人相比,高被引,或者說高影響力論文非常重要。
通過對研究對象的定量分析,我們得到以下結論。
第一,在實際統(tǒng)計中,發(fā)現(xiàn)部分教師,尤其是中年及以上教師,發(fā)文初期的連續(xù)性不好,第一篇論文和第二篇論文距離較遠,影響年平均發(fā)文率。這與上世紀八九十年代的高??蒲型度氲?,科研工作受重視程度不高有關。
第二,年輕教師普遍起點高,論文數(shù)量和質量整體水平好。從獲得的學者基本信息發(fā)現(xiàn),80后年輕教師群體普遍學歷高(博士比例幾乎百分之百,海外留學經(jīng)歷的比例高),經(jīng)過連續(xù)的科研能力培養(yǎng)。而基于科研論文成果的定量研究也表明這一群體普遍學術素質高、科研能力強。
第三,高校教師女性比例變大,高校40歲以下教師中,女性人數(shù)等于或大于男性,女性科研生產率接近或略高于男性。通過訪談,大致原因包括以下幾點:主觀上,女性認為高校工作環(huán)境好、工作比較輕松,能較好地平衡家庭和事業(yè);而男性認為高校收入不高,陳規(guī)陋習多,體制僵化,吸引力弱;客觀上,接受高層次教育的女性人數(shù)增加,女博士(或更高)受過嚴謹?shù)目蒲袑W術訓練,但大多沒有實際工作經(jīng)驗,進公司就業(yè)存在劣勢??傮w上與社會分工、經(jīng)濟發(fā)展都有著密切的關系。
第四,由因子分析結果分析,篇均被引指標是一個比較獨立的指標;其他6個指標之間兩兩相關性均在0.67以上。我們對198名研究對象進行篇均被引值排序,篇均被引大于12者有22位,最高達到49。22人中,教授14人,副教授6人,講師2人。篇均被引指標能凸顯科研論文數(shù)量少而影響廣泛的作者,這一指標與目前人才評價體系中要求提供代表性論文的要求相吻合,正如有學者呼吁“學術評價:超越量化模式”[11]。但從學科評價和學校排名角度,篇均被引是否還有更深刻的含義和價值,需要進一步的研究。
第五,實證研究表明,女性教師在科研數(shù)量上的趕超幅度大于質量上的趕超,因此造成篇均被引指標反而差距變大。在完成數(shù)量趕超后,女性教師需要關注論文質量的提高,關注科研成果的質量和學術影響力。
通過對圖情檔領域的高校教師科研生產率的定量分析,我們認為隨著時代的發(fā)展,女性教師已經(jīng)成為高校重要的科研、教學力量。在某些專業(yè)領域,女性教師不僅在人數(shù)和科研成果數(shù)量上趕超男性,在科研成果質量上也在逐步縮小差距,甚至開始超越男性,但要想成為行業(yè)優(yōu)秀人才,還需關注學術質量和影響力。
本文研究對象是圖情檔領域的高校教師群體,屬于管理學科,性別分布與與理工科可能存在差異,因此這一結論能否適用其他學科,還需要更多的數(shù)據(jù)支持。
[1]Peas C S,Willett P.Brief communication:Gender differences in publication and citation counts in librarianship and information science research[J]. Journal of Information Science,2006,32(5):480-485.
[2]Hirsch J E.An index to quantify an individual’s scientific research output[C].Proceedings of the National Academy of Sciences of the United States of America,2005,102(46):16569-16572.
[3]Braun T,Gianzel W,Schubert A.A Hirsch-type index for journal[J].The Scientist,2005,19(22):8.
[4]周英博,馬景娣,葉鷹.國際基礎學科核心期刊h指數(shù)實證研究[J].大學圖書館學報,2009,27(2):66-70.
[5]程麗,方志偉,韓松濤,等.國際大學h指數(shù)與綜合指標排名的比較研究[J].大學圖書館學報,2009,27(2):71-75.
[6]次仁拉珍,葉鷹.專利權人h指數(shù)研究[J].圖書與情報,2009(6):67-69.
[7]Egghe L.Theory and practice of the g-index[J]. Scientometrics,2006,69(1):131-152.
[8]葉鷹.h指數(shù)和類h指數(shù)的機理分析與實證研究導引[J].大學圖書館學報,2007,25(5):2-8.
[9]Burrell Q L.On the h-index,the size of the Hirsch core and Jin’s A-index[J].Journal of Informetrics,2007,1(2):170-177.
[10]Jin B H,Liang L M,Rousseau R,et al.The R-and AR-indices:Complementing the h-index[J]. Chinese Science Bulletin,2007,52(6):855-863.
[11]陳洪捷,沈文欽.學術評價:超越量化模式[N].光明日報,2012-12-18(15).
劉瑋西安電子科技大學經(jīng)濟管理學院副教授。陜西西安,710071。
李玲北京郵電大學圖書館館員。北京,100876。
沈奎林南京大學圖書館館員。江蘇南京,210093。
Empirical Study of the Faculty’s Research Productivity Based on the Gender Factor:A Case of Library and Information Science
Liu Wei,Li Ling,Shen Kuilin
From the quantity and the quality perspective,an empirical study of research productivity of the faculty is completed by this paper,based on 198 teachers in five popular domestic universities of the library and information science.It shows that there are more female people among the young and middle-aged faculty,and they published more journal articles.However they still need to improve the quality of publication according to the citation count analysis. There are still more outstanding male researchers.Lastly,this paper states possible explanation of such phenomenon.
Research productivity.Gender differences.Citation counts.Publication counts.Faculty.
G250
2013-10-28編校:劉明)
*本文系中央高?;究蒲袠I(yè)務費專項資金資助項目“復雜網(wǎng)絡視野下的知識共享研究”(項目編號:K50511060006)成果之一。