郭金忠 王申宏 劉曉玲 馮賀禾
新疆財經(jīng)大學信息管理學院 烏魯木齊 830012
隨著知識經(jīng)濟時代的到來和全球化水平的不斷提高,城市作為創(chuàng)新活動的聚集地和實現(xiàn)載體,其網(wǎng)絡地位比規(guī)模地位更加重要[1],也因此涌現(xiàn)出一批空間計量學、地理學、科學學等領域的學者在城市層面構(gòu)建引文網(wǎng)絡、合作網(wǎng)絡和創(chuàng)新網(wǎng)絡,以此探尋城市的知識地位、合作地位和創(chuàng)新地位。然而,目前針對城市學科的微觀研究卻略顯遜色。一方面,城市地址數(shù)據(jù)的龐大和不規(guī)范性使得數(shù)據(jù)收集和處理工作復雜而繁瑣,且語言的隔閡以及“城市”這一地理單元規(guī)模的不同也給相關研究帶來阻礙;另一方面,盡管學科分類可以劃分不同的學科領域,但不同學科分類體系的差異同樣為研究增加了不確定性。但是,結(jié)合知識流的特征和內(nèi)涵評價城市學科的學術影響力具有重要意義,不僅有助于城市管理者和政策制定者有效識別城市科學核心優(yōu)勢,從而更好的制定管理、投資戰(zhàn)略,而且能夠用城市學科網(wǎng)絡揭示國家知識流動格局,為城市協(xié)調(diào)均衡發(fā)展提供新思路,為探索國家協(xié)調(diào)創(chuàng)新路徑助力?;诖?,本文借鑒經(jīng)濟學中的投入產(chǎn)出模型探索世界城市學科的學術影響力,旨在豐富對城市學科的有限探索。
科技創(chuàng)新是搶占科學前沿高地的重要動力,黨的十九大報告強調(diào)要加快建設創(chuàng)新型國家,完善科技強國布局。因此黃衛(wèi)對加強我國面向世界科技強國的基礎研究布局發(fā)表若干見解[2]。Guo等[3]定量的衡量各個國家學科的學術影響力,揭示了國家學科間的知識流動格局。城市
是國家參與全球創(chuàng)新競爭的重要地理單元,在國家創(chuàng)新體系中的地位不斷提升。城市網(wǎng)絡已經(jīng)成為解釋城市空間組織結(jié)構(gòu)的一種新范式,而知識流動作為典型的城際互動關系之一[4],吸引著不同學科領域的關注,故越來越多的研究經(jīng)由科研論文和專利的引用、合作、轉(zhuǎn)讓關系探索城市間知識溢出和互動。Zhang等[5]基于APS數(shù)據(jù)庫建立城市引用關系網(wǎng)絡,定義知識擴散代理算法和科學生產(chǎn)排名算法,并確定物理知識生產(chǎn)和消費的關鍵城市。Csomós[6]構(gòu)建世界城市國際合作網(wǎng)絡,對城市國際合作的效率做出回答。馬海濤[7]提出四種城市間創(chuàng)新關系建構(gòu)和網(wǎng)絡模擬方法,反映城市創(chuàng)新關系的不同方面。曹湛等[8]以WoS合著論文數(shù)據(jù)為基礎,從空間結(jié)構(gòu)、拓撲特征及驅(qū)動因素三方面分析全球526個主要城市知識合作網(wǎng)絡的演化。可以看出,當前研究多停留在以城市間知識流動為研究對象,并未過多細化研究的粒度。因國家內(nèi)部的學術影響力和科研資源分配等存在地區(qū)性、學科性差異,故將城市學科作為研究的立足點較國家學科更具代表性。因此,本文依托于現(xiàn)有國家學科層面相關研究以及城市網(wǎng)絡研究日趨成熟的基礎上,深入學科層面對城市知識網(wǎng)絡開展微觀研究,為國家學科發(fā)展提供更細致的全息畫像。
學科分類是對具有一定關聯(lián)學科的歸類,最終分類結(jié)果構(gòu)成學科分類體系。出于不同的應用目的,產(chǎn)生了不同的學科分類體系。一個科學的學科分類體系不僅結(jié)構(gòu)完整、邏輯縝密,并且在理論上有助于人們對科學的從屬關系有整體的認知和把握,在實踐中能夠為科技政策和科技發(fā)展規(guī)劃以及科研成果統(tǒng)計和管理服務。目前,國內(nèi)外學者圍繞學科領域進行了廣泛的研究。陳雨[9]開發(fā)了分類體系差異性測度軟件,并對 WoS和Scopus學科分類對學科學術競爭力評價結(jié)果的影響展開分析。王文平[10]探討中國國際科技合作對學科發(fā)展的影響并發(fā)現(xiàn)新興的、應用性較強的領域跨學科研究程度較高。Sun等[11]依據(jù)APS中的PACS代碼劃分了現(xiàn)代物理學子領域,探究其內(nèi)外部知識的演化并發(fā)現(xiàn)知識流趨于同質(zhì)化,表明跨學科研究的重要性。葉春雷[12]基于WoS學科分類提出一種綜合的跨學科態(tài)勢分析方法,識別主題研究領域涉及的核心學科類別及其研究熱點內(nèi)容。閆慧等[13]對國內(nèi)外圖情檔領域研究熱點進行比較,并探索了學術熱點與學科發(fā)展的關系。不難發(fā)現(xiàn),目前的研究大多局限于不同學科分類體系差異性的影響、跨學科研究及某一領域的學術熱點等,而關于不同學科在不同計量實體間(科研人員、機構(gòu)、國家和地區(qū)等)的橫向比較相對較少,因此不利于發(fā)現(xiàn)差距和不足[14]。鑒于此,本文在城市網(wǎng)絡和學科領域兩個中觀研究的基礎上,深入城市學科間的知識互動,對城市學科的學術影響力進行評價,比較不同城市學科間的差距并探索城市重點學科領域,為城市科學發(fā)展尋求方向。
文獻中評價作者、期刊或機構(gòu)學術影響力最直接的方法是基于其所載論文的被引頻次,然而這一方法沒有對發(fā)文數(shù)量進行標準化[15],且未區(qū)分施引文章的重要性。隨著PageRank算法的出現(xiàn)和廣泛應用,利用PageRank算法評價學術影響力的方法應運而生,并衍生出各種變形。Chen等[16]使用PageRank算法評估論文的相對重要性。Ding[17]將加權 PageRank 算法應用于作者引文網(wǎng)絡,發(fā)現(xiàn)作者的知名度和聲望均與加權 PageRank高度相關。Zeng等[18]在量化科研論文的影響中詳盡的總結(jié)和介紹了PageRank及其變形。盡管從基于計數(shù)的方法到基于網(wǎng)絡的方法是科學計量學一次里程碑式的發(fā)展[15],但PageRank算法只能回答學術實體的重要性問題而無法解答學術實體間的相互影響關系。
為能在考慮引用數(shù)量和質(zhì)量的同時,一貫且定量的對學科領域的相對重要性和相互影響關系做出回答,Shen等[19]創(chuàng)造性地將經(jīng)濟學中的投入產(chǎn)出模型應用于物理學子領域。但文中使用的是后向投入產(chǎn)出關系矩陣B,即衡量的是施引領域的相對影響力,而從學科領域的角度看,因被引用端是知識的生產(chǎn)者和貢獻者,故考慮其影響力更具合理性與指導意義。Guo等[3]將初始投入產(chǎn)出矩陣所有元素加1并修正上述文章中的B矩陣,轉(zhuǎn)而使用衡量被引端重要性的前向投入產(chǎn)出關系矩陣F,并將其應用于國家學科層面。本文將城市學科的知識流網(wǎng)絡轉(zhuǎn)化為初始投入產(chǎn)出矩陣后不作任何處理,直接作為投入產(chǎn)出模型的輸入,以此探究投入產(chǎn)出模型在更精細范圍內(nèi)應用的可行性及中國城市學科的發(fā)展現(xiàn)狀,即將某個城市的某個學科視為模型中的一個部門,其引用其他城市學科的量視為投入,被其他城市學科引用的量視為產(chǎn)出,通過虛擬消去法探究城市學科的學術影響力,并將結(jié)果與PageRank、HITS算法比較,以此考察投入產(chǎn)出方法的評價效果。
此外,諸多學者針對在科學計量研究中應使用何種計數(shù)方法這一問題開展研究。但瓊潔[20]依據(jù)不同計數(shù)法下國際合作論文中機構(gòu)的貢獻度,發(fā)現(xiàn)不同計數(shù)方法的綜合運用,可以多角度反映機構(gòu)國際合作論文的研究現(xiàn)狀。張麗華等[21]基于評價科研人員時不同計數(shù)方法的影響,認為計數(shù)方法的選擇要與評價目的要結(jié)合。陳莉玥等[22]基于信譽值分配將計數(shù)方法分為全計數(shù)法與分數(shù)計數(shù)法兩大類,并比較計數(shù)方法在論文指標、引文指標、網(wǎng)絡指標三個方面的差異。而由于全計數(shù)法的便利性,大多數(shù)研究尤其是空間計量學的文章中,多使用全計數(shù)法[23]。因目前學界沒有一致的結(jié)論,考慮到本文重點驗證方法可行性的初始目的以及在城市層面細化論文作者地址信息的較大工作量,因此選擇全計數(shù)法,即文中涉及的發(fā)文數(shù)量、被引頻次及投入產(chǎn)出矩陣的元素均采用全計數(shù)法。
基于數(shù)據(jù)的可獲得性,本文依托APS數(shù)據(jù)集開展相關研究。APS于1975年開始采用PACS代碼用于論文分類,并于2016年啟用了新的分類方案PhySH[24],即物理主題詞語,但因其正處于不斷更新且逐漸完善的過程中,因此本文收集了1980-2013年發(fā)表在APS期刊的379310篇論文的信息(包括論文的DOI、發(fā)表時間、PACS代碼、作者地址信息和參考文獻及其上述信息)。在分析中,“城市”選取位于國家(州/地區(qū)等)和作者所屬機構(gòu)名稱之間的空間單元,而非空間計量學在城市相關研究中常用的大都市圈。在此基礎上統(tǒng)計每個國家和城市的發(fā)文數(shù)量,其中發(fā)文數(shù)量超過1000篇的國家有43個,城市有255個。將在美國、日本、英國、德國、意大利和法國6個國家中發(fā)
APS數(shù)據(jù)庫編制了具有多層次結(jié)構(gòu)的PACS代碼用于論文分類,如圖1a所示,最高級別的PACS代碼將現(xiàn)代物理學劃分為00, 10 , 20, 30,40, 50, 60, 70, 80, 90共10個主要的子領域[25],本文借此將論文劃分到不同的物理學子領域,并以此代表論文的所屬學科。每篇論文所屬的城市和學科均確定以后,經(jīng)配對組合得到論文所屬的“城市-學科”,并根據(jù)論文間6039964條引用關系建立城市學科間知識流網(wǎng)絡,如圖1b所示,由此最終得到節(jié)點數(shù)為4346,鏈接數(shù)為4483299的加權有向網(wǎng)絡。
圖1 a 論文地址、PACS代碼信息以及論文間引用關系,其中論文A引用了論文B和C
圖1 b 由圖1a中論文間引用關系得到的城市學科間知識流網(wǎng)絡
投入產(chǎn)出模型是研究國民經(jīng)濟各部門間文數(shù)量不足1000篇的城市歸類為“國家二級區(qū)域名稱-Others”的形式以離散數(shù)據(jù),在其他37個國家中的歸類為“國家名稱-Others”,發(fā)文數(shù)量不足1000篇的部分歸類為“Other-Others”,共得到448個城市地址。平衡關系時所使用的方法,并已應用于中國物流業(yè)碳排放測算[26]、新冠肺炎沖擊路徑分析[27]與科普能力評價[28]。在城市學科層面借鑒投入產(chǎn)出模型的思想,將每一個城市學科視為一個部門開展相應的分析[29]。由上文建立的知識流網(wǎng)絡,得到對應的投入產(chǎn)出矩陣X,如表1所示,矩陣的行為被引的城市學科i,列為施引的城市學科j,矩陣中的元素xij表示i傳遞給j的知識量,即網(wǎng)絡中對應鏈接的權重。
表1 城市學科間的投入產(chǎn)出矩陣
需要指出,城市學科的投入產(chǎn)出模型和傳統(tǒng)的投入產(chǎn)出模型有兩點不同:①文中投入產(chǎn)出模型是封閉系統(tǒng),即不存在傳統(tǒng)意義上的“增加值”行、“最終需求”列等,只存在各城市學科間知識的“中間投入-中間使用”矩陣;②在傳統(tǒng)的投入產(chǎn)出模型中,每個部門的總投入等于其總產(chǎn)出,而本文中城市學科i的總施引量等于其總被引量的概率極小。
對投入產(chǎn)出矩陣X的元素xij做式(1)所示處理以得到前向投入產(chǎn)出關系矩陣F,矩陣的元素fij表示城市學科領域i每施引一次,帶來的城市學科領域j的引用量:
其中,U是城市學科領域i引用的所有城市學科的集合。
F矩陣構(gòu)建完畢后采用虛擬消去法,即假設系統(tǒng)中沒有某個城市學科k,檢查整個系統(tǒng)的結(jié)構(gòu)所發(fā)生的變化。變化越大,則表示城市學科k的影響力越大。若系統(tǒng)中沒有某個城市學科k,即從F矩陣中去掉城市學科k所在的第k行k列,再計算新矩陣F(-k)的最大特征值。由于原始投入產(chǎn)出關系矩陣F的最大特征值為1,且去掉城市學科k后系統(tǒng)的最大特征值λ(-k)是小于等于1的,因此可由去掉城市學科k前后特征值的損失變化,衡量城市學科k的影響力。故定義投入產(chǎn)出學術影響力指標IOF如下:
其中,λ(-k)是矩陣F(-k)的最大特征值,越大,則表示城市學科k越重要。
科研產(chǎn)出一般通過發(fā)文數(shù)量或?qū)@麛?shù)量衡量[30]。為考察城市在物理學領域的科研產(chǎn)出水平,本文統(tǒng)計各城市在APS中發(fā)表論文的數(shù)量,并分別從整體視角和高產(chǎn)出的局部視角探索城市科研產(chǎn)出的分布情況。
圖2為繪制的城市發(fā)文數(shù)量累計概率分布圖及頻次分布圖,從整體看分析涉及3104個城市。其中在1980-2013年發(fā)文數(shù)量為1的城市有531個,占城市數(shù)量的17.11%,發(fā)文數(shù)量不大于10篇的城市有1548個,占城市數(shù)量的49.87%。同時,發(fā)文數(shù)量超過10000篇的城市也屈指可數(shù),僅有日本的東京市、中國的北京市及美國的劍橋市。如表2a所示,發(fā)文數(shù)量排名20的城市已銳減至5493篇。圖2a中累計概率在發(fā)文數(shù)量較小時增長速度較快,當發(fā)文數(shù)量大于22篇時增長趨于緩慢。同樣,圖2b中出現(xiàn)明顯的拖尾現(xiàn)象,故發(fā)文數(shù)量在城市間存在較大的異質(zhì)性,即大部分城市發(fā)文數(shù)量較少,而少部分城市發(fā)文數(shù)量較大,整體服從冪律分布且符合二八法則,因此聚焦于高科研產(chǎn)出城市進一步分析。
圖2 a 城市發(fā)文數(shù)量的累計概率分布
圖2 b 城市發(fā)文數(shù)量的頻次分布
表2 a APS中發(fā)文數(shù)量排名前20的城市 表2b 高科研產(chǎn)出城市中占比排名前20的國家
本文將高科研產(chǎn)出城市劃定為在APS中發(fā)文數(shù)量超過1000篇的城市,共255個城市參與分析。在地圖上對各個城市進行地理定位,用點的大小表示城市的發(fā)文數(shù)量,顏色表示被引頻次,在空間上呈現(xiàn)這些城市的地理分布情況,由此通過APS數(shù)據(jù)確定世界上哪些國家擁有物理學產(chǎn)出較高的城市。如圖3所示,絕大多數(shù)具有高科研產(chǎn)出的城市位于三個主要的地理區(qū)域:44.31%的城市位于歐洲;36.86%位于北美洲,尤其是美國的東海岸;15.68%位于亞洲,這與Csomós對Scopus數(shù)據(jù)庫觀察到的三個主要的地理區(qū)域吻合。同時,位于這些區(qū)域的城市論文被引頻次也十分突出,且與發(fā)文數(shù)量的Pearson相關系數(shù)為0.8685。結(jié)合表2b可知,美國有85個高科研產(chǎn)出城市,占比高達33.33%,因此在地圖上呈現(xiàn)出廣泛的分布。此外,在澳大利亞東海岸、印度、南美洲東部觀察到零星分布,代表著這些地方物理科研產(chǎn)出的主要來源,而位于中國的高科研產(chǎn)出城市有北京、上海、蘭州、武漢、南京、合肥、香港、臺北、桃園、新竹。
圖3 APS中發(fā)文數(shù)量超過1000篇的城市的空間地理分布格局
由式(2)計算出4346個城市學科學術影響力的得分IOF,將得分從高至低排序得到城市學科的影響力排名情況,并繪制由投入產(chǎn)出模型得到的IOF排名與發(fā)文數(shù)量排名以及被引頻次排名之間的相關圖,如圖4所示,圖中點的顏色代表各城市學科所歸屬的不同國家。圖4b中,大部分的點分布在1:1的對角線上,而IOF排名和發(fā)文數(shù)量排名相關圖中的點分布則比較分散,但兩圖均呈現(xiàn)出一定的正相關性。采用Spearman等級相關系數(shù)考察兩組排名的相關性分別為0.9010和0.9984,與圖中觀察到的結(jié)果一致,后者的相關性要明顯強于前者。
圖4 投入產(chǎn)出學術影響力指標IOF排名與發(fā)文數(shù)量排名的相關圖以及與被引頻次排名的相關圖
此外,由圖4b中的點分布在對角線周圍,盡管能說明投入產(chǎn)出方法所得排名和被引頻次排名較為接近,但并不能因此認為被引頻次比投入產(chǎn)出方法統(tǒng)計分析簡單而選擇被引頻次衡量學術影響力,仍要選擇投入產(chǎn)出方法的原因有:首先,兩種方法具有本質(zhì)區(qū)別。被引頻次衡量的是城市學科領域的直接影響力,而投入產(chǎn)出方法考慮的是總影響效應,即直接影響和間接影響。其次,圖4b在呈現(xiàn)兩者相關性時,為更好的展現(xiàn)“頭部”城市學科的排名差異,橫縱坐標軸均采用對數(shù)形式,因而會放大兩者間的線性關系,即實際分布要比所呈現(xiàn)的分散。因此,投入產(chǎn)出方法要優(yōu)于被引頻次,且通過圖4b還可以判斷哪些城市學科分別被高估或低估,如USA-Rochester-10位于對角線的左上方,即它的IOF排名高于被引頻次的排名,若只單純的依據(jù)被引頻次對其評價,則會低估它的實際學術影響力。
從學科層面看,基本粒子物理與場(10)子領域處于絕對領先的地位。其中學術影響力排名前97的城市學科均屬于10領域,且10領域處于城市各學科第一位的城市占城市數(shù)量的61.38%。一個可能的解釋是,城市層面10領域被引用的頻次較高,因此在全計數(shù)法中占據(jù)優(yōu)勢,在結(jié)果中突出。為此,對所有學科領域(00-90)在城市層面的被引頻次進行統(tǒng)計,發(fā)現(xiàn)10領域總被引頻次高居第一位,且是其對應的施引文章的城市數(shù)量、學科數(shù)量及其所屬被引文章的被引頻次綜合作用的結(jié)果。
表3為影響力排名前20的城市學科概況。從城市層面看,除去第4名是在美國二級行政區(qū)域得克薩斯州上合并的數(shù)據(jù),其他均為行政意義上的城市,而其中有12個位于美國,雖然這與APS數(shù)據(jù)庫歸屬美國有一定的原因,但也能夠見得美國在學術影響力上的主導地位;從學科層面看,前20名均屬于10領域。同時值得注意的是,城市各學科間學術影響力差異較大,美國劍橋市的10領域位列首位,而其50(氣體、等離子體和放電物理)領域則排名1909位,展現(xiàn)了城市內(nèi)部學科發(fā)展的不均衡。
表3 投入產(chǎn)出學術影響力指標IOF排名前20的城市學科概況
圖5繪制了中國10個高科研產(chǎn)出城市及國外6個重點城市在不同物理子領域下的排名情況,以此了解中國城市學科的發(fā)展現(xiàn)狀。當城市在某個子領域中的影響力越高時,圖中對應位置所堆疊的面積則越大。在城市學科綜合排名中,臺北市與北京市的10領域位列中國城市學科的前二,但北京市在不同子領域的影響力較臺北市更為均衡,且20(核物理)領域在所有城市中排15位,高于其在10領域中的排名28位。中國其他高科研產(chǎn)出城市在各子領域中的排名則相對靠后。而與國外的6個重點城市相比,中國城市學科的影響力還存在一定的差距,具有較大的發(fā)展空間。
圖5 中國10個高科研產(chǎn)出城市及國外6個重點城市在不同物理子領域下的影響力排名情況
當基于復雜網(wǎng)絡分析方法的科學學研究出現(xiàn)以后,以PageRank、HITS算法為代表的結(jié)構(gòu)化指標相繼涌現(xiàn)并產(chǎn)生了各種變形,因此本文選取上述兩種傳統(tǒng)的算法與投入產(chǎn)出方法進行比較,以驗證投入產(chǎn)出方法的有效性。PageRank算法作為互聯(lián)網(wǎng)網(wǎng)頁重要度的計算方法,最初是由Google用作網(wǎng)頁排序,并逐步在度量標準文獻重要性[31]、核心專利發(fā)現(xiàn)[32]、文獻檢索排序[33]等方面有了廣泛的應用。HITS算法是通過兩個權值,即內(nèi)容權威度(Authority)和鏈接權威度(Hub)計算網(wǎng)頁的得分。因PageRank算法只提供一個值,此值可以認為是網(wǎng)頁的Authority值[34]?;诒疚?.1中所建立的知識流網(wǎng)絡及投入產(chǎn)出矩陣X,由式(3)和式(4)分別進行迭代計算,當前后兩次迭代的數(shù)值差全部小于1×e-15時停止,此時得到各個節(jié)點的PageRank和Authority值,即為各城市學科的學術影響力得分。據(jù)此繪制城市學科基于IOF排名分別與基于PageRank算法的排名、基于HITS算法的Authority值排名的相關圖,如圖6所示,并計算相應的Spearman等級相關系數(shù)分別為0.9728和0.8283。
圖6 投入產(chǎn)出學術影響力指標IOF排名與PageRank算法排名的相關圖以及與HITS算法排名的相關圖
其中,d為阻尼因子,一般取0.85;N為網(wǎng)絡中的節(jié)點數(shù);PR(i)、PR(j)分別為節(jié)點i、j的PageRank值;U為節(jié)點i指向的所有節(jié)點的集合,R是指向節(jié)點j的所有節(jié)點的集合。
Authority(k)和hub(k)分別表示在k次迭代計算得出的Authority值與Hub值,式中XT表示X的轉(zhuǎn)置矩陣。
為觀察各方法中排名靠前的城市學科的一致性情況,本文重點選取在投入產(chǎn)出方法中排名前50的城市學科在基于被引頻次、PageRank和HITS算法下的排名分布情況。如圖7所示,IOF排序列表和HITS排序列表的前50與被引頻次排序列表基本一致,為此數(shù)據(jù)集中的高被引城市學科,和IOF排序差異最大的是PageR-ank算法,投入產(chǎn)出方法的前50名分布在PageRank算法的前80名中,其中Japan-Osaka-10排名差異最大,在兩種方法中分別排第45名和第80名。為此,研究每種方法下排名前100的城市學科的被引頻次分布和平均被引頻次情況,如表4所示。PageRank算法排名前100的城市學科中只有39個被引頻次介于30-50萬次之間,有36個的被引頻次少于30萬次,這可以從側(cè)面說明重要的引用會劇烈影響排序列表的順序。同樣從平均被引頻次角度可以看出,投入產(chǎn)出排序列表與被引頻次排序列表最相似,而PageR-ank排序列表與被引頻次排序列表差異最大。
圖7 投入產(chǎn)出學術影響力指標IOF排名前50的城市學科在被引頻次、PageRank、HITS算法下的排名分布
表4 各方法排序前100的城市學科的被引頻次分布和平均被引頻次
如表5所示,PageRank算法與其他三種方法排名列表前100的共有城市學科數(shù)都較少,表明其與其他方法的差異較大,其中與HITS-A算法差異最大,共有城市學科數(shù)僅有64個。因此,PageRank 算法得到的排序列表前列中會包括來自不同領域的城市學科,而不僅僅是10領域,故更適用于全局排序。HITS算法提供Authority 和 Hub 兩個分數(shù),考慮了內(nèi)容的相關性,更適用于同一領域內(nèi)的排序,但計算效率要低于PageRank算法。而投入產(chǎn)出方法與被引頻次的共有城市學科數(shù)為98,表明其與被引頻次排序方法高度相似,說明其對引用結(jié)構(gòu)的敏感度較低,即它對引用重要性的區(qū)分效果沒有PageRank算法和HITS算法明顯[34]。因PageR-ank 算法中的阻尼因子d為可變概率,故其結(jié)果依賴于d值的設定,而投入產(chǎn)出方法所得的學術影響力為確定型結(jié)果,同時投入產(chǎn)出模型可以定量評估城市學科間的相互影響關系[19],因此,投入產(chǎn)出方法要比PageRank 算法的結(jié)果更穩(wěn)定、準確,且超越了PageRank、HITS算法解決問題的范圍,具有一定的優(yōu)勢。
表5 各算法排序前100中共有城市學科的數(shù)量
綜上,與只考慮被引頻次的做法相比,投入產(chǎn)出、PageRank和HITS算法綜合考慮引用的數(shù)量和質(zhì)量的做法更為合理,能夠更好的反映城市學科的學術影響力,因而投入產(chǎn)出方法為評價城市學科的影響力提供了一種新的分析范式,但選擇算法時要考慮算法的適用場景以及研究的目的做出決定。
本文將經(jīng)濟學中的投入產(chǎn)出模型結(jié)合知識流網(wǎng)絡的背景與內(nèi)涵創(chuàng)造性地應用于城市學科,并通過APS數(shù)據(jù)集對方法的可實施性與評價效果進行驗證和考察。首先對城市科研產(chǎn)出分布情況進行探究,發(fā)現(xiàn)城市間發(fā)文數(shù)量呈現(xiàn)非均衡特征,整體服從冪律分布。發(fā)文數(shù)量超過1000篇的城市共255個,通過地理定位發(fā)現(xiàn)其多位于北美洲、歐洲和亞洲,尤其是美國和德國呈現(xiàn)出廣泛的分布,且這些城市的論文被引頻次也相當突出;其次,借助投入產(chǎn)出模型衡量各城市學科的影響力,研究發(fā)現(xiàn)城市內(nèi)部各學科間影響力差異較大,其中10領域在城市各學科中排名第一的城市占城市數(shù)量的61.38%,且影響力排名靠前的城市學科多為美國城市的基本粒子物理與場領域。北京市的學科發(fā)展相對均衡,中國的城市學科具有較大的發(fā)展空間;最后,將投入產(chǎn)出方法得到的排序列表與PageRank及HITS算法所得排序列表比較,并討論了每種方法下城市學科的共有數(shù)和平均被引頻次等特點。由于三種方法均綜合考慮了引用的數(shù)量和質(zhì)量,因此要優(yōu)于僅僅依據(jù)被引頻次的方法,而投入產(chǎn)出模型對于引用結(jié)構(gòu)的敏感度要低于PageRank、HITS算法,即不會賦予重要引用以過分的權重,且不受外界參數(shù)的影響,能得到更穩(wěn)定、準確的結(jié)果,同時能定量回答城市學科領域間的相互影響關系問題,為評價城市學科的影響力提供一種新的、可靠的分析框架和范式。
基于研究結(jié)果可以看出,中國城市1980-2013年間在APS中的發(fā)文數(shù)量尚可,尤其是北京,僅次于日本東京市處于所有城市的第二名,且北京和臺北市10領域的影響力處在前1%左右,學術影響力不容小覷。而近些年中國的科研產(chǎn)出更是呈井噴式增長,北京已連續(xù)三年蟬聯(lián)全球科研城市首位[35]。如今,中國已經(jīng)具備了孕育世界科學中心所需要的經(jīng)濟條件和物質(zhì)基礎,2020年12月至2021年6月,京津冀、粵港澳大灣區(qū)、長三角三個綜合類國家技術創(chuàng)新中心分別在北京、廣州和上海揭牌成立,同時《北京市“十四五”時期國際科技創(chuàng)新中心建設規(guī)劃》中也明確指出,到2025年北京將建設成為世界科學中心和創(chuàng)新高地[35],因此在這難得的“機會窗口”,中國應把握歷史機遇,發(fā)揮科學優(yōu)勢,做好城市重點布局工作,并積極破解挑戰(zhàn)性難題,搶占前沿研究與顛覆性技術創(chuàng)新先機,掌握科學話語權。
本研究存在一定的局限性并有待于進一步研究,主要表現(xiàn)在:第一,由于數(shù)據(jù)的可獲得性,本文基于APS數(shù)據(jù)庫1980-2013年內(nèi)的數(shù)據(jù)開展分析,缺乏對宏觀學科及最新數(shù)據(jù)的分析;第二,使用的計數(shù)方法單一,未探討不同計數(shù)方法間的差異;第三,文章僅從引文分析視角以數(shù)量化的思維對城市學科的學術影響力做出評價,后續(xù)應考慮基礎學科學術成果的創(chuàng)新性及突破性等因素綜合評價城市學科的學術影響力。但投入產(chǎn)出方法適用于任何可以提取城市信息和具有學科分類的數(shù)據(jù)集,如WoS、Scoups、OpenAlex等,因此筆者未來將會在醫(yī)學、數(shù)學、生物學等宏觀學科門類及不同計數(shù)方法下探究城市學科的知識流動,并將引入時間因素,結(jié)合各城市的相關科技政策,研究城市學科的影響力隨時間的變化,從中發(fā)掘重點城市的核心優(yōu)勢,為城市學科的發(fā)展做出更多貢獻;同時將定量的探究城市學科間的支撐或競爭關系,為中國的學科布局、科學研究以及科創(chuàng)中心建設提供參考。