吳菲菲 李一葦 苗 紅
(北京工業(yè)大學經(jīng)濟與管理學院 北京 100124)
基礎研究成果轉(zhuǎn)化是產(chǎn)業(yè)技術(shù)創(chuàng)新活動的重要環(huán)節(jié),能夠促進科技資源合理配置和有效利用,對于企業(yè)和國家的競爭實力提升具有重要作用。但是由于研發(fā)周期長、投資風險大等原因?qū)е禄A研究成果轉(zhuǎn)化存在障礙。為此世界各國采取措施強化技術(shù)研發(fā)與基礎研究的關聯(lián),促進基礎研究向技術(shù)研發(fā)的轉(zhuǎn)化,例如美國的先進技術(shù)計劃(ATP)中政府根據(jù)企業(yè)技術(shù)需求,資助具有市場潛力的科研項目,促進研究機構(gòu)與企業(yè)合作,促進基礎研究成果轉(zhuǎn)化[1];歐盟的“歐洲地平線”計劃,包括將基礎研究與創(chuàng)新和社會重大問題結(jié)合,服務基礎研究,解決社會與提升工業(yè)競爭力的相關問題[2]。中國發(fā)布《國家中長期科學與技術(shù)發(fā)展規(guī)劃綱要(2006-2020年)》,規(guī)劃部署面向國家重大戰(zhàn)略需求的基礎研究。面向技術(shù)研發(fā)需求開展的基礎研究,使基礎研究成果處于易轉(zhuǎn)化狀態(tài),也使利用基礎研究成果預測技術(shù)研發(fā)前沿主題成為可能。專利作為技術(shù)研發(fā)成果的載體,專利的科學文獻等非專利引文使技術(shù)研發(fā)與基礎研究構(gòu)成有效關聯(lián)[3-9],利用關聯(lián)的時滯特征和技術(shù)循環(huán)周期特征,可以確定預測前沿主題的非專利引文數(shù)據(jù)篩選準則。
基于技術(shù)研發(fā)與基礎研究關聯(lián)的技術(shù)領域前沿主題預測不同于傳統(tǒng)的技術(shù)前沿預測。傳統(tǒng)技術(shù)前沿預測以技術(shù)本身的發(fā)展和演化為基礎,除專家預測外[4,5,10,11],通常采用專利引用專利[4,5,12-13]或?qū)@谋就诰騕4,5,12-15]的方法實現(xiàn)。雖然在引文計算[16-18]和文本挖掘[19-21]的算法上不斷進步,機器學習[22-23]的方法也用于技術(shù)前沿的預測,但因為沒有將技術(shù)與基礎研究進行有機關聯(lián),因此難以跟蹤基礎研究的新成果,不能服務于基礎研究成果的轉(zhuǎn)化。單純的研究前沿又以論文為預測依據(jù),分析的是基礎研究發(fā)展趨勢,由于缺少與技術(shù)研發(fā)的關聯(lián),造成前沿主題范圍雖廣但可直接用于技術(shù)研發(fā)的基礎研究成果不明確,指導企業(yè)確定研發(fā)方向的作用有限。
技術(shù)前沿主題不同于技術(shù)熱點主題,技術(shù)熱點主題反映當下研究關注的焦點,短時間大量聚集或長時間持續(xù)累計都會增加熱度,技術(shù)熱點主題常用主題詞頻測度及詞與詞之間親疏或語義關系識別分析[24-28],但熱點主題強調(diào)的是受關注程度,并非技術(shù)主題的新穎性[4,29],不能反映技術(shù)未來的發(fā)展方向。技術(shù)前沿主題也不同于技術(shù)新興主題,新興主題關注詞頻增長率而不是累計頻次,對主題的新穎性要求高,但忽視了技術(shù)主題的時效性[4,29-30]。相對新興主題和熱點主題技術(shù)領域的前沿主題更貼近未來,更注重未來的研究價值與前景[4]。技術(shù)前沿主題的預測既要考慮新穎性,也要考慮時效性。通過專利的非專利引文能夠建立技術(shù)研發(fā)與基礎研究之間的關聯(lián)關系[7,9]。本文將以此建立技術(shù)研發(fā)與基礎研究的關聯(lián)關系,在關聯(lián)基礎上,通過技術(shù)研發(fā)成果引用基礎研究成果時滯、技術(shù)研發(fā)成果科學循環(huán)周期實現(xiàn)對基礎研究成果的時效性、新穎性的判斷,利用基礎研究成果預測技術(shù)領域前沿主題。
基于技術(shù)研發(fā)與基礎研究關聯(lián)的技術(shù)領域前沿主題預測,首先,本文通過篩選專利的非專利引文建立技術(shù)研發(fā)與基礎研究的關聯(lián)關系,測度基礎研究成果轉(zhuǎn)化層面的關聯(lián)特征。其次,根據(jù)關聯(lián)特征篩選用于預測技術(shù)領域前沿主題的基礎研究成果數(shù)據(jù)。最后,根據(jù)篩選出的基礎研究成果主題預測技術(shù)領域前沿主題。論文結(jié)構(gòu)如圖1所示。
圖1 基于技術(shù)研發(fā)與基礎研究關聯(lián)的技術(shù)領域前沿主題預測框架
2.1技術(shù)研發(fā)與基礎研究關聯(lián)的建立本文將專利作為技術(shù)研發(fā)成果,在下載得到的專利數(shù)據(jù)中剔除沒有引用信息,以及只引用了專利的數(shù)據(jù),然后對存在非專利引文的數(shù)據(jù)進行進一步分類,具體的分類方法借鑒Sung等人[6]的非專利引文分類及篩選方法,從專利的非專利引文中篩選期刊論文、會議論文與書籍作為基礎研究成果,手冊、報告、網(wǎng)頁信息不算作基礎研究成果。根據(jù)專利對期刊論文、會議論文與書籍的引用建立技術(shù)研發(fā)與基礎研究關聯(lián)。
2.2用于預測技術(shù)領域前沿主題的基礎研究成果篩選在建立了技術(shù)研發(fā)與基礎研究關聯(lián)后,并非所有存在關聯(lián)的基礎研究成果都可用于前沿主題預測。根據(jù)上文對前沿主題特征的描述可知,滿足新穎性與時效性的基礎研究成果才可用于預測技術(shù)領域前沿主題。
2.2.1 基礎研究成果轉(zhuǎn)化的時效性指標 基礎研究成果轉(zhuǎn)化的時效性指基礎研究成果的轉(zhuǎn)化速度,即從出版到被引用經(jīng)歷的時間長度。時間長度越短,時效性越好,反之越差。時效性可用技術(shù)研發(fā)成果引用基礎研究成果的時滯PTg指標測度[31-32],見公式(1):
PTgi=(Ypi-Yci)/s
(1)
式(1)中i=1,2,3…n,j=1,2,3,…s;Ypi表示專利i的公開年份;Ycj表示專利i引用的第j項基礎研究成果的出版年份;s表示專利i引用的基礎研究成果總數(shù)。PTgi越小,代表技術(shù)研發(fā)成果引用基礎研究成果時滯越短,基礎研究成果向技術(shù)研發(fā)轉(zhuǎn)化速度越快。
2.2.2 基礎研究成果的新穎性指標 基礎研究成果的新穎性指專利引用的基礎研究成果的出版年齡,即專利所引用的基礎研究成果的出版時間長度。時間長度越短,新穎性越強,反之越差。新穎性可用技術(shù)研發(fā)成果科學循環(huán)周期SCTt[31-32]測度,見公式(2):
SCTt=∑Sti/Pt
(2)
式(2)中=1,2,3…n,Sti表示專利i引用的基礎研究成果出版年齡中位數(shù),Pt表示施引專利總數(shù)。SCTt越小,代表技術(shù)研發(fā)成果科學循環(huán)周期越短,被引用的基礎研究成果新穎性越強。
為了更好地了解我國技術(shù)研發(fā)引用基礎研究成果的特征,本文對中國、美國、日本相同的技術(shù)領域情況進行了比較研究,然后,根據(jù)中國的技術(shù)研發(fā)與基礎研究的關聯(lián)特征進行技術(shù)領域前沿主題的預測。
3.1數(shù)據(jù)獲取與清洗根據(jù)《國務院關于全面加強基礎科學研究的若干意見》與《國家中長期科學與技術(shù)發(fā)展規(guī)劃綱要》選取農(nóng)業(yè)、材料、能源、網(wǎng)絡信息、制造與工程作為中國重點技術(shù)領域,并篩選技術(shù)領域相關重點關鍵詞進行全時間段的數(shù)據(jù)檢索與分類處理,檢索中國、美國、日本相同技術(shù)領域下有效的專利數(shù)據(jù)進行對比分析。中國數(shù)據(jù)收集時間2020年7月20日,美國、日本數(shù)據(jù)收集時間2020年9月19日,數(shù)據(jù)檢索結(jié)果如表1。面向本文測度技術(shù)研發(fā)成果引用基礎研究成果的時滯、技術(shù)研發(fā)成果科學循環(huán)周期的需求,對檢索獲得的專利數(shù)據(jù)按照參考文獻[6]進行分類統(tǒng)計。結(jié)果如表2。
表1 中美日三國重點技術(shù)領域數(shù)據(jù)集
表2 有引用非專利參考文獻的重點技術(shù)領域?qū)@麛?shù)據(jù)集
3.2基礎研究成果的時效性衡量面向不同技術(shù)領域以專利為單位測度技術(shù)研發(fā)成果引用基礎研究成果時滯,一方面測度時滯長度,在中美日三國之間對比,分析中國重點技術(shù)領域基礎研究向技術(shù)研發(fā)轉(zhuǎn)化的速度,另一方面測度時滯分布區(qū)間,分析中國重點技術(shù)領域技術(shù)研發(fā)成果相對集中引用基礎研究成果的區(qū)間,視為基礎研究相對密集向技術(shù)研發(fā)轉(zhuǎn)化的區(qū)間,確定用于預測技術(shù)領域前沿主題的依據(jù)。
根據(jù)公式(1),得到中日美不同技術(shù)領域研發(fā)成果引用基礎研究成果的時滯測度,截取各國時滯頻次分布相對密集的區(qū)間,結(jié)果如表3-表5。
表3 中國重點技術(shù)領域技術(shù)研發(fā)成果引用
表4 日本重點技術(shù)領域技術(shù)研發(fā)成果引用
表5 美國重點技術(shù)領域技術(shù)研發(fā)成果引用
續(xù)表5 美國重點技術(shù)領域技術(shù)研發(fā)成果引用
對比表3-表5可知,中國的時滯分布在2-8年之間,其中3-4年最為集中,即中國重點技術(shù)領域?qū)@麅A向于引用專利公開年之前2-8年之間發(fā)表的基礎研究成果,最為集中的是引用專利公開年之前3-4年發(fā)表的基礎研究成果。美國農(nóng)業(yè)和材料領域的時滯跨度較大,在2-25年之間,能源、網(wǎng)絡信息和制造與工程領域的時滯分布在2-30年之間,綜合來看時滯9-12年之間最為集中。日本由于專利數(shù)量相對較少,有引用基礎研究成果的專利更少,因此時滯分布較為分散,其中能源領域的時滯分布在3-15年之間,6年最為集中;制造與工程領域的時滯分布在3-20年之間,13年最為集中。對比發(fā)現(xiàn),中國重點技術(shù)領域基礎研究成果時效性最好,基礎研究向技術(shù)研發(fā)轉(zhuǎn)化的速度最快。一方面說明,中國的基礎研究成果在持續(xù)更新,可供技術(shù)研發(fā)成果引用;另一方面說明相對美國與日本,中國的基礎研究起步較晚,仍處于追趕發(fā)展階段,持續(xù)不斷的基礎研究成果轉(zhuǎn)化為技術(shù)研發(fā)成果,既促進了企業(yè)創(chuàng)新發(fā)展,又引導了基礎研究的方向選擇。
3.3基礎研究成果的新穎性衡量根據(jù)新穎性的概念定義及測度公式(2),對獲取的中美日數(shù)據(jù)進行測算,結(jié)果如表6。
表6 中美日重點技術(shù)領域技術(shù)研發(fā)成果科學循環(huán)周期對比(年)
根據(jù)表6,對比各國重點技術(shù)領域技術(shù)研發(fā)成果科學循環(huán)周期,發(fā)現(xiàn)中國重點技術(shù)領域技術(shù)研發(fā)成果科學循環(huán)周期普遍短于美國與日本,顯示中國重點技術(shù)領域?qū)@麅A向于引用更新穎的基礎研究成果。
綜合時滯指標的計算結(jié)果,中國存在持續(xù)更新的基礎研究成果,并且技術(shù)研發(fā)仍存在需要解決的基礎科學問題,需要引用新穎的基礎研究成果作為支撐。因此需要強化基礎研究與技術(shù)研發(fā)的關聯(lián)程度,增加技術(shù)研發(fā)對基礎研究的反饋,根據(jù)技術(shù)研發(fā)的需求進行基礎研究,從而更精準支持技術(shù)研發(fā)。
3.4中國重點技術(shù)領域前沿主題預測基于3.2節(jié)與3.3節(jié)共同呈現(xiàn)的中國重點技術(shù)領域基礎研究成果轉(zhuǎn)化特征,選定中國各個重點技術(shù)領域技術(shù)研發(fā)成果集中引用基礎研究成果的時滯區(qū)間。從本文檢索所得的數(shù)據(jù)集中篩選有引用基礎研究成果的專利與對應時滯區(qū)間內(nèi)被引用的基礎研究成果作為預測數(shù)據(jù)集,篩選其中包含超過兩個技術(shù)研發(fā)主題的專利公開年,按照最新專利公開年、最早專利公開年及二者中間總共三個時間點,分別人工閱讀歸納總結(jié)技術(shù)研發(fā)主題內(nèi)容和基礎研究主題內(nèi)容,結(jié)果如表7。
表7 基于技術(shù)研發(fā)成果引用基礎研究成果的時滯的中國重點技術(shù)領域技術(shù)研發(fā)主題與基礎研究主題的匹配
由于制造與工程領域?qū)@^少,且專利主題內(nèi)容集中于極端制造技術(shù)和數(shù)字化與智能化設計制造兩個主題,因此該技術(shù)領域可直接集中這兩個主題進行研發(fā)投入。
在表7的匹配結(jié)果基礎上,根據(jù)中國各個重點技術(shù)領域技術(shù)研發(fā)成果集中引用基礎研究成果的時滯區(qū)間,通過本文檢索所得數(shù)據(jù)集中的基礎研究成果預測2022年的技術(shù)研發(fā)主題內(nèi)容。為了驗證表7結(jié)果的可信性,選擇具有影響力的中國科學院科技戰(zhàn)略咨詢研究院、中國科學院文獻情報中心與科睿唯安發(fā)布的最新《2020研究前沿》報告中的新興前沿主題作為參照。該報告的預測依據(jù)是ESI數(shù)據(jù)庫中根據(jù)被引頻次和出版年篩選的核心論文,兼顧了本文所關注的基礎研究成果的時效性和新穎性,論文也涵蓋了大部分本文分析涉及的基礎研究成果。如果本文得到的前沿主題與該報告一致,則可以認為本文的研究方法具有可信性,能夠用于基于技術(shù)研發(fā)與基礎研究關聯(lián)的技術(shù)領域前沿主題預測。由于該報告采用學科視角歸納前沿主題,呈現(xiàn)出的主題粒度與本文存在差異,因此,采用兩種方式判斷兩者的一致性,一是報告給出的研究前沿與本文得到的前沿主題詞具有相似性,則可認為一致;二是盡管主題不相似,但根據(jù)主題粒度判斷存在包含關系或目的手段關系,則也可視為一致。例如,農(nóng)業(yè)科學、植物學和動物學領域可應用于環(huán)保型肥料創(chuàng)制、農(nóng)作物肥料資源化技術(shù)的可降解廢棄物資源化利用生物學調(diào)控技術(shù)及機制;生物科學領域可應用于分子評價、發(fā)掘、構(gòu)建技術(shù)和基因識別技術(shù)的基因編輯技術(shù),可應用于免疫防治技術(shù)的免疫相關研究;物理學領域可應用于發(fā)電部件和光電部件研究的二維范德瓦爾斯異質(zhì)結(jié)的摩爾超晶格研究;化學與材料科學領域信息科學領域可應用于pH敏性聚合物的可生物降解的傳感器材料,可應用于生物質(zhì)能源開發(fā)、工業(yè)節(jié)能評價的三元共沸物萃取精餾工藝、等離子體用于廢水處理;信息科學領域可用于5G發(fā)展,提升實時數(shù)據(jù)處理速度、識別網(wǎng)絡信息、支持云計算的無線移動邊緣計算,可用于機器學習技術(shù)研究的AlphaGo Zero的強化學習算法等等;地球科學領域可應用于現(xiàn)代服務業(yè)數(shù)據(jù)處理算法的模型預測研究;經(jīng)濟學、心理學及其他社會科學領域可應用于云平臺服務技術(shù)的人工智能、區(qū)塊鏈技術(shù)等。除了定性判斷本文與研究前沿報告具有一致性外,也通過匹配度計算定量的刻畫兩者的一致性程度,匹配度采用本文預測得到的技術(shù)領域前沿主題占報告給出的新興前沿主題的比例計算,結(jié)果如表8。
表8 2022年中國重點技術(shù)領域前沿主題預測
表8中加粗的字體表示與學科新興前沿主題存在一致性的技術(shù)領域前沿主題。從表8的對比可以認為學科新興前沿主題與預測得到的技術(shù)領域前沿主題具有較好的對應關系,從定量計算的結(jié)果來看,達到100%重合的有農(nóng)業(yè)科學、植物學和動物學領域、生態(tài)與環(huán)境科學領域、信息科學領域、地球科學領域,重合度最低的領域是經(jīng)濟學、心理學及其他社會科學領域以及化學與材料科學領域。達到100%重合一方面是由于這些學科領域與技術(shù)領域的劃分范圍相近,因此在研究主題和研究目的手段方面重合可能性更高,另一方面是學科新興前沿主題更容易轉(zhuǎn)化成實際應用,例如可降解廢棄物資源化、生物柴油成分與添加劑、析氫反應的催化劑成分等,而且研究目的手段適用面更廣,例如基因編輯技術(shù)、機器學習算法、模型預測研究等,可支持技術(shù)研發(fā)的發(fā)展。反之,其余學科的分類范圍與技術(shù)領域交集較小,例如生物科學領域的新興前沿主題,涉及大量認知功能障礙相關疾病的學術(shù)研究;經(jīng)濟學、心理學及其他社會科學領域以社會發(fā)展理論研究為主,如區(qū)域可再生能源與經(jīng)濟發(fā)展、養(yǎng)育方式與短期/長期社會化結(jié)果等,既導致學科領域的新興前沿主題與技術(shù)領域前沿主題交集較小,也導致學科新興前沿主題難以轉(zhuǎn)化并支持技術(shù)研發(fā),因此重合度較低。如此也說明了建立基礎研究與技術(shù)研發(fā)的關聯(lián)對促進基礎研究成果轉(zhuǎn)化,支持技術(shù)研發(fā)的重要性。
本文從基礎研究與技術(shù)研發(fā)關聯(lián)視角,通過專利對基礎研究成果的引用建立技術(shù)研發(fā)與基礎研究的關聯(lián)。通過測度技術(shù)研發(fā)成果引用基礎研究成果的時滯,以及技術(shù)研發(fā)成果科學循環(huán)周期,從基礎研究轉(zhuǎn)化的時效性和技術(shù)研發(fā)成果引用基礎研究成果的新穎度兩方面衡量基礎研究向技術(shù)研發(fā)的轉(zhuǎn)化狀況。選定技術(shù)研發(fā)成果相對集中引用基礎研究成果的時滯區(qū)間,利用基礎研究成果主題預測中國重點技術(shù)領域前沿主題,預測得到如下結(jié)論:
a.農(nóng)業(yè)技術(shù)領域的前沿主題包括種質(zhì)資源發(fā)掘保存與創(chuàng)新、畜禽健康養(yǎng)殖與疫病防護、農(nóng)林生物質(zhì)開發(fā)利用、環(huán)保型肥料創(chuàng)制、農(nóng)業(yè)信息化技術(shù)。
b.材料技術(shù)領域的前沿主題包括智能材料與結(jié)構(gòu)制備技術(shù)、高溫超導材料與制備技術(shù)。
c.能源技術(shù)領域的前沿主題包括大規(guī)模輸配電和電網(wǎng)安全保障、可再生能源低成本規(guī)模化開發(fā)利用、氫能及燃料電池技術(shù)、工業(yè)節(jié)能評價、煤液化與多聯(lián)產(chǎn)技術(shù)。
d.網(wǎng)絡信息技術(shù)領域的前沿主題包括傳感器網(wǎng)絡與智能信息處理、智能感知技術(shù)、信息安全保障技術(shù)、現(xiàn)代服務業(yè)數(shù)據(jù)處理算法、虛擬現(xiàn)實技術(shù)。
e.制造與工程技術(shù)領域的前沿主題包括極端制造技術(shù)、數(shù)字化與智能化設計制造。