黃魯成 薛爽
摘 要:[目的/意義]機(jī)器學(xué)習(xí)作為人工智能的關(guān)鍵核心技術(shù),受到了前所未有的重視和快速發(fā)展。深入研究其發(fā)展現(xiàn)狀和競爭格局,有助于為企業(yè)戰(zhàn)略和相關(guān)產(chǎn)業(yè)政策制定提供科學(xué)決策依據(jù)。[方法/過程]基于DII數(shù)據(jù)庫和WOS數(shù)據(jù)庫,從發(fā)展階段、熱點(diǎn)與核心領(lǐng)域識別、競爭國家對比三方面,對該技術(shù)領(lǐng)域發(fā)展現(xiàn)狀、競爭格局進(jìn)行了分析。[結(jié)果/結(jié)論]機(jī)器學(xué)習(xí)技術(shù)處于快速成長期,我國目前也處于快速發(fā)展期;我國在技術(shù)結(jié)構(gòu)布局上存在短板;美國的專利活動最強(qiáng),我國也屬于技術(shù)活躍者;美國的專利質(zhì)量最高,我國與其相差較大;互聯(lián)網(wǎng)企業(yè)是重要推動力量;熱點(diǎn)領(lǐng)域有智能診斷、自動駕駛儀、教育輔助、語音識別、計算機(jī)視覺等;核心領(lǐng)域有排序、學(xué)習(xí)、知識處理、搜索、模糊邏輯系統(tǒng)、專家系統(tǒng)等。
關(guān)鍵詞:機(jī)器學(xué)習(xí);專利分析;文獻(xiàn)計量;國際競爭
Abstract:[Purpose/Significance]As the key technology and basic industry for the Artificial Intelligence,Machine Learning receives unprecedented attention and rapid development.Thorough research on its technology trend and competitive posture will provide a scientific basis for the decision making of both relevant industry policies and business strategies.[Methods/Processes]Based on Derwent innovations index and Web of science database,this paper used patent statistical analysis,bibliometric analysis and social network analysis methods to analyze development status of this technology field from three aspects:the technology development stage,the core and hot technology field identification and the comparative analysis of major competitive countries,in order to clarify the strengths and weaknesses of China,and explore future development opportunities.Finally,based on the comprehensive analysis,this paper proposed corresponding countermeasures and suggestions for technological research and development,market layout and industrial development in the field of machine learning in China.[Results/Conclusion]Machine learning technology was in a rapid growth period,and China was also in a period of rapid development;there were shortcomings in the layout of technology structure in China;the United States had the strongest patent activity,and China was also a technology activist;the United States had the highest patent quality,and China was quite different from it;Internet companies were an important driving forces;the hotspots included intelligent diagnosis,autopilot,education aid,speech recognition,computer vision,and so on;the core areas included sequencing,learning,knowledge processing,search,fuzzy logic systems,and expert systems,and so on.
Key words:machine learning;patent analysis;bibliometrics;international competition
中共中央總書記習(xí)近平在2018年10月31日主持人工智能發(fā)展現(xiàn)狀和趨勢第九次集體學(xué)習(xí)時強(qiáng)調(diào):人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,加快發(fā)展新一代人工智能是事關(guān)我國能否抓住新一輪科技革命和產(chǎn)業(yè)變革機(jī)遇的戰(zhàn)略問題[1]。近年來,人工智能技術(shù)對人類社會的影響越來越深遠(yuǎn)與廣泛,它正在為農(nóng)業(yè)、醫(yī)療、教育、能源、國防等諸多領(lǐng)域提供了大量新的發(fā)展機(jī)遇[2]。機(jī)器學(xué)習(xí)技術(shù)是人工智能的一個核心研究領(lǐng)域[2-4],對機(jī)器學(xué)習(xí)技術(shù)進(jìn)行競爭國家對比分析,識別機(jī)器學(xué)習(xí)技術(shù)熱點(diǎn)和核心領(lǐng)域,理清機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域的競爭態(tài)勢及我國的地位,對于完善機(jī)器學(xué)習(xí)技術(shù)發(fā)展的政策,落實(shí)好國家人工智能發(fā)展戰(zhàn)略,輔助企業(yè)戰(zhàn)略決策具有重要意義。
專利信息對技術(shù)創(chuàng)新的時效性分析和發(fā)展態(tài)勢分析具有國家戰(zhàn)略性價值[5]。目前,運(yùn)用專利和文獻(xiàn)分析機(jī)器學(xué)習(xí)技術(shù)現(xiàn)狀的文獻(xiàn)極少,僅發(fā)現(xiàn)科睿唯安印度工商業(yè)聯(lián)合會在《科學(xué)觀察》上發(fā)表了名為“人工智能,下一代數(shù)字轉(zhuǎn)型的創(chuàng)新力與顛覆力”的文章,該文涉及機(jī)器學(xué)習(xí)技術(shù)自身的現(xiàn)狀與發(fā)展方向,但缺乏對機(jī)器學(xué)習(xí)應(yīng)用情況的競爭態(tài)勢分析?;诖?,本文確定了如下的研究內(nèi)容:一是從專利和文獻(xiàn)的相互關(guān)系上闡述機(jī)器學(xué)習(xí)技術(shù)的發(fā)展階段,以及各階段的特征;二是應(yīng)用專利數(shù)據(jù)分析機(jī)器學(xué)習(xí)技術(shù)的核心和熱點(diǎn)領(lǐng)域;三是從專利活躍程度、專利質(zhì)量、市場布局、技術(shù)領(lǐng)域等進(jìn)行了部分國家競爭對比分析。在此基礎(chǔ)上,為我國發(fā)展機(jī)器學(xué)習(xí)技術(shù)應(yīng)用提出了相關(guān)對策。
1 研究方法
1.1 分析方法
根據(jù)上述研究內(nèi)容,確立如下研究框架(如圖1所示):
技術(shù)發(fā)展階段分析:使用專利和科技文獻(xiàn)兩種數(shù)據(jù)源,確定機(jī)器學(xué)習(xí)技術(shù)所處的生命周期階段,分析機(jī)器學(xué)習(xí)基礎(chǔ)科學(xué)研究和技術(shù)應(yīng)用的情況,以期得出機(jī)器學(xué)習(xí)技術(shù)的發(fā)展脈絡(luò)。
技術(shù)核心與熱點(diǎn)領(lǐng)域分析:識別機(jī)器學(xué)習(xí)技術(shù)的熱點(diǎn)領(lǐng)域,把握整個機(jī)器學(xué)習(xí)研發(fā)動向,為合理布局研究重心、提高科研效率提供有價值參考和決策支持;識別核心技術(shù)領(lǐng)域,為國家和企業(yè)直擊核心技術(shù),降低投資風(fēng)險和成本,形成持續(xù)的競爭優(yōu)勢提供一定的決策支持。
技術(shù)競爭國家對比分析:從專利活躍程度、專利質(zhì)量、市場布局、技術(shù)領(lǐng)域等進(jìn)行了部分國家競爭對比分析,有助于識別我國在機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域所處的競爭地位,找準(zhǔn)市場,更好發(fā)力。
1.2 數(shù)據(jù)獲取
采用德溫特專利數(shù)據(jù)庫(Derwent Innovation Index)和Web of Science文獻(xiàn)數(shù)據(jù)庫進(jìn)行機(jī)器學(xué)習(xí)領(lǐng)域?qū)@臀墨I(xiàn)數(shù)據(jù)收集。對于機(jī)器學(xué)習(xí)技術(shù)(“Machine Learning”,簡稱”ML”),我們查閱了相關(guān)文獻(xiàn),也嘗試用其他關(guān)鍵詞合并進(jìn)行檢索,但最終檢索出來的數(shù)據(jù)會生成大量冗余信息,對后續(xù)的分析會造成很大影響。所以,本文以TS=(Machine Learning)為檢索表達(dá)式,分別在以上兩個數(shù)據(jù)庫中進(jìn)行檢索,檢索日期為2018年10月10日,檢索時間范圍為所有年份,檢索獲取專利(族)8 524件,文獻(xiàn)35 400篇,以下研究將以這些數(shù)據(jù)為基礎(chǔ)展開。
2 技術(shù)發(fā)展階段分析
本文使用專利數(shù)據(jù)和文獻(xiàn)數(shù)據(jù)相結(jié)合的方法來識別機(jī)器學(xué)習(xí)技術(shù)發(fā)展階段,一般而言:當(dāng)科技文獻(xiàn)數(shù)量大于專利數(shù)量時,該技術(shù)處于理論探索階段,主要科學(xué)原理需要進(jìn)一步完善,一些重要的科學(xué)問題尚未完全解決;反過來,當(dāng)專利數(shù)量與科技文獻(xiàn)數(shù)量相差較小時,該技術(shù)的科學(xué)問題基本得到解決,主導(dǎo)技術(shù)趨于穩(wěn)定[6]。機(jī)器學(xué)習(xí)技術(shù)發(fā)展的基本過程如圖2所示(因?yàn)閷@?8個月左右的滯后期,2017年和2018年的專利可能不夠完整,所以暫不做研究)。由圖2可知,機(jī)器學(xué)習(xí)技術(shù)整個發(fā)展過程呈現(xiàn)3個階段:萌芽期、平穩(wěn)成長期和快速成長期。
萌芽期(2001年以前),該階段的主要特征是:專利申請數(shù)比較少,年申請量少于15件;科技文獻(xiàn)年發(fā)表數(shù)少于300篇,科技文獻(xiàn)數(shù)量遠(yuǎn)大于專利數(shù)量;專利數(shù)量和科技文獻(xiàn)數(shù)量基數(shù)都比較小,且增長率波動幅度大。根據(jù)文獻(xiàn)[6],這表明機(jī)器學(xué)習(xí)在很多科學(xué)問題和學(xué)習(xí)及算法方面處于初期探索階段。
平穩(wěn)成長期(2001-2010年),該階段的主要特征是:專利申請量在百件左右;科技文獻(xiàn)數(shù)在千篇左右,科技文獻(xiàn)數(shù)量遠(yuǎn)大于專利數(shù)量;專利年均增長率為26.10%,科技文獻(xiàn)年均增長率為20.92%,專利申請量和科技文獻(xiàn)數(shù)出現(xiàn)了較快的增長,根據(jù)文獻(xiàn)[6],表明這一階段機(jī)器學(xué)習(xí)開始走向應(yīng)用,但仍有一些科學(xué)問題沒有完全解決。
快速成長期(2011-2018年),該階段的主要特征是:專利申請量首次突破2 000件;科技文獻(xiàn)數(shù)突破5 000篇,科技文獻(xiàn)數(shù)大于專利數(shù);專利申請年均增長率達(dá)52.72%,科技文獻(xiàn)年均增長率達(dá)24.63%,專利數(shù)和科技文獻(xiàn)數(shù)增速較前一時期加快。根據(jù)文獻(xiàn)[6],表明這一階段機(jī)器學(xué)習(xí)開始走向大規(guī)模多領(lǐng)域的應(yīng)用,但相關(guān)的一些學(xué)習(xí)方法和算法需要進(jìn)一步完善。
總體上,機(jī)器學(xué)習(xí)技術(shù)專利數(shù)和科技文獻(xiàn)數(shù)呈逐年上升趨勢,文獻(xiàn)數(shù)量一直高于專利的申請數(shù)量,說明目前機(jī)器學(xué)習(xí)領(lǐng)域的很多問題仍未完全得到解決,許多算法還在創(chuàng)新與完善過程當(dāng)中,機(jī)器學(xué)習(xí)應(yīng)用研發(fā)勢頭強(qiáng)勁。
3 技術(shù)熱點(diǎn)與核心領(lǐng)域分析
3.1 技術(shù)熱點(diǎn)領(lǐng)域識別
熱點(diǎn)領(lǐng)域是指在某一段時間內(nèi),有內(nèi)在聯(lián)系的、投入研究資源較多的領(lǐng)域。識別機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域的研發(fā)熱點(diǎn),有助于把握整個機(jī)器學(xué)習(xí)研發(fā)動向,使該領(lǐng)域相關(guān)研究人員與決策者迅速、準(zhǔn)確地把握機(jī)器學(xué)習(xí)研究態(tài)勢,為合理布局研究重心、提高科研效率提供有價值參考和決策支持。
國際專利分類(IPC)是目前國際通用的比較完善的專利技術(shù)分類體系。本文對IPC大組進(jìn)行共現(xiàn)網(wǎng)絡(luò)分析及聚類分析以識別出機(jī)器學(xué)習(xí)熱點(diǎn)技術(shù)領(lǐng)域。具體步驟是:將檢索出的8 471項(xiàng)專利中的IPC字段導(dǎo)入Excel中,將其保留至大組級別,使用Python編程選取頻次大于或等于30的IPC大組生成IPC共現(xiàn)矩陣。將共現(xiàn)矩陣導(dǎo)入到Ucinet中生成共現(xiàn)網(wǎng)絡(luò)。其中,節(jié)點(diǎn)代表機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,節(jié)點(diǎn)大小表示度中心度,節(jié)點(diǎn)之間的連線寬度表示不同技術(shù)領(lǐng)域共同出現(xiàn)的次數(shù)。
在社會網(wǎng)絡(luò)中,某些節(jié)點(diǎn)之間關(guān)系特別緊密,以至于形成一個次級團(tuán)體,這樣的團(tuán)體稱為凝聚子群[7]。凝聚子群中的節(jié)點(diǎn)之間具有相對較強(qiáng)、直接、緊密的關(guān)系。k核是基于點(diǎn)度基礎(chǔ)上的凝聚子群分析方法,要求任何節(jié)點(diǎn)至少與k個節(jié)點(diǎn)相連,進(jìn)行k核分析有利于發(fā)現(xiàn)一些有意義的凝聚子群[8]。
按照k核算法進(jìn)行網(wǎng)絡(luò)布局,根據(jù)IPC分類號所對應(yīng)的技術(shù)領(lǐng)域,形成明顯的14個凝聚子群,選擇最大的前5個k核作為5個熱點(diǎn)技術(shù)領(lǐng)域群,如圖3所示,這5個子群中的技術(shù)節(jié)點(diǎn)之間關(guān)聯(lián)相對緊密,每個節(jié)點(diǎn)都連接了相對較多的鄰居節(jié)點(diǎn):
熱點(diǎn)群Ⅰ:屬于24核子群,包括車輛控制自動駕駛儀等控制調(diào)節(jié)系統(tǒng);行政金融管理預(yù)測系統(tǒng);基于知識模式、生物學(xué)、數(shù)學(xué)系統(tǒng)等特定計算模型的計算機(jī)系統(tǒng);放射治療儀器等醫(yī)學(xué)診斷;語音識別;圖像處理;電視電報無線網(wǎng)絡(luò)通信及其安全裝置;報警器等信號裝置。
熱點(diǎn)群Ⅱ:屬于23核子群,包括無線通信網(wǎng)絡(luò)的監(jiān)控系統(tǒng);語音識別合成;報警器。
熱點(diǎn)群Ⅲ:屬于22核子群,包括教育輔助設(shè)備;叩診器械、超聲波診斷。
熱點(diǎn)群Ⅳ:屬于21核子群,包括定位系統(tǒng);電測試裝置;反射或再輻射系統(tǒng)如雷達(dá)系統(tǒng)。
熱點(diǎn)群Ⅴ:屬于20核子群,包括時間指示裝置、預(yù)報警及報警系統(tǒng)等控制系統(tǒng)或安全系統(tǒng);使用無線電波的系統(tǒng)。
3.2 技術(shù)核心領(lǐng)域識別
德溫特手工代碼(Derwent Manual Codes)(以下簡稱手工代碼)由標(biāo)引人員分配給專利,用于表示專利的具體技術(shù)創(chuàng)新點(diǎn)及其應(yīng)用的專有代碼,它們能夠反映出專利的核心內(nèi)容和主題[9],本文采用德溫特手工代碼進(jìn)行核心技術(shù)領(lǐng)域分析。
國內(nèi)學(xué)者韓志華[10]給出核心專利的定義,即在某一技術(shù)領(lǐng)域中處于關(guān)鍵地位,對技術(shù)發(fā)展具有突出貢獻(xiàn)的,對其他專利或者技術(shù)具有重大影響的,并且具有重要經(jīng)濟(jì)價值的專利。由于核心專利承載著核心技術(shù),通過對核心專利的分析,能夠?yàn)閲液推髽I(yè)篩選優(yōu)質(zhì)專利,直擊核心技術(shù),降低成本,從而形成持續(xù)的競爭優(yōu)勢。Narin F和Schettion F等[11-12]認(rèn)為,一項(xiàng)專利被后來的許多專利所引用,則表明該專利是一項(xiàng)比較核心的專利。根據(jù)普賴斯定律,以被引次數(shù)界定核心專利[13-14],全球機(jī)器學(xué)習(xí)專利中最高被引頻次為273次,定義M=0.749*273=12.3755,故被引頻次不少于13次的專利為核心專利。相對于總被引頻次,年均被引頻次可以校正由時間引起的誤差。因此,本文以年均被引頻次為統(tǒng)計量,選出年均被引頻次大于13的專利,列于表1中。
專利年均被引頻次最高的是美國NARUS公司在2014年申請的一項(xiàng)主題為計算機(jī)網(wǎng)絡(luò)(如廣域網(wǎng))中僵尸網(wǎng)絡(luò)的識別方法,包括使用機(jī)器學(xué)習(xí)算法分析網(wǎng)絡(luò)數(shù)據(jù)和數(shù)據(jù)集,生成表示標(biāo)簽的模型作為特征值的函數(shù)的專利。年均被引頻次第二位和第四位的專利主題也是關(guān)于僵尸網(wǎng)絡(luò),由此可見,僵尸網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)核心技術(shù)應(yīng)用領(lǐng)域,機(jī)器學(xué)習(xí)應(yīng)用于網(wǎng)絡(luò)安全已成為近年來安全領(lǐng)域的研究熱點(diǎn),具體涉及的核心技術(shù)領(lǐng)域有:排序(T01-E01A);模糊邏輯系統(tǒng)(T01-J16B);學(xué)習(xí),概念學(xué)習(xí)算法(T01-J16C2)。
此外,通過分析其他核心專利的手工代碼,識別出核心技術(shù)領(lǐng)域:1)專家系統(tǒng)(T01-J16A)、知識處理(T01-J16)、教育輔助工具(T01-J05B3、T01-N01B3);2)選擇,特殊字符檢測(T01-E01B);3)搜索和檢索(T01-J05B3)、信息存儲(T01-J05B2);4)多媒體數(shù)據(jù)傳輸(T01-N01D1);5)數(shù)據(jù)加密和解密(T01-D01)、測試網(wǎng)絡(luò)漏洞(T01-N02B3)、偽代碼(T01-S01C)等。
4 機(jī)器學(xué)習(xí)技術(shù)主要競爭國家對比分析
4.1 基于專利的量化對比分析
4.1.1 主要競爭國家專利申請總量對比分析
專利優(yōu)先權(quán)國家是指專利申請人就其發(fā)明創(chuàng)造第一次在某國提出的專利申請,反映了技術(shù)輸出地信息,反映該國家的技術(shù)創(chuàng)新能力和活躍程度[15]。本文選取機(jī)器學(xué)習(xí)專利申請數(shù)量前5名的國家作為主要競爭國家。根據(jù)最早優(yōu)先權(quán)國家/地區(qū)統(tǒng)計(圖4),在機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域中,美國、中國、日本是主力軍,其次為韓國和加拿大。這5個主要競爭國家在機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域中申請的專利數(shù)占據(jù)了總專利數(shù)的86%,其中,美國是最大的技術(shù)輸出國,美國優(yōu)先權(quán)專利數(shù)量4 894個專利族,達(dá)到全球申請總量的53%,處于絕對領(lǐng)軍地位。眾所周知,美國一直走在先進(jìn)科技的前列,非常重視科學(xué)技術(shù)的發(fā)展,其專利申請數(shù)量全球第一也恰恰說明了美國是機(jī)器學(xué)習(xí)技術(shù)產(chǎn)出大國。盡管我國的專利申請數(shù)量排在全球第二位,但專利數(shù)量不及美國的1/2,說明我國研發(fā)活躍度及研發(fā)實(shí)力有待進(jìn)一步提升。此外,韓國和加拿大的專利申請量與美國、我國的差距較大,兩國的專利申請量相加還不及全球申請總量的10%。
4.1.2 主要競爭國家專利申請?jiān)鲩L分析
主要競爭國家機(jī)器學(xué)習(xí)技術(shù)專利申請年度變化如圖5所示。從發(fā)展趨勢來看,五國的專利申請都經(jīng)歷了較長的醞釀期,快速的增長期。其中,美國的專利申請量從2000年開始就有所發(fā)展,2011年之后快速增長,目前發(fā)展勢頭依然很好,遙遙領(lǐng)先于其他國家;我國在機(jī)器學(xué)習(xí)領(lǐng)域的專利申請數(shù)量盡管名列第二,但從2011年開始,對機(jī)器學(xué)習(xí)技術(shù)才有了一定的重視和發(fā)展,比美國晚了10個年頭,2014年之后專利申請數(shù)量開始急劇增長,尤其是最近兩年,幾乎呈現(xiàn)直線上升的趨勢,可見,機(jī)器學(xué)習(xí)的技術(shù)研發(fā)在我國達(dá)到了空前的熱度;日本雖然專利總量不及我國,但起步早于我國,目前的發(fā)展勢頭也不容小覷;韓國和加拿大在該領(lǐng)域起步較晚,發(fā)展速度也跟不上,從圖中可以看出韓國近幾年在該領(lǐng)域的發(fā)展步伐也在加快。
4.2 基于市場與技術(shù)領(lǐng)域的對比分析
4.2.1 主要競爭國家專利申請市場布局
本文選取技術(shù)受理國家或組織作為橫軸,以主要競爭國家作為縱軸,繪制出如圖6所示的主要競爭國家專利市場布局氣泡圖??梢钥闯觯?、中、日、韓4個主要競爭國家在本國申請的專利是最多的,唯獨(dú)加拿大在美國申請的專利數(shù)量大于在本國申請的數(shù)量,說明了目前加拿大機(jī)器學(xué)習(xí)技術(shù)創(chuàng)新能力和知識產(chǎn)權(quán)保護(hù)意識整體比較薄弱。在美國受理的專利中,有93%是本國人申請的。我國的機(jī)器學(xué)習(xí)技術(shù)99%的專利都是本國人申請的,目前我國該技術(shù)領(lǐng)域創(chuàng)新能力和知識產(chǎn)權(quán)保護(hù)意識整體不算太弱;另一方面也說明了國外巨頭在我國的專利布局尚未完成,我國企業(yè)在國內(nèi)市場仍舊有大量機(jī)會。我國的海外技術(shù)市場主要有美國、世界知識產(chǎn)權(quán)組織、日本和歐洲專利局,專利國際化程度不夠高,沒有進(jìn)行大規(guī)模的海外專利布局,市場還有待進(jìn)一步擴(kuò)大。整體來看,美國不僅是全球重視的市場大國,也是技術(shù)產(chǎn)出大國,在各個國家基本都有專利布局,我國與其仍有很大差距。
4.2.2 主要競爭國家專利申請技術(shù)領(lǐng)域?qū)Ρ确治?/p>
通過分析專利的IPC分類號,可以清楚主要競爭國家的技術(shù)關(guān)注焦點(diǎn),識別技術(shù)市場,搶占技術(shù)制高點(diǎn)。為了了解5個主要競爭國家的技術(shù)關(guān)注焦點(diǎn)情況,全球及美、中、日、韓和加拿大專利申請數(shù)量前十IPC小類示于圖7中。
從總體來看,全球關(guān)注的機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域依次是G06F(電數(shù)字?jǐn)?shù)據(jù)處理)、G06N(基于特定計算模型的計算機(jī)系統(tǒng))、G06K(數(shù)據(jù)識別)、G06Q(用于行政、金融監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng))、H04L(數(shù)字信息的傳輸)、G06T(一般的圖像數(shù)據(jù)處理)、A61B(診斷;外科;鑒定)、G05B(一般的控制或調(diào)節(jié)系統(tǒng))、H04N(圖像通信)、G01N(借助于測定材料的化學(xué)或物理性質(zhì)來測試或分析材料)。
美國最關(guān)注的技術(shù)領(lǐng)域依次是:G06F、G06N、G06Q、H04L、G06K、G06T、A61B、H04W(無線通信網(wǎng)絡(luò))、H04N、G01N;我國最關(guān)注的技術(shù)領(lǐng)域依次是:G06F、G06K、G06N、G06Q、H04L、G06T、G09B(教育或演示用具)、G05B、H04N、A61B;日本最關(guān)注的技術(shù)領(lǐng)域依次是:G06F、G06N、G06T、G05B、G06Q、G06K、A61B、B25J
(機(jī)械手;裝有操縱裝置的容器)、B23Q(機(jī)床的零部件)、G10L;韓國最關(guān)注的技術(shù)領(lǐng)域是:G06F、G06N、G06Q、G06K、G06T、A61B、H04L、H04N、G10L、G01N;加拿大最關(guān)注的技術(shù)領(lǐng)域是:G06F、G06N、G06Q、G01N、A61B、C12Q(包含酶或微生物的測定或檢驗(yàn)方法)、H04L、G06K、G06T、G05B。有括號說明的技術(shù)領(lǐng)域是各國獨(dú)有的關(guān)注焦點(diǎn)。除G05B日本專利數(shù)量最多,其余9個領(lǐng)域均是美國排名第一。
總體排名前5的技術(shù)領(lǐng)域的專利申請數(shù)量均過千件,以下分析這5個領(lǐng)域的國家競爭態(tài)勢。G06F領(lǐng)域?qū)@麛?shù)量全球最多,五國都把其作為關(guān)注焦點(diǎn),美國和我國的研發(fā)尤其活躍,美國明顯領(lǐng)先于我國,兩國的專利數(shù)量遠(yuǎn)遠(yuǎn)高于日、韓和加拿大;全球第二受關(guān)注的技術(shù)領(lǐng)域是G06N,美國的研發(fā)實(shí)力具有明顯的優(yōu)勢,美、韓、日和加拿大都將其作為第二關(guān)注焦點(diǎn),唯獨(dú)我國是比較薄弱的;對于G06K技術(shù)領(lǐng)域,美國實(shí)力最強(qiáng),但我國與美國差別不大,說明我國在此領(lǐng)域技術(shù)基礎(chǔ)好,比較有優(yōu)勢,兩國的專利數(shù)量領(lǐng)先于其他國家;在G06Q和H04L領(lǐng)域中,美國和我國的專利數(shù)量明顯多于韓國和加拿大,但美國實(shí)力更勝一籌。
4.3 基于研發(fā)主體的對比分析
專利H指數(shù)可判斷專利權(quán)人的競爭實(shí)力[16]。本文采用H指數(shù)判斷專利權(quán)人的研發(fā)實(shí)力,計算方法為專利權(quán)人的至多H項(xiàng)專利分別被引用了至少H次。機(jī)器學(xué)習(xí)領(lǐng)域?qū)@暾埩壳笆畬@麢?quán)人的H指數(shù)如圖8所示。
整體來看,全球機(jī)器學(xué)習(xí)領(lǐng)域?qū)@暾埩颗琶笆难邪l(fā)主體中,有8家企業(yè)屬于美國,日本、德國企業(yè)各占1個,我國的研發(fā)主體不在其中,說明美國的研發(fā)主體在機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域的競爭實(shí)力遠(yuǎn)高于其他國家。有8個研發(fā)主體屬于互聯(lián)網(wǎng)企業(yè),分別是國際商業(yè)機(jī)器公司、微軟公司、谷歌公司、Facebook公司、英特爾公司、思科公司、亞馬遜公司和雅虎公司,可見互聯(lián)網(wǎng)企業(yè)是機(jī)器學(xué)習(xí)技術(shù)的重要推動力量;另外兩個主要研發(fā)主體中,發(fā)那科株式會社屬于數(shù)控系統(tǒng)類企業(yè),西門子公司屬于電氣工程類企業(yè)。
根據(jù)專利申請量和H指數(shù)兩個指標(biāo)對10個研發(fā)主體進(jìn)行分類,如圖8,其中,國際商業(yè)機(jī)器公司和微軟公司在機(jī)器學(xué)習(xí)領(lǐng)域不管是專利申請數(shù)量還是H指數(shù)都遙遙領(lǐng)先于其他研發(fā)主體,屬于技術(shù)領(lǐng)導(dǎo)者和技術(shù)活躍者;西門子公司、雅虎公司、谷歌公司專利申請數(shù)量及其H指數(shù)相對來說不低,競爭實(shí)力較強(qiáng),屬于技術(shù)突破者;發(fā)那科株式會社、思科公司、英特爾公司、Facebook公司和亞馬遜公司雖躋身前十,但H指數(shù)在10個機(jī)構(gòu)里面較
低,處于技術(shù)劣勢地位,屬于技術(shù)潛在競爭者。另外,全球?qū)@暾埩颗琶?0的研發(fā)主體中,我國企業(yè)阿里巴巴集團(tuán)、珠海格力電器、國家電網(wǎng)、百度,分別位列第15名、第16名、第18名、第20名,5家機(jī)構(gòu)H指數(shù)都較低,都在3以下,其中珠海格力電器公司雖然專利數(shù)量排名前20,但其H指數(shù)為0,機(jī)器學(xué)習(xí)研發(fā)實(shí)力有待提高,應(yīng)加大機(jī)器學(xué)習(xí)研發(fā)投入,捉住核心技術(shù)研發(fā),加強(qiáng)研發(fā)創(chuàng)新力度,進(jìn)入全球前十,提高我國企業(yè)的國際競爭力和影響力。
4.4 基于專利活動與專利質(zhì)量的對比分析
4.4.1 主要競爭國家專利活動對比分析
專利活動指標(biāo)使用傳統(tǒng)的衡量指標(biāo),包括RSI指數(shù)(相對專業(yè)化指數(shù),反映某個國家對某技術(shù)領(lǐng)域的重視程度和投入力度[17])、專利占有率和專利成長率。各個專利活動指標(biāo)列于表2中。
4.4.2 主要競爭國家專利質(zhì)量對比分析
針對以往研究的不足,對專利質(zhì)量指標(biāo)進(jìn)行優(yōu)化,增加專利權(quán)人合作指標(biāo),用此指標(biāo)來衡量各主要競爭國家相關(guān)研發(fā)機(jī)構(gòu)的活躍程度,活躍程度一定程度上影響著國家競爭實(shí)力,計算方法是各國家在機(jī)器學(xué)習(xí)領(lǐng)域申請專利中有1個以上的專利權(quán)人的專利數(shù)量。專利質(zhì)量指標(biāo)包括技術(shù)范圍(反映某個國家在某個領(lǐng)域的技術(shù)覆蓋范圍[18],技術(shù)范圍越大,包含的技術(shù)應(yīng)用領(lǐng)域越多,技術(shù)范圍越小,包含的技術(shù)應(yīng)用領(lǐng)域越少)、國際范圍(指在哪些國家申請專利,專利經(jīng)濟(jì)性和技術(shù)性重要性越高,就會在越多的國家申請專利,反之,就會在較少的國家申請專利)、核心專利數(shù)量和專利權(quán)人合作。各個專利質(zhì)量指標(biāo)列于表4中。對計算后的指標(biāo)進(jìn)行標(biāo)準(zhǔn)化(見表5),也同樣進(jìn)行了可視化(見圖10)。
于5個國家最大值;專利質(zhì)量排名第二位的是加拿大,其“國際范圍”指標(biāo)值遠(yuǎn)高于其他國家,核心專利數(shù)僅次于美國,但與美國差距較大;排名第三位的是我國,其“國家范圍”指標(biāo)值是5個國家中最少的,核心專利數(shù)也缺乏競爭力,“技術(shù)范圍”和“合作”指標(biāo)值僅次于美國;排名第四位的是日本,其核心專利數(shù)5個國家最少,其他3項(xiàng)指標(biāo)處于中間水平;排名第五位的是韓國,其“技術(shù)范圍”和“合作”指標(biāo)處于5個國家最小值,其“國際范圍”指標(biāo)值僅次于加拿大,核心專利數(shù)和我國相平。通過上述對比可以發(fā)現(xiàn),我國專利質(zhì)量水平在5個國家中排第三,其主要原因是核心專利數(shù)量少和國際范圍小。
4.5 基于綜合競爭力的對比分析
本文從專利質(zhì)量和專利活動兩個維度分析美、中、日、韓和加拿大5個主要競爭國家的技術(shù)綜合競爭力?;?.4部分計算出的數(shù)值做出主要競爭國家綜合競爭力圖(見圖11)。
從圖11可以看出,美國屬于機(jī)器學(xué)習(xí)領(lǐng)域的技術(shù)領(lǐng)導(dǎo)者,無論是專利活動還是專利質(zhì)量,都處于絕對的領(lǐng)先地位;其次,我國屬于技術(shù)活躍者,
機(jī)器學(xué)習(xí)領(lǐng)域技術(shù)實(shí)力較弱,缺乏專利對外輸出能力,因此我國應(yīng)注重向美國等國家學(xué)習(xí)先進(jìn)技術(shù),加強(qiáng)對強(qiáng)國技術(shù)領(lǐng)域的監(jiān)測,努力做到量與質(zhì)兼顧,才能實(shí)現(xiàn)技術(shù)突破;日本和韓國兩個國家屬于技術(shù)落后者,兩國相比之下不太重視機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,同時專利質(zhì)量也不高;而加拿大處于技術(shù)活躍者和潛在競爭者的邊緣,正朝著技術(shù)活躍者方向邁進(jìn),實(shí)力不容小覷。
5 結(jié)論與建議
1)通過技術(shù)發(fā)展階段分析可知,機(jī)器學(xué)習(xí)技術(shù)處于快速成長期,還有非常廣闊的發(fā)展空間。我國目前也處于快速發(fā)展期,國家或企業(yè)應(yīng)該加強(qiáng)該領(lǐng)域的研發(fā)資助和應(yīng)用研究,努力把握研究前沿,實(shí)現(xiàn)并跑到領(lǐng)跑的轉(zhuǎn)變。
2)通過技術(shù)熱點(diǎn)與核心領(lǐng)域分析可知,機(jī)器學(xué)習(xí)技術(shù)熱點(diǎn)領(lǐng)域有:醫(yī)學(xué)診斷、自動駕駛儀、教育輔助、無線通訊網(wǎng)絡(luò)、特定計算模型的計算機(jī)系統(tǒng)、定位系統(tǒng)、語音識別、計算機(jī)視覺等。機(jī)器學(xué)習(xí)核心技術(shù)領(lǐng)域有:排序、選擇、學(xué)習(xí)、知識處理、搜索和檢索、模糊邏輯系統(tǒng)、專家系統(tǒng)、安全等。中國應(yīng)直擊以上熱點(diǎn)和核心技術(shù)領(lǐng)域的研發(fā),加大研發(fā)投入,降低技術(shù)投資風(fēng)險,提高國際競爭力。
3)在申請海外專利方面,美國和日本海外市場布局全面,我國的海外申請專利主要集中在美國和世界知識產(chǎn)權(quán)組織,這不利于我國在全球機(jī)器學(xué)習(xí)中技術(shù)的擴(kuò)散和占領(lǐng)市場,因此我國應(yīng)該結(jié)合自身技術(shù)特點(diǎn)以及海外市場特點(diǎn),擴(kuò)大專利申請范圍,加大對歐洲專利局、德國、日本等國家的布局。
4)從機(jī)器學(xué)習(xí)專利申請總量來看,美國專利申請量排第一,中國排第二,日本排第三;從機(jī)器學(xué)習(xí)技術(shù)結(jié)構(gòu)上來看,美國的機(jī)器學(xué)習(xí)技術(shù)結(jié)構(gòu)布局與全球重點(diǎn)關(guān)注的機(jī)器學(xué)習(xí)技術(shù)結(jié)構(gòu)基本吻合,但是我國在技術(shù)結(jié)構(gòu)布局上存在短板,突出反映在GO6N技術(shù)領(lǐng)域(基于特定計算模型的計算機(jī)系統(tǒng))具有較大差距。因此,為避免“卡脖子”,企業(yè)應(yīng)該加大該領(lǐng)域的研發(fā)投入。
5)在專利活動方面,美國的專利活動最強(qiáng),日本最弱,我國屬于技術(shù)活躍者,但是RSI指數(shù)比較差,說明我國對機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域的重視程度和投入力度不足,應(yīng)該引起重視,各個相關(guān)研發(fā)機(jī)構(gòu),尤其是互聯(lián)網(wǎng)企業(yè)應(yīng)該想方設(shè)法把機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到自己的研發(fā)過程中,實(shí)現(xiàn)技術(shù)突破;國家也應(yīng)該健全相關(guān)法律法規(guī)制度,給予相關(guān)企業(yè)一定的支持和資助。
6)在專利質(zhì)量方面,美國的專利質(zhì)量最高,韓國的專利質(zhì)量最弱,中國的專利質(zhì)量水平有待提高,主要提升路徑是提升核心專利數(shù)量和擴(kuò)大國際申請范圍,應(yīng)積極開拓和布局海外市場,提高技術(shù)影響力。
參考文獻(xiàn)
[1]新華社.抓住新一代人工智能發(fā)展的重大機(jī)遇[EB/OL].http://www.gov.cn/xinwen/2018-11/02/content_5336686.htm,2018-11-20.
[2]閆志明,唐夏夏,秦旋,等.教育人工智能(EAI)的內(nèi)涵、關(guān)鍵技術(shù)與應(yīng)用趨勢——美國《為人工智能的未來做好準(zhǔn)備》和《國家人工智能研發(fā)戰(zhàn)略規(guī)劃》報告解析[J].遠(yuǎn)程教育雜志,2017,35(1):26-35.
[3]陳康,向勇,喻超.大數(shù)據(jù)時代機(jī)器學(xué)習(xí)的新趨勢[J].電信科學(xué),2012,28(12):88-95.
[4]科睿唯安印度工商業(yè)聯(lián)合會.人工智能,下一代數(shù)字轉(zhuǎn)型的創(chuàng)新力與顛覆力[J].科學(xué)觀察,2017,(5):45-55.
[5]中國專利保護(hù)協(xié)會.人工智能技術(shù)專利深度分析報告[EB/OL].http://www.ppac.org.cn/news/detail-38.html,2018-11-20.
[6]黃魯成,吳菲菲,李欣,等.新興技術(shù)未來分析理論方法與產(chǎn)業(yè)創(chuàng)新研究[M].北京:科學(xué)出版社,2018.
[7]車堯,李雪夢,璐羽.社會網(wǎng)絡(luò)視角下戰(zhàn)略性新興產(chǎn)業(yè)的專利情報研究[J].情報科學(xué),2015,(7):138-144.
[8]劉軍.整體網(wǎng)分析講義:UCINET軟件實(shí)用指南[M].上海:格致出版社,2009.
[9]杜宏巍.基于德溫特數(shù)據(jù)庫的關(guān)鍵共性技術(shù)分析[J].中國市場,2016,(31):273-273.
[10]韓志華.核心專利判別的綜合指標(biāo)體系研究[J].中國外資,2010,(4):193-196.
[11]Narin F.Patent Bibliometrics[J].Scientometrics,1994,30(1):147-155.
[12]Schettino F,Sterlacchini A,Venturini F.Inventive Productivity and Patent Quality:Evidence from Italian Inventors[J].Journal of Policy Modeling,2013,35(6):1043-1056.
[13]劉云,劉璐,閆哲,等.基于專利計量的全球碳納米管領(lǐng)域技術(shù)創(chuàng)新特征分析[J].科研管理,2016,(s1):337-345.
[14]楊曦,余翔,劉鑫.基于專利情報的石墨烯產(chǎn)業(yè)技術(shù)競爭態(tài)勢研究[J].情報雜志,2017,(12):75-81.
[15]李婧,古翔,蔡靜,等.燃?xì)廨啓C(jī)技術(shù)全球?qū)@麘B(tài)勢分析[J].世界科技研究與發(fā)展,2017,(6):483-490.
[16]官建成,高霞,徐念龍.運(yùn)用h-指數(shù)評價專利質(zhì)量與國際比較[J].科學(xué)學(xué)研究,2008,26(5):932-937.
[17]黃魯成,常蘭蘭,苗紅,等.基于ESTP-Chain四維分析法的老年福祉技術(shù)競爭態(tài)勢分析[J].科技管理研究,2016,36(12):213-219.
[18]Lerner J.The Importance of Patent Scope:An Empirical Analysis[J].Veterinary Record,1994,25(2):319-333.
[19]孫濤濤,唐小利,李越.核心專利的識別方法及其實(shí)證研究[J].圖書情報工作,2012,56(4):80-84.
(責(zé)任編輯:陳 媛)