戚湧 孫嘉燁
摘要摘?要:全球汽車(chē)行業(yè)正在經(jīng)歷巨大變革,電動(dòng)化、智能化和網(wǎng)聯(lián)化將成為未來(lái)汽車(chē)技術(shù)發(fā)展的潮流。智能網(wǎng)聯(lián)汽車(chē)是國(guó)家重點(diǎn)發(fā)展的戰(zhàn)略性新興產(chǎn)業(yè),將汽車(chē)、電子和信息技術(shù)深度融合在一起,對(duì)于推進(jìn)我國(guó)制造強(qiáng)國(guó)和網(wǎng)絡(luò)強(qiáng)國(guó)建設(shè)具有重大意義。如何用科學(xué)方法來(lái)識(shí)別智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域技術(shù)主題,指導(dǎo)智能網(wǎng)聯(lián)汽車(chē)產(chǎn)業(yè)技術(shù)選擇,給出相應(yīng)的政策建議,具有重要的學(xué)術(shù)價(jià)值與應(yīng)用前景。首先總結(jié)歸納了國(guó)內(nèi)外的相關(guān)研究,闡述了技術(shù)主題識(shí)別、技術(shù)演化的理論基礎(chǔ),并構(gòu)建相應(yīng)的研究模型與框架;然后對(duì)智能網(wǎng)聯(lián)汽車(chē)專(zhuān)利數(shù)據(jù)進(jìn)行檢索分析,再利用LDA模型完成相關(guān)專(zhuān)利文獻(xiàn)的主題識(shí)別,并在此基礎(chǔ)上構(gòu)建HMM模型分析相應(yīng)技術(shù)主題的演化關(guān)系;最后得出該領(lǐng)域技術(shù)主題的演化路徑及規(guī)律。針對(duì)智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域共識(shí)別出20個(gè)技術(shù)主題,并以此構(gòu)建技術(shù)主題演化關(guān)系有向網(wǎng)絡(luò)圖,可為相關(guān)企業(yè)及研發(fā)機(jī)構(gòu)提供決策參考。
關(guān)鍵詞關(guān)鍵詞:技術(shù)主題識(shí)別;技術(shù)演化;智能網(wǎng)聯(lián)汽車(chē);專(zhuān)利文獻(xiàn)
中圖分類(lèi)號(hào)中圖分類(lèi)號(hào):U495;G255.53
文獻(xiàn)標(biāo)識(shí)碼:A
DOIdoi:10.3969/j.issn.1672-2272.202401053
英文標(biāo)題Research on the Theme Identification and Evolution of Intelligent Connected Vehicle Technology from the Perspective of Patents
Qi Yong, Sun Jiaye
(Nanjing University of Science and Technology of Intellectual Property, Nanjing 210094,China)
英文摘要Abstract:As the era progresses, the global automotive industry is experiencing significant transformations, with electrification, intelligence, and connectivity emerging as future trends in automotive technology. Intelligent connected vehicles, as a key strategic emerging industry, amalgamate automotive, electronic, and information technologies, playing a crucial role in promoting Chinas ambitions to become a powerhouse in manufacturing and networking. This area also represents a significant aspect of technological research. Thus, applying scientific methods to identify technological themes in the intelligent connected vehicle sector, guiding the industrys technological decisions, and providing relevant policy recommendations hold substantial academic and practical value. This paper begins by summarizing relevant domestic and international research, elucidating the theoretical underpinnings of technology theme identification and evolution, and establishing the corresponding research models and frameworks. It then analyzes intelligent connected vehicle patent data, employs the LDA model for theme identification in related patent literature, and constructs an HMM model to examine the evolutionary relationships of these technology themes. The study ultimately delineates the evolutionary trajectory and patterns of technological themes in this field. In the realm of intelligent connected vehicles, 20 technical themes were identified, and a directed network graph depicting the evolution of these themes was created. This provides strategic guidance and support for relevant enterprises and research and development institutions.
英文關(guān)鍵詞Key Words:Technical Subject Identification; Technological Evolution; Intelligent Connected Vehicles; Patent Documents
隨著時(shí)代的發(fā)展,全球汽車(chē)行業(yè)正在經(jīng)歷巨大變革,電動(dòng)化、智能化和網(wǎng)聯(lián)化正成為未來(lái)汽車(chē)技術(shù)發(fā)展的潮流。智能網(wǎng)聯(lián)汽車(chē)結(jié)合了傳統(tǒng)汽車(chē)和網(wǎng)聯(lián)汽車(chē)技術(shù)的優(yōu)勢(shì),是一種跨越汽車(chē)、通信和安全技術(shù)領(lǐng)域的創(chuàng)新型產(chǎn)品,具有廣泛的應(yīng)用前景。作為汽車(chē)、電子、信息、交通等領(lǐng)域深度融合的戰(zhàn)略新興產(chǎn)業(yè),智能網(wǎng)聯(lián)汽車(chē)將在未來(lái)的技術(shù)革命和工業(yè)轉(zhuǎn)型中扮演關(guān)鍵角色,對(duì)于推進(jìn)我國(guó)制造強(qiáng)國(guó)和網(wǎng)絡(luò)強(qiáng)國(guó)建設(shè)具有重大意義。準(zhǔn)確把握相關(guān)技術(shù)領(lǐng)域中的核心技術(shù)或技術(shù)體系,能夠有效獲得競(jìng)爭(zhēng)優(yōu)勢(shì)與市場(chǎng)價(jià)值,而這些通常蘊(yùn)藏于專(zhuān)利、研發(fā)成果、專(zhuān)有技術(shù)之中[1]。如何對(duì)智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域內(nèi)眾多類(lèi)型的技術(shù)成果進(jìn)行技術(shù)的有效識(shí)別和分析,已經(jīng)成為當(dāng)下研究的重點(diǎn)。
專(zhuān)利文獻(xiàn)作為技術(shù)創(chuàng)新過(guò)程中一種獨(dú)特的產(chǎn)物,承載著專(zhuān)業(yè)技術(shù)領(lǐng)域的技術(shù)要點(diǎn)與技術(shù)內(nèi)容信息,其內(nèi)容詳實(shí)準(zhǔn)確且具有一定的長(zhǎng)期性、廣泛性和趨前性[2],可以提供有價(jià)值的信息并有助于了解技術(shù)創(chuàng)新中的核心內(nèi)容,能夠有效反映應(yīng)用研究與應(yīng)用創(chuàng)新。專(zhuān)利數(shù)據(jù)包含結(jié)構(gòu)化和非結(jié)構(gòu)化兩個(gè)部分,并且文獻(xiàn)數(shù)量龐大,需要選擇科學(xué)合理的研究方法和分析框架。技術(shù)主題作為技術(shù)文獻(xiàn)的主旨和核心,具有一定的代表性,其演變也遵循著一定的內(nèi)在規(guī)律[3]。通過(guò)對(duì)專(zhuān)利文獻(xiàn)信息的分析與挖掘,識(shí)別智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域的技術(shù)主題,在此基礎(chǔ)上分析這些技術(shù)主題的發(fā)展?fàn)顟B(tài)和演變趨勢(shì),進(jìn)而指導(dǎo)智能網(wǎng)聯(lián)汽車(chē)相關(guān)產(chǎn)業(yè)的技術(shù)選擇,實(shí)現(xiàn)智能網(wǎng)聯(lián)汽車(chē)產(chǎn)業(yè)層面技術(shù)預(yù)見(jiàn),具有重要的研究意義。
1?相關(guān)研究
1.1?技術(shù)識(shí)別
目前,國(guó)內(nèi)外很多學(xué)者針對(duì)不同技術(shù)領(lǐng)域開(kāi)展了各種技術(shù)類(lèi)型的識(shí)別研究,比較常見(jiàn)的是通過(guò)構(gòu)建相應(yīng)的指標(biāo)體系并基于專(zhuān)家經(jīng)驗(yàn)來(lái)完成技術(shù)的識(shí)別。
李政等[4]通過(guò)使用尖點(diǎn)型突變方程,建立能夠預(yù)測(cè)關(guān)鍵技術(shù)的模型,從而實(shí)現(xiàn)對(duì)關(guān)鍵技術(shù)的識(shí)別和預(yù)見(jiàn)。Porter等[5]通過(guò)建立一個(gè)指標(biāo)體系,從燃料電池等領(lǐng)域的專(zhuān)利文摘集合中篩選出關(guān)鍵技術(shù)主題。Lee等[6]建立多指標(biāo)體系,納入了正向引用、先驗(yàn)信息和專(zhuān)利家族成員數(shù)等指標(biāo),來(lái)確定關(guān)鍵技術(shù)。楊大飛等[7]通過(guò)構(gòu)建核心技術(shù):“三力”模型,建立核心技術(shù)識(shí)別指標(biāo)體系和識(shí)別模型,并基于OLED平板顯示產(chǎn)業(yè)進(jìn)行實(shí)證研究。此類(lèi)方法受到一定程度上主觀(guān)因素的影響,而且比較依賴(lài)于相關(guān)方面的專(zhuān)家資源。為了降低此類(lèi)影響,一些學(xué)者選擇基于圖與網(wǎng)絡(luò)分析的方法,從技術(shù)關(guān)聯(lián)的視角完成技術(shù)識(shí)別,比如Peng等[8]通過(guò)使用英文專(zhuān)利數(shù)據(jù)庫(kù),獲取GPS技術(shù)方面的專(zhuān)利信息,并將這些信息與社會(huì)網(wǎng)絡(luò)相結(jié)合,構(gòu)建引文網(wǎng)絡(luò)以識(shí)別共性技術(shù)。李瑞茜和陳向東[9]通過(guò)建立非對(duì)稱(chēng)的技術(shù)知識(shí)傳遞網(wǎng)絡(luò)研究有效發(fā)明專(zhuān)利之間的相似性,并通過(guò)分析這些相似性來(lái)確定技術(shù)之間的相互作用,從而識(shí)別出核心技術(shù)。紀(jì)亞琨等[10]基于專(zhuān)利網(wǎng)絡(luò)視角,構(gòu)建“領(lǐng)域-發(fā)明-主題”多層分析結(jié)構(gòu)模型以識(shí)別潛在顛覆性技術(shù),并以自動(dòng)駕駛領(lǐng)域?yàn)槔?yàn)證了模型的可行性和有效性。也有一些學(xué)者是在以上研究的基礎(chǔ)上,通過(guò)文本分析進(jìn)一步獲取相關(guān)技術(shù),比如張維沖等[11]以區(qū)塊鏈為例,面向多種不同科技文獻(xiàn)提出基于摘要的主題解析方法,獲取主題詞并進(jìn)行數(shù)據(jù)融合與主題關(guān)聯(lián)分析。馬永紅等[12]以專(zhuān)利文獻(xiàn)為基礎(chǔ),結(jié)合LDA算法完成主題聚類(lèi),通過(guò)技術(shù)的共現(xiàn)率來(lái)分析技術(shù)主題的共性,并利用社會(huì)網(wǎng)絡(luò)分析方法來(lái)確定關(guān)鍵技術(shù)。呂鯤等[13]通過(guò)區(qū)塊鏈金融的專(zhuān)利數(shù)據(jù),利用組合分詞方法和LDA模型識(shí)別關(guān)鍵技術(shù)主題,并根據(jù)產(chǎn)業(yè)關(guān)鍵技術(shù)特征衡量出區(qū)塊鏈金融領(lǐng)域內(nèi)關(guān)鍵技術(shù)。從上述相關(guān)研究中可以看出,多數(shù)學(xué)者基于專(zhuān)利數(shù)據(jù)展開(kāi)分析,將多種理論和研究方法相結(jié)合,并通過(guò)構(gòu)建相應(yīng)的模型以實(shí)現(xiàn)不同研究領(lǐng)域的技術(shù)識(shí)別。近些年為了避免相關(guān)領(lǐng)域?qū)<屹Y源獲取不便的情況,以客觀(guān)定量分析的方法成為主流,非常具有參考價(jià)值。因此,本研究擬選取目前有關(guān)技術(shù)識(shí)別中較為常用的文本分析的相關(guān)方法,在此基礎(chǔ)上加以改進(jìn),選取智能網(wǎng)聯(lián)汽這一領(lǐng)域?qū)崿F(xiàn)技術(shù)主題的識(shí)別。
1.2?技術(shù)演化
關(guān)于技術(shù)演化,國(guó)內(nèi)外學(xué)者從多個(gè)視角利用不同方法進(jìn)行了分析論證。大多數(shù)學(xué)者從專(zhuān)利視角出發(fā),通過(guò)構(gòu)建相應(yīng)的引文網(wǎng)絡(luò)展開(kāi)分析,如Oh等[14]基于專(zhuān)利網(wǎng)絡(luò)的動(dòng)態(tài)特征,構(gòu)建了引用專(zhuān)利關(guān)系網(wǎng)絡(luò),利用 USPTO專(zhuān)利數(shù)據(jù)對(duì)其特征進(jìn)行研究,可知穩(wěn)健技術(shù)趨勢(shì)計(jì)算的結(jié)論與技術(shù)發(fā)展的歷史趨勢(shì)基本一致。Yoon & Magee[15]利用專(zhuān)利文獻(xiàn)及引用關(guān)系對(duì)技術(shù)發(fā)展趨勢(shì)進(jìn)行了分析,結(jié)果顯示,對(duì)技術(shù)發(fā)展的規(guī)劃與評(píng)價(jià)有一定的參考價(jià)值。楊武等[16]以專(zhuān)利家族為研究視角,闡述技術(shù)路徑動(dòng)態(tài)演化過(guò)程中的路徑依賴(lài)以及受到的干擾,并提出一種修正技術(shù)演化主路徑的新思路。一些學(xué)者在此基礎(chǔ)上結(jié)合語(yǔ)義文本挖掘進(jìn)行相關(guān)研究,比如李欣等[17]針對(duì)目前在新興技術(shù)演化軌跡研究中存在的不足,提出了基于SAO結(jié)構(gòu)語(yǔ)義挖掘的新興技術(shù)演化軌跡分析方法。周源等[18]利用科技文獻(xiàn)的文本與引用信息,構(gòu)建引用網(wǎng)絡(luò)來(lái)進(jìn)行拓?fù)渚垲?lèi),以主題聚類(lèi)結(jié)果為基礎(chǔ),結(jié)合各時(shí)段網(wǎng)絡(luò)社區(qū)之間的關(guān)聯(lián),對(duì)技術(shù)演化路徑進(jìn)行分析。李子彪和張莉[19]借助LDA模型全面挖掘鋼鐵材料領(lǐng)域技術(shù)主題,深入考慮主題在強(qiáng)度、內(nèi)容方面的動(dòng)態(tài)演化過(guò)程,并結(jié)合我國(guó)工業(yè)化發(fā)展階段繪制相關(guān)路線(xiàn)圖。儲(chǔ)節(jié)旺等[20]利用專(zhuān)利分析方法與主題模型繪制了顛覆性技術(shù)整體演化的路徑,以把握技術(shù)發(fā)展整體態(tài)勢(shì)。伊惠芳等[21]以融入主題生命周期和技術(shù)熵要素的分析方法來(lái)探析石墨烯技術(shù)演化路徑,從技術(shù)主題狀態(tài)、主題演化強(qiáng)度變化及主題內(nèi)容3個(gè)維度進(jìn)行全面分析。李乾瑞等[22]以顛覆性技術(shù)為研究對(duì)象,引入主題-時(shí)序分析和專(zhuān)利引文網(wǎng)絡(luò)分析,提出了基于突變-融合視角的顛覆性技術(shù)主題演化分析模型。以上專(zhuān)家學(xué)者在針對(duì)技術(shù)演化和發(fā)展趨勢(shì)的研究中,以圖與網(wǎng)絡(luò)分析為基礎(chǔ)的相關(guān)研究方法已經(jīng)成為主流,但針對(duì)技術(shù)主題演化的內(nèi)涵與本質(zhì)的相關(guān)探討較少。因此本文在考量前文技術(shù)識(shí)別的相關(guān)研究方法后,將主題模型與圖與網(wǎng)絡(luò)分析的方法相結(jié)合,對(duì)智能網(wǎng)聯(lián)汽車(chē)技術(shù)演化進(jìn)行分析,根據(jù)智能網(wǎng)聯(lián)汽車(chē)技術(shù)領(lǐng)域特點(diǎn)融入技術(shù)主題的演化內(nèi)涵,以此發(fā)掘技術(shù)演化路徑。
2?模型構(gòu)建
本文將隱含狄利克雷分布(LDA)和隱馬爾可夫過(guò)程(HMM)相結(jié)合,提出一種基于LDA-HMM的智能網(wǎng)聯(lián)汽車(chē)技術(shù)主題識(shí)別和演化研究分析模型。通過(guò) LDA主題模型對(duì)專(zhuān)利文獻(xiàn)數(shù)據(jù)進(jìn)行主題建模,訓(xùn)練模型生成技術(shù)主題,避免了人工標(biāo)注法引起的效率和精度問(wèn)題;在此基礎(chǔ)上結(jié)合技術(shù)主題演化內(nèi)涵與本質(zhì),引入包含雙重隨機(jī)過(guò)程的隱馬爾可夫模型,結(jié)合智能網(wǎng)聯(lián)汽車(chē)技術(shù)領(lǐng)域特點(diǎn),通過(guò)隱馬爾可夫模型進(jìn)行相關(guān)參數(shù)估計(jì),繪制相應(yīng)網(wǎng)絡(luò)有向圖。以此完成智能網(wǎng)聯(lián)汽車(chē)技術(shù)主題識(shí)別和演化研究,挖掘技術(shù)主題的演化路徑。
2.1?技術(shù)主題識(shí)別部分
LDA主題模型是一種詞袋模型,利用隱含狄利克雷分布描述文檔的生成,基于詞語(yǔ)共現(xiàn)概率最大化以完成詞語(yǔ)聚類(lèi),能夠有效提取文檔的隱含主題。在LDA主題模型中,設(shè)定專(zhuān)利文獻(xiàn)內(nèi)隱含的技術(shù)主題服從分布:
Dirθm|α=Г(∑Kk=1αk∏Kk=1Гαk∏Kk=1θαk-1mk(1)
其中,θmk表示專(zhuān)利文獻(xiàn)m在技術(shù)主題k中的分布。對(duì)每個(gè)技術(shù)主題k生成主題詞項(xiàng)分布Φk~Dir(β),對(duì)于每篇專(zhuān)利文獻(xiàn)m,所生成的主題詞分布θm~Dir(а)。對(duì)每篇專(zhuān)利文獻(xiàn)中第n個(gè)詞項(xiàng)生成主題項(xiàng)zmn~Multinomial(θm)和詞項(xiàng) wmn~Multinomial(ΦZmn),LDA模型可以表述為:
pw,z|α,β=pw|z,βpz|α=∏Kk=1Δnk+βΔβ∏Mm=1Δnm+αΔα
(2)
在“文檔—主題—詞匯”這一路徑下,LDA根據(jù)主題個(gè)數(shù)k,在k條路徑下進(jìn)行吉布斯采樣(Gibbs Sampling),具體概率如下:
pzi=k|zi,w∝nkm,i+αk∑Kk=1nlm,i+αk.ntk,i+βt∑Vt=1nlk,i+βt(3)
LDA模型的核心是要準(zhǔn)確合理地設(shè)置文本集合中的隱含的主題數(shù),因?yàn)?LDA算法本身無(wú)法自主生成最優(yōu)的主題數(shù)目,所以擬通過(guò)對(duì)構(gòu)造完成后的模型進(jìn)行評(píng)價(jià)來(lái)選擇最優(yōu)的主題數(shù)量。相關(guān)研究中,以困惑度作為判斷主題數(shù)的標(biāo)準(zhǔn)[23],困惑度一般被用來(lái)衡量概率模型中的預(yù)測(cè)值和樣本之間的匹配情況,困惑度越小,匹配精度就會(huì)越高,從而可以對(duì)各種模型進(jìn)行對(duì)比評(píng)價(jià)。在語(yǔ)言模型中,該方法主要涉及整句或文本的概率分布,越是專(zhuān)業(yè)化的語(yǔ)義庫(kù)所呈現(xiàn)出的困惑度就越小。而且,LDA模型算法不能根據(jù)詞語(yǔ)實(shí)際意義進(jìn)行聚類(lèi),其主要是根據(jù)詞語(yǔ)聚類(lèi)或共現(xiàn)關(guān)系來(lái)判斷詞語(yǔ)之間的親疏程度。所以,本文選擇在困惑度相關(guān)方法的基礎(chǔ)上,結(jié)合主題詞分布關(guān)系和經(jīng)驗(yàn)法則,對(duì)最優(yōu)主題數(shù)的選取進(jìn)行綜合判別分析,具體如下。
2.1.1?困惑度判別
在LDA主題模型中,通常采用困惑度這一指標(biāo)去選定合適主題數(shù)。在一般情況下,隨著技術(shù)主題數(shù)目的增多,其所對(duì)應(yīng)的困惑度降低,困惑度的數(shù)值可以看作是文本中每個(gè)詞語(yǔ)所分得的似然值,在詞語(yǔ)分布概率中:
pw=∫θ∏Nn=1∑kZn=1pwn|zn;βpzn|θpθ;αdθ(4)
式中,p(θ; α)是Dirichlet分布,p(zn | θ)是含有參數(shù)θ的多項(xiàng)式,p(wn | zn; β)是詞的概率分布多項(xiàng)式。該模型的k維Dirichlet參數(shù)α=(α1, … , αk)以及矩陣β。
將困惑度模型公式化:
perplexityDtest=exp-∑mlogpwm∑mwm|(5)
將其代入得:
Dtest=exp-∑mlog∫θ∏Nn=1∑kZn=1pwn|zn;βpzn|θpθ;αdθ∑mwm|(6)
以此可知任意主題數(shù)量所對(duì)應(yīng)的困惑度值。
2.1.2?主題詞分布關(guān)系判別
選取合適的技術(shù)主題數(shù)并可視化后,能夠發(fā)現(xiàn)主題詞間距分布情況均勻、間距疏松、相互覆蓋程度較小。主題詞間距參考了Sievert等[24]的研究,將主題詞距離函數(shù)設(shè)為:
r(w,k|λ)=λlogkw)+(1-λ)logkwpw(7)
此式中λ是主題k中主題詞w的權(quán)重值。
2.1.3?綜合判別
本文擬將困惑度判別與主題詞分布關(guān)系判別法則的優(yōu)點(diǎn)結(jié)合起來(lái),因此采用以下方法:選擇具有低困惑度的技術(shù)主題數(shù)目作為參數(shù),并利用這些參數(shù)分別計(jì)算主題詞間距,并將其可視化表示為主題詞間距圖,并結(jié)合以往經(jīng)驗(yàn)判斷中的“手肘法”來(lái)選取最優(yōu)主題數(shù)k。
2.2?技術(shù)主題演化部分
在本文中,將相關(guān)領(lǐng)域技術(shù)主題的演變歸因于兩個(gè)方面:一是先前研發(fā)所獲得的成果潛移默化地啟發(fā)并支持新創(chuàng)意、新技術(shù)的出現(xiàn);二是在第一種情形的基礎(chǔ)上,隨著客觀(guān)研發(fā)環(huán)境的改變,研發(fā)創(chuàng)新主體改變期望而影響到所產(chǎn)生的研發(fā)成果,專(zhuān)利文獻(xiàn)作為研究成果的載體而顯現(xiàn)。在此引入隱馬爾可夫模型,探究相關(guān)領(lǐng)域技術(shù)的發(fā)展歷程。將隱馬爾可夫模型中的隱藏狀態(tài)轉(zhuǎn)移關(guān)系、觀(guān)測(cè)樣本與各個(gè)狀態(tài)之間的概率映射關(guān)系(混淆關(guān)系),與領(lǐng)域技術(shù)主題識(shí)別結(jié)果、各個(gè)技術(shù)主題在專(zhuān)利文獻(xiàn)中的分布一一對(duì)應(yīng),通過(guò)確定隱藏的技術(shù)主題間的轉(zhuǎn)移關(guān)系矩陣,從而推斷出技術(shù)主題的演變方式。根據(jù)這一思路,技術(shù)主題的演變與隱馬爾可夫模型之間存在的對(duì)應(yīng)關(guān)系具體如圖1所示。
根據(jù)上述思想,通過(guò)構(gòu)建相應(yīng)的隱馬爾可夫模型λ=[π,A,B],表現(xiàn)技術(shù)主題與專(zhuān)利文獻(xiàn)的關(guān)聯(lián)模式,具體如下:
(1)隱馬爾可夫狀態(tài)序列集合。
S=S1,S2,…,SN-1,SN(8)
在本文中,N是LDA模型聚類(lèi)的主題數(shù),且這些狀態(tài)Si對(duì)應(yīng)了LDA主題聚類(lèi)結(jié)果中的每個(gè)技術(shù)主題,他們是隱藏且無(wú)法被觀(guān)測(cè)到的。
(2)隱馬爾可夫可觀(guān)測(cè)狀態(tài)序列集合。
O=O1,O2,…,OM-1,OM9
在本文中,M是專(zhuān)利文獻(xiàn)類(lèi)型數(shù),在此與技術(shù)主題數(shù)目相對(duì)應(yīng),指代了特定技術(shù)主題所對(duì)應(yīng)的專(zhuān)利文獻(xiàn)數(shù)占整個(gè)技術(shù)領(lǐng)域?qū)@麛?shù)的比重,它們可直接觀(guān)測(cè)。
(3)狀態(tài)轉(zhuǎn)移概率分布A。
在隱馬爾可夫模型中,各個(gè)狀態(tài)間轉(zhuǎn)換的概率,記為矩陣A=aij,其中aij表示在任意時(shí)刻t,若狀態(tài)為Si,則在下一時(shí)刻(t+1)的狀態(tài)為Sj的概率,在本文中矩陣A指代了研發(fā)過(guò)程中,研發(fā)主題從狀態(tài)Si轉(zhuǎn)移到Sj的概率,可以表示為:
aij=PSj|Si,1≤i,j≤N10
aij≥0∑Nj=1aij=111
(4)輸出觀(guān)測(cè)概率B。
根據(jù)當(dāng)前狀態(tài)獲得各個(gè)觀(guān)測(cè)值的概率,記為矩陣B=bij,其中bij表示在任意時(shí)刻t,若狀態(tài)為Si則觀(guān)測(cè)值為Oj被獲取的概率,在本文中指的是歷年技術(shù)主題相關(guān)專(zhuān)利文獻(xiàn)占比,可以表示為:
bij=POi|Sj,1≤i≤M,1≤j≤N12
(5)初始狀態(tài)概率π。
模型中隱藏狀態(tài)在初始時(shí)刻出現(xiàn)的概率,記為π=π1,π2,…πN-1,πN,πi表示出現(xiàn)狀態(tài)Si的概率,本文通過(guò)LDA主題識(shí)別后,將各個(gè)技術(shù)主題中主題詞共現(xiàn)數(shù)的歸一化矩陣作為πi的初始迭代值。
(6)Baum-Welch算法。
為探索研究領(lǐng)域的技術(shù)演化機(jī)理,即對(duì)應(yīng)了隱馬爾可夫模型的參數(shù)估計(jì)問(wèn)題,所以用Baum-Welch算法來(lái)實(shí)現(xiàn)這一過(guò)程,具體如下:
輸入:觀(guān)測(cè)數(shù)據(jù)Ob=Ob1,Ob2,…,Obt
輸出:隱馬爾可夫模型參數(shù)
①初始化。
對(duì)n=0,選取aij0,bij0,πi0,得到模型λ0=(A0,B0,π0)
②遞推,對(duì)n=1,2,……,
an+1ij=∑T-1t=1ξti,j∑T=1t=1γti13
bn+1ij=∑Tt=1γtjIObt=vj∑Tt=1γtj14
πn+1i=γ1i15
③終止,得到模型參數(shù)λ(n+1)=(A(n+1),B(n+1),π(n+1))
3?實(shí)證分析
3.1?專(zhuān)利數(shù)據(jù)獲取
本文選取“南京理工大學(xué)知識(shí)產(chǎn)權(quán)大數(shù)據(jù)平臺(tái)”對(duì)智能網(wǎng)聯(lián)汽車(chē)專(zhuān)利數(shù)據(jù)進(jìn)行檢索分析,為全面獲取智能網(wǎng)聯(lián)汽車(chē)相關(guān)專(zhuān)利數(shù)據(jù),制定了相應(yīng)的檢索策略。首先,根據(jù)智能網(wǎng)聯(lián)汽車(chē)的技術(shù)架構(gòu)進(jìn)行技術(shù)分解;其次,確定檢索要素以及檢索范圍,在本文中主要選取的檢索要素是“關(guān)鍵詞”和“分類(lèi)號(hào)”,檢索范圍是“標(biāo)題名稱(chēng)”“摘要”;最后,構(gòu)建專(zhuān)利檢索表達(dá)式,在構(gòu)建過(guò)程中需要不斷的閱讀專(zhuān)利文獻(xiàn),增添關(guān)鍵詞,同時(shí)排除雜質(zhì)因素,確定適合的檢索式。
綜上所述,構(gòu)建專(zhuān)利檢索表達(dá)式:(名稱(chēng),摘要+=(智能網(wǎng)聯(lián)汽車(chē) OR (車(chē)聯(lián)網(wǎng) OR 自動(dòng)駕駛 OR 無(wú)人駕駛 OR 傳感器 OR 控制器 OR 圖像 OR 檢測(cè) OR 采集 OR 安全 OR 通信) AND 汽車(chē))) AND (分類(lèi)號(hào)=(G02C21 OR G08G1 OR G05D1 OR H04L29 OR H04N7 OR B60R16 OR E04H6 OR B62D5 OR G06K9 OR G06F17 OR G01C21 OR H04W04)) AND 申請(qǐng)日=(20140101 to 20221231)。依據(jù)所構(gòu)建的專(zhuān)利檢索式進(jìn)行相關(guān)專(zhuān)利檢索,在排除重復(fù)和信息不完整的專(zhuān)利后,共獲得智能網(wǎng)聯(lián)汽車(chē)相關(guān)專(zhuān)利18 759項(xiàng)。
3.2?智能網(wǎng)聯(lián)汽車(chē)技術(shù)主題識(shí)別
本文選取“智能網(wǎng)聯(lián)汽車(chē)”專(zhuān)利數(shù)據(jù)中的摘要進(jìn)行相關(guān)研究,構(gòu)建相應(yīng)的LDA主題模型。因?yàn)樗x取的數(shù)據(jù)庫(kù)對(duì)智能網(wǎng)聯(lián)汽車(chē)進(jìn)行了專(zhuān)題優(yōu)化,所以參考其中的關(guān)鍵詞作為補(bǔ)充詞典,并根據(jù)專(zhuān)利文本的特殊性建立停用詞表,添加諸如“具有”“一類(lèi)”“本實(shí)用新型”“本發(fā)明”“提出”“形成”“進(jìn)行”“申請(qǐng)”等詞語(yǔ),上述詞典的完善能夠使得技術(shù)主題的識(shí)別結(jié)果更加準(zhǔn)確合理。
在確認(rèn)智能網(wǎng)聯(lián)汽車(chē)技術(shù)主題的數(shù)目時(shí),首先計(jì)算了1-25個(gè)主題數(shù)時(shí)的困惑度,并繪制“主題數(shù)—困惑度”函數(shù)圖像,如圖2所示。
又選取主題數(shù)16、18、21、22這幾個(gè)點(diǎn)分別繪制主題詞距離圖,如圖3所示。
根據(jù)主題詞距離圖與“主題數(shù)—困惑度”的關(guān)系函數(shù)圖,并結(jié)合“手肘法”這一經(jīng)驗(yàn)法則,可以判斷最優(yōu)的主題數(shù)在15~23之間,因此需要對(duì)主題數(shù)15~23之間的函數(shù)圖像進(jìn)行局部放大,具體結(jié)果如圖4所示。
繪制主題數(shù)為20的主題詞距離圖,如圖5所示。
綜上,當(dāng)相關(guān)專(zhuān)利文獻(xiàn)的主題聚類(lèi)結(jié)果為20時(shí),符合困惑度較低而且主題詞間距適中,所以本文選取的智能網(wǎng)聯(lián)車(chē)輛的技術(shù)主題數(shù)為20個(gè),利用Python中的Sklearn庫(kù)獲取各主題相關(guān)專(zhuān)利,并導(dǎo)出關(guān)鍵主題詞,因篇幅所限,在此僅列出各個(gè)技術(shù)主題中前6個(gè)關(guān)鍵詞。將主題聚類(lèi)結(jié)果與《智能網(wǎng)聯(lián)汽車(chē)技術(shù)路線(xiàn)圖2.0》研究報(bào)告對(duì)照,可知這些主題之間的技術(shù)領(lǐng)域界限清楚,分類(lèi)效果理想。為方便指代,本文將各個(gè)主題進(jìn)行編號(hào)并命名,具體如表1所示。
基于上述結(jié)果,繪制各個(gè)技術(shù)主題所對(duì)應(yīng)的專(zhuān)利數(shù)據(jù)分布直方圖,具體如圖6所示。
可以看出,智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域內(nèi)各個(gè)技術(shù)主題所對(duì)應(yīng)的專(zhuān)利數(shù)量各有差異,其中安全限位裝置、立體車(chē)庫(kù)、車(chē)載終端等技術(shù)主題具有較多的專(zhuān)利數(shù)量,表明該領(lǐng)域內(nèi)的相應(yīng)配套設(shè)施設(shè)備以及安全問(wèn)題正在受到廣泛關(guān)注,而技術(shù)主題中智能遙控、車(chē)載中控系統(tǒng)、電驅(qū)系統(tǒng)等專(zhuān)利數(shù)量較少,但這不能直接表明它們沒(méi)有受到關(guān)注或者不重要,也可能是由于存在技術(shù)壁壘或者技術(shù)已經(jīng)趨于成熟。
3.3?智能網(wǎng)聯(lián)汽車(chē)技術(shù)主題演化
主題間之間主題詞越相似,主題間出現(xiàn)混淆或轉(zhuǎn)移概率越高[25]。在本研究中使用主題詞共現(xiàn)分析方法,根據(jù)從智能網(wǎng)聯(lián)汽車(chē)的主題識(shí)別結(jié)果,提取每一個(gè)技術(shù)主題中出現(xiàn)概率最高的前40個(gè)關(guān)鍵詞,然后統(tǒng)計(jì)每?jī)蓚€(gè)技術(shù)主題之間關(guān)鍵詞的共現(xiàn)數(shù)量,以此來(lái)衡量這些技術(shù)主題值間相似的程度,各技術(shù)主題之間共現(xiàn)關(guān)鍵詞數(shù)量分布情況具體如圖7所示。
由圖7可知,對(duì)角線(xiàn)上的主題詞共現(xiàn)數(shù)都是40,這是因?yàn)樵谙惹癓DA模型的參數(shù)設(shè)定上,每一技術(shù)主題均提取各自概率最高前40個(gè)關(guān)鍵詞。去除對(duì)角線(xiàn)以后,其他數(shù)據(jù)也有一定差異,在主題1(車(chē)載終端)和主題6(移動(dòng)通訊)之間共現(xiàn)詞數(shù)最多,達(dá)到了16個(gè),從主題相關(guān)技術(shù)研發(fā)視角來(lái)看,兩個(gè)技術(shù)主題的確具有很強(qiáng)的技術(shù)聯(lián)系,也有一些技術(shù)主題間共現(xiàn)詞數(shù)在10個(gè)以上,這說(shuō)明他們?cè)诩夹g(shù)上也有較強(qiáng)的關(guān)聯(lián)性。在整個(gè)圖中有51對(duì)技術(shù)主題之間共現(xiàn)詞數(shù)量在2個(gè)以下,這證明了多數(shù)技術(shù)主題之間的相似程度較低,也從側(cè)面驗(yàn)證了先前所構(gòu)建的 LDA 模型中一系列參數(shù)設(shè)定是合理的,主題識(shí)別結(jié)果的準(zhǔn)確性較高。
將主題詞共現(xiàn)數(shù)進(jìn)行歸一化處理,所獲得的共現(xiàn)詞數(shù)矩陣,作為HMM模型的初始混淆矩陣及轉(zhuǎn)移矩陣,具體如表2所示,因篇幅所限,表中省略了部分主題間的轉(zhuǎn)移/混淆關(guān)系。
導(dǎo)入本文構(gòu)建的技術(shù)主題演化隱馬爾可夫模型中,利用 Baum-Welch算法訓(xùn)練HMM模型,獲得最優(yōu)轉(zhuǎn)移矩陣。其中在Baum-Welch算法中,由于智能網(wǎng)聯(lián)汽車(chē)是近些年才受到關(guān)注,所以針對(duì)模型中的觀(guān)測(cè)序列Ob=(Ob1,Ob2,…,Obt)采用了“訓(xùn)練—測(cè)試”的方式。在訓(xùn)練數(shù)據(jù)中生成了200條數(shù)據(jù),每條數(shù)據(jù)包含100個(gè)觀(guān)測(cè)樣本,在測(cè)試數(shù)據(jù)中生成30條數(shù)據(jù)以及相應(yīng)的100個(gè)觀(guān)測(cè)樣本,經(jīng)過(guò)50輪迭代后,以完成對(duì)所構(gòu)建的隱馬爾可夫模型的最優(yōu)參數(shù)估計(jì)。具體如表3所示,由于篇幅有限,表中略去部分主題間的轉(zhuǎn)移關(guān)系。
在宏觀(guān)研發(fā)的進(jìn)程中,轉(zhuǎn)移矩陣體現(xiàn)出技術(shù)主題發(fā)生轉(zhuǎn)變的可能性,即對(duì)應(yīng)了本文研究中智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域內(nèi)技術(shù)主題之間隱藏的相互轉(zhuǎn)移關(guān)系,為了更直觀(guān)地表現(xiàn)這一對(duì)應(yīng)關(guān)系,本文利用上述矩陣數(shù)據(jù)繪制熱度圖,如圖8所示。
總體上看,最優(yōu)轉(zhuǎn)移矩陣熱度圖中深色區(qū)域占多數(shù),這表明大部分技術(shù)主題都有發(fā)生轉(zhuǎn)移的傾向。從單一技術(shù)主題的角度來(lái)看,主題間研發(fā)的轉(zhuǎn)移傾向具有不同的特點(diǎn)。為了進(jìn)一步獲取智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域內(nèi)技術(shù)主題演化關(guān)系,提取了轉(zhuǎn)移概率大于8.5%的技術(shù)主題,利用Ucinet軟件建立一個(gè)轉(zhuǎn)移關(guān)系網(wǎng)絡(luò)有向圖來(lái)表示技術(shù)主題的演化路徑,具體如圖9所示,其中箭頭方向代表轉(zhuǎn)移方向,線(xiàn)條粗細(xì)代表轉(zhuǎn)移概率。
從圖9可以看出,在智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域內(nèi)技術(shù)主題的演化中,主要的技術(shù)主題節(jié)點(diǎn)有:智能泊車(chē)、汽車(chē)傳動(dòng)系統(tǒng)、微控制單元等,這些技術(shù)主題流入比重很高,是智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域內(nèi)的核心技術(shù)。而且,從圖9中可以找出多條技術(shù)主題的演化路徑,主要的有:“汽車(chē)監(jiān)測(cè)診斷技術(shù)→智能泊車(chē)→車(chē)聯(lián)網(wǎng)→汽車(chē)傳動(dòng)系統(tǒng)→危險(xiǎn)態(tài)勢(shì)預(yù)警→車(chē)載智能空調(diào)→自動(dòng)駕駛輔助”“車(chē)載智能空調(diào)→總線(xiàn)記錄儀器→汽車(chē)傳動(dòng)系統(tǒng)→微控制單元→車(chē)聯(lián)網(wǎng)→智能決策→安全限位裝置”等技術(shù)演化方式,這一過(guò)程體現(xiàn)出智能網(wǎng)聯(lián)汽車(chē)相關(guān)技術(shù)研究開(kāi)發(fā)方向上的轉(zhuǎn)變趨勢(shì)。
其中,技術(shù)主題演化中保持自身研發(fā)方向能力較強(qiáng)的主題包括:自動(dòng)駕駛輔助(0.566)、微控制單元(0.205)、高壓電池(0.182)、安全限位裝置(0.162)等,這些技術(shù)主題在演化過(guò)程中一直保持著較高的熱度,是智能網(wǎng)聯(lián)汽車(chē)相關(guān)研發(fā)過(guò)程中的熱門(mén)技術(shù)節(jié)點(diǎn)。此外,技術(shù)主題演化過(guò)程中轉(zhuǎn)移流失比重最大的主題是“圖像處理”,其主要流向總線(xiàn)記錄儀、微控制單元、汽車(chē)傳動(dòng)系統(tǒng)等方面,這是由于圖像處理技術(shù)的數(shù)字化、集成化的趨勢(shì),這一功能的實(shí)現(xiàn)需要依賴(lài)上述技術(shù)的輔助,所以這一特定領(lǐng)域內(nèi)的演化表現(xiàn)顯著。
4?結(jié)論與展望
本文將LDA與HMM相結(jié)合,基于專(zhuān)利數(shù)據(jù)對(duì)智能網(wǎng)聯(lián)汽車(chē)領(lǐng)域進(jìn)行分析研究。利用LDA對(duì)智能網(wǎng)聯(lián)汽車(chē)進(jìn)行技術(shù)主題識(shí)別,將該領(lǐng)域劃分為20個(gè)技術(shù)主題,并在此基礎(chǔ)上引入HMM模型,將技術(shù)研發(fā)與隱馬爾可夫過(guò)程相結(jié)合,從中分析智能網(wǎng)聯(lián)汽車(chē)技術(shù)主題演化路徑與規(guī)律。本文所識(shí)別出的技術(shù)主題是該領(lǐng)域內(nèi)重要研發(fā)方向,是未來(lái)技術(shù)創(chuàng)新和產(chǎn)品競(jìng)爭(zhēng)的重點(diǎn),所構(gòu)建的技術(shù)主題演化關(guān)系網(wǎng)絡(luò)能夠?yàn)橄嚓P(guān)企業(yè)及研發(fā)機(jī)構(gòu)了解該領(lǐng)域內(nèi)的技術(shù)研發(fā)趨勢(shì),提供研發(fā)決策方向,把握機(jī)會(huì)形成優(yōu)勢(shì),節(jié)約資源,降低研發(fā)成本。該模型方法實(shí)現(xiàn)了無(wú)需專(zhuān)家經(jīng)驗(yàn)的專(zhuān)利數(shù)據(jù)高效無(wú)監(jiān)督聚類(lèi),能夠快速有效地挖掘其中隱含的技術(shù)主題信息,獲得關(guān)鍵的技術(shù)節(jié)點(diǎn)及技術(shù)演化趨勢(shì),為專(zhuān)利計(jì)量提供新的途徑,也可以應(yīng)用于其他技術(shù)領(lǐng)域。
但本研究也存在一定局限,一是在數(shù)據(jù)獲取方面,僅對(duì)本國(guó)專(zhuān)利文獻(xiàn)這單一維度進(jìn)行采集,未來(lái)可以擴(kuò)大文獻(xiàn)收集范圍,加入國(guó)內(nèi)外的期刊論文和外國(guó)的專(zhuān)利數(shù)據(jù),通過(guò)不同來(lái)源不同類(lèi)別數(shù)據(jù)的采集和分析,完成更加嚴(yán)謹(jǐn)全面的智能網(wǎng)聯(lián)汽車(chē)技術(shù)主題相關(guān)研究;二是針對(duì)隱馬爾可夫模型中的混淆關(guān)系,即技術(shù)主題所對(duì)應(yīng)的相關(guān)專(zhuān)利文獻(xiàn)類(lèi)型,可以進(jìn)一步展開(kāi)研究,選取適當(dāng)?shù)姆椒ǘ糠治銎渲兴鶎?duì)應(yīng)的關(guān)系,比如可以借助PageRank算法確定領(lǐng)域內(nèi)的關(guān)鍵技術(shù)主題。
參考文獻(xiàn)參考文獻(xiàn):
[1]?韓志華. 核心專(zhuān)利判別的綜合指標(biāo)體系研究[J]. 中國(guó)外資,2010(4): 193-196.
[2]?林巖. 基于專(zhuān)利數(shù)據(jù)的知識(shí)計(jì)量研究評(píng)述[J]. 科技管理研究,2008(9): 91-93.
[3]?楊恒,王曰芬,張露. 基于核心專(zhuān)利技術(shù)主題識(shí)別與演化分析的技術(shù)預(yù)測(cè)[J].情報(bào)雜志,2022,41(7): 49-56.
[4]?李政,羅暉,李正風(fēng),等. 基于突變理論的科技評(píng)價(jià)方法初探[J]. 科研管理,2017,38(s1): 193-200.
[5]?PORTER A L, GARNER J, CARLEY S F, et al. Emergence scoring to identify frontier R&D topics and key players[J]. Technological Forecasting and Social Change, 2019,146:628-643.
[6]?LEE C, KWON O, KIM M, et al. Early identification of emerging technologies: a machine learning approach using multiple patent indicators[J]. Technological Forecasting and Social Change, 2018, 127(Feb): 291-303.
[7]?楊大飛,楊武,田雪姣,等.基于專(zhuān)利數(shù)據(jù)的核心技術(shù)識(shí)別模型構(gòu)建及實(shí)證研究[J]. 情報(bào)雜志,2021,40(2): 47-54.
[8]?PENG Z, YANJUN Y, LIXUE S. Recognition and evolution of generic technology in GPS industry and its enlightenment: based on patent analysis[J]. Technology Economics, 2016(12): 60-75,89.
[9]?李瑞茜,陳向東. 基于專(zhuān)利共類(lèi)的關(guān)鍵技術(shù)識(shí)別及技術(shù)發(fā)展模式研究[J]. 情報(bào)學(xué)報(bào),2018,37(5): 495-502.
[10]?紀(jì)亞琨,余翔,張奔,等. 專(zhuān)利網(wǎng)絡(luò)視角下的潛在顛覆性技術(shù)識(shí)別——以自動(dòng)駕駛領(lǐng)域?yàn)槔齕J]. 情報(bào)雜志,2022,41(12): 46-50,139.
[11]?張維沖,王芳,趙洪. 多源信息融合用于新興技術(shù)發(fā)展趨勢(shì)識(shí)別——以區(qū)塊鏈為例[J]. 情報(bào)學(xué)報(bào),2019,38(11): 1166-1176.
[12]?馬永紅,孔令凱,林超然,等. 基于專(zhuān)利挖掘的關(guān)鍵共性技術(shù)識(shí)別研究[J]. 情報(bào)學(xué)報(bào),2020,39(10): 1093-1103.
[13]?呂鯤,陳簫羽,靖繼鵬. 基于組合分詞方法和LDA模型的區(qū)塊鏈金融產(chǎn)業(yè)關(guān)鍵技術(shù)識(shí)別研究[J]. 圖書(shū)情報(bào)工作,2022,66(19): 110-121.
[14]?OH G, KIM H-Y, PARK A. Analysis of technological innovation based on citation information[J]. Quality & Quantity, 2017, 51(3SI): 1065-1091.
[15]?YOON B, MAGEE C L. Exploring technology opportunities by visualizing patent information based on generative topographic mapping and link prediction[J]. Technological Forecasting and Social Change, 2018, 132: 105-117.
[16]?楊武,陳培,GAD DAVID. 光刻機(jī)產(chǎn)業(yè)技術(shù)擴(kuò)散與技術(shù)動(dòng)態(tài)演化——對(duì)“卡脖子”技術(shù)的啟示[J]. 中國(guó)科技論壇,2022(9): 73-84.
[17]?李欣,謝前前,黃魯成,等.基于SAO結(jié)構(gòu)語(yǔ)義挖掘的新興技術(shù)演化軌跡研究[J]. 科學(xué)學(xué)與科學(xué)技術(shù)管理,2018,39(1): 17-31.
[18]?周源,杜俊飛,劉宇飛,等. 基于引用網(wǎng)絡(luò)和文本挖掘的技術(shù)演化路徑識(shí)別[J]. 情報(bào)雜志,2018,37(10): 76-81.
[19]?李子彪,張莉. 基于LDA模型的鋼鐵材料專(zhuān)利技術(shù)主題演化研究[J]. 科技管理研究,2020,40(24): 175-183.
[20]?儲(chǔ)節(jié)旺,李佳軒,安怡然. 基于專(zhuān)利分析的顛覆性技術(shù)演化與預(yù)測(cè)研究——以量子信息技術(shù)為例[J]. 科技進(jìn)步與對(duì)策,2023,40(22):130-140.
[21]?伊惠芳,吳紅,李昌,等.基于主題生命周期與技術(shù)熵的石墨烯技術(shù)主題演化研究[J]. 情報(bào)雜志,2019,38(2): 64-70.
[22]?李乾瑞,郭俊芳,黃穎,等. 基于突變-融合視角的顛覆性技術(shù)主題演化研究[J]. 科學(xué)學(xué)研究,2021,39(12): 2129-2139.
[23]?BLEI D M. Probabilistic topic models[J]. Communications of the ACM, 2012, 55(4): 77-84.
[24]?SIEVERT C, SHIRLEY K. LDAvis: a method for visualizing and interpreting topics[M]. Baltimore: Association for Computational Linguistics,2014.
[25]?林超然. 基于專(zhuān)利數(shù)據(jù)挖掘的關(guān)鍵共性技術(shù)識(shí)別及預(yù)測(cè)研究——以3D打印為例[D]. 哈爾濱: 哈爾濱工程大學(xué),2020.
責(zé)任編輯(責(zé)任編輯:吳?漢)