亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于異構(gòu)數(shù)據(jù)的顛覆性技術(shù)識別研究

        2022-07-05 11:37:48馬永紅孔令凱林超然楊曉萌倪惠莉
        現(xiàn)代情報 2022年7期
        關(guān)鍵詞:文本挖掘

        馬永紅 孔令凱 林超然 楊曉萌 倪惠莉

        摘要:[目的/意義]顛覆性技術(shù)研發(fā)作為國家戰(zhàn)略,如何準確識別顛覆性技術(shù),對于國家和企業(yè)把握技術(shù)先機,搶占技術(shù)制高點意義重大。[方法/過程]本文結(jié)合專利文獻數(shù)據(jù),利用LDA主題模型實現(xiàn)數(shù)據(jù)降維,提取技術(shù)主題,從技術(shù)主題成長性、融合性、創(chuàng)新性、突破性4個特征識別候選顛覆性技術(shù);在此基礎(chǔ)上,結(jié)合網(wǎng)頁新聞數(shù)據(jù),測算候選顛覆性技術(shù)主題與網(wǎng)頁新聞數(shù)據(jù)主題之間的匹配度,分析技術(shù)的市場屬性,準確識別顛覆性技術(shù)。[結(jié)果/結(jié)論]本文以智能制造裝備領(lǐng)域為例,通過實證研究得到“智能數(shù)字控制”及“智能數(shù)據(jù)采集系統(tǒng)”是智能制造裝備領(lǐng)域的顛覆性技術(shù)。

        關(guān)鍵詞:異構(gòu)數(shù)據(jù);文本挖掘;顛覆性技術(shù);技術(shù)識別

        DOI:10.3969/j.issn.1008-0821.2022.07.008

        〔中圖分類號〕G255.53〔文獻標識碼〕A〔文章編號〕1008-0821(2022)07-0092-13

        Research on the Identification of Disruptive Technologies

        Based on Heterogeneous Data

        ——An Example in the Field of Intelligent Manufacturing EquipmentMa YonghongKong Lingkai Lin ChaoranYang XiaomengNi Huili

        (School of Economics and Management,Harbin Engineering University,Harbin 150001,China)

        Abstract:[Purpose/Significance]Disruptive technology research and development as a national strategy,how to accurately identify it is of great significance for the country and enterprises to grasp the technological first opportunity and seize the technological high ground.[Method/Process]The study patent data,using the LDA topic model to achieve data dimensionality reduction and extracting technology topics.And screened candidate disruptive technologies based on four characteristics:growth,convergence,innovation,and breakthrough of the technology topic.On this basis,the match between candidate disruptive technology topics and web news data topics was measured in conjunction with the web news data.The market attributes of the technology were analysed to identify disruptive technologies comprehensively.[Results/Conclusions]This paper took the field of intelligent manufacturing equipment as an example.Through empirical research,the study found that“intelligent digital control”and“intelligent data acquisition system”are disruptive technologies in the field of intelligent manufacturing equipment.

        Key words:heterogeneous data;text mining;disruptive technologies;technology identification

        技術(shù)創(chuàng)新是經(jīng)濟發(fā)展第一動力,而顛覆性技術(shù)作為技術(shù)創(chuàng)新的重要內(nèi)容,其對以往的技術(shù)和市場具有較強的破壞力。顛覆性技術(shù)是打破原有技術(shù)生命周期,構(gòu)建新的技術(shù)軌道,以意想不到的方式取代現(xiàn)有主流技術(shù)的技術(shù)[1],它能夠?qū)崿F(xiàn)社會技術(shù)體系的躍遷,改變技術(shù)產(chǎn)品性能,變革原有技術(shù)性能標準,對于軍事、科技、產(chǎn)業(yè)等具有變革性的意義。世界各國普遍重視顛覆性技術(shù)研發(fā),并設(shè)計專門的組織或研發(fā)計劃,旨在促進顛覆性技術(shù)發(fā)展,例如:美國國防高級研究技術(shù)局(DARPA)、日本的顛覆性技術(shù)創(chuàng)新計劃(ImPACT)。中國也高度關(guān)注顛覆性技術(shù)研發(fā),中國的《國家創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略綱要》《科技部辦公廳關(guān)于開展顛覆性技術(shù)研發(fā)方向建議征集工作的通知》等文件明確提出發(fā)展顛覆性技術(shù),將顛覆性技術(shù)擺在國家戰(zhàn)略位置。而顛覆性技術(shù)發(fā)展具有高度不確定性,研發(fā)過程漫長,如何在復(fù)雜的技術(shù)環(huán)境中及早準確識別顛覆性技術(shù),對于加快顛覆性技術(shù)研發(fā),掌握國際競爭發(fā)展先機具有重要意義。

        1相關(guān)工作概述

        對于如何識別顛覆性技術(shù),國內(nèi)外學者已經(jīng)取得豐富研究成果,其中專家經(jīng)驗、專利數(shù)據(jù)、科技論文、市場用戶數(shù)據(jù)、政策法規(guī)是顛覆性技術(shù)識別常用的數(shù)據(jù)源。早期主要采用專家經(jīng)驗及知識識別顛覆性技術(shù),而依靠專家經(jīng)驗的識別方法包含:調(diào)查問卷法[2-3]、專家訪談[4]、理論分析[5]、技術(shù)路線圖[6]等。專家知識和經(jīng)驗的利用,能夠準確識別特定領(lǐng)域顛覆性技術(shù),但專家資源稀缺,且應(yīng)用范圍較窄,難以滿足顛覆性技術(shù)識別需求。

        為解決該問題,學者采用專利文獻數(shù)據(jù)及科技論文識別顛覆性技術(shù)。專利文獻包含大量技術(shù)信息,學者綜合專利申請數(shù)量[7]、專利引用量[8]、科學關(guān)聯(lián)度[9]、專利權(quán)利要求數(shù)[9]、IPC數(shù)量[10]、專利發(fā)展路徑[11]、專利引用知識突變[12]、專利引文相似度[13]等專利外部屬性識別顛覆性技術(shù),然而基于專利外部屬性的顛覆性技術(shù)識別方法,難以充分挖掘?qū)@墨I信息,技術(shù)寬泛,細粒度不足,并且專利引用具有滯后性,無法及時識別顛覆性技術(shù)。為解決以上問題,學者深入專利內(nèi)部,將文本挖掘及深度學習方法應(yīng)用于顛覆性技術(shù)識別,以技術(shù)屬性集相似度[14]、技術(shù)主題突變[15-16]挖掘?qū)@墨I內(nèi)部信息,以此完成顛覆性技術(shù)識別。目前,基于專利內(nèi)部信息識別顛覆性技術(shù)的研究還比較少??萍颊撐耐瑯影夹g(shù)信息,部分學者將科技論文用于顛覆性技術(shù)識別,結(jié)合科技論文數(shù)量變化[11]、科技論文被引量[17]、科技論文關(guān)鍵詞網(wǎng)絡(luò)[18]、知識主題突變[19]等指標識別潛在顛覆性技術(shù)。除了從“技術(shù)屬性”層面識別顛覆性技術(shù),也有學者基于市場用戶需求數(shù)據(jù)、商業(yè)報告數(shù)據(jù),分析技術(shù)功能變化[20]、技術(shù)發(fā)展軌跡[21]、技術(shù)成熟度[22]、技術(shù)市場潛力[23]、消費者偏好[24]、產(chǎn)品功能變化[21]、客戶滿意度[25],進而探究技術(shù)對于市場的顛覆程度,以此完成顛覆性技術(shù)識別。該類顛覆性技術(shù)識別方法,考慮了市場及用戶數(shù)據(jù),更貼近市場需求,但該識別方法對技術(shù)本身挖掘不充分,忽視技術(shù)知識結(jié)構(gòu),識別結(jié)果較為片面。

        為了提升顛覆性技術(shù)識別準確性及全面性,本研究基于專利文獻,引入文本挖掘技術(shù),獲取技術(shù)知識結(jié)構(gòu)信息,結(jié)合顛覆性技術(shù)特征,從技術(shù)屬性層面識別候選顛覆性技術(shù),并結(jié)合網(wǎng)頁新聞數(shù)據(jù),探究候選顛覆性技術(shù)的市場影響,分析技術(shù)的市場屬性,進而確定顛覆性技術(shù)。顛覆性技術(shù)整個識別過程,綜合專利文獻及網(wǎng)頁新聞數(shù)據(jù),從技術(shù)屬性及市場屬性兩個角度識別顛覆性技術(shù),能夠提高識別結(jié)果的準確性及全面性。

        2顛覆性技術(shù)特征分析

        顛覆性技術(shù)源于技術(shù)融合或創(chuàng)新活動中產(chǎn)生的重大技術(shù)范式變革,實現(xiàn)技術(shù)性能突破,帶來全新的功能屬性,滿足主流客戶需求,取代現(xiàn)有主流技術(shù)。本文將其特征歸納為4個方面。

        1)成長性:顛覆性技術(shù)沿著“利基市場—中間市場—主流市場”的路徑演進[26],顛覆性技術(shù)早期在主流市場需求的性能維度上比主流技術(shù)產(chǎn)品低劣[1],只能服務(wù)利基市場或邊緣市場,但通過后期的技術(shù)改進與創(chuàng)新,技術(shù)產(chǎn)品性能不斷提升,具備高性能、低成本優(yōu)勢[27],最終成長為市場主流技術(shù)。因此,技術(shù)成長性是顛覆性技術(shù)的重要特征之一。

        2)融合性:顛覆性技術(shù)可以是技術(shù)融合的產(chǎn)物[28],未來大部分顛覆性技術(shù)將來源于不同領(lǐng)域的技術(shù)融合[29]??缭讲煌R結(jié)構(gòu)或不相關(guān)領(lǐng)域的技術(shù)不斷交叉、嵌入,組合新穎的知識元素,打破以往知識結(jié)構(gòu)對技術(shù)軌道的約束[30],為顛覆性技術(shù)的產(chǎn)生奠定基礎(chǔ)。因此,融合性是其重要特征[10]。

        3)創(chuàng)新性:顛覆性技術(shù)不是對現(xiàn)有技術(shù)的進一步改進,而是更大程度的創(chuàng)新[31],該技術(shù)可以提供全新功能、不連續(xù)的技術(shù)標準以及新的所有制形式,同時可以改變市場標準和消費者期望[32],實現(xiàn)產(chǎn)品或服務(wù)技術(shù)特征以及功能屬性的革新。因此,創(chuàng)新性是顛覆性技術(shù)顯著特征之一。

        4)突破性:顛覆性技術(shù)可以由科學知識突變或科學原理變化產(chǎn)生,也可以由技術(shù)集成創(chuàng)新產(chǎn)生,該類技術(shù)具有重大的突破性[2],能夠替代原有的技術(shù),實現(xiàn)技術(shù)性能突破,改變因技術(shù)研發(fā)局限性造成的產(chǎn)業(yè)市場落后狀況,滿足主流市場技術(shù)需求,實現(xiàn)市場突破[33]。因此,突破性是顛覆性技術(shù)所具有的特征之一。

        3顛覆性技術(shù)識別框架

        3.1異構(gòu)數(shù)據(jù)收集及預(yù)處理

        異構(gòu)數(shù)據(jù)是指來源和結(jié)構(gòu)不同的數(shù)據(jù),相對于單一數(shù)據(jù)集,異構(gòu)數(shù)據(jù)使不同數(shù)據(jù)特征融合成為可能。顛覆性技術(shù)識別過程中,為提高顛覆性技術(shù)識別準確性及全面性,本文綜合使用專利文獻及網(wǎng)頁新聞兩種異構(gòu)數(shù)據(jù)。專利文獻記錄技術(shù)創(chuàng)新、工藝優(yōu)化,蘊含豐富的技術(shù)知識結(jié)構(gòu)信息;網(wǎng)絡(luò)新聞數(shù)據(jù)是市場不同主體對技術(shù)的客觀描述,反映市場主體對技術(shù)的態(tài)度、應(yīng)用以及評述,可用于分析技術(shù)的市場屬性[34]。因此,本文將專利文獻及網(wǎng)頁新聞兩種異構(gòu)數(shù)據(jù)作為顛覆性技術(shù)識別的數(shù)據(jù)源。

        1)專利數(shù)據(jù)收集及預(yù)處理

        德溫特數(shù)據(jù)庫作為世界知名專利數(shù)據(jù)庫,已經(jīng)收集多個國家和地區(qū)的專利文獻,專利信息覆蓋全面,且數(shù)據(jù)庫不斷更新,為技術(shù)情報分析提供了可能。因此,本文選擇德溫特數(shù)據(jù)庫收集專利文獻數(shù)據(jù)。為全面檢索專利文獻,本文結(jié)合關(guān)鍵詞及IPC分類號,制定檢索表達式,收集專利文獻數(shù)據(jù)。NLTK術(shù)語庫是著名的自然語言處理庫,具有詞性分類、詞干提取、詞性標記等功能,為50多種語料庫和詞匯資源提供使用界面[35],為此,本文將其引入專利數(shù)據(jù)處理,實現(xiàn)詞干提取及詞性還原,并結(jié)合停用詞表,剔除無關(guān)詞語,保證數(shù)據(jù)的有效性。

        2)網(wǎng)頁新聞數(shù)據(jù)收集及預(yù)處理

        網(wǎng)頁新聞數(shù)據(jù)量龐大,人工收集數(shù)據(jù)工作量巨大,且難以全面獲取新聞數(shù)據(jù)。為此,本文采用網(wǎng)絡(luò)爬蟲技術(shù)實現(xiàn)網(wǎng)頁新聞數(shù)據(jù)收集。而維特比(Viterbi)算法通過尋找動態(tài)規(guī)劃最大概率路徑,找出詞頻的最大切分組合,具有良好的分詞效果[36],對此,本文將其應(yīng)用于網(wǎng)頁新聞數(shù)據(jù)分詞。

        3.2文本數(shù)據(jù)聚類模塊

        LDA(Latent Dirichlet Allocation)主題模型作為典型無監(jiān)督學習,能夠挖掘文檔隱藏語義信息,處理海量文本文檔,降低無效信息影響,實現(xiàn)專利文獻及網(wǎng)頁新聞數(shù)據(jù)的高效聚類,因此,LDA模型作為本文主題聚類的首選。LDA主題模型最早由Blei D M等提出[37],其假設(shè)每篇文檔由特定概率的主題組成,而主題又由特定概率的特征詞組成,形成“文檔—主題—特征詞”的三層貝葉斯概率模型。LDA模型提取效果直接由主題數(shù)量決定,為精準確定主題參數(shù),本文結(jié)合困惑度(perplexity)及“肘形”理論確定模型參數(shù)。困惑度表示所訓練模型中特定文檔屬于哪個主題的不確定性[37],其中困惑度計算如式(1)~(3)所示;而“肘形”是困惑度曲線的拐點,該拐點與上一節(jié)點差值最大,而與后一節(jié)點的差值最小,而“肘形”對應(yīng)的主題數(shù)為模型的最優(yōu)主題數(shù)[38]。

        3.3顛覆性技術(shù)主題識別模塊

        根據(jù)顛覆性技術(shù)的成長性、融合性、創(chuàng)新性以及突破性,本文采用專利申請量以及技術(shù)強度判斷技術(shù)成長性;采用技術(shù)主題IPC分類號、接近中心性判斷技術(shù)融合性;測度技術(shù)主題有效規(guī)模及約束度探究技術(shù)創(chuàng)新性;基于技術(shù)異常檢測判斷技術(shù)的突破性,結(jié)合以上4個維度從技術(shù)屬性層面識別候選顛覆性技術(shù),并結(jié)合網(wǎng)頁新聞數(shù)據(jù),探究候選顛覆性技術(shù)主題的市場屬性,最終完成顛覆性技術(shù)識別。識別流程如圖1所示。

        1)技術(shù)成長性及融合性測度

        “成長性”是指顛覆性技術(shù)能夠逐步替代原有技術(shù),變革技術(shù)知識結(jié)構(gòu),最終成為市場主流技術(shù)。為體現(xiàn)技術(shù)成長性,本文采用專利申請數(shù)量以及技術(shù)主題強度變化測度技術(shù)成長性。技術(shù)主題強度能夠反映各時期內(nèi)技術(shù)的熱門度,技術(shù)主題強度越高表示技術(shù)主題影響力越強。技術(shù)主題強度計算公式為:

        “融合性”作為顛覆性技術(shù)基本特征之一,本文從技術(shù)主題接近中心性以及技術(shù)主題IPC分類號種類兩個維度分析技術(shù)主題融合性。接近中心性表示某技術(shù)主題與其他技術(shù)主題的接近程度,如式(6)所示,接近中心性越高,技術(shù)主題融合性越強[40]。為測度技術(shù)主題接近中心性變化趨勢,本文基于專利文獻時間屬性,構(gòu)建不同年份下技術(shù)主題共現(xiàn)網(wǎng)絡(luò),以此測算不同年份技術(shù)主題接近中心性;此外,統(tǒng)計技術(shù)主題內(nèi)部不同類型的IPC分類號,若技術(shù)主題內(nèi)IPC分類號種類增加,則技術(shù)主題融合性增強。

        “創(chuàng)新性”是顛覆性技術(shù)基本屬性之一。顛覆性技術(shù)能夠提供新的產(chǎn)品或技術(shù)功能,改變原有技術(shù)范式,具備較強創(chuàng)新性。技術(shù)主題共現(xiàn)網(wǎng)絡(luò)中結(jié)構(gòu)洞占據(jù)者能夠獲取非重復(fù)異質(zhì)信息,技術(shù)創(chuàng)新可能性較高,因此,本文采用結(jié)構(gòu)洞指標測度技術(shù)主題的創(chuàng)新性。有效規(guī)模(ES)、約束度(H)是結(jié)構(gòu)洞指數(shù)典型指標,有效規(guī)模是技術(shù)節(jié)點的個體網(wǎng)絡(luò)規(guī)模減去網(wǎng)絡(luò)冗余度,有效規(guī)模與技術(shù)節(jié)點結(jié)構(gòu)洞數(shù)量呈正比,如式(9)所示。約束度表示約束性多大程度集中在某個節(jié)點上,如式(10)所示。

        顛覆性技術(shù)能夠突破現(xiàn)有技術(shù)桎梏,改變原有技術(shù)軌道。為分析技術(shù)主題是否具有突破可能性,本文采用技術(shù)異常檢測,探究技術(shù)突破的可能性。技術(shù)異常檢測是一種技術(shù)突破形式,異常技術(shù)是對已建立規(guī)則、主流技術(shù)的革新[42]。技術(shù)異常檢測包含局部異常因子(LOF)、K均值等方法,而K均值異常檢測能夠應(yīng)用于不同類型數(shù)據(jù),因此,K均值技術(shù)異常檢測作為本文首選。其計算公式如式(11)所示:

        3)技術(shù)主題匹配度測算

        專利文獻挖掘能夠深入技術(shù)本身,獲取技術(shù)知識結(jié)構(gòu)信息,但難以分析技術(shù)的市場屬性,導致技術(shù)分析結(jié)果片面。社會網(wǎng)絡(luò)新聞數(shù)據(jù)包含技術(shù)應(yīng)用、技術(shù)需求、潛在技術(shù)機會等重要技術(shù)信息[34,43],網(wǎng)絡(luò)新聞技術(shù)信息的報道,是技術(shù)事件轉(zhuǎn)移的重要信號,表明市場不同主體的關(guān)注,對于分析技術(shù)市場應(yīng)用,技術(shù)產(chǎn)生的社會經(jīng)濟效益、潛在競爭力、商業(yè)機會具有重要價值[44]。部分學者已將網(wǎng)頁新聞用于評估技術(shù)潛在競爭力、市場認可度,論證網(wǎng)絡(luò)新聞數(shù)據(jù)用于分析技術(shù)市場屬性的可行性[34]。對此,本研究將網(wǎng)頁新聞數(shù)據(jù)引入,結(jié)合主題匹配度測算方法,探究待選顛覆性技術(shù)的市場屬性,提升技術(shù)識別的準確性及全面性。

        主題匹配度測算包含詞共現(xiàn)匹配、余弦夾角向量匹配等方法,該類方法從詞頻角度測度主題匹配度,尚未考慮主題內(nèi)特征詞的詞義信息。為準確測算技術(shù)主題匹配度,本文基于語義相似度Sim(kwi,kwj),形成特征詞相似度矩陣F,如式(12)所示,取矩陣中相似度排名前50%元素的均值作為主題匹配度[45]。

        4智能制造裝備領(lǐng)域顛覆性技術(shù)識別案例

        制造業(yè)是國民經(jīng)濟的主體,是立國之本、興國之器。制造系統(tǒng)的智能化是制造業(yè)新的發(fā)展方向,制約國家競爭力的提升,是各國關(guān)注的焦點。智能制造裝備領(lǐng)域具有科技創(chuàng)新能力強、產(chǎn)業(yè)關(guān)聯(lián)度高等特征,極易產(chǎn)生顛覆性技術(shù)。因此,本文選擇智能制造裝備領(lǐng)域作為研究對象,利用專利文獻以及網(wǎng)頁新聞數(shù)據(jù),識別智能制造裝備領(lǐng)域顛覆性技術(shù)。

        4.1智能制造裝備領(lǐng)域數(shù)據(jù)收集及主題提取

        4.1.1智能制造裝備領(lǐng)域數(shù)據(jù)收集

        1)智能制造裝備領(lǐng)域?qū)@墨I數(shù)據(jù)收集

        智能制造裝備產(chǎn)業(yè)作為戰(zhàn)略性新興產(chǎn)業(yè),根據(jù)《戰(zhàn)略性新興產(chǎn)業(yè)重點產(chǎn)品和服務(wù)指導目錄》獲取智能制造裝備領(lǐng)域技術(shù)關(guān)鍵詞,結(jié)合IPC分類號,制定智能制造裝備領(lǐng)域?qū)@麛?shù)據(jù)檢索表達式,TI=(Intelligent numerical control machine or industrial robots manufacturing or additive manufacturing or intelligent sensing or intelligent control equipment or intelligent measurement or assembly equipment or intelligent logistics or storage equipment) AND IP=( B62D* OR B23P* OR B23Q* OR B24B* OR B23D* OR B23F* OR B23B* OR B23C* OR B23G* OR H02N* OR B23K* OR F16J* OR H04R* OR B64G* OR G08B* OR G11B* OR G06E* OR G06F* OR G08C* OR H01F* OR G05B* OR G01B* OR G02B* OR A24B* OR B02C* OR C03B* OR C25C* OR G08G* OR H02K* OR F16C* OR E01D* OR B60B),檢索時間跨度為1963—2021年,檢索日期為2021年9月25日,基于德溫特數(shù)據(jù)庫共得到25 564條專利文獻,刪除無效數(shù)據(jù),剩余23 581條專利,繪制各年份部分國家(地區(qū))的專利申請情況,結(jié)果如圖2所示。

        由圖2可知,德國最早申請智能制造裝備領(lǐng)域相關(guān)專利,并保持較強研發(fā)態(tài)勢。此外,中國(CN)及中國香港(HK(China))、中國臺灣地區(qū)(TW(China))、世界知識產(chǎn)權(quán)組織(WO)、美國(US)、韓國(KR)、日本(JP)、英國(GB)、歐洲專利局(EP)等國家、地區(qū)或組織的專利申請數(shù)量也不斷增加。在本文收集的專利文獻中,中國(CN)最早圖2各年份部分國家及地區(qū)專利申請情況

        于1997年申請智能制造裝備領(lǐng)域相關(guān)專利,相比其他國家及地區(qū),起步較晚,但中國及地區(qū)專利申請數(shù)量不斷增加。

        2)智能制造裝備領(lǐng)域網(wǎng)頁新聞數(shù)據(jù)收集

        網(wǎng)頁新聞數(shù)據(jù)龐大,人工收集工作量巨大,且面臨數(shù)據(jù)收集不全面問題。為此,本研究借助Python軟件,采用爬蟲技術(shù)收集智能制造裝備領(lǐng)域網(wǎng)頁新聞數(shù)據(jù)。其中,智能制造裝備領(lǐng)域網(wǎng)頁新聞檢索關(guān)鍵詞為“智能制造技術(shù)”“智能制造裝備”“智能制造裝備技術(shù)”“高檔數(shù)控機床”“工業(yè)機器人”“增材制造裝備”“智能傳感與控制裝備”“智能檢測與裝配裝備”“智能物流與倉儲裝備”,通過收集共得到7 218條新聞數(shù)據(jù),去除冗余文本及無效文本,剩余6 694條新聞數(shù)據(jù),如圖3所示,時間跨度為2012—2021年。

        4.1.2專利文獻及網(wǎng)頁新聞數(shù)據(jù)預(yù)處理

        1)專利文獻數(shù)據(jù)預(yù)處理

        為保證智能制造裝備領(lǐng)域?qū)@墨I技術(shù)主題提取效果,本研究刪除長度小于2和長度大于15的單詞,并實現(xiàn)智能制造裝備領(lǐng)域?qū)@墨I的詞性還原及詞干提取;根據(jù)NLTK術(shù)語庫自帶停用詞表,并結(jié)合LDA主題模型計算結(jié)果反復(fù)調(diào)整停用詞表,剔除無效詞語。專利文獻數(shù)據(jù)預(yù)處理后,抽樣得到:“Telescopic”“Bolt”“Monitoring”“Medium”“Grid”等詞語,從抽樣結(jié)果可知,數(shù)據(jù)預(yù)處理后得到的詞語專業(yè),說明智能制造裝備領(lǐng)域?qū)@墨I數(shù)據(jù)預(yù)處理有效。

        2)網(wǎng)頁新聞數(shù)據(jù)預(yù)處理

        針對智能制造裝備領(lǐng)域網(wǎng)頁新聞數(shù)據(jù),采用維特比算法實現(xiàn)文本分詞,但文本中存在部分無效詞語,影響文本信息的挖掘。哈工大停用詞庫以及百度停用詞庫是開源的停用詞表[46],收錄了比較全面的停用詞,是目前最常用的停用詞庫,本文將其引入,過濾無效詞語,降低無效詞對本研究的影響。

        4.1.3智能制造裝備領(lǐng)域技術(shù)主題提取

        LDA模型的主題參數(shù)直接決定智能制造裝備領(lǐng)域技術(shù)主題提取的準確性,為保障智能制造裝備領(lǐng)域?qū)@墨I及網(wǎng)頁新聞數(shù)據(jù)聚類效果,本研究綜合困惑度及肘形確定LDA模型主題參數(shù)。其中,專利文獻以及網(wǎng)頁新聞LDA主題模型困惑度及肘形如圖4所示。

        綜合不同主題數(shù)下模型困惑度及肘形,如圖4所示,得到智能制造裝備領(lǐng)域?qū)@墨ILDA模型最優(yōu)主題數(shù)為87,而智能制造裝備領(lǐng)域網(wǎng)頁新聞數(shù)據(jù)LDA模型最優(yōu)主題數(shù)為72。其中,專利文獻聚類結(jié)果中兩個主題由數(shù)字構(gòu)成,本研究將其剔除,剩余85個技術(shù)主題;由智能制造裝備領(lǐng)域網(wǎng)頁新聞數(shù)據(jù)LDA模型得到72個主題,其中與智能制造裝備領(lǐng)域相關(guān)的主題共28個,剩余44個主題與智能制造裝備領(lǐng)域關(guān)聯(lián)性不強,將其剔除。每篇文檔由一定概率的主題組成,為準確提取文檔信息,本文借鑒Mann G S等的研究[47],認為若主題分布概率大于0.1,則認為文檔屬于該主題,進而刪除文檔中主題分布概率低于0.1的主題。

        根據(jù)專利文獻及網(wǎng)頁新聞數(shù)據(jù)LDA模型提取結(jié)果,分別展示不同數(shù)據(jù)源下前5個主題的特征詞及其概率分布,結(jié)果如表1所示。

        4.2智能制造裝備領(lǐng)域候選顛覆性技術(shù)識別

        基于智能制造裝備領(lǐng)域?qū)@墨I以及LDA模型提取結(jié)果,本研究從成長性、融合性、創(chuàng)新性、突破性4個維度分析技術(shù)自身知識屬性,識別候選顛覆性技術(shù)。

        4.2.1智能制造裝備領(lǐng)域技術(shù)主題成長性測度

        顛覆性技術(shù)實現(xiàn)技術(shù)性能突破,不斷發(fā)展,最終成為主流技術(shù),該發(fā)展過程中技術(shù)創(chuàng)新主體逐漸多樣化,專利申請數(shù)量不斷增加。因此,本研究結(jié)合專利文獻的時間屬性,統(tǒng)計技術(shù)主題專利申請數(shù)量及技術(shù)主題強度,繪制不同時間段各技術(shù)主題專利申請數(shù)量及主題強度變化。由于2000年前專利數(shù)量較少,信息不豐富,因此,本文僅展示2000年以后的統(tǒng)計結(jié)果,結(jié)果如圖5和圖6所示。

        圖5及圖6顯示智能制造裝備領(lǐng)域大部分技術(shù)主題專利申請數(shù)量以及主題強度呈現(xiàn)上升趨勢,尤其2015年后,隨著智能傳感器、人工智能、智能算法、大數(shù)據(jù)采集技術(shù)、存儲技術(shù)等的不斷成熟,智能制造裝備領(lǐng)域內(nèi)技術(shù)復(fù)雜度凸顯,裝備性能得以優(yōu)化,成為不同國家或地區(qū)關(guān)注的重點,專利申請量及主題強度不斷提升。但從智能制造裝備領(lǐng)域技術(shù)主題強度變化趨勢上看,Topic79、Topic76、Topic72、Topic54、Topic25、Topic3 6個技術(shù)主題2000—2012年變化不明顯,尚未出現(xiàn)增強或減弱的趨勢,因此,本文后續(xù)研究將該類技術(shù)主題刪除,保障顛覆性技術(shù)識別的準確性。

        4.2.2智能制造裝備領(lǐng)域技術(shù)主題融合性測度

        基于技術(shù)主題共現(xiàn)強度,構(gòu)建智能制造裝備領(lǐng)域技術(shù)主題共現(xiàn)網(wǎng)絡(luò),測算技術(shù)主題接近中心性,利用接近中心性探究技術(shù)主題的融合程度。為動態(tài)觀測技術(shù)主題融合性變化,本文以時間為切片,分別構(gòu)建1966—2021年內(nèi)55個技術(shù)主題共現(xiàn)網(wǎng)絡(luò),并展示2020年智能制造裝備領(lǐng)域技術(shù)主題共現(xiàn)網(wǎng)絡(luò),如圖7所示。

        通過構(gòu)建不同年份下技術(shù)主題共現(xiàn)網(wǎng)絡(luò),得到技術(shù)主題接近中心性變化趨勢。由于2000年前各技術(shù)主題共現(xiàn)強度較弱,接近中心性不顯著,因此僅展示2000年后技術(shù)主題的接近中心性變化趨勢,如圖8所示。為保持數(shù)據(jù)一致性,下文同樣僅展示2000年后智能制造裝備領(lǐng)域的數(shù)據(jù)。此外,本文統(tǒng)計不同技術(shù)主題內(nèi)部IPC分類號,多維度分析技術(shù)主題融合性,結(jié)果如圖9所示。

        圖8中智能制造裝備領(lǐng)域部分技術(shù)主題接近中心性不斷增加,不同類型的技術(shù)主題關(guān)聯(lián)密切,融合度上升,該類技術(shù)主題共23個,主要包含Topic86、Topic84、Topic83、Topic74等。此外,觀測23個技術(shù)主題內(nèi)部IPC分類號種類,其中Topic21、Topic28、Topic43、Topic56、Topic59、Topic73、Topic84 7個技術(shù)主題的IPC號種類均超過200,技術(shù)主題涉及領(lǐng)域廣泛,包含不同類型的技術(shù),技術(shù)融合性明顯。

        4.2.3智能制造裝備領(lǐng)域技術(shù)主題創(chuàng)新性測度

        顛覆性技術(shù)改變原有技術(shù)范式,實現(xiàn)技術(shù)結(jié)構(gòu)變革,技術(shù)創(chuàng)新性明顯。本文利用結(jié)構(gòu)洞指數(shù)測度具有創(chuàng)新性的技術(shù)主題,結(jié)構(gòu)洞指數(shù)越高,技術(shù)主題獲取非冗余信息能力越強,實現(xiàn)技術(shù)創(chuàng)新可能性越高。本文采用有效規(guī)模及約束度指標測算技術(shù)主題結(jié)構(gòu)洞?;诩夹g(shù)主題成長性及融合性分析,得到23個技術(shù)主題,結(jié)合構(gòu)建的技術(shù)主題共現(xiàn)網(wǎng)絡(luò),其有效規(guī)模及約束度指數(shù)變化情況如圖10、圖11所示。

        由圖10可知,Topic22、Topic55、Topic62 3個技術(shù)主題有效規(guī)模變化不明顯,而Topic19有效規(guī)模呈下降趨勢,非冗余信息獲取能力低于其他類型的技術(shù)主題,擁有結(jié)構(gòu)洞數(shù)量較少,技術(shù)主題創(chuàng)新性不強,本文將該4個技術(shù)主題刪除;由圖11可知,各技術(shù)主題約束度不斷下降,技術(shù)主題網(wǎng)絡(luò)能力較強,對其他技術(shù)主題的依賴程度逐漸減小。

        通過技術(shù)主題成長性、融合性以及創(chuàng)新性篩選,得到19個技術(shù)主題,結(jié)合技術(shù)主題特征詞及概率,對19個技術(shù)主題進行命名,結(jié)果如表2所示。表2技術(shù)主題命名

        主題號IDTopic5太陽能電池電流與電壓控制技術(shù)Topic12智能協(xié)議轉(zhuǎn)化裝置Topic17智能手機傳感器技術(shù)Topic21智能數(shù)字控制Topic28機器人智能傳感控制技術(shù)Topic35智能輔助技術(shù)Topic43智能軟件Topic44智能裝配技術(shù)Topic46三維參數(shù)繪圖技術(shù)Topic56電機控制與連接技術(shù)Topic59導軌安裝技術(shù)Topic60耐高溫隔熱與散熱材料Topic65信號智能處理技術(shù)Topic69機器人識別掃描系統(tǒng)Topic73無線傳感器網(wǎng)絡(luò)芯片技術(shù)Topic74驅(qū)動器控制系統(tǒng)Topic83智能信息存儲Topic84智能數(shù)據(jù)采集系統(tǒng)Topic86原材料處理方法

        4.2.4智能制造裝備領(lǐng)域技術(shù)主題突破性測度

        技術(shù)異常檢測是另一種技術(shù)突破形式,通常認為異常點可能表示對已建立規(guī)則、主流趨勢和模式的革新和打破,具備技術(shù)突破的可能性[48-49]。本文采用K均值算法檢測技術(shù)異常點,分析智能制造裝備領(lǐng)域技術(shù)主題的異常,檢測結(jié)果如圖12所示。

        通過智能制造裝備領(lǐng)域技術(shù)主題異常檢測可知,Topic21(智能數(shù)字控制)、Topic84(智能數(shù)據(jù)采集系統(tǒng))兩個技術(shù)主題與其他類型技術(shù)主題距離較遠,屬于智能制造裝備領(lǐng)域異常點,具有實現(xiàn)技術(shù)突破的可能性。因此,本文認為“智能數(shù)字控制”以及“智能數(shù)據(jù)采集系統(tǒng)”兩項技術(shù)是智能制造裝備領(lǐng)域的候選顛覆性技術(shù)。

        4.3主題匹配性分析

        4.3.1網(wǎng)頁新聞數(shù)據(jù)主題命名

        網(wǎng)頁新聞數(shù)據(jù)LDA主題模型共提取72個主題,刪除無關(guān)主題及低強度主題44個,剩余28個主題與智能制造裝備領(lǐng)域相關(guān)。根據(jù)智能制造裝備網(wǎng)頁新聞數(shù)據(jù)LDA主題模型特征詞及概率分布,對提取的智能制造裝備領(lǐng)域網(wǎng)頁新聞數(shù)據(jù)主題進行命名,結(jié)果如表3所示。表3智能制造裝備領(lǐng)域網(wǎng)頁新聞數(shù)據(jù)主題命名

        NO.IDNO.ID1智能建筑設(shè)計15智能系統(tǒng)2航空航天發(fā)動機16智能制造業(yè)3科技成果轉(zhuǎn)化17智能物流4智能家居18燃料電池5腦機19智能制造平臺6智能服務(wù)20新能源電池7增材制造21人工智能汽車8高鐵列車22智能終端9智能機器人23物聯(lián)網(wǎng)傳感器10制造裝備設(shè)計24工業(yè)機器人11工業(yè)互聯(lián)網(wǎng)25增材制造藥物125G網(wǎng)絡(luò)芯片26人工智能13數(shù)字經(jīng)濟27智能交通14智能農(nóng)機28發(fā)動機設(shè)計

        4.3.2主題匹配結(jié)果

        根據(jù)28個網(wǎng)頁新聞數(shù)據(jù)主題以及兩個候選顛覆性技術(shù)主題各自包含的特征詞,并結(jié)合式(12)、式(13),測算候選顛覆性技術(shù)主題與智能制造裝備領(lǐng)域網(wǎng)頁新聞主題之間的匹配度,探究候選顛覆性技術(shù)的市場屬性,更準確識別智能制造裝備領(lǐng)域顛覆性技術(shù)。其中,主題匹配度如圖13所示。

        由圖13可知,“智能數(shù)字控制”“智能數(shù)據(jù)采集系統(tǒng)”兩項候選顛覆性技術(shù)與智能家居、智能服務(wù)、智能系統(tǒng)、人工智能汽車、智能交通、發(fā)動機設(shè)計6個網(wǎng)頁新聞數(shù)據(jù)主題實現(xiàn)匹配,表明“智

        能數(shù)字控制”“智能數(shù)據(jù)采集系統(tǒng)”已被市場中多個主體所關(guān)注,潛在競爭力較高。其中,智能系統(tǒng)、智能家居兩個主題與兩項候選顛覆性技術(shù)主題匹配度最高,表明“智能數(shù)字控制”“智能數(shù)據(jù)采集系統(tǒng)”對于智能系統(tǒng)以及智能家居影響力最強,技術(shù)作用顯著。

        基于以上研究結(jié)果,本文認為“智能數(shù)字控制”及“智能數(shù)據(jù)采集系統(tǒng)”兩項技術(shù)是智能制造裝備領(lǐng)域的顛覆性技術(shù)?!爸悄軘?shù)字控制”與傳統(tǒng)的控制技術(shù)不同,智能控制技術(shù)更強調(diào)設(shè)備的自動化和智能化,融合機械技術(shù)、計算機技術(shù)以及控制技術(shù),改變了傳統(tǒng)機械制造模式,實現(xiàn)高效率制動控制;此外,智能數(shù)字控制技術(shù)顯著提升產(chǎn)品質(zhì)量及生產(chǎn)精度,彌補機械精細化加工領(lǐng)域傳統(tǒng)機械制造模式“粗放”缺點?!爸悄軘?shù)據(jù)采集系統(tǒng)”能夠完成海量規(guī)模數(shù)據(jù)的采集,有效處理智能制造各環(huán)節(jié)數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)化為知識,有利于問題的分析,避免問題的重復(fù)發(fā)生。由于智能數(shù)據(jù)采集系統(tǒng)所具有的高效便捷特性以及良好的可擴展性,智能數(shù)據(jù)采集系統(tǒng)已經(jīng)得到越來越多國內(nèi)企業(yè)及客戶的支持,成為多個企業(yè)研究和開發(fā)的重點。

        5效果評估

        為評估論文提出方法的有效性,本文采用基于離群專利的顛覆性技術(shù)識別方法[9],識別智能制造裝備領(lǐng)域顛覆性技術(shù),并對比結(jié)果。由于篇幅限制,本文未展示識別過程。根據(jù)該方法,篩選得到智能制造裝備領(lǐng)域離群專利7 745條,涵蓋15種技術(shù)組合,并綜合科學關(guān)聯(lián)度、技術(shù)影響潛力等多個指標評估技術(shù)組合,運用孔多塞投票法識別顛覆性技術(shù)。最終得到智能數(shù)字控制、電機控制與連接技術(shù)、無線傳感器網(wǎng)絡(luò)芯片技術(shù)、智能信息存儲、智能數(shù)據(jù)采集系統(tǒng)屬于智能制造裝備領(lǐng)域的顛覆性技術(shù)。該方法最終的識別結(jié)果包含本研究的識別結(jié)果,識別結(jié)果相對寬泛,主要原因在于當技術(shù)組合得分相近時,該方法主觀性較強,且該方法尚未考慮技術(shù)的市場屬性,影響識別結(jié)果的準確性。而本文提出的方法,綜合專利文獻及網(wǎng)頁新聞兩種異構(gòu)數(shù)據(jù),識別過程客觀,考慮技術(shù)的市場屬性,能顯著提升顛覆性技術(shù)識別的準確性。

        6研究結(jié)論

        本文利用專利文獻及網(wǎng)頁新聞數(shù)據(jù),提取不同類型的主題,從成長性、突破性、創(chuàng)新性及融合性4個維度識別候選顛覆性技術(shù)主題,并結(jié)合網(wǎng)頁新聞數(shù)據(jù),探究候選顛覆性技術(shù)的市場屬性,最終完成顛覆性技術(shù)識別。本研究結(jié)合不同數(shù)據(jù)源,利用文本挖掘方法準確地識別顛覆性技術(shù),對于加快顛覆性技術(shù)研發(fā)具有重要的參考價值。

        智能制造裝備領(lǐng)域顛覆性技術(shù)識別案例中,利用LDA模型從專利文獻中提取87個技術(shù)主題,其中“智能數(shù)字控制”以及“智能數(shù)據(jù)采集系統(tǒng)”兩個技術(shù)主題符合顛覆性技術(shù)成長性、融合性、創(chuàng)新性以及突破性特征;結(jié)合網(wǎng)頁新聞數(shù)據(jù)主題,得到“智能數(shù)字控制”“智能數(shù)據(jù)采集系統(tǒng)”與多個網(wǎng)頁新聞主題匹配,兩種技術(shù)已被市場所接受,技術(shù)影響力較強,能夠改變原有生產(chǎn)方式,屬于智能制造裝備領(lǐng)域顛覆性技術(shù)。

        案例研究結(jié)合專利文獻及網(wǎng)頁新聞兩種異構(gòu)數(shù)據(jù)識別顛覆性技術(shù),研究結(jié)論清晰明確,說明綜合專利數(shù)據(jù)以及網(wǎng)頁新聞數(shù)據(jù)能夠有效識別顛覆性技術(shù)。但限于篇幅,本研究對智能制造裝備領(lǐng)域網(wǎng)頁新聞數(shù)據(jù)挖掘不充分,技術(shù)對市場的影響體現(xiàn)不足。未來研究將結(jié)合深度學習模型,深入分析技術(shù)與市場之間的關(guān)系,充分體現(xiàn)技術(shù)的市場屬性。

        參考文獻

        [1]Bower J L,Christensen C M.Disruptive Technologies:Catching the Wave[J].The Journal of Product Innovation Management,1995,28(2):155.

        [2]孫永福,王禮恒,孫棕檀,等.引發(fā)產(chǎn)業(yè)變革的顛覆性技術(shù)內(nèi)涵與遴選研究[J].中國工程科學,2017,19(5):9-16.

        [3]Collins R W,Hevner A R,Linger R C.Evaluating a Disruptive Innovation:Function Extraction Technology in Software Development[C]//2011 44th Hawaii International Conference on System Sciences,2011.

        [4]Hang C C,Chen J,Yu D.An Assessment Framework for Disruptive Innovation[J].IEEE Engineering Management Review,2013,41(4):109-118.

        [5]Sainio L M,Puumalainen K.Evaluating Technology Disruptiveness in a Strategic Corporate Context:A Case Study[J].Technological Forecasting and Social Change,2007,74(8):1315-1333.

        [6]Zhang Y,Robinson D,Porter A L,et al.Technology Roadmapping for Competitive Technical Intelligence[J].Technological Forecasting and Social Change,2016,110(9):175-186.

        [7]Buchanan B,Corken R.A Toolkit for the Systematic Analysis of Patent Data to Assess a Potentially Disruptive Technology[J].Intellectual Property Office United Kingdom,2010.

        [8]欒春娟,程昉.技術(shù)的市場潛力測度與預(yù)測——基于技術(shù)顛覆潛力與技術(shù)成熟度綜合指標[J].科學學研究,2016,34(12):1761-1768,1816.

        [9]羅素平,寇翠翠,金金,等.基于離群專利的顛覆性技術(shù)預(yù)測——以中藥專利為例[J].情報理論與實踐,2019,42(7):165-170.

        [10]李乾瑞,郭俊芳,黃穎,等.基于專利計量的顛覆性技術(shù)識別方法研究[J].科學學研究,2021,39(7):1166-1175.

        [11]Momeni A,Rost K.Identification and Monitoring of Possible Disruptive Technologies By Patent-development Paths and Topic Modeling[J].Technological Forecasting and Social Change,2016,(104):16-29.

        [12]張金柱,張曉林.利用引用科學知識突變識別突破性創(chuàng)新[J].情報學報,2014,33(3):259-266.

        [13]于光輝,寧鐘,李昊夫.基于專利和Bass模型的顛覆性技術(shù)識別方法研究[J].科學學研究,2021,39(8):1467-1473,1536.

        [14]黃魯成,成雨,吳菲菲,等.關(guān)于顛覆性技術(shù)識別框架的探索[J].科學學研究,2015,33(5):654-664.

        [15]李乾瑞,郭俊芳,黃穎,等.基于突變-融合視角的顛覆性技術(shù)主題演化研究[J].科學學研究,2021,39(12):2129-2139.

        [16]劉忠寶,康嘉琦,張靜.基于主題突變檢測的顛覆性技術(shù)識別——以無人機技術(shù)領(lǐng)域為例[J].科技導報,2020,38(20):97-105.

        [17]Pilkington A.Exploring the Disruptive Nature of Disruptive Technology[C]//IEEE International Conference on Industrial Engineering &Engineering Management,2009.

        [18]Dotsika F,Watkins A.Identifying Potentially Disruptive Trends By Means of Keyword Network Analysis[J].Technological Forecasting & Social Change,2017,119:114-127.

        [19]白光祖,鄭玉榮,吳新年,等.基于文獻知識關(guān)聯(lián)的顛覆性技術(shù)預(yù)見方法研究與實證[J].情報雜志,2017,36(9):38-44.

        [20]Diab S,Kanyaru J,Zantout H.Disruptive Innovation:A Dedicated Forecasting Framework[M].Agent and Multi-Agent Systems:Technologies and Applications,2015.

        [21]Keller A,Hüsig S.Ex-ante Identification of Disruptive Innovations in the Software Industry Applied to Web Applications:The Case of Microsofts vs.Googles Office Applications[J].Technological Forecasting & Social Change,2009,76(8):1044-1054.

        [22]Ganguly A,Nilchiani R,F(xiàn)arr J V.Defining a Set of Metrics to Evaluate the Potential Disruptiveness of a Technology[J].Engineering Management Journal;EMJ,2010,22(1):34-44.

        [23]Linton J D.Forecasting the Market Diffusion of Disruptive and Discontinuous Innovation[J].Engineering Management IEEE Transactions On,2002,49(4):365-374.

        [24]Klenner P,Hüsig S, Dowling M.Ex-ante Evaluation of Disruptive Susceptibility in Established Value Networks—When are Markets Ready for Disruptive Innovations?[J].Research Policy,2013,42(4):914-927.

        [25]Benzidia S,Luca R M,Boiko S.Disruptive Innovation,Business Models,and Encroachment Strategies:Buyers Perspective on Electric and Hybrid Vehicle Technology[J].Technological Forecasting and Social Change,2021,165:120520.

        [26]劉安蓉,李莉,曹曉陽,等.顛覆性技術(shù)概念的戰(zhàn)略內(nèi)涵及政策啟示[J].中國工程科學,2018,20(6):7-13.

        [27]Paap J,Katz R.Anticipating Disruptive Innovation[J].IEEE Engineering Management Review,2004,32(4):74-85.

        [28]Yu D,Chang C H.A Reflective Review of Disruptive Innovation Theory[C]//PICMET08-2008 Portland International Conference on Management of Engineering & Technology.IEEE,2008.

        [29]欒恩杰,孫棕檀,李輝,等.國防顛覆性技術(shù)在航天領(lǐng)域的發(fā)展應(yīng)用研究[J].中國工程科學,2017,19(5):74-78.

        [30]劉玉梅,溫馨,孟翔飛.基于技術(shù)軌道躍遷的突破性技術(shù)預(yù)測方法及應(yīng)用研究[J].情報雜志,2021,40(11):39-45,15.

        [31]黃魯成,蔣林杉,吳菲菲.萌芽期顛覆性技術(shù)識別研究[J].科技進步與對策,2019,36(1):10-17.

        [32]Nagy D,Schuessler J,Dubinsky A.Defining and Identifying Disruptive Innovations[J].Industrial Marketing Management,2016,57:119-126.

        [33]張佳維,董瑜.顛覆性技術(shù)識別指標的研究進展[J].情報理論與實踐,2020,43(6):194-199,193.

        [34]Thorleuchter D,Poel D.Weak Signal Identification with Semantic Web Mining[J].Expert Systems with Applications,2013,40(12):4978-4985.

        [35]Bird S,Klein E,Loper E.Natural Language Processing with Python:Analyzing Text with the Natural Language Toolkit[M].OReilly Media,Inc,2009.

        [36]Viterbi A J.Viterbi Algorithm[J].Scholarpedia,2009,4(1):6246.

        [37]Blei D M,Ng A Y,Jordan M I.Latent Dirichlet Allocation[J].The Journal of Machine Learning Research,2003,3:993-1022.

        [38]趙蓉英,戴祎璠,王旭.基于LDA模型與ATM模型的學者影響力評價研究——以我國核物理學科為例[J].情報科學,2019,37(6):3-9.

        [39]Salton G,Buckley C.Term-weighting Approaches in Automatic Text Retrieval[J].Information Processing & Management,1988,24(5):513-523.

        [40]李盛竹,蔣婧秋.企業(yè)“互聯(lián)網(wǎng)+”信息技術(shù)融合應(yīng)用能力的識別研究——基于社會網(wǎng)絡(luò)分析視角[J].現(xiàn)代情報,2016,36(5):98-103.

        [41]劉俊婉,龍志昕,王菲菲.基于LDA主題模型與鏈路預(yù)測的新興主題關(guān)聯(lián)機會發(fā)現(xiàn)研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2019,3(1):104-117.

        [42]翟東升,郭程,張杰,等.采用異常檢測的技術(shù)機會識別方法研究[J].現(xiàn)代圖書情報技術(shù),2016,(10):81-90.

        [43]Rotolo D,Hicks D,Martin B R.What is an Emerging Technology?[J].Research Policy,2015,44(10):1827-1843.

        [44]Alkemade F,Suurs R A A.Patterns of Expectations for Emerging Sustainable Technologies[J].Technological Forecasting and Social Change,2012,79(3):448-456.

        [45]李綱,余輝,毛進.基于多層語義相似的技術(shù)供需文本匹配模型研究[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2021,5(12):1-16,25-36.

        [46]畢達天,楚啟環(huán),曹冉.基于文本挖掘的消費者差評意愿的影響因素研究[J].情報理論與實踐,2020,43(10):137-143.

        [47]Mann G S,Mimno D,McCallum A.Bibliometric Impact Measures Leveraging Topic Analysis[C]//Proceedings of the 6th ACM/IEEE-CS Joint Conference on Digital Libraries.New York:ACMPress,2006.

        [48]伊惠芳,劉細文,龍藝璇.技術(shù)創(chuàng)新全視角下技術(shù)機會發(fā)現(xiàn)研究進展[J].圖書情報工作,2021,65(7):132-142.

        [49]Chandola V,Banerjee A,Kumar V.Anomaly Detection:A Survey[J].Acm Computing Surveys,2009,41(3):1-58.

        (責任編輯:郭沫含)

        猜你喜歡
        文本挖掘
        基于貝葉斯分類器的中文垃圾短信辨識
        科技資訊(2017年5期)2017-04-12 15:18:52
        基于潛在特征的汽車評論要素挖掘
        基于評論信息的淘寶服裝類評分體系優(yōu)化
        商情(2016年32期)2017-03-04 00:27:28
        數(shù)據(jù)挖掘技術(shù)在電站設(shè)備故障分析中的應(yīng)用
        軟件導刊(2016年12期)2017-01-21 15:55:21
        基于LDA模型的95598熱點業(yè)務(wù)工單挖掘分析
        文本數(shù)據(jù)挖掘在電子商務(wù)網(wǎng)站個性化推薦中的應(yīng)用
        商(2016年34期)2016-11-24 16:28:51
        從《遠程教育》35年載文看遠程教育研究趨勢
        基于文獻的中西醫(yī)結(jié)合治療腦梗死藥物使用情況分析
        基于改進Hadoop云平臺的海量文本數(shù)據(jù)挖掘
        慧眼識璞玉,妙手煉渾金
        久久精品国产亚洲av成人擦边 | 午夜精品久久久久久久久久久久| 国产网站视频| 藏春阁福利视频| 色欲AV成人无码精品无码| 亚洲一区二区三区麻豆| 亚洲av无码国产精品色| 性激烈的欧美三级视频| 日韩AV无码一区二区三| 日美韩精品一区二区三区| 手机看片久久第一人妻| 大陆极品少妇内射aaaaaa| 久久久亚洲经典视频| 羞涩色进入亚洲一区二区av| 精品无码久久久久久久久水蜜桃| 人人爽人人爱| 亚洲中文字幕巨乳人妻| 久久久亚洲成年中文字幕| 久人人爽人人爽人人片av| 亚洲av无码片一区二区三区| 国产男女做爰猛烈视频网站| 熟女一区二区中文字幕| 日本中文字幕一区二区高清在线 | 性色av一区二区三区四区久久| 丰满人妻一区二区三区视频| 激情偷乱人成视频在线观看| 精品九九视频| 大香蕉青青草视频在线| 日本另类αv欧美另类aⅴ| 无码少妇一级AV便在线观看| 中文字幕成人精品久久不卡| 久久久国产精品123| 日本爽快片18禁免费看| 亚欧免费视频一区二区三区| 日本精品一级二区三级| 人禽交 欧美 网站| 中文字幕在线码一区| 白色白色在线视频播放平台| 男人添女人囗交做爰视频| 婷婷综合缴情亚洲| 伊人久久婷婷综合五月97色|