亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合專利數(shù)據(jù)與社交媒體數(shù)據(jù)的潛在顛覆性技術(shù)識(shí)別——基于深度學(xué)習(xí)模型

        2024-03-11 07:18:10馮立杰秦浩王金鳳劉鵬仵軒張芷芯
        情報(bào)學(xué)報(bào) 2024年2期
        關(guān)鍵詞:情感模型

        馮立杰,秦浩,王金鳳,劉鵬,仵軒,張芷芯

        (1. 鄭州大學(xué)管理學(xué)院,鄭州 450001;2. 上海海事大學(xué)物流工程學(xué)院,上海 201306;3. 河南省創(chuàng)新方法工程技術(shù)研究中心,鄭州 450001;4. 上海海事大學(xué)中國(guó)(上海)自貿(mào)區(qū)供應(yīng)鏈研究院,上海 201306)

        0 引 言

        顛覆性技術(shù)被認(rèn)為是推動(dòng)技術(shù)創(chuàng)新和經(jīng)濟(jì)增長(zhǎng)的重要驅(qū)動(dòng)力[1]。作為技術(shù)創(chuàng)新的重要內(nèi)容,顛覆性技術(shù)具有強(qiáng)烈的破壞力,能夠打破原有技術(shù)生命周期,構(gòu)建新的技術(shù)軌道,并逐漸取代現(xiàn)有主流技術(shù),從而對(duì)社會(huì)產(chǎn)生深遠(yuǎn)影響[2]。因此,通過(guò)科學(xué)方法識(shí)別潛在顛覆性技術(shù),將有助于定位重要的研發(fā)方向,合理分配資源配置,指導(dǎo)科技決策與規(guī)劃,從而進(jìn)一步提升企業(yè)競(jìng)爭(zhēng)力,幫助國(guó)家搶占發(fā)展先機(jī)[3]。

        對(duì)此,有學(xué)者嘗試采用多種方法識(shí)別顛覆性技術(shù),主要包括基于專家經(jīng)驗(yàn)的識(shí)別方法、基于模型的識(shí)別方法以及基于數(shù)據(jù)挖掘的識(shí)別方法等。基于專家經(jīng)驗(yàn)的識(shí)別方法主要是德?tīng)柗品╗4]、技術(shù)路線圖[5]、調(diào)查問(wèn)卷法[6]等。這些方法囿于專家知識(shí)范圍的影響,具有較強(qiáng)的主觀性,且專家資源較為稀缺,難以實(shí)現(xiàn)顛覆性技術(shù)識(shí)別的準(zhǔn)確性與全面性?;谀P偷淖R(shí)別方法主要是以一定的理論框架和標(biāo)準(zhǔn)為基礎(chǔ),結(jié)合統(tǒng)計(jì)方法構(gòu)建相關(guān)模型以識(shí)別顛覆性技術(shù)。例如,于光輝等[7]采用專利引用信息和Bass模型構(gòu)建了對(duì)顛覆性技術(shù)識(shí)別和判斷的新方法,并用技術(shù)擴(kuò)散的S形規(guī)律進(jìn)行驗(yàn)證;Cheng等[8]基于SIRS(susceptible, infectious, recovered, suscepti‐ble)流行病模型,提出了一種顛覆性技術(shù)擴(kuò)散模型,用于識(shí)別潛在的顛覆性技術(shù)。但這些方法受限于學(xué)者自身領(lǐng)域?qū)I(yè)知識(shí)與市場(chǎng)信息,難以抽象顛覆性技術(shù)的核心內(nèi)容或者屬性,從而影響顛覆性技術(shù)識(shí)別的準(zhǔn)確性。隨著數(shù)據(jù)驅(qū)動(dòng)概念的深入,基于數(shù)據(jù)挖掘的識(shí)別方法越來(lái)越受到關(guān)注。當(dāng)前,基于數(shù)據(jù)挖掘的識(shí)別方法主要是結(jié)合統(tǒng)計(jì)學(xué)、文獻(xiàn)計(jì)量學(xué)以及指標(biāo)評(píng)估等方法識(shí)別顛覆性技術(shù)。例如,陳育新等[9]基于技術(shù)與市場(chǎng)構(gòu)建顛覆性潛力測(cè)度指標(biāo),通過(guò)結(jié)合滑動(dòng)窗口與LDA(latent Dirichlet allo‐cation)主題模型,提出了一個(gè)能夠動(dòng)態(tài)識(shí)別具有顛覆性潛力的技術(shù),并用IPC(international patent classification)關(guān)聯(lián)強(qiáng)度驗(yàn)證識(shí)別結(jié)果;李乾瑞等[10]基于專利視角,運(yùn)用熵權(quán)法和模糊一致矩陣方法,從4個(gè)維度構(gòu)建了一套系統(tǒng)的顛覆性技術(shù)識(shí)別體系,并對(duì)5個(gè)技術(shù)領(lǐng)域展開(kāi)了3個(gè)維度的對(duì)比分析以驗(yàn)證模型的可行性;Dotsika等[11]以科技文獻(xiàn)為數(shù)據(jù)源,依據(jù)關(guān)鍵詞在共現(xiàn)網(wǎng)絡(luò)中的接近度和遠(yuǎn)離度來(lái)識(shí)別顛覆性技術(shù)。這些方法具有較強(qiáng)的客觀性,在一定程度上降低了專家對(duì)于識(shí)別結(jié)果的影響。但顛覆性技術(shù)早期特征信號(hào)較弱,識(shí)別難度較高,且上述方法主要考慮技術(shù)本身,較少考慮市場(chǎng)等因素。

        為進(jìn)一步彌補(bǔ)僅考慮技術(shù)本身導(dǎo)致的顛覆性技術(shù)識(shí)別的低準(zhǔn)確性,部分學(xué)者結(jié)合多源數(shù)據(jù)進(jìn)行顛覆性技術(shù)識(shí)別。例如,馬永紅等[12]運(yùn)用LDA主題模型從專利中提取技術(shù)主題,并采用4個(gè)特征識(shí)別候選顛覆性技術(shù),基于網(wǎng)頁(yè)新聞數(shù)據(jù)分析技術(shù)的市場(chǎng)屬性,進(jìn)而識(shí)別出顛覆性技術(shù);譚曉等[13]基于論文、專利與項(xiàng)目等數(shù)據(jù)源,結(jié)合社團(tuán)發(fā)現(xiàn)、主題識(shí)別、主題演化等方法,構(gòu)建了科學(xué)-技術(shù)-市場(chǎng)模型用于識(shí)別顛覆性技術(shù);呂璐成等[14]基于專家知識(shí)和技術(shù)層次體系確定候選顛覆性技術(shù),結(jié)合專利、論文、基金、企業(yè)與輿情等數(shù)據(jù)源評(píng)估顛覆性潛力,并界定了兩類顛覆性技術(shù)。綜上所述,已有文獻(xiàn)從多源數(shù)據(jù)出發(fā),從多個(gè)維度開(kāi)展顛覆性技術(shù)的識(shí)別,進(jìn)一步提升了顛覆性技術(shù)識(shí)別的準(zhǔn)確性。

        顯然,現(xiàn)有顛覆性技術(shù)的識(shí)別文獻(xiàn)從多方面進(jìn)行了有益探索,但仍存在以下不足。一是鮮有研究考慮社交媒體數(shù)據(jù)對(duì)于顛覆性技術(shù)識(shí)別的重要性。顛覆性技術(shù)在發(fā)展的過(guò)程中,以滿足用戶需求為導(dǎo)向,能夠吸引主流用戶[15],而社交媒體是社會(huì)大眾反映對(duì)顛覆性技術(shù)關(guān)注度與情感傾向的重要平臺(tái)。通過(guò)社交媒體數(shù)據(jù),能夠?qū)撛陬嵏残约夹g(shù)作進(jìn)一步分類,以提升顛覆性技術(shù)早期識(shí)別的準(zhǔn)確性。二是鮮有研究利用深度學(xué)習(xí)模型分析顛覆性技術(shù)的指標(biāo)特征,從海量專利中挖掘出深層次的復(fù)雜非線性顛覆性技術(shù)關(guān)鍵特征,并運(yùn)用該特征來(lái)識(shí)別未來(lái)潛在顛覆性技術(shù),從而進(jìn)一步減少專家經(jīng)驗(yàn)的主觀性,并提高潛在顛覆性技術(shù)識(shí)別的效率。

        鑒于此,為避免專家經(jīng)驗(yàn)評(píng)估帶來(lái)的主觀性以及上述研究較少考慮社交媒體數(shù)據(jù)等問(wèn)題,本文擬基于專利與社交媒體雙數(shù)據(jù)源,通過(guò)結(jié)合深度學(xué)習(xí)模型、BERTopic主題建模等,提出一種潛在顛覆性技術(shù)的識(shí)別路徑。具體研究路徑如下:首先,基于專利數(shù)據(jù),劃分?jǐn)?shù)據(jù)集,構(gòu)建出專利指標(biāo)與技術(shù)影響力之間的關(guān)系;其次,依托雙向長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(bi-directional long short-term memory,Bi-LSTM)擬合專利指標(biāo)與技術(shù)影響力之間的關(guān)系,預(yù)測(cè)出候選顛覆性技術(shù),并結(jié)合BERTopic提取技術(shù)主題;再其次,通過(guò)BERTopic基于社交媒體數(shù)據(jù)提取出社會(huì)主題,并通過(guò)關(guān)注度和情感傾向?qū)ι鐣?huì)主題進(jìn)行評(píng)價(jià);最后,通過(guò)語(yǔ)義相似度,將社會(huì)主題與技術(shù)主題匹配映射,并將技術(shù)主題分為高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度與低關(guān)注度-消極態(tài)度4種類型,根據(jù)4種類型技術(shù)主題各自的特點(diǎn),識(shí)別出潛在顛覆性技術(shù)。

        1 理論基礎(chǔ)

        1.1 雙向長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(Bi-LSTM)

        長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(long short term memory,LSTM)是一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recur‐rent neural network,RNN)結(jié)構(gòu)的改進(jìn)模型,相較于RNN,LSTM解決了RNN存留的“梯度爆炸”和“梯度消失”等問(wèn)題[16],并考慮了輸入和輸出之間的時(shí)間關(guān)系[17]。LSTM由遺忘門Ft、輸入門It和輸出門Ot共3個(gè)門結(jié)構(gòu)組成,并由這3個(gè)門來(lái)更新網(wǎng)絡(luò)。LSTM中的內(nèi)存單元Ct和隱藏狀態(tài)Ht由前狀態(tài)Ct-1和Ht-1更新得到,具體更新過(guò)程計(jì)算公式[18]為

        其中,Xt為t時(shí)刻輸入LSTM的數(shù)據(jù);Ht為L(zhǎng)STM在時(shí)間t更新網(wǎng)絡(luò)的輸出;W為每個(gè)門單元的權(quán)重矩陣;b為每個(gè)門的偏置向量;σ為sigmoid函數(shù);tanh為tanh函數(shù)。LSTM模型結(jié)構(gòu)如圖1[19]所示。

        圖1 LSTM模型結(jié)構(gòu)[19]

        LSTM模型只能通過(guò)上一時(shí)刻的時(shí)序信息預(yù)測(cè)下一時(shí)刻的信息,為了充分利用文本信息,本文引入雙向長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)(Bi-LSTM),該模型由兩個(gè)方向相反的LSTM模型組成,同時(shí)處理文本信息,以獲得具有相反時(shí)間序列的兩個(gè)隱藏層狀態(tài),并將其堆疊以獲得相同的輸出。Bi-LSTM模型結(jié)構(gòu)如圖2[20]所示。

        圖2 Bi-LSTM結(jié)構(gòu)模型[20]

        截至目前,Bi-LSTM已被廣泛應(yīng)用于變壓器故障診斷[21]、交通事故檢測(cè)與狀態(tài)分析[22]、醫(yī)療保健數(shù)據(jù)監(jiān)測(cè)[23]、專利數(shù)據(jù)效應(yīng)匹配[24]等眾多領(lǐng)域,且在不同領(lǐng)域均表現(xiàn)出了良好性能。但該模型有較高的技術(shù)環(huán)境要求:一是需要質(zhì)量和數(shù)量較高的數(shù)據(jù)集,并進(jìn)行有效的數(shù)據(jù)清洗與預(yù)處理;二是Bi-LSTM在訓(xùn)練過(guò)程中需要大量的參數(shù)調(diào)整和優(yōu)化,以達(dá)到最佳性能。

        隨著科研大數(shù)據(jù)的發(fā)展,人們能夠獲取更多顛覆性技術(shù)的特征,相較于人工定義顛覆性技術(shù)特征,深度學(xué)習(xí)模型依據(jù)自身多層非線性結(jié)構(gòu),在處理復(fù)雜數(shù)據(jù)時(shí),能夠更加全面、準(zhǔn)確地提取數(shù)據(jù)特征,從而預(yù)測(cè)出候選顛覆性技術(shù)[25]。鑒于此,本文擬運(yùn)用Bi-LSTM擬合專利指標(biāo)數(shù)據(jù)與技術(shù)影響力之間的關(guān)系,以預(yù)測(cè)候選顛覆性技術(shù)。

        1.2 BERTopic主題建模

        BERTopic是一種主題建模技術(shù),能夠從海量專利文獻(xiàn)中提取技術(shù)主題及其關(guān)鍵詞。由于其能在提取技術(shù)主題時(shí)保留重要的詞匯,且相較于LDA、STM(structural topic model)[26]等模型,能夠充分考慮文本語(yǔ)義信息。因此,眾多學(xué)者利用BERTopic提取了專利主題[27]、在線評(píng)論主題[28]、論文主題[29]等,這些研究均驗(yàn)證了BERTopic應(yīng)用在不同文本的普適性。故本文使用BERTopic主題建模模型提取潛在顛覆性技術(shù)主題。BERTopic模型在BERT(bi-directional encoder representation from transform‐ers)基礎(chǔ)上,使用了UMAP(uniform manifold ap‐proximation and projection)降維、HDBSCAN(hier‐archical density-based spatial clustering of applications with noise)文本聚類和c-TF-IDF(class-based TFIDF)提取主題詞3個(gè)步驟,其運(yùn)行原理如圖3[30]所示。

        圖3 BERTopic運(yùn)行原理[30]

        鑒于此,本文擬運(yùn)用BERTopic主題建模,分別基于專利數(shù)據(jù)提取候選顛覆性技術(shù)主題及主題關(guān)鍵詞和基于社交媒體數(shù)據(jù)提取社會(huì)主題及主題關(guān)鍵詞??紤]到專利數(shù)據(jù)和社交媒體數(shù)據(jù)不同主體、不同訴求和不同關(guān)注等因素導(dǎo)致的差異,本文通過(guò)語(yǔ)義相似度對(duì)兩者進(jìn)行匹配映射,并從社會(huì)大眾關(guān)注度和社會(huì)大眾情感傾向兩個(gè)維度對(duì)社會(huì)主題進(jìn)行評(píng)價(jià),從而實(shí)現(xiàn)對(duì)技術(shù)主題的分類。

        2 研究路徑

        本文通過(guò)融合專利數(shù)據(jù)與社交媒體數(shù)據(jù),并依托Bi-LSTM與BERTopic主題建模,構(gòu)建了潛在顛覆性技術(shù)識(shí)別研究路徑,如圖4所示。

        圖4 研究路徑

        2.1 專利數(shù)據(jù)收集及數(shù)據(jù)集劃分

        本文通過(guò)制定與具象技術(shù)主題相關(guān)的檢索策略來(lái)收集相關(guān)專利數(shù)據(jù)。為提升數(shù)據(jù)分析的有效性,在正式分析之前,需要對(duì)已經(jīng)收集的專利數(shù)據(jù)進(jìn)行預(yù)處理。首先,對(duì)檢索到的專利進(jìn)行甄選,剔除與具象技術(shù)領(lǐng)域相關(guān)度不高的專利;其次,由于最短顛覆性技術(shù)認(rèn)證時(shí)限為6年[31],本文按時(shí)間段將專利數(shù)據(jù)集劃分為訓(xùn)練集與預(yù)測(cè)集,并保證每個(gè)數(shù)據(jù)集的時(shí)間跨度至少為6年;最后,保存每個(gè)專利對(duì)應(yīng)的指標(biāo),為后續(xù)構(gòu)建深度學(xué)習(xí)模型奠定基礎(chǔ)。

        2.2 顛覆性技術(shù)特征選擇

        2.2.1 顛覆性技術(shù)指標(biāo)選取及體系構(gòu)建

        在文獻(xiàn)計(jì)量領(lǐng)域中,許多學(xué)者從技術(shù)、科學(xué)、市場(chǎng)等多種角度出發(fā),綜合多個(gè)指標(biāo)描述顛覆性技術(shù)[32]。結(jié)合顛覆性技術(shù)特性和現(xiàn)有專利指標(biāo)體系,同時(shí)考慮指標(biāo)的可獲得性,本文使用技術(shù)類、科學(xué)類以及市場(chǎng)類3類共8項(xiàng)指標(biāo)對(duì)顛覆性技術(shù)各方面特征進(jìn)行測(cè)度,構(gòu)建顛覆性技術(shù)的技術(shù)指標(biāo)體系。各類指標(biāo)名稱以及衡量方式如表1所示。

        表1 指標(biāo)名稱及衡量方式

        (1)技術(shù)類指標(biāo)[33]:技術(shù)類指標(biāo)包括技術(shù)新穎性(technological novelty,TN)、技術(shù)價(jià)值(techno‐logical value,TV)、技術(shù)涵蓋度(technological scope,TS)、專利權(quán)人數(shù)量(patentees,PAT)、發(fā)明人數(shù)量(inventors,INV)等指標(biāo)。技術(shù)新穎性描述了目標(biāo)專利對(duì)其他技術(shù)的參考程度,即引用其他專利的數(shù)量越多,其新穎性就越低;技術(shù)價(jià)值描述了目標(biāo)專利對(duì)其他技術(shù)的影響程度,即被其他專利引用的數(shù)量越多,其影響力就越高;技術(shù)涵蓋度描述了目標(biāo)專利技術(shù)覆蓋的范圍,即專利所屬類別數(shù)越多,其技術(shù)范圍度就越廣;專利權(quán)人數(shù)量描述了目標(biāo)專利的未來(lái)技術(shù)發(fā)展力與影響力,專利權(quán)人的能力與水平將影響技術(shù)的未來(lái)發(fā)展與影響力,即專利擁有的專利權(quán)人越多,其技術(shù)未來(lái)發(fā)展力與影響力就越高;發(fā)明人數(shù)量描述了目標(biāo)專利的未來(lái)技術(shù)發(fā)展的潛力,擁有多個(gè)發(fā)明人的專利往往具有更大的發(fā)展?jié)摿Α?/p>

        (2)科學(xué)類指標(biāo)[34]:科學(xué)類指標(biāo)包括科學(xué)關(guān)聯(lián)度(scientific relevance,SR)指標(biāo)??茖W(xué)關(guān)聯(lián)度描述了目標(biāo)專利與科學(xué)文獻(xiàn)的關(guān)聯(lián)程度,即專利引用非專利文獻(xiàn)的數(shù)量越多,其與科學(xué)的關(guān)聯(lián)度就越高。

        (3)市場(chǎng)類指標(biāo):市場(chǎng)類指標(biāo)包括專利族大?。╪umber of patent families,NF)、專利競(jìng)爭(zhēng)力(pat‐ent competitiveness,PC)等指標(biāo)。專利族大小描述了目標(biāo)專利在全球布局的廣度,即專利的專利族越大,其在全球布局區(qū)域越廣,花費(fèi)成本越高[35];專利競(jìng)爭(zhēng)力描述了目標(biāo)專利在市場(chǎng)的競(jìng)爭(zhēng)能力,通常用權(quán)利要求數(shù)來(lái)表征,即專利的權(quán)利要求數(shù)越多,其競(jìng)爭(zhēng)力越強(qiáng)[36]。

        2.2.2 顛覆性技術(shù)影響力評(píng)估

        高技術(shù)影響力作為顛覆性技術(shù)的核心特征,常常被專利的前向引用次數(shù)所衡量。即若一項(xiàng)技術(shù)越被頻繁、廣泛地應(yīng)用到未來(lái)技術(shù)中,則意味著其具有越大的技術(shù)影響力[37]。但針對(duì)特定領(lǐng)域而言,高被引專利并不一定是被本領(lǐng)域所引用,也有可能是被其他領(lǐng)域所引用。即對(duì)于其他技術(shù)領(lǐng)域而言是顛覆性技術(shù),對(duì)本領(lǐng)域而言只是高價(jià)值專利。此外,有些顛覆性技術(shù)早期影響力較弱,意味著前向引用次數(shù)較少。因此,直接使用專利的前向引用次數(shù)來(lái)衡量技術(shù)的影響力并不妥當(dāng)。鑒于此,本文采用黃魯成等[38]提出的NPCIA(novel patent cross-impact analysis)法,用于衡量技術(shù)間的交叉影響及技術(shù)影響力(technological influence,TI),計(jì)算公式為

        其中,N(j)為包含技術(shù)j的專利數(shù)量;N(i∩j)為同時(shí)包含技術(shù)i和技術(shù)j的專利數(shù)量;Si為技術(shù)影響力系數(shù);n為技術(shù)數(shù)量;i和j為技術(shù)的子集;aij為技術(shù)i對(duì)技術(shù)j的交叉影響。

        本文將技術(shù)影響力按大小分為高和低兩個(gè)等級(jí)。為了更加準(zhǔn)確地設(shè)置技術(shù)影響力大小之間的閾值,需探究不同閾值大小與模型預(yù)測(cè)準(zhǔn)確率之間的關(guān)系。因此,本文使用回歸分析,通過(guò)比對(duì)不同閾值大小對(duì)預(yù)測(cè)模型準(zhǔn)確率的影響,確定合理的技術(shù)影響力大小的閾值[39]。將大于等于該閾值的專利樣本視為高技術(shù)影響力專利,并貼上標(biāo)簽“1”,其余專利樣本視為低技術(shù)影響力專利,并貼上標(biāo)簽“0”,為后續(xù)深度學(xué)習(xí)模型的構(gòu)建提供數(shù)據(jù)源[40]。

        2.3 候選顛覆性技術(shù)預(yù)測(cè)

        2.3.1 深度學(xué)習(xí)模型訓(xùn)練

        一個(gè)技術(shù)領(lǐng)域會(huì)存在海量的專利,且有較多指標(biāo)對(duì)其進(jìn)行衡量及描述。作為一種神經(jīng)網(wǎng)絡(luò)分類器,深度學(xué)習(xí)模型能夠處理大量數(shù)據(jù)[41]。因此,本文使用深度學(xué)習(xí)模型來(lái)預(yù)測(cè)候選顛覆性技術(shù),而使用深度學(xué)習(xí)模型預(yù)測(cè)候選顛覆性技術(shù)的關(guān)鍵是構(gòu)建出專利指標(biāo)和專利未來(lái)影響力之間的關(guān)系。

        為了進(jìn)一步提高識(shí)別精度以構(gòu)建合適的深度學(xué)習(xí)模型,本文將專利數(shù)據(jù)集劃分為兩個(gè)部分——數(shù)據(jù)集1和數(shù)據(jù)集2。其中,數(shù)據(jù)集1用于幫助深度學(xué)習(xí)模型擬合專利指標(biāo)與專利未來(lái)影響力之間的關(guān)系。其具體訓(xùn)練步驟如下:首先,從訓(xùn)練集中依據(jù)前述構(gòu)建的指標(biāo)體系提取相應(yīng)的指標(biāo);其次,依據(jù)前述未來(lái)影響力算法,人工計(jì)算并標(biāo)注每個(gè)專利的未來(lái)影響力;最后,使用未經(jīng)訓(xùn)練的深度學(xué)習(xí)模型擬合技術(shù)指標(biāo)與專利未來(lái)影響力之間的關(guān)系。深度學(xué)習(xí)模型的構(gòu)建如圖5所示。

        圖5 深度學(xué)習(xí)模型構(gòu)建

        在建立深度學(xué)習(xí)模型之初,首先,需要對(duì)模型的各種參數(shù)進(jìn)行初始化設(shè)置,具體包括神經(jīng)元數(shù)量、Epoch以及Batch size等;其次,使用數(shù)據(jù)集1對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)模型的迭代與參數(shù)的更新;最后,完成訓(xùn)練,保存深度學(xué)習(xí)模型。

        2.3.2 深度學(xué)習(xí)模型測(cè)試

        為了評(píng)估深度學(xué)習(xí)模型的訓(xùn)練效果,本文隨機(jī)將數(shù)據(jù)集1按8∶1∶1劃分為訓(xùn)練集、驗(yàn)證集與測(cè)試集[42],并使用準(zhǔn)確率、精確率、召回率和F1-score共4個(gè)指標(biāo)對(duì)訓(xùn)練效果進(jìn)行評(píng)估。計(jì)算公式為

        其中,Acc為準(zhǔn)確率;Pre為精確率;Re為召回率;TP和TN分別為判斷正確的正樣本和負(fù)樣本;FP和FN分別為判斷錯(cuò)誤的正樣本和負(fù)樣本;P和N分別為正樣本和負(fù)樣本。

        2.3.3 候選顛覆性技術(shù)預(yù)測(cè)及技術(shù)主題提取

        依托上述深度學(xué)習(xí)模型的訓(xùn)練預(yù)測(cè)候選顛覆性技術(shù)。其具體步驟如下:首先,提取數(shù)據(jù)集2中的專利指標(biāo);其次,將指標(biāo)信息輸入完成訓(xùn)練的深度學(xué)習(xí)模型中,并輸出相應(yīng)的技術(shù)影響力;最后,將具有高技術(shù)影響力的專利視為候選顛覆性技術(shù),并使用BERTopic模型提取候選顛覆性技術(shù)的技術(shù)主題,其具體流程如圖6所示。

        圖6 候選顛覆性技術(shù)預(yù)測(cè)流程

        2.4 潛在顛覆性技術(shù)識(shí)別

        通過(guò)專利數(shù)據(jù)預(yù)測(cè)出的候選顛覆性技術(shù),難以反映社會(huì)大眾對(duì)其的關(guān)注度與情感傾向。已有研究表明,除去技術(shù)改進(jìn)的自身動(dòng)力,技術(shù)發(fā)展本身也是一項(xiàng)社會(huì)行動(dòng)[43]。社會(huì)大眾往往基于自身利益,動(dòng)態(tài)、持續(xù)性地關(guān)注某個(gè)主題領(lǐng)域。即如果某項(xiàng)科學(xué)研究的社會(huì)大眾關(guān)注度較高,態(tài)度較為積極,那么意味著該研究具有較高的社會(huì)影響力。顛覆性技術(shù)作為科研活動(dòng)的成果表現(xiàn)之一,也同樣適用[44]。因此,本文以社交媒體數(shù)據(jù)為數(shù)據(jù)源,探究社會(huì)大眾對(duì)前述預(yù)測(cè)出的候選顛覆性技術(shù)的關(guān)注度與情感傾向,以進(jìn)一步提升潛在顛覆性技術(shù)的準(zhǔn)確性及全面性,具體步驟如下。

        Step1.數(shù)據(jù)獲取及社會(huì)主題提取。以社交媒體數(shù)據(jù)庫(kù)為數(shù)據(jù)源,利用Python爬取與目標(biāo)技術(shù)領(lǐng)域相關(guān)的內(nèi)容及閱讀量,并使用BERTopic提取出相應(yīng)的社會(huì)主題以及文本-主題概率矩陣。

        Step2.社會(huì)主題關(guān)注度與情感分?jǐn)?shù)計(jì)算。基于文本-主題概率矩陣匹配社會(huì)主題與文本,并分別以文本閱讀量的算術(shù)平均數(shù)作為社會(huì)主題的社會(huì)大眾關(guān)注度,以文本情感分?jǐn)?shù)的算術(shù)平均數(shù)作為社會(huì)主題的社會(huì)大眾情感分?jǐn)?shù)。

        Step3.二維坐標(biāo)構(gòu)建與技術(shù)主題分類。構(gòu)建二維評(píng)價(jià)坐標(biāo),從4個(gè)象限出發(fā)對(duì)社會(huì)主題進(jìn)行分類,并基于語(yǔ)義相似度將上述技術(shù)主題與社會(huì)主題進(jìn)行匹配映射,進(jìn)而依據(jù)社會(huì)關(guān)注度與社會(huì)情感分?jǐn)?shù)兩個(gè)指標(biāo)將技術(shù)主題劃分為高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度以及低關(guān)注度-消極態(tài)度4種。

        Step4.基于各指標(biāo)的潛在顛覆性技術(shù)識(shí)別?;趯<乙庖?jiàn)闡釋4種技術(shù)主題類型的顛覆性潛力,并識(shí)別潛在顛覆性技術(shù)。

        具體流程如圖7所示。

        圖7 潛在顛覆性技術(shù)識(shí)別流程

        2.4.1 社交媒體數(shù)據(jù)獲取及社會(huì)主題提取

        本文通過(guò)制定與具象技術(shù)主題相關(guān)的檢索策略,收集相關(guān)社交媒體數(shù)據(jù),并獲取社會(huì)主題。具體過(guò)程如下:首先,對(duì)獲得的數(shù)據(jù)進(jìn)行清洗,去除與主題相關(guān)度不高和無(wú)關(guān)的數(shù)據(jù);其次,對(duì)清洗過(guò)后的數(shù)據(jù)進(jìn)行預(yù)處理,包括HTML(hyper text markup language)解碼、刪除標(biāo)點(diǎn)符號(hào)等,并進(jìn)行規(guī)范化儲(chǔ)存;最后,使用BERTopic模型提取社會(huì)主題及文本-主題概率矩陣,并結(jié)合相關(guān)領(lǐng)域?qū)<乙庖?jiàn),去除相關(guān)度不高的主題,得到最終高相關(guān)度的社會(huì)主題。

        2.4.2 社會(huì)主題關(guān)注度與情感分?jǐn)?shù)計(jì)算

        社會(huì)主題的關(guān)注度為該主題下的所有文本的閱讀量算術(shù)平均數(shù)。具體過(guò)程如下:首先,基于文本-主題概率矩陣,并結(jié)合相關(guān)領(lǐng)域?qū)<乙庖?jiàn),篩選出每個(gè)主題下的文本;其次,統(tǒng)計(jì)每個(gè)文本的閱讀量,并計(jì)算算術(shù)平均數(shù);最后,將每個(gè)主題的閱讀量作為社會(huì)大眾的社會(huì)關(guān)注度。

        本文使用Python中的SnowNLP來(lái)計(jì)算社會(huì)大眾對(duì)社會(huì)主題的情感分?jǐn)?shù)[45]。具體過(guò)程如下:首先,根據(jù)先驗(yàn)概率和條件概率,使用樸素貝葉斯算法計(jì)算每個(gè)詞語(yǔ)對(duì)于正面情感和負(fù)面情感的概率;其次,根據(jù)文本-主題概率得到每篇文本所屬每個(gè)主題的概率,依據(jù)每個(gè)文本所屬主題概率大小并結(jié)合文本具體內(nèi)容,匹配主題與文本;再其次,根據(jù)文本每個(gè)句子中所有詞的情感極性進(jìn)行加權(quán)平均,計(jì)算每個(gè)句子的情感分?jǐn)?shù),將每個(gè)句子的情感分?jǐn)?shù)加權(quán)平均得到每個(gè)文本的情感分?jǐn)?shù),從而基于主題與文本的匹配結(jié)果計(jì)算每個(gè)主題的情感分?jǐn)?shù);最后,設(shè)置情感分?jǐn)?shù)閾值,將高于該閾值的主題視為社會(huì)大眾具有積極態(tài)度的社會(huì)主題,將低于該閾值的主題視為社會(huì)大眾具有消極態(tài)度的社會(huì)主題,將等于該閾值的主題視為社會(huì)大眾具有中性態(tài)度的社會(huì)主題。

        在計(jì)算每個(gè)句子的情感分?jǐn)?shù)時(shí),需要將該句子中的所有詞語(yǔ)的情感極性進(jìn)行加權(quán)平均,從而得到該句子的情感分?jǐn)?shù)。每個(gè)詞語(yǔ)的權(quán)重大小根據(jù)其出現(xiàn)頻率而確定,頻率較大的詞語(yǔ)權(quán)重較大,頻率較小的詞語(yǔ)權(quán)重較小,這樣可以更好地反映每個(gè)詞語(yǔ)在整個(gè)句子情感分?jǐn)?shù)計(jì)算中的貢獻(xiàn)程度。句子的情感分?jǐn)?shù)計(jì)算公式為

        其中,sen為情感分?jǐn)?shù);wi為詞語(yǔ)的權(quán)重;pi為情感概率;n為一個(gè)句子中包含的詞語(yǔ)個(gè)數(shù)。

        在計(jì)算每個(gè)文本的情感分?jǐn)?shù)時(shí),同樣需要將每個(gè)句子的情感分?jǐn)?shù)進(jìn)行加權(quán)平均,從而得到每個(gè)文本的情感分?jǐn)?shù)。每個(gè)句子的權(quán)重根據(jù)其出現(xiàn)在文本中的位置而確定,出現(xiàn)在文本首句和末句的句子權(quán)重較大,并將剩余權(quán)重分配至其他句子中。這樣可以更好地反映每個(gè)句子在整個(gè)文本情感分?jǐn)?shù)計(jì)算中的貢獻(xiàn)程度。文本的情感分?jǐn)?shù)計(jì)算公式為

        其中,pas為情感分?jǐn)?shù);seni為句子的權(quán)重;vi為句子的權(quán)重;m為一個(gè)文本中包含的句子個(gè)數(shù)。

        2.4.3 二維坐標(biāo)構(gòu)建與技術(shù)主題分類

        以主題關(guān)注度為橫坐標(biāo)、以主題情感分?jǐn)?shù)為縱坐標(biāo)構(gòu)建二維評(píng)價(jià)坐標(biāo)?;诟魃鐣?huì)主題的指標(biāo)大小,將各社會(huì)主題映射到二維坐標(biāo)中。通過(guò)社會(huì)主題與技術(shù)主題進(jìn)行匹配映射,從而將技術(shù)主題按照高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度以及低關(guān)注度-消極態(tài)度分為4類。

        技術(shù)主題與社會(huì)主題之間的匹配映射是基于二者的語(yǔ)義相似度實(shí)現(xiàn)的,其具體計(jì)算過(guò)程如下:首先,使用BERT模型對(duì)技術(shù)主題與社會(huì)主題分別進(jìn)行編碼以得到其向量;其次,按照余弦相似度的計(jì)算公式計(jì)算社會(huì)主題與每個(gè)技術(shù)主題之間的余弦相似度;最后,將技術(shù)主題與每個(gè)社會(huì)主題中余弦相似度最大者進(jìn)行匹配映射,并基于相關(guān)領(lǐng)域?qū)<抑R(shí)對(duì)其進(jìn)一步闡釋說(shuō)明。

        2.4.4 基于社會(huì)主題的潛在顛覆性技術(shù)識(shí)別

        本文依據(jù)社會(huì)大眾對(duì)技術(shù)主題的關(guān)注度與情感傾向,預(yù)測(cè)未來(lái)技術(shù)主題的顛覆性潛力。技術(shù)主題的關(guān)注度大小與情感傾向和數(shù)量廣泛的社會(huì)大眾自身利益息息相關(guān),即技術(shù)主題的關(guān)注度大小與情感傾向在一定程度上代表了社會(huì)影響力。而顛覆性技術(shù)相較于主流技術(shù),能夠改變技術(shù)的發(fā)展方向,離不開(kāi)其對(duì)社會(huì)產(chǎn)生的巨大影響,從而得到大規(guī)模的擴(kuò)散并被社會(huì)廣泛接受[46]。因此,社會(huì)大眾對(duì)技術(shù)主題的關(guān)注度大小與情感傾向和其顛覆性潛力有很大的關(guān)系。

        (1)高關(guān)注度-積極態(tài)度的技術(shù)主題:高關(guān)注度意味著社會(huì)大眾持續(xù)關(guān)注該技術(shù)主題,積極態(tài)度意味著社會(huì)大眾對(duì)該技術(shù)主題較為滿意。該類技術(shù)主題可能擁有較大的技術(shù)先進(jìn)性,從而導(dǎo)致?lián)碛休^高的社會(huì)影響力,并且未來(lái)有較大可能性快速占據(jù)市場(chǎng),完成顛覆。

        (2)高關(guān)注度-消極態(tài)度的技術(shù)主題:高關(guān)注度意味著社會(huì)大眾持續(xù)關(guān)注該技術(shù)主題,而消極態(tài)度意味著社會(huì)大眾對(duì)該技術(shù)主題不太滿意。該類技術(shù)主題往往產(chǎn)生于低端市場(chǎng),可能初始性能不高,導(dǎo)致社會(huì)大眾對(duì)其態(tài)度消極,但因其便宜、簡(jiǎn)單、方便等特點(diǎn)而受到廣泛關(guān)注。未來(lái)可能會(huì)借助成本優(yōu)勢(shì)與市場(chǎng)優(yōu)勢(shì)向主流市場(chǎng)侵蝕并完成顛覆[47]。

        (3)低關(guān)注度-積極態(tài)度的技術(shù)主題:低關(guān)注度意味著社會(huì)大眾尚未關(guān)注或較少關(guān)注該技術(shù)主題,而積極態(tài)度意味著社會(huì)大眾對(duì)該技術(shù)主題較為滿意。該類技術(shù)主題具有邊緣消費(fèi)者看重的全新功能或?qū)傩?,未?lái),隨著性能和功能的不斷完善,逐漸滿足多數(shù)大的需求,有可能完成顛覆[48],也可能因無(wú)法滿足用戶而不再受到關(guān)注。

        (4)低關(guān)注度-消極態(tài)度的技術(shù)主題:低關(guān)注度意味著社會(huì)大眾尚未關(guān)注或較少關(guān)注該技術(shù)主題,消極態(tài)度意味著社會(huì)大眾對(duì)該技術(shù)主題不太滿意。該類技術(shù)主題可能處于萌芽期,因技術(shù)的不完善使得人們對(duì)其態(tài)度不夠積極,加之時(shí)間原因暫時(shí)還未受到廣泛關(guān)注。但在技術(shù)發(fā)展的早期,即使顛覆性技術(shù)也呈現(xiàn)“弱信號(hào)”的特征[49],因此,對(duì)于該類技術(shù)主題,還需等待時(shí)間的驗(yàn)證,亦不能排除其顛覆性的潛力。

        綜上所述,本文認(rèn)為高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度以及低關(guān)注度-積極態(tài)度的技術(shù)主題更有可能成為顛覆性技術(shù);而低關(guān)注度-消極態(tài)度的技術(shù)主題具有較大不確定性,需要等待時(shí)間的驗(yàn)證。

        3 案例應(yīng)用——以醫(yī)療機(jī)器人為例

        醫(yī)療機(jī)器人的出現(xiàn),打破了常規(guī)醫(yī)療的現(xiàn)狀,有力地推動(dòng)了醫(yī)療技術(shù)的變革,越來(lái)越多的企業(yè)加入醫(yī)療機(jī)器人產(chǎn)業(yè)化隊(duì)伍[50]。醫(yī)療機(jī)器人由于具有交叉性、前瞻性等特點(diǎn),很有可能引起新一輪技術(shù)革命,從而催生一系列顛覆性技術(shù)[51]。盡管我國(guó)近年來(lái)大力扶持醫(yī)療機(jī)器人產(chǎn)業(yè)的發(fā)展,但是與世界先進(jìn)水平仍存在一定的差距[52],亟須開(kāi)展?jié)撛陬嵏残约夹g(shù)的識(shí)別,以幫助國(guó)家和企業(yè)明晰未來(lái)的發(fā)展方向,進(jìn)而縮小與發(fā)達(dá)國(guó)家的技術(shù)差距。鑒于此,本文選擇醫(yī)療機(jī)器人領(lǐng)域進(jìn)行實(shí)證分析,以闡釋上述方法的應(yīng)用過(guò)程,并驗(yàn)證其合理性。

        3.1 醫(yī)療機(jī)器人的專利數(shù)據(jù)收集及數(shù)據(jù)集劃分

        本文采用incoPat數(shù)據(jù)庫(kù)(http://www.incopat.com)為專利數(shù)據(jù)源。經(jīng)初步檢索,得到10652項(xiàng)專利。對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,去除相關(guān)度低和重復(fù)的專利,最終得到9300項(xiàng)專利。具體檢索時(shí)間、檢索表達(dá)式等信息如表2所示。

        表2 醫(yī)療機(jī)器人的專利檢索信息

        依據(jù)2.1節(jié)提出的數(shù)據(jù)集劃分方法,本文按時(shí)間段進(jìn)行劃分。2011年1月1日至2016年12月31日的專利數(shù)據(jù)為數(shù)據(jù)集1,將其稱為2020年候選顛覆性技術(shù),共有1982項(xiàng)專利;2017年1月1日至2022年12月31日的專利數(shù)據(jù)為數(shù)據(jù)集2,將其稱為2026年候選顛覆性技術(shù),共有7318項(xiàng)專利。

        3.2 醫(yī)療機(jī)器人的顛覆性技術(shù)特征選擇

        3.2.1 醫(yī)療機(jī)器人的指標(biāo)選取及體系構(gòu)建

        按照2.2.1節(jié)中提出的方法提取訓(xùn)練集中專利樣本的專利指標(biāo)。訓(xùn)練集共1982個(gè)樣本,其中每一個(gè)樣本都有8維數(shù)據(jù),包含8個(gè)專利指標(biāo)的數(shù)值。由于各指標(biāo)數(shù)值跨度較大,直接使用該數(shù)據(jù)會(huì)影響模型的訓(xùn)練效果[53]。因此,本文對(duì)所有專利指標(biāo)數(shù)值中不為0的取對(duì)數(shù)處理,數(shù)值為0的取0。訓(xùn)練集中各專利樣本指標(biāo)描述性統(tǒng)計(jì)如表3所示。

        表3 專利樣本各指標(biāo)描述性統(tǒng)計(jì)

        3.2.2 醫(yī)療機(jī)器人的專利樣本技術(shù)影響力評(píng)估

        按照公式(7)和公式(8)計(jì)算每個(gè)專利樣本的技術(shù)影響力,并借助XGB(extreme gradient boosting)模型開(kāi)展回歸分析,以確定不同技術(shù)影響力閾值大小對(duì)模型預(yù)測(cè)準(zhǔn)確率的影響,從而確立最佳技術(shù)影響力閾值。具體結(jié)果如圖8所示。

        圖8 不同技術(shù)影響力閾值大小對(duì)模型預(yù)測(cè)準(zhǔn)確率的影響

        由圖8可知,在閾值為1.3時(shí),模型預(yù)測(cè)準(zhǔn)確率達(dá)到峰值,隨后處于下降狀態(tài),因此,本文將技術(shù)影響力大小的閾值設(shè)為1.3,并將技術(shù)影響力不低于1.3的專利樣本貼上標(biāo)簽“1”,將剩余專利樣本貼上標(biāo)簽“0”。部分專利樣本的部分指標(biāo)如表4所示。

        表4 部分專利樣本的技術(shù)影響力

        3.3 醫(yī)療機(jī)器人的候選顛覆性技術(shù)預(yù)測(cè)及主題提取

        3.3.1 醫(yī)療機(jī)器人的深度學(xué)習(xí)模型訓(xùn)練

        由于高影響力和低影響力的專利樣本比例為1∶11,樣本的不均衡導(dǎo)致Bi-LSTM模型無(wú)法充分學(xué)習(xí)到高影響力專利樣本的特征。為了進(jìn)一步提升Bi-LSTM模型的學(xué)習(xí)效果,本文在訓(xùn)練集中復(fù)用正樣本專利數(shù)據(jù),使得用于構(gòu)建模型的訓(xùn)練集中正負(fù)樣本相對(duì)均衡[54]。經(jīng)訓(xùn)練,最終確定了各模型參數(shù),具體參數(shù)設(shè)置情況如表5所示。

        表5 Bi-LSTM模型訓(xùn)練參數(shù)設(shè)置

        訓(xùn)練完畢之后,需要檢驗(yàn)?zāi)P偷臄M合程度。將Bi-LSTM訓(xùn)練集的擬合效果與真實(shí)值進(jìn)行對(duì)比可知,Bi-LSTM的擬合程度整體上與真實(shí)值差別不大,可以用于下一階段的候選顛覆性技術(shù)預(yù)測(cè)。具體對(duì)比結(jié)果如圖9所示。

        圖9 Bi-LSTM的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果對(duì)比(彩圖請(qǐng)見(jiàn)http://qbxb.istic.ac.cn/)

        3.3.2 醫(yī)療機(jī)器人的深度學(xué)習(xí)模型測(cè)試

        為了評(píng)估Bi-LSTM訓(xùn)練效果,按照2.3.2節(jié)的公式(9)~公式(12)分別計(jì)算準(zhǔn)確率、精確率、召回率和F1-score指標(biāo),并與RF(random forest)、 VSM(vector space model)與LR(logistic regression)等模型進(jìn)行對(duì)比。評(píng)估指標(biāo)如表6所示。

        表6 Bi-LSTM、RF、SVM與LR模型訓(xùn)練效果對(duì)比

        由表6可知,Bi-LSTM在各項(xiàng)指標(biāo)表現(xiàn)上均優(yōu)于其他模型,即該模型在候選顛覆性技術(shù)分類任務(wù)中整體性能更高,能夠更好地?cái)M合候選顛覆性技術(shù)指標(biāo)與其未來(lái)技術(shù)影響力之間復(fù)雜的非線性關(guān)系。因此,可將Bi-LSTM用于2026年候選顛覆性技術(shù)的預(yù)測(cè)。

        3.3.3 醫(yī)療機(jī)器人的候選顛覆性技術(shù)預(yù)測(cè)

        提取數(shù)據(jù)集2中的專利各指標(biāo)數(shù)據(jù),經(jīng)由訓(xùn)練完成的Bi-LSTM模型,得到了數(shù)據(jù)集2中各專利的未來(lái)技術(shù)影響力。數(shù)據(jù)集2中共有7318項(xiàng)專利,預(yù)計(jì)有395項(xiàng)專利具有高技術(shù)影響力,并視為候選顛覆性技術(shù),占預(yù)測(cè)集專利數(shù)量的5.4%。

        為了進(jìn)一步明晰候選顛覆性技術(shù)的技術(shù)主題及主題關(guān)鍵詞分布信息,本文使用BERTopic主題建模來(lái)提取候選顛覆性技術(shù)的技術(shù)主題及主題關(guān)鍵詞。在此基礎(chǔ)上,結(jié)合領(lǐng)域?qū)<乙庖?jiàn),可得到9個(gè)技術(shù)主題。各主題代表的技術(shù)領(lǐng)域清晰,具有較好的聚類效果,因此,可根據(jù)各技術(shù)主題所含主題關(guān)鍵詞的內(nèi)容進(jìn)行命名。具體如表7所示。

        表7 醫(yī)療機(jī)器人候選顛覆性技術(shù)主題及主題關(guān)鍵詞

        由表7可知,醫(yī)療機(jī)器人領(lǐng)域候選顛覆性技術(shù)的技術(shù)主題主要分布在區(qū)塊鏈技術(shù)、智能感知技術(shù)、醫(yī)學(xué)影像采集技術(shù)、上下肢外骨骼康復(fù)、血管介入手術(shù)、自主導(dǎo)航與云服務(wù)技術(shù)、神經(jīng)外科手術(shù)、柔性微型醫(yī)療技術(shù)和神經(jīng)網(wǎng)絡(luò)技術(shù)9個(gè)技術(shù)主題中。為了進(jìn)一步提升識(shí)別的準(zhǔn)確性,需要結(jié)合社交媒體數(shù)據(jù)對(duì)其加以研判。

        3.4 醫(yī)療機(jī)器人的潛在顛覆性技術(shù)識(shí)別

        3.4.1 醫(yī)療機(jī)器人的社交媒體數(shù)據(jù)獲取及社會(huì)主題提取

        隨著互聯(lián)網(wǎng)的發(fā)展,社會(huì)大眾逐漸在社交媒體中發(fā)表有關(guān)潛在顛覆性技術(shù)的推文,這些推文包含社會(huì)大眾對(duì)其的情感傾向、認(rèn)知看法與未來(lái)期望等,因此具有重要的研究?jī)r(jià)值[55]。綜合考慮數(shù)據(jù)的可獲得性與質(zhì)量等特點(diǎn),本文選擇以微信公眾號(hào)中的推文、小紅書(shū)中的筆記以及知乎中的回答作為社交媒體數(shù)據(jù)。各社交媒體平臺(tái)的檢索信息及特點(diǎn)如表8所示。

        表8 各社交媒體平臺(tái)的檢索信息及特點(diǎn)

        因各類型數(shù)據(jù)龐大,本文借助Python來(lái)爬取與醫(yī)療機(jī)器人相關(guān)的社交媒體數(shù)據(jù)。經(jīng)數(shù)據(jù)預(yù)處理,濾除重復(fù)數(shù)據(jù)以及與主題相關(guān)度不高的數(shù)據(jù)等,最終獲得668條有效推文。具體檢索關(guān)鍵詞、檢索時(shí)間等信息如表9所示。

        表9 醫(yī)療機(jī)器人的微信公眾號(hào)推文檢索信息

        使用BERTopic主題建模提取上述微信公眾號(hào)推文、小紅書(shū)筆記以及知乎回答中的社會(huì)主題及主題關(guān)鍵詞,初步得到33個(gè)主題,刪除無(wú)關(guān)主題及低相關(guān)度主題,最終得到7個(gè)主題。具體結(jié)果如表10所示。

        表10 醫(yī)療機(jī)器人相關(guān)的微信公眾號(hào)社會(huì)主題及主題關(guān)鍵詞

        3.4.2 醫(yī)療機(jī)器人的社會(huì)主題關(guān)注度與情感分?jǐn)?shù)計(jì)算

        基于文本-主題概率矩陣,結(jié)合相關(guān)領(lǐng)域?qū)<乙庖?jiàn),將文本匹配到不同社會(huì)主題下。按照2.4.2節(jié)提出的方法,分別計(jì)算不同社會(huì)主題的關(guān)注度及情感分?jǐn)?shù),并將情感分?jǐn)?shù)的算術(shù)平均值設(shè)為情感分?jǐn)?shù)閾值。經(jīng)計(jì)算,情感分?jǐn)?shù)的閾值為0.65,故將S1、S2、S3、S4主題設(shè)為積極態(tài)度,將S5、S6、S7主題設(shè)為消極態(tài)度,各社會(huì)主題的關(guān)注度與情感分?jǐn)?shù)如表11所示。

        表11 社會(huì)主題的關(guān)注度及情感分?jǐn)?shù)

        3.4.3 二維坐標(biāo)構(gòu)建與醫(yī)療機(jī)器人技術(shù)主題分類

        根據(jù)關(guān)注度與情感分?jǐn)?shù)兩個(gè)指標(biāo),以情感分?jǐn)?shù)為縱坐標(biāo)、以關(guān)注度為橫坐標(biāo)構(gòu)建二維評(píng)價(jià)坐標(biāo),以更直觀、清晰地了解社會(huì)大眾對(duì)于醫(yī)療機(jī)器人領(lǐng)域相關(guān)主題的關(guān)注度與情感分?jǐn)?shù)。依據(jù)各指標(biāo)的平均值,將該二維坐標(biāo)劃分為4個(gè)象限,分別是高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度和低關(guān)注度-消極態(tài)度。其中,醫(yī)療機(jī)器人的輔助治療屬于高關(guān)注度-積極態(tài)度,處于S2區(qū)域;機(jī)器人的智能化與精準(zhǔn)治療、臨床機(jī)器人應(yīng)用與系統(tǒng)開(kāi)發(fā)以及機(jī)器人在外科手術(shù)中的應(yīng)用屬于低關(guān)注度-積極態(tài)度,處于S3區(qū)域;其余3個(gè)主題屬于低關(guān)注度-消極態(tài)度,處于S4區(qū)域。具體情況如圖10所示。

        圖10 醫(yī)療機(jī)器人社會(huì)主題的關(guān)注度與情感傾向二維評(píng)價(jià)坐標(biāo)

        為了將技術(shù)主題與社會(huì)主題進(jìn)行匹配映射,需計(jì)算其余弦相似度。按照2.4.3節(jié)提出的方法,利用BERT模型對(duì)其進(jìn)行編碼以得到其向量化表示,并計(jì)算每個(gè)技術(shù)主題與社會(huì)主題之間的余弦相似度。醫(yī)療機(jī)器人技術(shù)主題與社會(huì)主題之間的余弦相似度計(jì)算結(jié)果如表12所示。

        基于表12的計(jì)算結(jié)果,依次統(tǒng)計(jì)各個(gè)技術(shù)主題與每個(gè)社會(huì)主題之間的余弦相似度大小,并將技術(shù)主題與社會(huì)主題之間余弦相似度中最大者進(jìn)行匹配映射,并依托相關(guān)領(lǐng)域?qū)<抑R(shí),對(duì)其進(jìn)一步闡釋說(shuō)明。具體來(lái)說(shuō),神經(jīng)外科手術(shù)需要非常細(xì)致和精細(xì)的操作,與機(jī)器人在外科手術(shù)中的應(yīng)用相關(guān),故將其匹配;神經(jīng)網(wǎng)絡(luò)技術(shù)可以幫助機(jī)器人系統(tǒng)的學(xué)習(xí)和優(yōu)化,從而實(shí)線個(gè)性化與準(zhǔn)確治療,與機(jī)器人的智能化與精準(zhǔn)治療相關(guān),故將其匹配;智能感知技術(shù)可以檢測(cè)患者的生理狀態(tài)、行為習(xí)慣等信息,從而實(shí)現(xiàn)更加準(zhǔn)確和個(gè)性化的治療效果,與機(jī)器人的智能化與精準(zhǔn)治療相關(guān),故將其匹配;區(qū)塊鏈技術(shù)可以用于記錄和管理醫(yī)療數(shù)據(jù)的安全性,并實(shí)現(xiàn)數(shù)據(jù)的可追溯性,從而為醫(yī)療機(jī)器人提供更加豐富、準(zhǔn)確的數(shù)據(jù)信息,提升機(jī)器人的診斷與治療效果,與醫(yī)療機(jī)器人的輔助治療相關(guān),故將其匹配;柔性微型醫(yī)療技術(shù)可以幫助醫(yī)生在狹小的空間內(nèi)對(duì)患者進(jìn)行檢查或治療,與醫(yī)療機(jī)器人的輔助治療相關(guān),故將其匹配;自主導(dǎo)航與云服務(wù)技術(shù)可以幫助醫(yī)生遠(yuǎn)程觀察并操作臨床機(jī)器人查看醫(yī)療影像與數(shù)據(jù)以及遠(yuǎn)程指導(dǎo)手術(shù)過(guò)程等,與臨床機(jī)器人應(yīng)用與系統(tǒng)開(kāi)發(fā)有關(guān),故將其匹配;醫(yī)學(xué)影像采集技術(shù)可以幫助機(jī)器人獲取更加清晰、準(zhǔn)確的醫(yī)學(xué)影像系統(tǒng),與機(jī)器人在醫(yī)學(xué)影像技術(shù)應(yīng)用相關(guān),故將其匹配;上下肢外骨骼康復(fù)是一種常見(jiàn)的機(jī)器人輔助康復(fù)方法,與運(yùn)動(dòng)康復(fù)與機(jī)器人技術(shù)應(yīng)用有關(guān),故將其匹配;血管介入手術(shù)通常需要在血管內(nèi)進(jìn)行精細(xì)的操作,與微創(chuàng)外科技術(shù)與機(jī)器人應(yīng)用有關(guān),故將其匹配。

        為了進(jìn)一步明晰技術(shù)主題與社會(huì)主題之間的匹配映射關(guān)系,以社會(huì)大眾關(guān)注度大小為橫坐標(biāo)、以社會(huì)大眾情感態(tài)度為縱坐標(biāo)構(gòu)建二維坐標(biāo)系,如圖11所示。其中,社會(huì)主題中的醫(yī)療機(jī)器人的輔助治療因具有較高關(guān)注度和較為積極的態(tài)度,位于坐標(biāo)系中的第一象限;又因上述的社會(huì)主題與技術(shù)主題的匹配結(jié)果,將該主題與技術(shù)主題中的區(qū)塊鏈技術(shù)、柔性微型醫(yī)療技術(shù)進(jìn)行匹配映射;其余社會(huì)主題所處的象限以及相匹配映射的技術(shù)主題同理。

        圖11 醫(yī)療機(jī)器人技術(shù)主題與社會(huì)主題匹配映射

        3.4.4 醫(yī)療機(jī)器人潛在顛覆性技術(shù)識(shí)別

        根據(jù)上述社會(huì)主題二維評(píng)價(jià)與技術(shù)主題和社會(huì)主題匹配結(jié)果,可將技術(shù)主題劃分為4類,分別是高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度和低關(guān)注度-消極態(tài)度,具體結(jié)果如表13所示。

        表13 醫(yī)療機(jī)器人候選顛覆性技術(shù)主題所屬類別

        依據(jù)各技術(shù)主題的指標(biāo)大小,對(duì)醫(yī)療機(jī)器人領(lǐng)域相關(guān)技術(shù)主題具體闡釋如下。

        具有高關(guān)注度-積極態(tài)度的技術(shù)主題有2個(gè),分別是柔性微型醫(yī)療技術(shù)與區(qū)塊鏈技術(shù)。該類技術(shù)主題未來(lái)有較大可能性快速占據(jù)市場(chǎng),完成顛覆。

        (1)柔性微型醫(yī)療技術(shù)可以使機(jī)器人通過(guò)微小的切口或者腔道進(jìn)行胃腸道、肺部等部位的檢查和治療,相較于傳統(tǒng)的內(nèi)窺鏡,柔性微型醫(yī)療機(jī)器人更加靈活、精確,并減少了手術(shù)對(duì)患者的傷害和恢復(fù)時(shí)間。除此之外,柔性微型機(jī)器人還可以通過(guò)柔性身體結(jié)構(gòu),實(shí)現(xiàn)對(duì)患者關(guān)節(jié)、肌肉等部位的康復(fù)治療。

        (2)區(qū)塊鏈技術(shù)可以為機(jī)器人提供更加安全、可靠的數(shù)據(jù)加密和存儲(chǔ)方式,以確?;颊邆€(gè)人數(shù)據(jù)的安全;可以通過(guò)智能合約實(shí)現(xiàn)醫(yī)生的資質(zhì)認(rèn)證和訪問(wèn)權(quán)限控制,從而確保會(huì)診過(guò)程的安全性和可信度。除此之外,還可以幫助機(jī)器人實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的共享和交換,促進(jìn)病例數(shù)據(jù)和治療方案的共享和優(yōu)化。

        具有低關(guān)注度-積極態(tài)度的技術(shù)主題有4個(gè),分別是神經(jīng)外科技術(shù)、智能感知技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù)以及自主導(dǎo)航與云服務(wù)技術(shù)。該類技術(shù)主題隨著未來(lái)性能和功能的不斷完善,若能夠逐漸滿足大部分社會(huì)大眾的需求,則有可能完成顛覆。

        (1)神經(jīng)外科技術(shù)可以幫助機(jī)器人實(shí)現(xiàn)高精度的運(yùn)動(dòng)和立體成像技術(shù),從而實(shí)現(xiàn)對(duì)神經(jīng)系統(tǒng)病變部位的準(zhǔn)確定位和操作;可以幫助機(jī)器人通過(guò)MRI(magnetic resonance imaging)和CT(computed to‐mography)等成像技術(shù),實(shí)現(xiàn)對(duì)腦功能區(qū)的影像采集和分析。除此之外,神經(jīng)外科機(jī)器人通過(guò)植入電極等裝置,實(shí)時(shí)監(jiān)測(cè)神經(jīng)元活動(dòng)和神經(jīng)信號(hào)傳導(dǎo)情況。

        (2)智能感知技術(shù)可以幫助機(jī)器人識(shí)別患者的身體狀態(tài)、疾病類型等,進(jìn)而改變室內(nèi)溫度、適度等參數(shù),提升患者的舒適度和治療效果,從而實(shí)現(xiàn)精準(zhǔn)的診斷和治療。除此之外,還可以幫助機(jī)器人智能獲取醫(yī)生的指令,同時(shí)將患者的信息同步反饋給醫(yī)護(hù)人員,以便及時(shí)調(diào)整治療方案。

        (3)神經(jīng)網(wǎng)絡(luò)技術(shù)可以幫助機(jī)器人通過(guò)對(duì)大量醫(yī)學(xué)數(shù)據(jù)的分析和處理,預(yù)測(cè)疾病發(fā)展趨勢(shì),評(píng)估患者疾病風(fēng)險(xiǎn),提供個(gè)性化的治療方案和干預(yù)措施。除此之外,還可以幫助機(jī)器人自動(dòng)學(xué)習(xí)并模擬醫(yī)生的手術(shù)技巧,提升手術(shù)的精度和安全性。

        (4)自主導(dǎo)航與云服務(wù)技術(shù)可以幫助機(jī)器人在醫(yī)院內(nèi)部自主移動(dòng),從而實(shí)現(xiàn)對(duì)患者與醫(yī)生的快速響應(yīng)與服務(wù)。除此之外,該技術(shù)也可以幫助機(jī)器人在云端通過(guò)深度學(xué)習(xí)算法和人工智能技術(shù),對(duì)大量的病理圖片進(jìn)行識(shí)別和分析,從而提供更準(zhǔn)確的病理學(xué)結(jié)果。

        具有低關(guān)注度-消極態(tài)度的技術(shù)主題有3個(gè),分別是醫(yī)學(xué)影像采集技術(shù)、上下肢外骨骼康復(fù)與血管介入技術(shù)。對(duì)于該類技術(shù)主題,還需等待時(shí)間的驗(yàn)證,不能排除其顛覆性的潛力。

        (1)醫(yī)學(xué)影像采集技術(shù)可以使機(jī)器人通過(guò)不同的成像技術(shù),獲取人體內(nèi)部的結(jié)構(gòu)、病變及異常情況,從而幫助醫(yī)生實(shí)現(xiàn)精準(zhǔn)定位、準(zhǔn)確診斷與治療。除此之外,還可以對(duì)人體各個(gè)部位的影像進(jìn)行三維重建,輔助醫(yī)生進(jìn)行手術(shù)規(guī)劃與操作,既提高了手術(shù)的精度與效率,又減輕了患者的痛苦與風(fēng)險(xiǎn)。

        (2)上下肢外骨骼康復(fù)可以使機(jī)器人通過(guò)機(jī)械和電氣相結(jié)合的控制方式,協(xié)助患者進(jìn)行康復(fù)訓(xùn)練;可以通過(guò)內(nèi)置的傳感器和計(jì)算機(jī)視覺(jué)技術(shù),對(duì)患者的步態(tài)進(jìn)行分析和識(shí)別。即上下肢外骨骼康復(fù)機(jī)器人有助于改善患者日常生活中的行走和站立能力,提高康復(fù)效果和生活質(zhì)量。

        (3)血管介入技術(shù)可以幫助機(jī)器人通過(guò)微小切口或穿刺進(jìn)入血管內(nèi)部,完成血管內(nèi)手術(shù);或是通過(guò)導(dǎo)管和氣囊等裝置將血管擴(kuò)大,從而緩解血管狹窄造成的癥狀。除此之外,該技術(shù)還可以幫助機(jī)器人進(jìn)行神經(jīng)介入治療,利用導(dǎo)管和支架等裝置,恢復(fù)閉塞性動(dòng)脈供血,保護(hù)受損腦細(xì)胞,從而促進(jìn)患者的恢復(fù)。

        4 結(jié)論與展望

        本文提出了一種基于深度學(xué)習(xí)模型,融合專利數(shù)據(jù)和社交媒體數(shù)據(jù)來(lái)識(shí)別潛在顛覆性技術(shù)的方法,并以醫(yī)療機(jī)器人領(lǐng)域?yàn)槔M(jìn)行了驗(yàn)證,是潛在顛覆性技術(shù)識(shí)別的重要補(bǔ)充。

        本文的學(xué)術(shù)貢獻(xiàn)主要體現(xiàn)在以下兩個(gè)層面。

        一是在候選顛覆性技術(shù)預(yù)測(cè)階段,本文依托Bi-LSTM挖掘出隱藏在海量專利數(shù)據(jù)中的顛覆性技術(shù)關(guān)鍵特征,并運(yùn)用這些特征識(shí)別候顛覆性技術(shù)。該方法不僅能夠有效挖掘隱藏在海量數(shù)據(jù)中的潛在顛覆性技術(shù),并且相較于以往人工歸納顛覆性技術(shù)特征的方法,具有更高的效率、更低的成本以及更高的客觀性。

        二是在潛在顛覆性技術(shù)識(shí)別階段,提出了一種融合專利數(shù)據(jù)與社交媒體數(shù)據(jù)的潛在顛覆性技術(shù)識(shí)別方法,該方法綜合考慮了技術(shù)影響力、社會(huì)大眾關(guān)注度與社會(huì)大眾情感傾向等,進(jìn)而將潛在顛覆性技術(shù)劃分為高關(guān)注度-積極態(tài)度、高關(guān)注度-消極態(tài)度、低關(guān)注度-積極態(tài)度以及低關(guān)注度-消極態(tài)度4種類型,并對(duì)其顛覆性潛力做出了闡釋,是現(xiàn)有顛覆性技術(shù)識(shí)別方法的重要補(bǔ)充,能夠?yàn)檎疀Q策、產(chǎn)業(yè)投資等提供參考依據(jù),具有重要的理論和實(shí)踐價(jià)值。

        本文尚存在以下局限性。雖然以醫(yī)療儀器人為例驗(yàn)證了本文方法的可行性,但缺乏對(duì)多領(lǐng)域技術(shù)的系統(tǒng)研究,未來(lái)研究有待于擴(kuò)展補(bǔ)充其他領(lǐng)域的專利數(shù)據(jù)源,以擴(kuò)大潛在顛覆性技術(shù)識(shí)別所涵蓋的領(lǐng)域范圍,進(jìn)一步提升研究方法的普適性。此外,本文采用的數(shù)據(jù)主要來(lái)自專利數(shù)據(jù)和社交媒體數(shù)據(jù),雖然這些數(shù)據(jù)包含了大量的技術(shù)信息和社會(huì)信息,但仍存在不足;未來(lái)可以考慮引入更多的數(shù)據(jù)源,如新聞媒體、科技網(wǎng)站等,以獲得更全面和多樣化的數(shù)據(jù)。

        猜你喜歡
        情感模型
        一半模型
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        被情感操縱的人有多可悲
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        3D打印中的模型分割與打包
        情感移植
        国产精品亚洲片在线观看不卡| 亚洲成av人片天堂网九九| 国产亚洲欧美在线| 亚洲双色视频在线观看| 中文字幕视频一区二区| 久久中文字幕亚洲综合| 国产精品国产三级国产av中文| 亚洲综合网站久久久| 亚洲不卡av一区二区三区四区| 在线视频免费自拍亚洲| 国产av自拍在线观看| 久久久人妻一区二区三区蜜桃d| 日韩精品一区二区在线天天狠天| 国产剧情一区二区三区在线| av免费在线播放视频| 日本一卡二卡3卡四卡免费观影2022| 免费久久人人爽人人爽av| 国产精品久久久久久久妇| 日韩电影一区二区三区| 国产在线观看www污污污| 又爽又黄又无遮挡的激情视频| 国产精品一区二区久久| 亚洲国产日韩在线人成蜜芽| 国产成人福利在线视频不卡| 亚洲麻豆av一区二区| 国产成人自拍视频视频| 久久老熟女乱色一区二区| 久久伊人精品色婷婷国产| 亚洲天堂精品成人影院| 一本一道av无码中文字幕麻豆| 亚洲午夜精品久久久久久人妖 | 无码精品国产一区二区三区免费 | 亚洲日本无码一区二区在线观看| 精品国产三级国产av| 国产av一区二区亚洲精品| 久久久久人妻精品一区三寸| 亚洲精品无码成人a片| 久久青草伊人精品| 一区二区三区国产美女在线播放| 日韩精品综合在线视频| 高清日韩av在线免费观看|