亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多源數(shù)據(jù)融合的新興技術(shù)識(shí)別方法研究

        2025-03-24 00:00:00王宏劉沁瑩玉峰王慶紅周育忠
        科技進(jìn)步與對(duì)策 2025年5期
        關(guān)鍵詞:機(jī)器學(xué)習(xí)

        摘 要:新興技術(shù)在科技革命和產(chǎn)業(yè)變革中發(fā)揮著重要作用,準(zhǔn)確把握新興技術(shù)發(fā)展方向有助于國(guó)家政策制定和科技快速發(fā)展。融合學(xué)術(shù)論文和專利文獻(xiàn)數(shù)據(jù),構(gòu)建一套新興技術(shù)識(shí)別方法。通過(guò)主題N元語(yǔ)法(TNG)模型抽取和篩選技術(shù)主題,確定關(guān)鍵技術(shù)主題,通過(guò)量化新興技術(shù)的5項(xiàng)特征指標(biāo):影響力、增長(zhǎng)性、連貫性、創(chuàng)新性、不確定性和模糊性,計(jì)算新興指數(shù)得分,對(duì)多源數(shù)據(jù)融合新興技術(shù)進(jìn)行識(shí)別和預(yù)判。預(yù)測(cè)新興技術(shù)未來(lái)發(fā)展趨勢(shì),可為電網(wǎng)領(lǐng)域可持續(xù)發(fā)展提供有價(jià)值的參考,驗(yàn)證研究方法的可行性和有效性。

        關(guān)鍵詞:新興技術(shù);多源異構(gòu)數(shù)據(jù)融合;新興技術(shù)畫(huà)像;機(jī)器學(xué)習(xí)

        DOI:10.6049/kjjbydc.2023080688

        中圖分類號(hào):G303 文獻(xiàn)標(biāo)識(shí)碼:A

        文章編號(hào):1001-7348(2025)05-0021-11

        0 引言

        新一輪科技革命和產(chǎn)業(yè)變革正在重塑世界格局,新興技術(shù)作為技術(shù)創(chuàng)新的先導(dǎo)力量和戰(zhàn)略抓手,已經(jīng)成為大國(guó)博弈的核心。隨著新能源技術(shù)、人工智能等領(lǐng)域的迅猛發(fā)展,這些技術(shù)應(yīng)用和探索深刻影響著國(guó)家安全和經(jīng)濟(jì)發(fā)展的各個(gè)方面。世界各科技發(fā)達(dá)國(guó)家對(duì)新興技術(shù)高度重視,例如,歐盟地平線計(jì)劃投入巨資支持新興技術(shù)開(kāi)發(fā)及其相關(guān)產(chǎn)業(yè)發(fā)展,以促進(jìn)戰(zhàn)略自主權(quán);同時(shí),韓國(guó)科技評(píng)估與規(guī)劃研究院(KISTEP)的6G研發(fā)實(shí)施計(jì)劃旨在加快6G等新興技術(shù)研發(fā),打造重點(diǎn)領(lǐng)域核心競(jìng)爭(zhēng)力。中國(guó)“十四五”戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展規(guī)劃則聚焦于增強(qiáng)原始創(chuàng)新,實(shí)現(xiàn)關(guān)鍵新興技術(shù)自主可控。新興技術(shù)探測(cè)有助于我國(guó)實(shí)現(xiàn)前沿技術(shù)突破[1],開(kāi)展前瞻性部署[2],培育新興市場(chǎng),布局未來(lái)產(chǎn)業(yè)方向。因此,準(zhǔn)確把握新興技術(shù)發(fā)展趨勢(shì),是國(guó)家、企業(yè)掌握競(jìng)爭(zhēng)優(yōu)勢(shì)和發(fā)展主動(dòng)權(quán)的關(guān)鍵。

        新興技術(shù)最初被界定為“基于科學(xué)、有可能創(chuàng)立新行業(yè)或改造現(xiàn)有行業(yè)的創(chuàng)新”。此后,學(xué)術(shù)界對(duì)新興技術(shù)概念的內(nèi)涵與外延不斷進(jìn)行拓展[3-4]。Small等[5]認(rèn)為新興技術(shù)具有增長(zhǎng)性和新穎性兩大特征;Wang[6]指出新興技術(shù)具有影響力、增長(zhǎng)性、連貫性和創(chuàng)新性等特征;Carley等[7]將新興技術(shù)特征總結(jié)為創(chuàng)新性、持續(xù)性、社區(qū)性和成長(zhǎng)性;Rotolo等[8]指出,新興技術(shù)是一種具有根本性創(chuàng)新且快速發(fā)展的技術(shù),隨著時(shí)間推移會(huì)保持一定連貫性,且對(duì)社會(huì)經(jīng)濟(jì)具有巨大影響潛力。基于此,本文總結(jié)出新興技術(shù)的五大特征:影響力、增長(zhǎng)性、連貫性、創(chuàng)新性、不確定性和模糊性。

        現(xiàn)有新興技術(shù)識(shí)別研究主要關(guān)注專利和論文等單一數(shù)據(jù)源,或在多源數(shù)據(jù)基礎(chǔ)上進(jìn)行數(shù)量統(tǒng)計(jì),從多源數(shù)據(jù)融合視角構(gòu)建新興技術(shù)識(shí)別評(píng)價(jià)指標(biāo)體系的研究不夠深入,而且鮮有量化操作不確定性和模糊性的新興技術(shù)識(shí)別研究。因此,本文采取資源融合方法,用論文數(shù)據(jù)表征科學(xué)、用專利數(shù)據(jù)表征技術(shù),同時(shí)量化新興技術(shù)的五大特征。

        碳中和是全球共同努力的重要目標(biāo),世界各國(guó)已經(jīng)展開(kāi)多項(xiàng)具體研究和實(shí)施工作。例如,歐盟委員會(huì)發(fā)布了《歐洲氣候法》草案,計(jì)劃通過(guò)立法在2050年實(shí)現(xiàn)碳中和;美國(guó)宣布重新加入《巴黎協(xié)定》;值得注意的是,2020年9月22日,我國(guó)在第七十五屆聯(lián)合國(guó)大會(huì)上提出將努力爭(zhēng)取2060年前實(shí)現(xiàn)碳中和。電網(wǎng)企業(yè)要實(shí)現(xiàn)國(guó)產(chǎn)替代和在國(guó)際市場(chǎng)上取得競(jìng)爭(zhēng)優(yōu)勢(shì),首先需要以科技創(chuàng)新驅(qū)動(dòng)電網(wǎng)高質(zhì)量發(fā)展,其次要摸清電網(wǎng)新興技術(shù)發(fā)展方向,瞄準(zhǔn)未來(lái)電網(wǎng)發(fā)展新興技術(shù)領(lǐng)域,策劃開(kāi)展電網(wǎng)行業(yè)急需、剛需的關(guān)鍵技術(shù)攻關(guān),從而帶動(dòng)我國(guó)電網(wǎng)領(lǐng)域技術(shù)由國(guó)產(chǎn)替代走向國(guó)產(chǎn)引領(lǐng)。因此,本文致力于探測(cè)電網(wǎng)領(lǐng)域的新興技術(shù),捕捉該領(lǐng)域相關(guān)技術(shù)發(fā)展方向,引導(dǎo)電網(wǎng)研發(fā)投資精準(zhǔn)施策,以期在國(guó)際競(jìng)爭(zhēng)中占據(jù)先導(dǎo)優(yōu)勢(shì)地位,有力推動(dòng)我國(guó)電網(wǎng)領(lǐng)域技術(shù)發(fā)展。

        1 研究現(xiàn)狀

        1.1 新興技術(shù)內(nèi)涵

        華宏鳴(1995)從商業(yè)角度提出新興技術(shù)是尚未被商業(yè)化但在未來(lái)3~5年有可能會(huì)商業(yè)化的技術(shù),或是已經(jīng)應(yīng)用且會(huì)發(fā)生顯著變化的技術(shù)。與之不同,Day等[9]在《Wharton on Managing Emerging Technologies》一書(shū)中將新興技術(shù)定義為“基于科學(xué)創(chuàng)新,有潛力創(chuàng)造新產(chǎn)業(yè)或改變現(xiàn)有產(chǎn)業(yè)的技術(shù),包括非連續(xù)創(chuàng)新和漸進(jìn)性創(chuàng)新”。這兩種觀點(diǎn)均強(qiáng)調(diào)新興技術(shù)的商業(yè)化潛力和創(chuàng)新性質(zhì),并引發(fā)了學(xué)術(shù)界對(duì)新興技術(shù)的廣泛關(guān)注。此外,Cozzens等[10]認(rèn)為新興技術(shù)具有巨大市場(chǎng)潛力,但其價(jià)值尚未證明或未達(dá)成共識(shí),具有增長(zhǎng)性、創(chuàng)新性、未開(kāi)發(fā)的市場(chǎng)潛力和高科技基礎(chǔ)4個(gè)關(guān)鍵特征。為凸顯潛在技術(shù)價(jià)值和經(jīng)濟(jì)價(jià)值, Rotolo等[8]認(rèn)為新興技術(shù)是一種高創(chuàng)新性且快速發(fā)展的技術(shù),對(duì)經(jīng)濟(jì)社會(huì)具有巨大影響力,并提出5個(gè)關(guān)鍵特征:影響力、增長(zhǎng)性、連貫性、創(chuàng)新性、不確定性和模糊性;李昌等[11]在此基礎(chǔ)上,將新興技術(shù)界定為利用特征關(guān)鍵詞表征的新技術(shù)領(lǐng)域,在一定時(shí)間內(nèi)足夠新穎,同時(shí)對(duì)其它技術(shù)具有推動(dòng)作用,具有較高關(guān)注度,且在整個(gè)發(fā)展歷程中表現(xiàn)出有序快速、連貫發(fā)展性特征?;谶@一定義,本文認(rèn)為新興技術(shù)包括5個(gè)動(dòng)態(tài)變化特征:新穎性、關(guān)注性、引領(lǐng)性、傳承性和無(wú)序性??傊?,學(xué)術(shù)界對(duì)新興技術(shù)的定義和特征未達(dá)成共識(shí),不同觀點(diǎn)如表1所示。其中,Cozzens等[10]和Rotolo等[8]的觀點(diǎn)影響作用較大,本文采用Rotolo等[8]的觀點(diǎn),對(duì)電網(wǎng)領(lǐng)域新興技術(shù)進(jìn)行識(shí)別。

        1.2 新興技術(shù)識(shí)別方法

        當(dāng)前,關(guān)于新興技術(shù)識(shí)別方法的研究大致可分為兩類:定性分析法和定量分析法。定性分析是早期學(xué)者識(shí)別新興技術(shù)的一種研究方法,包括德?tīng)柗品?、情景分析法、技術(shù)路線圖法,主要依靠專家主觀判斷作為新興技術(shù)識(shí)別標(biāo)準(zhǔn),受主觀因素影響較大,問(wèn)卷設(shè)計(jì)和收集不但耗時(shí)且成本較高,不適合大數(shù)據(jù)時(shí)代新興技術(shù)識(shí)別。

        隨著機(jī)器學(xué)習(xí)技術(shù)的迅猛發(fā)展,許多研究者開(kāi)始使用大數(shù)據(jù)挖掘方法改進(jìn)傳統(tǒng)新興技術(shù)識(shí)別過(guò)程,從而出現(xiàn)了一系列定量研究方法。例如,徐碩等[14]基于專利文獻(xiàn)數(shù)據(jù),從創(chuàng)新性、獨(dú)創(chuàng)性、原創(chuàng)性角度出發(fā),利用負(fù)二項(xiàng)回歸方法和邏輯回歸方法探測(cè)醫(yī)藥領(lǐng)域新興技術(shù);與專利數(shù)據(jù)不同,Liu等[15]認(rèn)為論文分析通常位于專利分析“上游”,他們利用染料敏化太陽(yáng)能電池(DSSC)、非線性編程(NLP)和納米藥物輸送(NEDD)3個(gè)領(lǐng)域論文數(shù)據(jù)集,在Porter等[16]研究的基礎(chǔ)上構(gòu)建持久性、社區(qū)性、增長(zhǎng)性三維新興技術(shù)識(shí)別評(píng)價(jià)指標(biāo)體系。隨著大數(shù)據(jù)時(shí)代的到來(lái),新興技術(shù)探測(cè)使用數(shù)據(jù)來(lái)源越來(lái)越廣,逐漸形成以多源異構(gòu)數(shù)據(jù)為基礎(chǔ)的新興技術(shù)識(shí)別趨勢(shì)。例如,周云澤等[17]基于LDA模型,利用專利和論文數(shù)據(jù)源,采用主題強(qiáng)度、主題新穎度兩個(gè)指標(biāo)識(shí)別自動(dòng)駕駛汽車(chē)領(lǐng)域的新興技術(shù);張維沖等[18]以區(qū)塊鏈技術(shù)為例,利用主題關(guān)聯(lián)分析法,運(yùn)用專利、論文(期刊論文、學(xué)位論文和會(huì)議論文)、圖書(shū)、基金項(xiàng)目和行業(yè)報(bào)告5類資源識(shí)別新興技術(shù);Noor等[19]使用論文數(shù)據(jù)與社交媒體數(shù)據(jù)識(shí)別4個(gè)領(lǐng)域的新興技術(shù)。表2展示了學(xué)者識(shí)別新興技術(shù)所采用的方法、度量特征以及數(shù)據(jù)源。由表2可知,當(dāng)前研究在識(shí)別新興技術(shù)方面存在數(shù)據(jù)源單一的局限性,這種單一數(shù)據(jù)源研究雖然有其價(jià)值,但忽視了其它數(shù)據(jù)來(lái)源的潛在信息。事實(shí)上,專利和論文分別代表科技創(chuàng)新發(fā)展不同階段,它們都包含對(duì)新興技術(shù)的重要見(jiàn)解。因此,綜合使用多源異構(gòu)信息資源對(duì)于全面了解特定領(lǐng)域新興技術(shù)演變規(guī)律具有重要意義。

        2 研究設(shè)計(jì)

        2.1 研究思路

        為識(shí)別新興技術(shù),本文從新興技術(shù)影響力、增長(zhǎng)性、連貫性、創(chuàng)新性、不確定性和模糊性5個(gè)方面構(gòu)建評(píng)價(jià)指標(biāo)體系,并綜合采用學(xué)術(shù)論文和專利文獻(xiàn)資源對(duì)每項(xiàng)技術(shù)進(jìn)行畫(huà)像,衡量其是否為新興技術(shù)。新興技術(shù)識(shí)別路線如圖1所示。具體過(guò)程如下:首先,收集專利和論文多源異構(gòu)數(shù)據(jù)。其次,剔除無(wú)效數(shù)據(jù)和不完整數(shù)據(jù),對(duì)原始數(shù)據(jù)進(jìn)行清洗,包括句子切分、分詞、詞形還原、停用詞過(guò)濾等。運(yùn)用主題N元語(yǔ)法模型(Topical N-Grams,TNG),從學(xué)術(shù)論文和專利文獻(xiàn)中提取技術(shù)主題(term-based theme),測(cè)算技術(shù)主題的影響力、增長(zhǎng)性、連貫性、創(chuàng)新性、不確定性和模糊性五維指標(biāo)。利用支持向量回歸機(jī)模型對(duì)五維指標(biāo)進(jìn)行外推分析,計(jì)算新興度得分,在此基礎(chǔ)上預(yù)判新興技術(shù)。

        2.2 主題識(shí)別技術(shù)

        大多數(shù)主題模型,如Blei等[28]提出的隱含狄利克雷分布模型(LDA)均是基于詞袋(BoW)假設(shè),即假設(shè)文本中每個(gè)單詞都是獨(dú)立的,忽視了單詞之間的順序和上下文信息。Wang等[29]在LDA模型的基礎(chǔ)上提出一個(gè)擴(kuò)展模型,即TNG主題模型,此模型考慮了詞序信息,比LDA模型解釋力更強(qiáng)[30],因此本文選用TNG模型抽取新興技術(shù)主題。

        表3總結(jié)了TNG模型用到的數(shù)學(xué)符號(hào),其中v=0表示段落或句子開(kāi)始或結(jié)束標(biāo)記,k=0表示對(duì)應(yīng)v=0的主題。圖2為T(mén)NG模型概率圖,其中雙圓圈節(jié)點(diǎn)表示觀察變量,單圓圈節(jié)點(diǎn)表示潛在變量,箭頭表示條件依賴,方盤(pán)表示內(nèi)部元素需要重復(fù)右下角指定的次數(shù)。

        式(1)為吉布斯采樣的迭代條件概率公式。

        2.3 主題識(shí)別指標(biāo)

        2.3.1 影響力指標(biāo)構(gòu)建

        影響力是指新興技術(shù)具備某種改變現(xiàn)有產(chǎn)業(yè)“行事方式”的潛力,本文將其量化為新進(jìn)入相應(yīng)技術(shù)領(lǐng)域關(guān)鍵研究者的數(shù)量。一篇學(xué)術(shù)論文通常會(huì)涉及多個(gè)機(jī)構(gòu)的合作署名,一篇專利文獻(xiàn)通常會(huì)涉及多個(gè)申請(qǐng)機(jī)構(gòu)。同時(shí),學(xué)術(shù)論文和專利文獻(xiàn)通常會(huì)涵蓋多個(gè)技術(shù)主題。本文在不同時(shí)間切片下通過(guò)量化機(jī)構(gòu)對(duì)主題k的貢獻(xiàn),利用機(jī)構(gòu)在主題上的累積貢獻(xiàn)值判斷科學(xué)影響力。

        為闡釋方便,假設(shè)科技文獻(xiàn)m共涉及Am個(gè)單位,按署名順序?qū)⑵浔硎緸閛m=(om,1,om,2,…,om,Am)。本文利用SDC計(jì)數(shù)法[31],運(yùn)用貢獻(xiàn)分配方案計(jì)算每個(gè)單位對(duì)該文獻(xiàn)的貢獻(xiàn)比,單位om,i對(duì)其文獻(xiàn)貢獻(xiàn)的分配權(quán)重cm,i計(jì)算過(guò)程如下:

        在得到貢獻(xiàn)分配權(quán)重后,計(jì)算每個(gè)單位x在時(shí)間切片t對(duì)技術(shù)主題k的科學(xué)貢獻(xiàn)值∑m:timestamp=t∧m∈A∧om,i=xcm,i和技術(shù)貢獻(xiàn)值∑m:timestamp=t∧m∈P∧om,i=xcm,i。

        針對(duì)時(shí)間切片t和技術(shù)主題k,在學(xué)術(shù)論文中,按照科學(xué)貢獻(xiàn)值從大到小排序,確定最少單位數(shù)目,使這些單位貢獻(xiàn)累積值大于或等于用戶預(yù)設(shè)閾值,確定科學(xué)影響力InfluenceAk,t。類似地,對(duì)專利文獻(xiàn)中的單位按照技術(shù)貢獻(xiàn)值從大到小排序,確定最少單位數(shù)目,使這些單位貢獻(xiàn)累積值大于或等于用戶預(yù)設(shè)閾值,確定技術(shù)影響力InfluencePk,t。因此,技術(shù)主題k在時(shí)間切片t的影響力計(jì)算公式如下:

        2.3.2 增長(zhǎng)性指標(biāo)構(gòu)建

        在新興技術(shù)發(fā)展過(guò)程中,增長(zhǎng)性是一個(gè)重要指標(biāo),用于衡量該技術(shù)相對(duì)于其它技術(shù)的增長(zhǎng)速度。通常情況下,新興技術(shù)呈現(xiàn)出比其它技術(shù)更快的增長(zhǎng)趨勢(shì)。本文采用流行度斜率反映不同技術(shù)主題之間的相對(duì)增長(zhǎng)速度。具體而言,針對(duì)時(shí)間切片t和技術(shù)主題k,技術(shù)主題增長(zhǎng)性公式如下:

        Growthk,t=wApAk,t-pAk,t-1+wP(pPk,t-pPk,t-1)pAk,t=∑m:timestamp=t∧m∈Am,kpPk,t=∑m:timestamp=t∧m∈Pm,k(8)

        其中,pAk,t、pPk,t分別表示時(shí)間切片t的技術(shù)主題k分別在學(xué)術(shù)論文和專利文獻(xiàn)的流行度,可通過(guò)計(jì)算學(xué)術(shù)論文和專利文獻(xiàn)多項(xiàng)式概率分布得到。

        需要說(shuō)明的是,A表示學(xué)術(shù)論文,P表示專利文獻(xiàn),wA表示賦予學(xué)術(shù)論文指標(biāo)計(jì)算結(jié)果的權(quán)重,wP則表示賦予專利文獻(xiàn)指標(biāo)計(jì)算結(jié)果的權(quán)重。

        2.3.3 連貫性指標(biāo)構(gòu)建

        連貫性是指相應(yīng)技術(shù)并非突然出現(xiàn),而是需要經(jīng)過(guò)一段時(shí)間積累,但具體含義比較穩(wěn)定,不同于仍處于波動(dòng)狀態(tài)的技術(shù)。本文使用對(duì)稱Kullback-Leibler散度(symKLD)指標(biāo)測(cè)量新興技術(shù)連貫性。具體而言,技術(shù)主題k在時(shí)間切片t的連貫性計(jì)算公式如式(9)所示。

        CoherencesymKLDk,t=12wAKLDAφk,t-1,φk,t+KLDAφk,t,φk,t-1+12wPKLDPφk,t-1,φk,t+KLDPφk,t,φk,t-1(9)

        當(dāng)時(shí)間t時(shí)某個(gè)技術(shù)主題概率較高詞匯與時(shí)間t-1時(shí)同個(gè)主題概率較高詞匯完全不同時(shí),CoherencesynKLDk,t值變大,意味著這一主題含義從時(shí)間t-1到時(shí)間t發(fā)生遷移。

        2.3.4 創(chuàng)新性指標(biāo)構(gòu)建

        識(shí)別新興技術(shù)創(chuàng)新性的關(guān)鍵在于挖掘其技術(shù)本質(zhì),著名經(jīng)濟(jì)學(xué)家Arthur[32]在《技術(shù)的本質(zhì)》一書(shū)中指出,所有技術(shù)都來(lái)自其它次級(jí)技術(shù)的組合,元初技術(shù)是對(duì)自然現(xiàn)象及其效應(yīng)的捕獲。這樣,新興技術(shù)被視為采用全新的科學(xué)原理、或?qū)σ延泄δ芑蚍椒ㄟM(jìn)行重新組合而產(chǎn)生新的、不同于原有母體技術(shù)的技術(shù)。

        結(jié)合TNG模型,進(jìn)一步計(jì)算學(xué)術(shù)論文和專利文獻(xiàn)在時(shí)間切片t下技術(shù)主題k的創(chuàng)新性值,計(jì)算公式如下:

        Noveltyk,t=wA∑m∈AZA10mm,k+wP∑m∈PZP10(m)m,kZA10(m)=obsA(m)-expA(m)σA(m)NZP10(m)=obsP(m)-expP(m)σP(m)(10)

        其中,ZA10(m)、ZP10(m)分別表示學(xué)術(shù)論文m和專利文獻(xiàn)m的創(chuàng)新性值,通過(guò)計(jì)算參考文獻(xiàn)所屬期刊組合[33]和被引專利IPC分類號(hào)組合Z值的十分位數(shù)得到。

        2.3.5 不確定性和模糊性指標(biāo)構(gòu)建

        不確定性和模糊性是指新興技術(shù)產(chǎn)出和用途不可預(yù)期,其中包含跨學(xué)科、技術(shù)領(lǐng)域與科研實(shí)踐社群間的模糊性。根據(jù)香農(nóng)在1948年提出的“信息熵”(Shannon entropy, SE)理論,某項(xiàng)新興技術(shù)在前期無(wú)序性較大,隨著時(shí)間推移其無(wú)序性開(kāi)始降低,技術(shù)更加明確。因此,本文采用信息熵法對(duì)尚處于早期階段、無(wú)序性還在增加的新興技術(shù)主題進(jìn)行預(yù)判。某個(gè)技術(shù)主題越有序,說(shuō)明該主題信息熵越低;反之,則說(shuō)明信息熵越高。

        對(duì)于學(xué)術(shù)論文和專利文獻(xiàn),分別采用研究領(lǐng)域與技術(shù)類別(IPC分類號(hào))的信息熵值表示新興技術(shù)主題的不確定性和模糊性。具體來(lái)說(shuō),在時(shí)間切片t技術(shù)主題k的不確定性和模糊性計(jì)算公式如下:

        其中,PAk,tc、PAk,tc分別表示學(xué)術(shù)論文研究領(lǐng)域和專利文獻(xiàn)技術(shù)類別(IPC分類號(hào))在技術(shù)主題k和時(shí)間切片t上的分布概率,cm表示學(xué)術(shù)論文m的研究領(lǐng)域或?qū)@墨I(xiàn)m的技術(shù)類別(IPC分類號(hào))。

        3 實(shí)證結(jié)果分析

        3.1 數(shù)據(jù)獲取

        近年來(lái),電網(wǎng)尖端科技領(lǐng)域發(fā)展是國(guó)家實(shí)現(xiàn)可持續(xù)發(fā)展、保障國(guó)家能源安全的重大部署,因此應(yīng)準(zhǔn)確把握新興技術(shù)在電網(wǎng)領(lǐng)域的科學(xué)定位,破解電網(wǎng)領(lǐng)域技術(shù)難題,搶占行業(yè)發(fā)展制高點(diǎn),提前對(duì)技術(shù)發(fā)展創(chuàng)新趨勢(shì)進(jìn)行預(yù)測(cè)。本文以電網(wǎng)領(lǐng)域?yàn)槔?,開(kāi)展電網(wǎng)新興技術(shù)識(shí)別和預(yù)判研究。從德溫特創(chuàng)新數(shù)據(jù)庫(kù)(Derwent Innovation)中下載專利文獻(xiàn)集合,選定Web of Science核心合集下載學(xué)術(shù)論文集合。由于專利文獻(xiàn)和學(xué)術(shù)論文檢索式較長(zhǎng),本文不再一一列示,檢索文獻(xiàn)類型限定為“Article”和“Review”,時(shí)間范圍為2015—2022年,學(xué)者大多選用5~10年數(shù)據(jù)作為支撐[25]。由于電網(wǎng)領(lǐng)域論文與專利數(shù)據(jù)量較大,同時(shí)8年數(shù)據(jù)量能有效保證識(shí)別出的技術(shù)范圍在合理區(qū)間之內(nèi),并能精準(zhǔn)提出相應(yīng)政策建議,故選取近8年數(shù)據(jù)。經(jīng)過(guò)檢索,本文最終獲取743 344篇學(xué)術(shù)論文和1 247 235篇專利文獻(xiàn)。

        圖3展示了2015—2022年電網(wǎng)領(lǐng)域?qū)W術(shù)論文和專利文獻(xiàn)數(shù)量分布情況。由圖3可以看出,電網(wǎng)領(lǐng)域?qū)W術(shù)論文和專利文獻(xiàn)發(fā)表量總體呈逐年遞增態(tài)勢(shì)。與論文數(shù)量不同,專利數(shù)量增長(zhǎng)速度在2019年之后明顯加快,這在一定程度上體現(xiàn)了人們對(duì)于技術(shù)創(chuàng)新的關(guān)注度和投資力度,反映出電網(wǎng)領(lǐng)域近年來(lái)研究熱度不斷上漲,發(fā)展速度加快、發(fā)展規(guī)模擴(kuò)大。

        3.2 數(shù)據(jù)預(yù)處理

        為確保數(shù)據(jù)質(zhì)量,首先對(duì)學(xué)術(shù)論文和專利文獻(xiàn)數(shù)據(jù)進(jìn)行初步清洗,包括去除無(wú)效、重復(fù)和不完整的數(shù)據(jù)。本文使用OpenNLP工具對(duì)標(biāo)題和摘要進(jìn)行句子切分、分詞和詞形還原。其次,利用英文停用詞列表過(guò)濾停用詞,并將科技文獻(xiàn)中的數(shù)字替換為“Number”。通過(guò)上述過(guò)程,最終獲得實(shí)驗(yàn)語(yǔ)料集。

        3.3 候選技術(shù)主題識(shí)別

        3.3.1 模型參數(shù)設(shè)定

        本文利用TNG模型識(shí)別技術(shù)主題,其中TNG超參數(shù)取值為:α=0.5, β=0.01, γ=0.1和δ=0.01。為對(duì)參數(shù)后驗(yàn)分布進(jìn)行估計(jì),使用Gibbs采樣方法,并設(shè)置迭代次數(shù)為1 000次。困惑度在評(píng)估主題模型性能方面發(fā)揮關(guān)鍵作用,是一種衡量模型泛化能力的指標(biāo)。通過(guò)對(duì)不同主題數(shù)困惑度進(jìn)行比較,本文確定最優(yōu)主題數(shù)量為50。

        3.3.2 候選技術(shù)主題內(nèi)容

        經(jīng)過(guò)篩選,剔除明顯不相關(guān)主題后,最終確定36個(gè)相關(guān)技術(shù)主題。同時(shí),通過(guò)人工判斷和歸納,對(duì)這些技術(shù)主題標(biāo)簽進(jìn)行提煉,如表4所示。

        3.4 新興度指標(biāo)計(jì)算

        本文致力于確定36個(gè)技術(shù)主題是否屬于電網(wǎng)領(lǐng)域新興技術(shù)。首先,收集關(guān)于36個(gè)技術(shù)主題的5個(gè)特征指標(biāo)數(shù)據(jù),即影響力指標(biāo)Influence'k,t、增長(zhǎng)性指標(biāo)Growth'k,t、連貫性指標(biāo)Coherence'k,t、創(chuàng)新性指標(biāo)Novelty'k,t、不確定性和模糊性指標(biāo)Uncertainty'k,t。這些指標(biāo)數(shù)據(jù)包括特定時(shí)間切片t下每個(gè)技術(shù)主題k的值。在計(jì)算新興度指數(shù)之前,采用最小值—最大值歸一化方法,將所有五維指標(biāo)歸一化至共同區(qū)間[0,1]。這一步驟是為消除不同指標(biāo)之間的度量單位和范圍差異,以確保它們具有可比性。對(duì)連貫性指標(biāo)進(jìn)行正向化處理,歸一化處理公式如下:

        在新興度指標(biāo)計(jì)算中,每個(gè)特征指標(biāo)都有一個(gè)權(quán)重 wi,它們代表每個(gè)指標(biāo)的重要性。本研究對(duì)5個(gè)指標(biāo)賦予相同權(quán)重,即 w1=w2=w3=w4=w5=1/5。最終,使用簡(jiǎn)單線性加權(quán)法,將歸一化后的五維特征指標(biāo)值乘以相應(yīng)權(quán)重,然后將它們相加,得到新興度指數(shù)得分。具體計(jì)算公式如下:

        3.5 技術(shù)主題識(shí)別與解讀

        基于上述指標(biāo),本文得到2016—2022年技術(shù)主題新興度得分及排名。其中,“新型電力系統(tǒng)低碳規(guī)劃研究”在過(guò)去一段時(shí)間一直保持較高的新興度排名。在當(dāng)前電力行業(yè)深度發(fā)展戰(zhàn)略中,低碳轉(zhuǎn)型升級(jí)是至關(guān)重要的戰(zhàn)略環(huán)節(jié)。在實(shí)施 “雙碳”目標(biāo)進(jìn)程中,能源是關(guān)鍵領(lǐng)域,而電力則扮演著核心角色。新型電力系統(tǒng)具有安全高效、清潔低碳、柔性靈活和智能融合4個(gè)重要特征,其中清潔低碳是核心目標(biāo)。因此,該新興技術(shù)與當(dāng)前戰(zhàn)略目標(biāo)高度契合。本文將2022年排名前六的技術(shù)判定為電網(wǎng)領(lǐng)域新興技術(shù),分別為新型電力系統(tǒng)低碳規(guī)劃研究、電機(jī)驅(qū)動(dòng)與控制技術(shù)、輸電線智能巡檢技術(shù)、數(shù)字電網(wǎng)智能運(yùn)維技術(shù)、多無(wú)人系統(tǒng)中的協(xié)同控制技術(shù)和內(nèi)燃機(jī)動(dòng)力系統(tǒng)技術(shù)。通過(guò)對(duì)相關(guān)文獻(xiàn)、政策規(guī)劃以及工業(yè)應(yīng)用進(jìn)行綜合調(diào)研,可間接證實(shí)識(shí)別結(jié)果的合理性。舉例來(lái)說(shuō),“新型電力系統(tǒng)低碳規(guī)劃研究”在歐美國(guó)家推進(jìn)新能源發(fā)展過(guò)程中不僅規(guī)定了中長(zhǎng)期戰(zhàn)略目標(biāo),還重視能源立法及體制機(jī)制設(shè)計(jì)。在立法方面,英國(guó)出臺(tái)《能源法案》及《電力市場(chǎng)改革》,德國(guó)不斷修訂《可再生能源法》等,以完整的法律框架保證能源政策的前瞻性、連續(xù)性和可操作性;同時(shí),國(guó)家能源局發(fā)布的《新型電力系統(tǒng)發(fā)展藍(lán)皮書(shū)》也提出要加強(qiáng)電力供應(yīng)支撐體系、新能源開(kāi)發(fā)利用體系、儲(chǔ)能規(guī)?;季謶?yīng)用體系、電力系統(tǒng)智慧化運(yùn)行體系四大體系建設(shè)?!半姍C(jī)驅(qū)動(dòng)與控制技術(shù)”在《中國(guó)制造2025》國(guó)家戰(zhàn)略背景下備受關(guān)注,作為系統(tǒng)高效運(yùn)行和低能耗的關(guān)鍵,電機(jī)驅(qū)動(dòng)與控制技術(shù)正朝著高能效、智能化和集成化方向發(fā)展,目前發(fā)達(dá)國(guó)家新能源汽車(chē)使用鋰離子電池能量密度已經(jīng)實(shí)現(xiàn)300Wh/kg以上的高能量密度電池,不但實(shí)現(xiàn)技術(shù)標(biāo)準(zhǔn)化,而且產(chǎn)能更高效。“輸電線智能巡檢技術(shù)”在智能電網(wǎng)背景下具有重要地位,數(shù)字化手段有助于實(shí)現(xiàn)輸電線路狀態(tài)可視化、智能化巡檢,而且這項(xiàng)技術(shù)在國(guó)家相關(guān)戰(zhàn)略規(guī)劃中得到驗(yàn)證,如《“工業(yè)互聯(lián)網(wǎng)+安全生產(chǎn)”行動(dòng)計(jì)劃(2021-2023年)》通過(guò)開(kāi)展“5G+智能巡檢”提高實(shí)時(shí)監(jiān)測(cè)能力。目前,英國(guó)加強(qiáng)對(duì)設(shè)計(jì)、生產(chǎn)、運(yùn)輸、使用和回收等環(huán)節(jié)的安全管理,建立完善的電池安全檢測(cè)和監(jiān)控機(jī)制,保障每個(gè)環(huán)節(jié)的安全性;《南方電網(wǎng)公司建設(shè)新型電力系統(tǒng)行動(dòng)方案 (2021—2030年)白皮書(shū)》和“十四五”新型基礎(chǔ)設(shè)施建設(shè)戰(zhàn)略明確提出數(shù)字電網(wǎng)智能運(yùn)維技術(shù),有力推進(jìn)電網(wǎng)輸配電網(wǎng)絡(luò)智能運(yùn)維;此外,美國(guó)在《Grid2030——美國(guó)電力系統(tǒng)下一個(gè)百年的國(guó)家愿景(2003)》中也強(qiáng)調(diào)智能數(shù)字電網(wǎng)技術(shù),用信息化+儲(chǔ)能讓電網(wǎng)更好地適應(yīng)新能源占比提升引發(fā)的各類問(wèn)題?!岸酂o(wú)人系統(tǒng)中的協(xié)同控制技術(shù)”針對(duì)我國(guó)“制造強(qiáng)國(guó)”戰(zhàn)略目標(biāo),無(wú)人系統(tǒng)已成為社會(huì)重點(diǎn)研究領(lǐng)域,而多無(wú)人系統(tǒng)協(xié)同控制問(wèn)題則是未來(lái)無(wú)人系統(tǒng)發(fā)展備受關(guān)注的核心議題之一。2017年,我國(guó)在《新一代人工智能發(fā)展規(guī)劃》中,將自主式智能無(wú)人系統(tǒng)作為人工智能發(fā)展的一項(xiàng)重要內(nèi)容;2018年,美國(guó)在未來(lái)地面人機(jī)組合計(jì)劃中專門(mén)研究了機(jī)器人和人工智能如何與人類協(xié)同行動(dòng)的問(wèn)題。對(duì)于“內(nèi)燃機(jī)動(dòng)力系統(tǒng)技術(shù)”,內(nèi)燃機(jī)是國(guó)民經(jīng)濟(jì)和國(guó)防建設(shè)的“動(dòng)力心臟”,同時(shí)也是“雙碳”目標(biāo)實(shí)現(xiàn)的主力軍,我國(guó)《內(nèi)燃機(jī)產(chǎn)業(yè)高質(zhì)量發(fā)展規(guī)劃(2021-2035)》強(qiáng)調(diào)智能化關(guān)鍵技術(shù)創(chuàng)新與應(yīng)用,英國(guó)也在碳排放稅和配套碳價(jià)政策中限制傳統(tǒng)內(nèi)燃機(jī)燃料使用,英國(guó)技術(shù)戰(zhàn)略委員會(huì)同時(shí)贊助了3個(gè)關(guān)于飛輪混合動(dòng)力系統(tǒng)的研究項(xiàng)目,且掌握了大量飛輪混合動(dòng)力先進(jìn)技術(shù)。

        為深入了解這些新興技術(shù)未來(lái)發(fā)展趨勢(shì),本文采用支持向量機(jī)回歸模型對(duì)當(dāng)前五維指標(biāo)進(jìn)行外推分析。這種模型以支持向量機(jī)的思想為基礎(chǔ),在特征空間中構(gòu)建一個(gè)超平面,盡可能地?cái)M合基于時(shí)間序列的新興技術(shù)數(shù)據(jù)。具體方法如下:首先,計(jì)算過(guò)去7年時(shí)間多維度新興技術(shù)特征數(shù)據(jù),對(duì)每個(gè)新興技術(shù)數(shù)據(jù)進(jìn)行切片處理,使用歷史數(shù)據(jù)作為自變量,即用前3個(gè)時(shí)間切片指標(biāo)數(shù)值預(yù)測(cè)下一個(gè)時(shí)間切片(t+1)的指標(biāo)數(shù)值,即因變量。窗口大小設(shè)置為3,每個(gè)窗口包含3個(gè)連續(xù)的時(shí)間切片數(shù)據(jù),隨著窗口滑動(dòng),數(shù)據(jù)被切分為不同自變量和因變量組合。其次,將每個(gè)新興技術(shù)的前n條數(shù)據(jù)作為訓(xùn)練集,將最后一條數(shù)據(jù)作為驗(yàn)證集。這種數(shù)據(jù)劃分方式能夠了解同一領(lǐng)域下不同新興技術(shù)的特點(diǎn),從而更好地?cái)M合和預(yù)測(cè)數(shù)據(jù)。

        本文使用支持向量機(jī)回歸模型對(duì)這些數(shù)據(jù)進(jìn)行擬合分析。為獲得最佳性能,首先利用K折交叉驗(yàn)證和網(wǎng)格搜索確定最優(yōu)支持向量機(jī)超參數(shù),確保選擇適用于數(shù)據(jù)集的最佳參數(shù)配置,以最大限度減少預(yù)測(cè)數(shù)據(jù)的不確定性。其次,根據(jù)擬合曲線推測(cè)未來(lái)一年的指標(biāo)數(shù)值。最后,結(jié)合歷史數(shù)據(jù)和模型擬合結(jié)果,預(yù)測(cè)和分析未來(lái)兩年指標(biāo)趨勢(shì)。圖4呈現(xiàn)了未來(lái)兩年的外推結(jié)果,可見(jiàn)新型電力系統(tǒng)低碳規(guī)劃研究、輸電線智能巡檢技術(shù)、多無(wú)人系統(tǒng)中的協(xié)同控制技術(shù)和內(nèi)燃機(jī)動(dòng)力系統(tǒng)技術(shù)保持前五位置不變,而智能風(fēng)能電力系統(tǒng)集成技術(shù)和離子電池與能量存儲(chǔ)技術(shù)排名逐漸靠前,說(shuō)明這些新興技術(shù)在未來(lái)有望獲得更多關(guān)注和發(fā)展。

        4 結(jié)論與討論

        4.1 研究結(jié)論

        新興技術(shù)在當(dāng)今世界科技革命和產(chǎn)業(yè)變革中扮演著重要角色。各科技發(fā)達(dá)國(guó)家都高度重視新興技術(shù),并將其作為國(guó)家戰(zhàn)略規(guī)劃的核心。準(zhǔn)確把握新興技術(shù)發(fā)展趨勢(shì)至關(guān)重要,有助于我國(guó)實(shí)現(xiàn)技術(shù)突破、進(jìn)行前瞻性技術(shù)部署、培育新興市場(chǎng)以及指導(dǎo)產(chǎn)業(yè)化布局。

        本文采用多源數(shù)據(jù)融合方法,以電網(wǎng)領(lǐng)域論文和專利數(shù)據(jù)為基礎(chǔ)開(kāi)展新興技術(shù)識(shí)別方法研究。利用TNG模型抽取技術(shù)主題,并通過(guò)人工篩選確定關(guān)鍵主題?;诔槿〉玫降闹黝},測(cè)度新興技術(shù)的影響力、增長(zhǎng)性、連貫性、創(chuàng)新性以及不確定性和模糊性特征指標(biāo),其中不確定性和模糊性指標(biāo)之前研究較少涉及,本文基于“信息熵”理論對(duì)其進(jìn)行度量,在驗(yàn)證中取得較好效果。隨后,對(duì)5個(gè)指標(biāo)進(jìn)行融合分析,得到新興度得分,從而對(duì)論文和專利數(shù)據(jù)中的新興技術(shù)進(jìn)行識(shí)別和預(yù)測(cè),確定電網(wǎng)領(lǐng)域新興技術(shù)為:新型電力系統(tǒng)低碳規(guī)劃研究、電機(jī)驅(qū)動(dòng)與控制技術(shù)、輸電線智能巡檢技術(shù)、數(shù)字電網(wǎng)智能運(yùn)維技術(shù)、多無(wú)人系統(tǒng)中的協(xié)同控制技術(shù)和內(nèi)燃機(jī)動(dòng)力系統(tǒng)技術(shù)。同時(shí),通過(guò)外推未來(lái)兩年發(fā)展趨勢(shì),本文揭示具有新興潛力的技術(shù)為智能風(fēng)能電力系統(tǒng)集成技術(shù)和離子電池與能量存儲(chǔ)技術(shù)。這些發(fā)現(xiàn)為科學(xué)界、產(chǎn)業(yè)界和政策制定者提供了有價(jià)值的參考,有助于推動(dòng)電網(wǎng)領(lǐng)域可持續(xù)發(fā)展,從而驗(yàn)證本文方法的可行性和有效性。

        4.2 不足與展望

        新質(zhì)生產(chǎn)力的提出進(jìn)一步明確了新興技術(shù)在先進(jìn)生產(chǎn)力發(fā)展中的重要地位。本文基于電網(wǎng)領(lǐng)域論文和專利數(shù)據(jù),利用影響力、增長(zhǎng)性、連貫性、創(chuàng)新性以及不確定性和模糊性特征指標(biāo)構(gòu)建新興技術(shù)識(shí)別框架,以電網(wǎng)領(lǐng)域?yàn)槔R(shí)別新興技術(shù),豐富了新興技術(shù)識(shí)別領(lǐng)域研究,具有一定理論和實(shí)踐意義,但仍存在一定不足,需要后續(xù)研究加以完善。

        (1)在大數(shù)據(jù)和人工智能時(shí)代背景下,數(shù)據(jù)來(lái)源不斷豐富,本文僅使用論文和專利數(shù)據(jù)作為主題識(shí)別依據(jù),忽視了其它文本數(shù)據(jù)源如圖書(shū)、基金項(xiàng)目、行業(yè)報(bào)告、政策文獻(xiàn)等,這些資源既能提供科技研究資助和支持方向,還能關(guān)注行業(yè)發(fā)展前沿,以及政府對(duì)新興技術(shù)的重視程度和政策導(dǎo)向。此外,還可以將初創(chuàng)企業(yè)數(shù)據(jù)、公共輿論數(shù)據(jù)納入指標(biāo)度量中,這兩種資源能在一定程度上提供行業(yè)企業(yè)發(fā)展情況和社會(huì)輿論方面的關(guān)注度,有助于提升新興技術(shù)識(shí)別的準(zhǔn)確性和全面性。

        (2)本文旨在提出一種普適性的方法運(yùn)用于所有領(lǐng)域,因此以電網(wǎng)領(lǐng)域數(shù)據(jù)為例識(shí)別新興技術(shù)只是研究開(kāi)端,后續(xù)還需將此方法應(yīng)用于更多領(lǐng)域,以驗(yàn)證其普適性。

        (3)隨著人工智能和深度學(xué)習(xí)技術(shù)的快速發(fā)展,應(yīng)探索更高效、數(shù)據(jù)量更大的方法對(duì)技術(shù)主題進(jìn)行識(shí)別,進(jìn)而提高識(shí)別效率,并形成一套自動(dòng)化體系,助力其他領(lǐng)域科研人員運(yùn)用于相關(guān)領(lǐng)域研究。

        參考文獻(xiàn):

        [1]JOUNG J, KIM K. Monitoring emerging technologies for technology planning using technical keyword based analysis from patent data[J]. Technological Forecasting and Social Change, 2017, 114: 281-292.

        [2]徐碩,王聰聰,安欣. 新興技術(shù)弱信號(hào)掃描預(yù)判述評(píng)[J]. 情報(bào)雜志,2023,42(3):117-122.

        [3]盧小賓,楊冠燦,徐碩,等. 計(jì)量與演化視角下的新興技術(shù)識(shí)別研究進(jìn)展評(píng)述[J]. 情報(bào)學(xué)報(bào),2020,39(6):651-661.

        [4]楊思洛,江曼. 新興技術(shù)內(nèi)涵特征和識(shí)別方法研究進(jìn)展[J].情報(bào)科學(xué),2023,41(5):181-190.

        [5]SMALL H, BOYACK K W, KLAVANS R. Identifying emerging topics in science and technology[J]. Research Policy, 2014, 43(8): 1450-1467.

        [6]WANG Q. A bibliometric model for identifying emerging research topics[J]. Journal of the Association for Information Science and Technology, 2018, 69(2): 290-304.

        [7]CARLEY S F, NEWMAN N C, PORTER A L, et al. An indicator of technical emergence[J]. Scientometrics, 2018, 115(1): 35-49.

        [8]ROTOLO D, HICKS D, MARTIN B R. What is an emerging technology[J].Research Policy,2015,44(10): 1827-1843.

        [9]DAY G S, SCHOEMAKER P J H, GUNTHER R E. Wharton on managing emerging technologies[M].Hoboken:John Wileyamp;Sons, Inc, 2000.

        [10]COZZENS S E, GATCHAIR S, KANG Y, et al. Emerging technologies: quantitative identification and measurement[J]. Technology Analysis and Strategic Management, 2010, 22(3): 361-376.

        [11]李昌,楊中楷,董坤. 基于多維屬性動(dòng)態(tài)變化特征的新興技術(shù)識(shí)別研究[J]. 情報(bào)學(xué)報(bào),2022,41(5):463-474.

        [12]李仕明,肖磊,蕭延高. 新興技術(shù)管理研究綜述[J]. 管理科學(xué)學(xué)報(bào),2007,10(6):76-85.

        [13]徐建國(guó),李孟軍,游翰霖. 新興技術(shù)識(shí)別研究進(jìn)展[J]. 情報(bào)雜志,2018,37(12):8-12,7.

        [14]徐碩,郝麗媛,安欣. 基于藥物專利信息資源的新興技術(shù)探測(cè)研究[J]. 中國(guó)發(fā)明與專利,2021,18(6):14-23.

        [15]LIU X, PORTER A L. A 3-dimensional analysis for evaluating technology emergence indicators[J]. Scientometrics, 2020, 124: 27-55.

        [16]PORTER A L, GARNER J, CARLEY S F, et al. Emerging scoring to identify Ramp;D topics and key players[J]. Technological Forecasting and Social Change, 2019, 146: 628-643.

        [17]周云澤,閔超. 基于LDA模型與共享語(yǔ)義空間的新興技術(shù)識(shí)別——以自動(dòng)駕駛汽車(chē)為例[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2022,6(Z1):55-66.

        [18]張維沖,王芳,趙洪. 多源信息融合用于新興技術(shù)發(fā)展趨勢(shì)識(shí)別——以區(qū)塊鏈為例[J]. 情報(bào)學(xué)報(bào),2019,38(11):1166-1176.

        [19]NOOR S, GUO Y, SHAH S H H, et al. Research synthesis and thematic analysis of twitter through bibliometric analysis[J]. International Journal on Semantic Web and Information Systems, 2020, 16(3): 88-109.

        [20]CORROCHER N, MALERBA F, MONTOBBIO F. The emergence of new technologies in the ICT field: main actors, geographical distribution and knowledge sources[R]. Department of Economics, University of Insubria, 2003.

        [21]楊冠燦,丁月,徐碩,等. 基于專利動(dòng)態(tài)指標(biāo)的新興技術(shù)預(yù)測(cè)建模方法——以癌癥藥物領(lǐng)域?yàn)槔齕J]. 情報(bào)學(xué)報(bào),2022,41(8):786-795.

        [22]LEE C, KWON O, KIM M, et al. Early identification of emerging technologies: a machine learning approach using multiple patent indicators[J]. Technological Forecasting and Social Change, 2018, 127: 291-303.

        [23]宋欣娜,郭穎,席笑文.基于專利文獻(xiàn)的多指標(biāo)新興技術(shù)識(shí)別研究[J]. 情報(bào)雜志,2020,39(6):76-81,88.

        [24]任惠超,黃慶龍,張祖國(guó),等. 船舶領(lǐng)域新興技術(shù)主題識(shí)別技術(shù)研究[J]. 情報(bào)理論與實(shí)踐,2022,45(11):103-106.

        [25]XU S,HAO L,YANG G, et al. A topic models based framework for detecting and forecasting emerging technologies[J].Technological Forecasting and Social Change, 2021, 162: 120366.

        [26]XU S, HAO L, AN X, et al. Emerging research topics detection with multiple machine learning models[J]. Journal of Informetrics, 2019, 13(2): 100983.

        [27]高楠,高嘉騏,陳洪璞. 新興技術(shù)識(shí)別與演化路徑分析方法研究——以集成電路領(lǐng)域?yàn)槔齕J]. 情報(bào)科學(xué),2023,41(3):127-135,172.

        [28]BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.

        [29]WANG X, MCCALLUM A, WEI X. Topical n-grams: phrase and topic discovery, with an application to information retrieval[C].Proceedings of the 7th IEEE International Conference on Data Mining. IEEE, 2007: 697-702.

        [30]MANN G S, MIMNO D, MCCALLUM A. Bibliometric impact measures leveraging topic analysis[C].Proceedings of the 6th ACM/IEEE Joint Conference on Digital Libraries,2006: 65-74.

        [31]TSCHARNTKE T, HOCHBERG M E, RAND T A, et al. Author sequence and credit for contributions in multiauthored publications[J]. PLoS Biology, 2017,5(1): 18.

        [32]ARTHUR W B. The nature of technology: what it is and how it evolves[M]. New York: Simon and Schuster, 2009.

        [33]UZZI B, MUKHERJEE S, STRINGER M, et al. Atypical combination and scientific impact[J]. Science, 2013, 342(6157): 468-472.

        (責(zé)任編輯:王敬敏)

        An Approach to Identifying Emerging Technologies by Fusing Multi-Source Data

        Wang Hong1, Liu Qinying1, Hu Yufeng2, Wang Qinghong1, Zhou Yuzhong1

        (1.Southern Power Grid Research Institute Co., Ltd.Guangzhou 510663,China;2.China Southern Power Grid Co., Ltd., Guangzhou 510663, China)

        Abstract:Emerging technologies not only signify the cutting edge of technological innovation but also represent a pivotal aspect of international competition, and they are highly valued by nations, international organizations, and leading corporations worldwide. By swiftly and accurately detecting potential emerging technologies in target domains, they can grasp the opportunities of future technological and industrial development, break through the technological barriers in various fields, and thus enhance the competitive advantage of both nations and enterprises in strategic global competitions. In the context of China's aggressive pursuit of its \"carbon neutrality and carbon peak\" goals, innovation in power grid technology assumes exceptional importance. Power grid companies are compelled to deeply comprehend and master the evolving trends in emerging grid technologies, undertake crucial technological research, and guide precise research and development investments to secure a dominant position in the international arena.

        As vital carriers of scientific information, academic papers and patent literature are predominantly used to evaluate the level of scientific research activities and the innovation in industrial technology, and have become the primary sources for detecting emerging technologies. An in-depth study and analysis of these documents, followed by the extraction and selection of innovative information within them, helps to uncover latent technological knowledge. Although single data source methods are operationally effective, they struggle to accurately reflect the complexity of scientific themes. Conversely, research on detecting emerging technologies through multi-source data remains relatively scarce. Currently, there is a lack of academic consensus on the definition of emerging technologies, leading to different indicators for assessing whether a technology topic is an emerging technology. Identifying these technologies accurately and delineating their quintessential characteristics—impact, growth, coherence, novelty, and uncertainty—is crucial. It is noteworthy that quantified research on these features, particularly uncertainty and ambiguity, is still scarce.

        This paper introduces a method for integrating multi-source data, aiming to amalgamate academic and patent data to enhance semantic complementarity between varied data types, thereby boosting efficiency in identifying emerging technologies. The study utilizes the Topical N-Grams (TNG) model to extract technological themes from academic papers and patent documents, followed by manual selection to ascertain key technological themes. According to these themes, it computes five primary feature indicators: impact, growth, coherence, novelty, and uncertainty. These indicators are then amalgamated to calculate an emergence score. Subsequently, the study employs a support vector regression machine model for extrapolating these indicators, identifying emerging technologies with potential for future growth. Focusing on the grid sector, the study collects patent literature from the Derwent Innovation database and academic papers from the Web of Science core collection,limiting document types to \"Article\" and \"Review\" and setting the timeframe from 2015 to 2022, with a total of 743 344 academic papers and 1 247 235 patents. The analysis of the annual distribution of academic and patent papers published in the grid field reveals a steady increase in research interest; the emerging technologies in the grid sector for 2022 include research on low-carbon planning for new power systems, electric motor drive and control technology, intelligent inspection technology for transmission lines, smart operation and maintenance technology for digital grids, cooperative control technology in multi-unmanned systems, and internal combustion engine power system technology. Notably, research on low-carbon planning for new power systems has consistently ranked high in emergence in recent times. In the deep development strategy of the current power industry, low-carbon transformation and upgrading are deemed vital. Further indicator extrapolation indicates that research on low-carbon planning for new power systems, intelligent inspection technology for transmission lines, cooperative control technology in multi-unmanned systems, and internal combustion engine power system technology maintain their top-five status, while intelligent wind energy power system integration technology and ion battery and energy storage technology are gradually climbing the ranks, suggesting that these emerging technologies are poised for increased attention and development in the future. In addition to academic papers and patent literature, funding programs and policy texts are also very important sources of information. These resources can provide information about the direction of funding and support for Samp;T research, as well as the level of government attention and policy orientation towards emerging technologies.

        Key Words:Emerging Technology;Multi-Source Heterogeneous Data Fusion;Profile of Emerging Technology;Machine Learning

        收稿日期:2023-08-29 修回日期:2024-01-04

        基金項(xiàng)目:中國(guó)南方電網(wǎng)有限責(zé)任公司創(chuàng)新項(xiàng)目(ZBKJXM20220013)

        作者簡(jiǎn)介:王宏(1989—),男,湖北荊州人,南方電網(wǎng)科學(xué)研究院有限責(zé)任公司高級(jí)工程師,研究方向?yàn)榧夹g(shù)和戰(zhàn)略情報(bào)分析、數(shù)據(jù)挖掘、電力系統(tǒng)自動(dòng)化;劉沁瑩(1996—),女,貴州六盤(pán)水人,博士,南方電網(wǎng)科學(xué)研究院有限責(zé)任公司工程師,研究方向?yàn)榧夹g(shù)和戰(zhàn)略情報(bào)分析、電網(wǎng)風(fēng)險(xiǎn)管控、電力系統(tǒng)自動(dòng)化;胡玉峰(1975—),男,湖南郴州人,博士, 中國(guó)南方電網(wǎng)有限責(zé)任公司高級(jí)工程師,研究方向?yàn)榭萍紕?chuàng)新管理、知識(shí)產(chǎn)權(quán)管理、電力系統(tǒng)自動(dòng)化;王慶紅(1976—),男,貴州銅仁人,博士,南方電網(wǎng)科學(xué)研究院有限責(zé)任公司教授級(jí)高級(jí)工程師,研究方向?yàn)殡娏萍紕?chuàng)新、技術(shù)競(jìng)爭(zhēng)情報(bào)、知識(shí)產(chǎn)權(quán)管理;周育忠(1974—),男,廣東汕頭人, 南方電網(wǎng)科學(xué)研究院有限責(zé)任公司教授級(jí)高級(jí)工程師,研究方向?yàn)橹R(shí)管理、標(biāo)準(zhǔn)化、電力大數(shù)據(jù)。

        猜你喜歡
        機(jī)器學(xué)習(xí)
        基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
        前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
        下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
        活力(2016年8期)2016-11-12 17:30:08
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        基于Spark的大數(shù)據(jù)計(jì)算模型
        基于樸素貝葉斯算法的垃圾短信智能識(shí)別系統(tǒng)
        基于圖的半監(jiān)督學(xué)習(xí)方法綜述
        機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
        av无码一区二区三| 亚洲九九九| 精品日产卡一卡二卡国色天香| 日本一本一道久久香蕉男人的天堂| 中国免费av网| 国产精品露脸视频观看| 插我一区二区在线观看| 一本久久精品久久综合| 好看午夜一鲁一鲁一鲁| 国产一级做a爱免费观看| 韩国三级中文字幕hd| 色婷婷精品久久二区二区蜜臀av| 人成视频在线观看免费播放| 国产最新地址| 亚洲精品午夜无码电影网| 无码人妻丰满熟妇区免费| 麻豆精品国产免费av影片| 69国产成人综合久久精| 麻豆av传媒蜜桃天美传媒| 色天使久久综合网天天| 午夜亚洲精品一区二区| 久久一日本道色综合久久大香| 一区二区传媒有限公司| 国产综合精品| 爆操丝袜美女在线观看| 在线观看av不卡 一区二区三区| 亚洲国产成人无码电影| 欧美激情二区| 亚洲熟女乱色一区二区三区| 国产成人av综合色| 国产一区二区视频免费在| 偷拍视频这里只有精品| 亚洲一道一本快点视频| 老汉tv永久视频福利在线观看 | 久久婷婷五月综合色欧美| 日韩av一区二区不卡| 美女狂喷白浆网站视频在线观看| av大片在线无码永久免费网址| 亚洲国产麻豆综合一区| 欧美成人一区二区三区在线观看| 99国产精品人妻噜啊噜|