亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于趨勢(shì)演化分析的技術(shù)預(yù)測(cè)研究

        2021-01-23 05:26:40
        科技管理研究 2020年24期
        關(guān)鍵詞:高頻詞詞頻趨勢(shì)

        (華東理工大學(xué)科技信息研究所,上海 200237)

        隨著科學(xué)技術(shù)的發(fā)展和經(jīng)濟(jì)全球化進(jìn)程的加快,獲取關(guān)鍵技術(shù)優(yōu)勢(shì)成為提升國(guó)家和產(chǎn)業(yè)競(jìng)爭(zhēng)力的重要手段,技術(shù)預(yù)測(cè)受到越來(lái)越多國(guó)家的重視,美國(guó)、日本、英國(guó)等國(guó)家開(kāi)始紛紛加強(qiáng)對(duì)科技發(fā)展趨勢(shì)的預(yù)測(cè)及研究工作[1-2]。作為世界各國(guó)政府決策的基礎(chǔ)與前提,技術(shù)預(yù)測(cè)是遴選可能產(chǎn)生最大經(jīng)濟(jì)效益與社會(huì)效益的戰(zhàn)略研究領(lǐng)域和通用新技術(shù)的手段。技術(shù)是隨時(shí)間而進(jìn)化,絕大多數(shù)的技術(shù)都是漸進(jìn)發(fā)展的,絕非憑空建立起來(lái)的[3],技術(shù)預(yù)測(cè)也應(yīng)是一個(gè)隨時(shí)間推移而逐漸演變的過(guò)程,因此,構(gòu)建客觀、全面、合理且具操作性的技術(shù)預(yù)測(cè)模型,提升預(yù)測(cè)模型的精準(zhǔn)性具有重要的理論價(jià)值和現(xiàn)實(shí)意義。

        1 文獻(xiàn)綜述

        隨著技術(shù)預(yù)測(cè)研究和實(shí)踐的開(kāi)展,用于技術(shù)預(yù)測(cè)的方法也日趨豐富。傳統(tǒng)的技術(shù)預(yù)測(cè)方法主要以基于專(zhuān)家意見(jiàn)的定性預(yù)測(cè)法為主,包括德?tīng)柗品?、情景分析法以及技術(shù)路線圖等[4-6]。20 世紀(jì)90 年代,定量研究方法開(kāi)始在技術(shù)預(yù)測(cè)中得到應(yīng)用,比如,1998 年Chakravarti 等[7]將數(shù)理統(tǒng)計(jì)學(xué)方面的知識(shí)嵌套進(jìn)德?tīng)柗品ǎ謩e對(duì)短、中、長(zhǎng)期的技術(shù)預(yù)測(cè)需求進(jìn)行了方法上的微調(diào)。為提高技術(shù)預(yù)測(cè)質(zhì)量和效果,越來(lái)越多的研究者將定量方法應(yīng)用于技術(shù)預(yù)測(cè)中,以試圖改善技術(shù)預(yù)測(cè)方法體系,彌補(bǔ)定性方法易產(chǎn)生主觀偏誤性、全面性不足、顆粒度不一致等問(wèn)題[8-9]。進(jìn)入21 世紀(jì)初期,技術(shù)預(yù)測(cè)研究的內(nèi)容則進(jìn)一步深入到新興熱點(diǎn)技術(shù)和未來(lái)能源技術(shù)預(yù)測(cè)等特定領(lǐng)域[10-11]。而后,一些學(xué)者和機(jī)構(gòu)引入文獻(xiàn)計(jì)量、專(zhuān)利分析作為技術(shù)預(yù)測(cè)的重要工具,出現(xiàn)了以數(shù)據(jù)分析為基礎(chǔ)的技術(shù)預(yù)測(cè)方法和以科學(xué)地圖為基礎(chǔ)的技術(shù)預(yù)測(cè)方法等等[12-13],如Chen 等[14]利用邏輯增長(zhǎng)曲線模型描繪燃料電池行業(yè)的技術(shù)發(fā)展趨勢(shì);Schaeffer 等[15]基于文獻(xiàn)數(shù)據(jù)分析識(shí)別技術(shù)關(guān)注度;Sitarz 等[16]利用聚類(lèi)分析識(shí)別技術(shù)主題;Cocci 等[17]通過(guò)文獻(xiàn)發(fā)表量和引用網(wǎng)絡(luò)分析識(shí)別新興研究領(lǐng)域的技術(shù)發(fā)展軌跡,將專(zhuān)家調(diào)查數(shù)據(jù)與文獻(xiàn)和專(zhuān)利數(shù)據(jù)相結(jié)合,利用文獻(xiàn)計(jì)量識(shí)別技術(shù)發(fā)展動(dòng)力模式和發(fā)展趨勢(shì)。

        隨著大數(shù)據(jù)時(shí)代的到來(lái),越來(lái)越多的研究者選擇采用組合方法并通過(guò)構(gòu)建模型來(lái)進(jìn)行技術(shù)預(yù)測(cè)研究,如Momeni 等[18]利用專(zhuān)利分析識(shí)別技術(shù)發(fā)展路徑,結(jié)合K 核分析和主題模型(topic modeling)分析技術(shù)發(fā)展趨勢(shì);Jun 等[19]利用專(zhuān)利矩陣地圖和基于支持向量機(jī)的K-Medoids 聚類(lèi)算法(KM-SVC)識(shí)別技術(shù)空白點(diǎn);Trappey 等[20]提出基于時(shí)間序列擴(kuò)展的邏輯模型;Lee 等[21]利用隨機(jī)專(zhuān)利引用分析和負(fù)二項(xiàng)分布模型動(dòng)態(tài)評(píng)估未來(lái)技術(shù)的影響力;陳偉等[22]則結(jié)合隱含狄利克雷分布(LDA)和隱馬爾可夫過(guò)程(HMM),通過(guò)LDA 模型對(duì)海量異構(gòu)專(zhuān)利文獻(xiàn)數(shù)據(jù)進(jìn)行主題建模,預(yù)測(cè)技術(shù)趨勢(shì);胡吉明等[23]對(duì)LDA 模型進(jìn)行了改進(jìn),通過(guò)改進(jìn)的Gibbs 抽樣估計(jì)提高主題挖掘模型的準(zhǔn)確性;董放等[24]提出了一種基于機(jī)器學(xué)習(xí)(LDA 模型、SVM 模型)和時(shí)間序列預(yù)測(cè)(ARIMA)的新興技術(shù)預(yù)測(cè)方法,用以預(yù)測(cè)特定技術(shù)未來(lái)發(fā)展趨勢(shì)。

        上述研究多是基于統(tǒng)計(jì)的主題模型揭示主題演化,這類(lèi)方法雖涉及了知識(shí)創(chuàng)新演化分析的重點(diǎn),如新主題的演化及時(shí)間周期的引入,但由于在進(jìn)行主題提取時(shí)指標(biāo)過(guò)于單一,且過(guò)于強(qiáng)調(diào)對(duì)現(xiàn)有主題趨勢(shì)變化的研究,而忽略了對(duì)于發(fā)現(xiàn)新主題概念的研究;另一方面,基于技術(shù)主題的預(yù)測(cè)模型大都偏向于靜態(tài)模型,而現(xiàn)實(shí)的技術(shù)發(fā)展都隨時(shí)間變化不斷演化,基于靜態(tài)的主題模型方法很難發(fā)掘技術(shù)演變過(guò)程及趨勢(shì)變化,極易忽略新技術(shù)的出現(xiàn)與演化,更有對(duì)微觀信息的挖掘不夠深入,也將在理解、認(rèn)識(shí)復(fù)雜創(chuàng)新網(wǎng)絡(luò)時(shí)具有明顯的不足??傊?,單一的技術(shù)預(yù)測(cè)方法往往各有自身的局限性,如何在技術(shù)預(yù)測(cè)方法中提高基于客觀數(shù)據(jù)的定量研究的比重,構(gòu)建系統(tǒng)有效的技術(shù)預(yù)測(cè)模型成為未來(lái)技術(shù)預(yù)測(cè)方法學(xué)研究的重點(diǎn)。為了更加有效地提升預(yù)測(cè)的可靠性,克服單一研究方法的缺陷,有效地?cái)U(kuò)展趨勢(shì)演化模型的全面性,本研究將在對(duì)技術(shù)預(yù)測(cè)的基礎(chǔ)上進(jìn)行主題演化模型分析,進(jìn)一步通過(guò)技術(shù)主題清洗和引入時(shí)間窗研究技術(shù),將技術(shù)主題演化通過(guò)相應(yīng)遞進(jìn)操作步驟,構(gòu)建更為客觀、全面、合理和更具操作性的趨勢(shì)演化模型。

        2 基于趨勢(shì)演化分析的技術(shù)預(yù)測(cè)研究思路與流程

        《美國(guó)聯(lián)邦政府技術(shù)預(yù)測(cè)工具應(yīng)用現(xiàn)狀與潛在應(yīng)用》研究報(bào)告將技術(shù)預(yù)測(cè)定義為:在特定的時(shí)間窗口內(nèi)對(duì)技術(shù)未來(lái)特征或應(yīng)用的預(yù)測(cè)[25]。Porter 等[26]指出,技術(shù)預(yù)測(cè)是描述在未來(lái)一段時(shí)間內(nèi)技術(shù)的出現(xiàn)、性能、功能或影響的系統(tǒng)過(guò)程。劉育新[27]則認(rèn)為技術(shù)預(yù)測(cè)就是一個(gè)綜合考慮未來(lái)科技、經(jīng)濟(jì)和社會(huì)發(fā)展的趨勢(shì)和需要、選擇戰(zhàn)略研究領(lǐng)域和新興技術(shù),以期產(chǎn)生最大的經(jīng)濟(jì)和社會(huì)效益的過(guò)程,其中過(guò)程性和導(dǎo)向性是技術(shù)預(yù)測(cè)最典型的特征。目前,對(duì)于技術(shù)預(yù)測(cè)缺乏統(tǒng)一的定義,但技術(shù)預(yù)測(cè)包含新技術(shù)發(fā)現(xiàn)和新技術(shù)發(fā)展?fàn)顟B(tài)兩方面內(nèi)容已取得共識(shí)。為了更好地開(kāi)展研究,本研究將技術(shù)預(yù)測(cè)研究定義為某一時(shí)間狀態(tài)下的新技術(shù)出現(xiàn)和新技術(shù)發(fā)展的動(dòng)態(tài)變化趨勢(shì),并進(jìn)行技術(shù)趨勢(shì)演化探索?;诖?,本研究將以文獻(xiàn)數(shù)據(jù)源為技術(shù)預(yù)測(cè)數(shù)據(jù)源,從新技術(shù)發(fā)現(xiàn)和領(lǐng)域技術(shù)發(fā)展態(tài)勢(shì)兩個(gè)方向進(jìn)行趨勢(shì)演化模型的技術(shù)預(yù)測(cè)探索與研究,即不僅從現(xiàn)有文獻(xiàn)中探索新的技術(shù)出現(xiàn),而且也將現(xiàn)有技術(shù)發(fā)展趨勢(shì)作為研究目標(biāo)?;谮厔?shì)演化的技術(shù)預(yù)測(cè)模型框架如圖1 所示。

        圖1 基于趨勢(shì)演化的技術(shù)預(yù)測(cè)模型框架

        由圖1 可見(jiàn),趨勢(shì)演化模型分為3 個(gè)模塊:領(lǐng)域技術(shù)主題篩選與處理模塊、領(lǐng)域新技術(shù)主題清洗模塊、領(lǐng)域技術(shù)主題時(shí)序演化趨勢(shì)模塊,每個(gè)模塊之間的遞進(jìn)分別給出測(cè)度條件,并定義相應(yīng)的測(cè)度方法和分析工具,構(gòu)造合理的模型。領(lǐng)域技術(shù)主題篩選與處理模塊采用文獻(xiàn)分析和數(shù)學(xué)模型的構(gòu)建方法,以BICOMBII 和Python 為分析工具;領(lǐng)域新技術(shù)主題清洗模塊采用聚類(lèi)分析法、數(shù)學(xué)模型的構(gòu)建以及文獻(xiàn)計(jì)量學(xué)的方法,用Python 為分析工具;領(lǐng)域技術(shù)主題時(shí)序演化趨勢(shì)模塊采用圖譜法,用Python 為分析工具。

        2.1 領(lǐng)域技術(shù)主題篩選與處理

        首先以Python 為工具建立詞庫(kù),然后利用BICOMBII 對(duì)相關(guān)文獻(xiàn)的關(guān)鍵詞、高頻詞以及共詞等進(jìn)行提取和詞頻統(tǒng)計(jì)。論文中的關(guān)鍵詞反映研究的技術(shù)主題,即所屬領(lǐng)域的專(zhuān)業(yè)術(shù)語(yǔ),詞頻隨時(shí)間的變化可以反映研究的技術(shù)主題變化,為了避免因詞頻統(tǒng)計(jì)中不相關(guān)詞以及命名不規(guī)范關(guān)鍵詞的存在而影響分析結(jié)果,研究將從相關(guān)文獻(xiàn)中提取關(guān)鍵詞,并進(jìn)行主題規(guī)范化處理,利用Python 進(jìn)行統(tǒng)計(jì),形成技術(shù)概念詞集Ki。高頻詞是指概念詞集相對(duì)高頻的技術(shù)主題,高頻概念詞隨時(shí)間的變化可以反映研究關(guān)注主題的變化,因此將數(shù)據(jù)集中的主題按照詞頻從高到低進(jìn)行排列,取詞頻高的主題概念形成高頻數(shù)據(jù)集Hi。單一的主題概念以及高頻詞的變化尚不能全面描述技術(shù)主題的變化,因而利用詞共現(xiàn)描述發(fā)現(xiàn)的技術(shù)主題、詞共現(xiàn)的時(shí)序動(dòng)態(tài)變化可以較為全面反映技術(shù)主題的變化,通過(guò)關(guān)鍵詞進(jìn)行兩兩或者三三共詞分析得到詞共現(xiàn)矩陣,從而得到數(shù)據(jù)集Ci。

        2.2 領(lǐng)域新技術(shù)主題清洗

        新主題概念詞是指在一定的時(shí)間區(qū)間(n年)內(nèi),按照一定的算法得到篩選出年度新呈現(xiàn)的主題概念。新主題概念詞的算法為:

        式(1)中:n為研究選取的時(shí)間區(qū)間;NKi為第i+1 年的主題概念詞;Ki為第i年的主題概念詞。

        新技術(shù)主題高頻詞是指在一定的時(shí)間區(qū)間(n年)內(nèi),按照一定的算法得到的新高頻主題概念詞。新技術(shù)主題高頻詞的算法為:

        式(2)中:NHi為第i+1 年的新高頻主題概念詞;Hi為第i年的高頻主題概念詞。

        新技術(shù)主題共現(xiàn)是指在一定的時(shí)間區(qū)間(n年)內(nèi),按照一定的算法得到的新主題概念詞共詞。新技術(shù)主題共詞的算法為:

        式(3)中:NCi為第i+1 年的共詞新詞;Ci為第i年的共詞。

        經(jīng)過(guò)領(lǐng)域新技術(shù)主題清洗模塊得到的新主題概念詞、新技術(shù)主題高頻詞以及新技術(shù)主題共詞,共同形成了新主題集。新主題集公式為:

        式(4)中:n為研究選取的時(shí)間區(qū)間;NSi為第i+1 年的新主題集。

        2.3 領(lǐng)域技術(shù)主題時(shí)序演化趨勢(shì)

        經(jīng)過(guò)上述兩個(gè)模塊得到的新主題集進(jìn)入到領(lǐng)域技術(shù)主題時(shí)序演化趨勢(shì)模塊,通過(guò)對(duì)主題概念和新主題的詞頻進(jìn)行分析、新主題的詞清洗以及對(duì)新主題的識(shí)別,得到具有潛力的技術(shù)主題范圍,繪制每個(gè)技術(shù)主題的時(shí)序演化曲線,從而得到技術(shù)主題的發(fā)展趨勢(shì)以及發(fā)現(xiàn)新技術(shù)主題。如,對(duì)研究時(shí)間區(qū)間(n年)內(nèi)的每個(gè)新主題概念詞在每一年出現(xiàn)的情況進(jìn)行分析,即出現(xiàn)在NKi中的新主題概念詞在NKi+1,NKi+2,… ,NKn-1年的新主題概念詞中的出現(xiàn)頻度及其詞頻,依據(jù)頻度值及研究時(shí)間區(qū)間設(shè)定閾值最大值,由于研究技術(shù)主題趨勢(shì)變化,則閾值最小值為3,將未達(dá)到閾值的新主題概念詞舍去,形成新的有效數(shù)據(jù)集。在新的有效數(shù)據(jù)集的基礎(chǔ)上對(duì)詞共現(xiàn)進(jìn)行統(tǒng)計(jì),探索技術(shù)主題相關(guān)性。新主題概念詞共現(xiàn)在每一年出現(xiàn)的情況,即出現(xiàn)在NCi年的共詞是否在NCi+1,NCi+2,… ,NCn-1中持續(xù)出現(xiàn),采用相同的方法設(shè)定閾值,將未達(dá)到閾值的新主題概念詞舍去,形成新的有效數(shù)據(jù)集。依據(jù)不同數(shù)據(jù)分析處理后形成新的有效數(shù)據(jù)集,繪制技術(shù)主題時(shí)序演化趨勢(shì)的技術(shù)主題概念的時(shí)序演化圖表。

        2.4 模型的趨勢(shì)分析

        由不同模塊生成不同數(shù)據(jù)集,分析處理后形成新的有效數(shù)據(jù)集,依據(jù)繪制技術(shù)主題時(shí)序演化趨勢(shì)的技術(shù)主題概念的時(shí)序演化圖表,對(duì)模型流程中呈現(xiàn)的眾多圖表作技術(shù)趨勢(shì)解讀分析。

        2.4.1 詞頻趨勢(shì)解讀分析

        分析每個(gè)技術(shù)主題概念在每一年出現(xiàn)的狀態(tài),即出現(xiàn)在NHi的技術(shù)主題概念詞是否在NHi+1,NHi+2,…,NHn-1年的連續(xù)出現(xiàn),對(duì)狀態(tài)演化結(jié)果進(jìn)行分析和處理。根據(jù)選取時(shí)間區(qū)間的長(zhǎng)度,從BICOMBII 得到的高頻詞詞頻表中查找得到技術(shù)主題概念詞對(duì)應(yīng)的詞頻,形成技術(shù)主題概念詞及對(duì)應(yīng)的詞頻表,通過(guò)對(duì)主題概念詞頻統(tǒng)計(jì)分析得到數(shù)據(jù)集,繪制每個(gè)技術(shù)主題概念詞繪制時(shí)序演化的詞頻圖表。觀察技術(shù)主題概念詞頻的變化趨勢(shì)圖,分析變化趨勢(shì)的3 種不同狀態(tài):第1 類(lèi)是技術(shù)主題概念詞頻有穩(wěn)定趨勢(shì)方向,如已形成穩(wěn)定的增長(zhǎng)趨勢(shì)或下降趨勢(shì);第2 類(lèi)是技術(shù)主題概念詞頻尚未出現(xiàn)穩(wěn)定趨勢(shì),就是曲線波動(dòng);第3 類(lèi)是技術(shù)主題概念詞頻變化尚未有趨勢(shì),就是未形成連續(xù)時(shí)序曲線。對(duì)于有穩(wěn)定趨勢(shì)的技術(shù)主題概念高頻詞,有望成為關(guān)注程度高的技術(shù)主題,作為技術(shù)主題的發(fā)展態(tài)勢(shì)分析基礎(chǔ)。

        2.4.2 新主題概念解讀分析

        根據(jù)上述新主題概念模塊對(duì)技術(shù)主題概念新詞及其詞頻統(tǒng)計(jì)分析得到的新主題概念詞,及其對(duì)應(yīng)的詞頻表形成新主題概念新詞時(shí)序演化趨勢(shì)圖。該技術(shù)主題概念詞頻的變化趨勢(shì)圖同樣存在3 種不同狀態(tài):第1 類(lèi)是技術(shù)主題概念詞頻有穩(wěn)定趨勢(shì)方向,如已形成穩(wěn)定的增長(zhǎng)趨勢(shì)或下降趨勢(shì);第2 類(lèi)是技術(shù)主題概念詞頻尚未出現(xiàn)穩(wěn)定趨勢(shì),就是曲線波動(dòng);第3 類(lèi)是技術(shù)主題概念詞頻變化尚未有趨勢(shì),就是未形成連續(xù)時(shí)序曲線??蓪⒂蟹€(wěn)定趨勢(shì)的技術(shù)主題概念詞變化趨勢(shì)解讀為:新技術(shù)主題概念時(shí)序趨勢(shì)成持續(xù)向上線性分布,說(shuō)明新技術(shù)主題概念已形成穩(wěn)定趨勢(shì);新技術(shù)主題概念時(shí)序趨勢(shì)曲線平行分布,說(shuō)明新技術(shù)主題概念出現(xiàn),具發(fā)展?jié)摿?;?duì)于有穩(wěn)定趨勢(shì)的新技術(shù)主題概念,可認(rèn)為有新技術(shù)出現(xiàn)的跡象,有望成為新的技術(shù)領(lǐng)域的技術(shù)主題;對(duì)于詞頻在連續(xù)幾年都有出現(xiàn)但無(wú)穩(wěn)定趨勢(shì)的新技術(shù)主題概念詞,可供專(zhuān)家進(jìn)一步分析,作為備選的新技術(shù)主題;對(duì)于詞頻變化不成趨勢(shì)的新技術(shù)主題概念,呈點(diǎn)狀出現(xiàn),將不作為新技術(shù)主題概念。

        2.4.3 詞共現(xiàn)趨勢(shì)分析

        在新的有效數(shù)據(jù)集基礎(chǔ)上統(tǒng)計(jì)詞共現(xiàn)探索技術(shù)主題相關(guān)性,分析數(shù)據(jù)集中詞共現(xiàn)現(xiàn)象,即每一年出現(xiàn)狀態(tài),出現(xiàn)在NCi年的詞共現(xiàn)是否在NCi+1,NCi+2,… ,NCn-1中出現(xiàn)。對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行分析和處理,選取特定時(shí)間區(qū)間的長(zhǎng)度,通過(guò)BICOMBII 得到的共詞詞頻表對(duì)應(yīng)的詞頻,生成詞共現(xiàn)趨勢(shì)分析圖。

        通過(guò)詞共現(xiàn)技術(shù)主題概念詞的時(shí)序演化圖表,解讀詞共現(xiàn)技術(shù)主題概念詞變化趨勢(shì)。從變化趨勢(shì)有穩(wěn)定發(fā)展的技術(shù)主題概念得到不同粒度的技術(shù)主題概念,以及解讀交叉領(lǐng)域有新技術(shù)出現(xiàn)的跡象,有利于鎖定新的技術(shù)領(lǐng)域和關(guān)注程度高的技術(shù)主題。

        3 實(shí)驗(yàn)過(guò)程

        為驗(yàn)證上述分析構(gòu)建的模型的可操作性,本研究以揮發(fā)性有機(jī)物(VOCs)治理技術(shù)領(lǐng)域?yàn)槔_(kāi)展實(shí)證研究。

        3.1 數(shù)據(jù)采集

        以Scopus 數(shù)據(jù)庫(kù)為數(shù)據(jù)源,采集到2010—2017年揮發(fā)性有機(jī)物治理技術(shù)領(lǐng)域相關(guān)文獻(xiàn)34 146 篇,提取索引關(guān)鍵詞共211 407 個(gè)。其中,各年提取關(guān)鍵詞的個(gè)數(shù)分別為25 268、27 883、27 873、25 842、23 854、25 753、27 599、27 335。對(duì)關(guān)鍵詞進(jìn)行篩選,得到待分析數(shù)據(jù)集。以2017 年部分關(guān)鍵詞及詞頻為例,如表1 所示。表1 中“human(人類(lèi))”屬于無(wú)關(guān)詞,“titanium dioxide(二氧化鈦)”和“titania(二氧化鈦)”為同義詞,說(shuō)明待分析數(shù)據(jù)集中存在無(wú)關(guān)詞和同義詞。

        表1 2017 年揮發(fā)性有機(jī)物治理技術(shù)領(lǐng)域待分析數(shù)據(jù)集中的關(guān)鍵詞及詞頻 單位:次

        3.2 領(lǐng)域技術(shù)主題篩選與處理

        由于待分析數(shù)據(jù)集是基礎(chǔ)數(shù)據(jù),在領(lǐng)域技術(shù)主題篩選與處理模塊從專(zhuān)業(yè)術(shù)語(yǔ)、高頻詞及詞共現(xiàn)3 個(gè)維度對(duì)待分析數(shù)據(jù)集進(jìn)行刪除無(wú)關(guān)詞和合并同義詞的處理,得到術(shù)語(yǔ)集。2010—2017 年揮發(fā)性有機(jī)物治理技術(shù)領(lǐng)域的術(shù)語(yǔ)集中關(guān)鍵詞的個(gè)數(shù)分別為538、1 110、973、1 024、1 656、2 665、4 717、3 241。以術(shù)語(yǔ)集中2017 年部分關(guān)鍵詞及詞頻為例,如表2 所示。

        表2 2017 年揮發(fā)性有機(jī)物治理技術(shù)領(lǐng)域術(shù)語(yǔ)集中部分關(guān)鍵詞及詞頻 單位:次

        當(dāng)?shù)玫降膶?zhuān)業(yè)術(shù)語(yǔ)、高頻詞和詞共現(xiàn)的關(guān)鍵詞同時(shí)滿足以下兩個(gè)條件時(shí),則可進(jìn)入第二模塊領(lǐng)域新技術(shù)主題清洗模塊:條件一,專(zhuān)業(yè)術(shù)語(yǔ)、高頻詞、詞共現(xiàn)的關(guān)鍵詞集不包含任何無(wú)關(guān)關(guān)鍵詞;條件二,專(zhuān)業(yè)術(shù)語(yǔ)、高頻詞、詞共現(xiàn)的關(guān)鍵詞的同義詞已全部找出且同義詞的詞頻已累加求和。

        3.3 領(lǐng)域新技術(shù)主題清洗

        在模型的領(lǐng)域新技術(shù)主題清洗模塊中,從新主題概念詞、新技術(shù)主題高頻詞和新技術(shù)主題共詞3 個(gè)維度,對(duì)術(shù)語(yǔ)集按照領(lǐng)域新技術(shù)主題清洗模塊的算法得到新主題集。以第一年為參考日期,則2011—2017 年會(huì)出現(xiàn)新主題概念詞,將連續(xù)3 年出現(xiàn)的新主題概念詞稱(chēng)為連續(xù)發(fā)展的新主題概念詞,并將其作為研究對(duì)象,預(yù)測(cè)新技術(shù)及發(fā)展態(tài)勢(shì)。得到2011—2015 年連續(xù)發(fā)展的新主題概念詞,如表3 所示。表3 中,2011 年列舉的新主題概念詞“montmorillonite(蒙脫石)”為揮發(fā)性有機(jī)物催化及催化劑應(yīng)用研究領(lǐng)域;2012 年列舉的新主題概念詞“pressurized liquid extraction(加壓液相萃?。焙汀皊uccessive ionic layer adsorption and reaction(連續(xù)的離子層吸附和反應(yīng))”為揮發(fā)性有機(jī)物治理設(shè)備及工藝研究領(lǐng)域;2013 年列舉的新主題概念詞“reduced graphene oxides(還原石墨烯氧化)”和“halide perovskites(鹵化物鈣鈦礦)”屬于揮發(fā)性有機(jī)物治理設(shè)備及工藝研究領(lǐng)域;2014 年列舉的新主題概念詞“vis absorptionspectroscopy (吸收光譜)”和“functionalized multi-walled carbon nanotubes (功能化多壁碳納米管)”屬于污染源檢測(cè)/監(jiān)測(cè)研究領(lǐng)域;2015 年列舉的新主題概念詞“perovskite thin films (鈣鈦礦薄膜)”為揮發(fā)性有機(jī)物治理設(shè)備及工藝研究領(lǐng)域。

        表3 2011—2015 年揮發(fā)性有機(jī)物治理技術(shù)領(lǐng)域連續(xù)發(fā)展的新主題概念詞

        當(dāng)每年的新主題概念詞NKi、新技術(shù)主題高頻詞NHi、新技術(shù)主題共詞NCi都包含其對(duì)應(yīng)的新主題概念詞、高頻詞新技術(shù)主題和新技術(shù)交叉主題時(shí),則可進(jìn)入第三模塊,即領(lǐng)域技術(shù)主題時(shí)序演化趨勢(shì)模塊。

        3.4 領(lǐng)域技術(shù)主題時(shí)序演化趨勢(shì)分析

        在領(lǐng)域技術(shù)主題時(shí)序演化趨勢(shì)模塊中,采用追溯法對(duì)新技術(shù)主題的發(fā)現(xiàn)和領(lǐng)域技術(shù)發(fā)展態(tài)勢(shì)進(jìn)行研究,發(fā)現(xiàn)新主題詞的變化呈現(xiàn)3 種趨勢(shì),分別為詞頻呈現(xiàn)穩(wěn)定變化趨勢(shì)、詞頻有連續(xù)出現(xiàn)但無(wú)穩(wěn)定變化趨勢(shì)和詞頻未呈現(xiàn)變化趨勢(shì)。

        (1)詞頻呈現(xiàn)穩(wěn)定變化趨勢(shì)。以2017 年為起始年份,按照2017 年、2016 年 2010 年的順序進(jìn)行追溯式查找,詞頻呈現(xiàn)穩(wěn)定變化趨勢(shì)的特征為主題詞詞頻連續(xù)出現(xiàn),并且每年呈現(xiàn)均勻增長(zhǎng)或者平穩(wěn)的狀態(tài),即屬于第1 類(lèi)。部分主題詞詞頻從2010 年進(jìn)入前50(50 為高頻詞閾值)的行列,且每年連續(xù)出現(xiàn)并一直保持在前50 的位置,其詞頻趨勢(shì)變化曲線如圖2 所示。高頻詞的閾值是指關(guān)鍵詞成為高頻詞時(shí)詞頻要達(dá)到的值。統(tǒng)計(jì)分析發(fā)現(xiàn),樣本文獻(xiàn)量隨時(shí)間呈不斷上升趨勢(shì),則提取得到的關(guān)鍵詞詞頻同樣隨時(shí)間不斷上升。選取固定的詞頻值作為閾值不能滿足詞頻動(dòng)態(tài)變化的需求,將關(guān)鍵詞按照降序排列,選取前50 個(gè)詞作為高頻詞,第50 個(gè)詞對(duì)應(yīng)的詞頻作為高頻詞閾值。從圖2 可以發(fā)現(xiàn),這11 個(gè)主題詞在2010—2017 年每年都有進(jìn)入前50并且呈現(xiàn)增長(zhǎng)或者平穩(wěn)的趨勢(shì),說(shuō)明這些主題詞是在處理VOCs 技術(shù)領(lǐng)域一直高度備受關(guān)注,揭示了領(lǐng)域技術(shù)發(fā)展態(tài)勢(shì)。

        圖2 2010—2017 年揮發(fā)性有機(jī)物治理技術(shù)領(lǐng)域新主題詞變化趨勢(shì)

        (2)詞頻有連續(xù)出現(xiàn)但無(wú)穩(wěn)定變化趨勢(shì)。以2017 年為起始年份,按照2017 年、2016 年 2010 年的順序進(jìn)行追溯式查找,詞頻有連續(xù)出現(xiàn)但無(wú)穩(wěn)定變化趨勢(shì)的特征為主題詞詞頻在2010—2015年可能沒(méi)有出現(xiàn),在2016 年、2017 年出現(xiàn)且呈現(xiàn)增長(zhǎng)的趨勢(shì)。即屬于第2 類(lèi)。

        (3)詞頻未呈現(xiàn)變化趨勢(shì)。以2017 年為起始年份,按照2017 年、2016 年 2010 年的順序進(jìn)行追溯式查找,詞頻未呈現(xiàn)變化趨勢(shì)的特征為只在2017 年出現(xiàn)在前50 新主題詞中,而在2010—2016年都沒(méi)有出現(xiàn)。此類(lèi)主題詞呈現(xiàn)散點(diǎn)式分布,并不能夠形成趨勢(shì)變化圖,即屬于第3 類(lèi)。此類(lèi)主題詞可擴(kuò)展研究的時(shí)間段做進(jìn)一步的研究,作為后續(xù)研究的一個(gè)方向。

        3.5 新技術(shù)發(fā)現(xiàn)及領(lǐng)域技術(shù)發(fā)展態(tài)勢(shì)

        通過(guò)運(yùn)用趨勢(shì)演化的技術(shù)預(yù)測(cè)模型得到主題詞趨勢(shì)變化曲線,根據(jù)技術(shù)主題的趨勢(shì)變化確定技術(shù)主題,并預(yù)測(cè)技術(shù)主題所屬領(lǐng)域。以新主題概念詞“zinc oxide nanoparticles”為例,如圖3 所示。由圖3 可見(jiàn),氧化鋅納米粒子(zinc oxide nanoparticles)是2014 年出現(xiàn)的新主題概念詞,新主題概念詞的出現(xiàn)意味著新技術(shù)的出現(xiàn)。其中,在2014—2017 年氧化鋅納米粒子詞頻基本呈現(xiàn)上升趨勢(shì),可以推測(cè)這是今后值得關(guān)注的新技術(shù)。

        圖3 2014—2017 年氧化鋅納米粒子技術(shù)主題概念詞趨勢(shì)變化

        綜合上述,經(jīng)過(guò)3 個(gè)模塊的層層遞進(jìn),得到反映新技術(shù)的關(guān)鍵詞。本研究對(duì)新主題集中的關(guān)鍵詞結(jié)合其趨勢(shì)變化進(jìn)行總結(jié),預(yù)測(cè)了揮發(fā)性有機(jī)物處理技術(shù)主要集中于5 個(gè)領(lǐng)域:(1)揮發(fā)性有機(jī)物催化及催化劑應(yīng)用研究領(lǐng)域;(2)光催化研究領(lǐng)域;(3)揮發(fā)性有機(jī)物治理設(shè)備及工藝研究領(lǐng)域;(4)污染源控制研究領(lǐng)域;(5)污染源檢測(cè)/監(jiān)測(cè)研究領(lǐng)域。

        4 結(jié)論

        本研究綜合運(yùn)用了文本分析、共現(xiàn)分析和圖譜法,以BICOMBII 和Python 為分析工具進(jìn)行數(shù)學(xué)模型的構(gòu)建,且從新技術(shù)發(fā)現(xiàn)和領(lǐng)域技術(shù)發(fā)展態(tài)勢(shì)兩方面提出了一種基于趨勢(shì)演化分析的技術(shù)預(yù)測(cè)研究框架,并以Scopus 文獻(xiàn)數(shù)據(jù)庫(kù)為數(shù)據(jù)源,以揮發(fā)性有機(jī)化合物處理技術(shù)領(lǐng)域?yàn)槔M(jìn)行了實(shí)證研究,篩選出VOCs 領(lǐng)域待選的新技術(shù)主題以及技術(shù)趨勢(shì)。研究所采用的數(shù)據(jù)全部采集于文獻(xiàn)數(shù)據(jù)庫(kù),數(shù)據(jù)采集和分析過(guò)程可重復(fù)、可追溯,研究中受主觀因素的影響較少,所以結(jié)論比較客觀、真實(shí)。

        本研究提出的模型由領(lǐng)域技術(shù)主題篩選與處理、領(lǐng)域新技術(shù)主題清洗、領(lǐng)域技術(shù)主題時(shí)序演化趨勢(shì)3 個(gè)模塊構(gòu)成,各模塊之間存在遞進(jìn)關(guān)系。模型一方面從系統(tǒng)化和定量化優(yōu)化了技術(shù)預(yù)測(cè)方法,另一方面基于文獻(xiàn)內(nèi)容特征的多要素指標(biāo)進(jìn)行技術(shù)主題的提取,數(shù)據(jù)源更為豐富全面,便于更深入地挖掘微觀信息。可以說(shuō),綜合、動(dòng)態(tài)的文獻(xiàn)計(jì)量分析范式對(duì)于其他科學(xué)主題進(jìn)行研究前沿篩選和研究技術(shù)演化模式的探索,也具有一定的參考價(jià)值和推廣借鑒意義。

        猜你喜歡
        高頻詞詞頻趨勢(shì)
        30份政府工作報(bào)告中的高頻詞
        小康(2022年7期)2022-03-10 11:15:54
        省級(jí)兩會(huì)上的高頻詞
        小康(2022年7期)2022-03-10 11:15:54
        基于詞頻分析法的社區(qū)公園歸屬感營(yíng)建要素研究
        園林科技(2021年3期)2022-01-19 03:17:48
        趨勢(shì)
        28份政府工作報(bào)告中的高頻詞
        小康(2021年7期)2021-03-15 05:29:03
        省級(jí)兩會(huì)上的高頻詞
        小康(2021年7期)2021-03-15 05:29:03
        初秋唇妝趨勢(shì)
        Coco薇(2017年9期)2017-09-07 21:23:49
        SPINEXPO?2017春夏流行趨勢(shì)
        詞頻,一部隱秘的歷史
        云存儲(chǔ)中支持詞頻和用戶喜好的密文模糊檢索
        中文字幕人妻伦伦| 91精品国产乱码久久久| 水蜜桃网站视频在线观看| 亚洲熟妇无码久久精品| 激情综合色五月丁香六月亚洲| 久久亚洲AV无码精品色午夜| 成人激情视频一区二区三区| 日韩女优av一区二区| 国产av精品一区二区三区视频| 日本一区二区三级在线观看| 人妻丰满熟妇av无码区不卡| 国产一极毛片| 女同视频网站一区二区| 国产激情视频免费在线观看| 四虎影视永久地址www成人| 图图国产亚洲综合网站| 国产无套粉嫩白浆内精| 亚洲av中文无码乱人伦在线观看| 国产麻豆精品一区| 成人片99久久精品国产桃花岛| 国产激情小视频在线观看的| 在线观看人成视频免费| 欧美老熟妇欲乱高清视频| 亚洲无线码一区在线观看| 国产乱子伦一区二区三区国色天香| 精品欧洲av无码一区二区14| 福利一区在线观看| 国产精品三级自产拍av| 国产18禁黄网站免费观看| 内谢少妇xxxxx8老少交| 亚洲 暴爽 AV人人爽日日碰| 日本在线一区二区三区观看| 日韩av水蜜桃一区二区三区| 九九久久自然熟的香蕉图片| 玩弄少妇高潮ⅹxxxyw| 国产精品久久中文字幕第一页| 国产韩国一区二区三区| 波多野结衣爽到高潮大喷| 久久免费国产精品| 白白色青青草视频免费观看| 亚洲国产av无码精品|