亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多參數(shù)動(dòng)態(tài)時(shí)序的技術(shù)預(yù)測(cè)方法與實(shí)證研究

        2022-08-25 03:04:50王小慶李建霞嚴(yán)素梅程月月孫濟(jì)慶
        科技管理研究 2022年14期
        關(guān)鍵詞:模型

        陳 榮,王小慶,李建霞,嚴(yán)素梅,周 莉,程月月,孫濟(jì)慶

        (華東理工大學(xué)科技信息研究所,上海 200237)

        《中共中央關(guān)于制定國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》明確指出,要堅(jiān)持創(chuàng)新在我國(guó)現(xiàn)代化建設(shè)全局中的核心地位,把科技自立自強(qiáng)作為國(guó)家發(fā)展的戰(zhàn)略支撐。這一戰(zhàn)略目標(biāo)對(duì)細(xì)化國(guó)家科技創(chuàng)新發(fā)展目標(biāo)、精準(zhǔn)識(shí)別科技創(chuàng)新戰(zhàn)略重點(diǎn)領(lǐng)域和優(yōu)先發(fā)展技術(shù)清單提出了新的更高要求[1]。因此,如何通過(guò)科學(xué)、規(guī)范的研究方法來(lái)把握和識(shí)別未來(lái)技術(shù)發(fā)展方向,最大程度地提高預(yù)測(cè)結(jié)果的準(zhǔn)確性是進(jìn)行前沿技術(shù)戰(zhàn)略布局與創(chuàng)新政策制定的重要決策基礎(chǔ)。當(dāng)前,信息理論與計(jì)算能力的飛速發(fā)展,為技術(shù)預(yù)測(cè)和關(guān)鍵技術(shù)選擇等前瞻性研究提供了新的發(fā)展機(jī)遇[2],也為科研人員在眾多研究方向的選擇上提供指導(dǎo)意見(jiàn)[3]。為了能夠更加有效地全面展現(xiàn)技術(shù)發(fā)展過(guò)程出現(xiàn)的變化情況,本研究擬在通過(guò)分析文獻(xiàn)與技術(shù)發(fā)展變化關(guān)系的基礎(chǔ)上,探索更加精細(xì)地識(shí)別技術(shù)發(fā)展趨勢(shì)的技術(shù)預(yù)測(cè)方法。

        1 文獻(xiàn)綜述

        技術(shù)預(yù)測(cè)方法及其應(yīng)用研究始于20 世紀(jì)50 年代美國(guó)對(duì)國(guó)防前沿技術(shù)的預(yù)測(cè)研究[4]。隨著技術(shù)預(yù)測(cè)研究熱度的增加,20 世紀(jì)90 年代起,技術(shù)預(yù)測(cè)成為全球流行趨勢(shì)并得到了快速發(fā)展,由最初以德?tīng)柗品?、情景分析法等定性方法為主向以文獻(xiàn)計(jì)量法、專利地圖、社會(huì)網(wǎng)絡(luò)分析、神經(jīng)網(wǎng)絡(luò)、時(shí)間序列分析等定量方法為主過(guò)渡。其中,時(shí)間序列分析法是將預(yù)測(cè)對(duì)象的歷史數(shù)據(jù)按一定的時(shí)間間隔進(jìn)行排列,構(gòu)成一個(gè)隨時(shí)間變化的統(tǒng)計(jì)序列,建立相應(yīng)的數(shù)據(jù)隨時(shí)間變化的模型,并將模型外推到未來(lái)進(jìn)行預(yù)測(cè)[5]。早期的時(shí)間序列模型主要應(yīng)用于金融領(lǐng)域的股票市場(chǎng)預(yù)測(cè)、醫(yī)療領(lǐng)域人員需求預(yù)測(cè)和傳染病發(fā)病率預(yù)測(cè)、國(guó)內(nèi)生產(chǎn)總值(GDP)或消費(fèi)者價(jià)格指數(shù)(CPI)預(yù)測(cè)。隨著研究的深入,研究人員開(kāi)始將時(shí)間序列模型應(yīng)用于圖書(shū)情報(bào)領(lǐng)域,如圖書(shū)借閱量、主題或?qū)W科發(fā)展等預(yù)測(cè),如2004 年蔡智澄等[6]利用概率統(tǒng)計(jì)學(xué)中的相關(guān)原理,使用線性回歸分析法對(duì)圖書(shū)館讀者流通數(shù)據(jù)進(jìn)行分析;龔新剛等[7]通過(guò)使用回歸分析和時(shí)間序列分析的方法預(yù)測(cè)某圖書(shū)館未來(lái)一年的圖書(shū)借閱量,并對(duì)總利用率和新書(shū)利用率進(jìn)行分析,由此推算未來(lái)可能需要購(gòu)買的新書(shū)數(shù)量。

        Watts 等[8]認(rèn)為文獻(xiàn)記錄著技術(shù)活動(dòng)的歷史和現(xiàn)狀,利用文獻(xiàn)能夠客觀地分析技術(shù)的發(fā)展趨勢(shì)。21 世紀(jì)初期,出現(xiàn)了眾多利用從文獻(xiàn)中提取的關(guān)鍵詞、主題,結(jié)合時(shí)間序列模型進(jìn)行趨勢(shì)預(yù)測(cè)的研究成果,比如,劉自強(qiáng)等[9]、岳麗欣等[10]、Abuhay等[11]運(yùn)用差分整合移動(dòng)平均自回歸(ARIMA)模型對(duì)關(guān)鍵詞的時(shí)間序列變化進(jìn)行了預(yù)測(cè);Adamuthe等[12]采用6 個(gè)函數(shù)對(duì)多個(gè)技術(shù)進(jìn)行趨勢(shì)預(yù)測(cè),最終發(fā)現(xiàn)二階多項(xiàng)式函數(shù)趨勢(shì)線適用于多數(shù)技術(shù)的預(yù)測(cè);白敬毅等[13]提出基于主題模型和曲線擬合的預(yù)測(cè)方法,從科技文獻(xiàn)數(shù)據(jù)中識(shí)別抽取新興研究主題,并通過(guò)主題時(shí)序特征預(yù)測(cè)有關(guān)研究主題的未來(lái)發(fā)展情況;程月月等[14]對(duì)基于多種函數(shù)擬合的模型進(jìn)行對(duì)比分析,最終發(fā)現(xiàn)正弦函數(shù)、高斯函數(shù)、四次多項(xiàng)式函數(shù)對(duì)詞的趨勢(shì)擬合效果最佳。

        由于技術(shù)的發(fā)展具有演化性和積累性[15],且技術(shù)的發(fā)展軌跡在一定的時(shí)空范圍內(nèi)有前進(jìn)性和方向鎖定性[16],具體表現(xiàn)為相鄰兩個(gè)時(shí)間節(jié)點(diǎn)的技術(shù)主題詞頻會(huì)有波動(dòng)性;而運(yùn)用數(shù)理模型來(lái)分析關(guān)鍵詞、主題等的時(shí)序變化研究中,僅對(duì)詞頻進(jìn)行簡(jiǎn)單統(tǒng)計(jì)和粗略的計(jì)算不能揭示詞頻的波動(dòng)變化規(guī)律,且部分研究通過(guò)人工解讀時(shí)序數(shù)據(jù)判斷技術(shù)發(fā)展趨勢(shì),缺乏科學(xué)性,也缺乏對(duì)技術(shù)變化趨勢(shì)的精細(xì)識(shí)別,最終會(huì)影響預(yù)測(cè)結(jié)果的準(zhǔn)確性。目前,技術(shù)預(yù)測(cè)方法日漸成熟,以數(shù)據(jù)分析和模型為基礎(chǔ)的技術(shù)預(yù)測(cè)組合方法已成為新的焦點(diǎn),因此,本研究針對(duì)當(dāng)前研究中存在的不足,借鑒統(tǒng)計(jì)學(xué)中數(shù)據(jù)分析指標(biāo),探索技術(shù)時(shí)序變化的趨勢(shì),提出多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)方法,為精細(xì)地識(shí)別技術(shù)發(fā)展的演變趨勢(shì)提供參考。

        2 多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)方法

        按照層級(jí)功能的不同,本研究提出的多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)方法,包括3 個(gè)步驟:技術(shù)主題提取、多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)模型構(gòu)建與技術(shù)預(yù)測(cè)。這3 個(gè)步驟環(huán)環(huán)相扣,如圖1 所示。第1 步:采用機(jī)器語(yǔ)言與人工判讀相結(jié)合的方法,進(jìn)行技術(shù)主題提?。坏? 步:選取能夠反映詞頻波動(dòng)的指標(biāo)作為參數(shù),建立多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)模型;第3 步:根據(jù)多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)模型定義的多種技術(shù)發(fā)展模式,對(duì)技術(shù)的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。

        圖1 多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)方法框架

        2.1 技術(shù)主題提取

        技術(shù)主題提取是技術(shù)預(yù)測(cè)過(guò)程的第1 步,也是最重要的一步,因?yàn)榧夹g(shù)主題的準(zhǔn)確提取將直接影響到預(yù)測(cè)結(jié)果的準(zhǔn)確性。主題提取又稱為“主題抽取”“主題識(shí)別”或“主題挖掘”,是利用聚類算法、主題模型構(gòu)建等發(fā)現(xiàn)算法和技術(shù)對(duì)規(guī)模性的信息數(shù)據(jù)進(jìn)行處理與分析,以便挖掘出有效主題信息的過(guò)程。本研究采用機(jī)器語(yǔ)言和人工相結(jié)合的方法進(jìn)行技術(shù)主題提取,以提高提取結(jié)果的準(zhǔn)確性。由領(lǐng)域?qū)<覍?duì)文獻(xiàn)中獲取的關(guān)鍵詞集合中與研究主題無(wú)關(guān)的詞(以下簡(jiǎn)稱“無(wú)關(guān)詞”)、詞頻一直較低且變化不大的詞(以下簡(jiǎn)稱“低頻詞”)和同義詞等進(jìn)行識(shí)別,根據(jù)技術(shù)特征將技術(shù)主題詞歸并到相應(yīng)的技術(shù)主題,采用機(jī)器語(yǔ)言進(jìn)行低頻詞、無(wú)關(guān)詞的刪除和同義詞的合并以及詞頻統(tǒng)計(jì)。

        2.2 多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)模型構(gòu)建

        時(shí)間序列分析是一種定量的預(yù)測(cè)方法,按照收集到的數(shù)據(jù)特征,可分為平穩(wěn)時(shí)間序列和非平穩(wěn)時(shí)間序列:平穩(wěn)時(shí)間序列實(shí)際值的波動(dòng)處于一定的范圍之內(nèi),但并不存在某種規(guī)律;而非平穩(wěn)時(shí)間序列具有一定的趨勢(shì)性或周期性[17]。因此,可以通過(guò)分析時(shí)間序列上數(shù)據(jù)的波動(dòng)情況達(dá)到趨勢(shì)預(yù)測(cè)的目的。

        文獻(xiàn)的關(guān)鍵詞直接反映了研究成果的核心內(nèi)容,分析其變化可以全面地把握技術(shù)發(fā)展的動(dòng)態(tài)過(guò)程、特點(diǎn)和規(guī)律,但關(guān)鍵詞隨時(shí)間的變化是一個(gè)高噪音、線性、非平穩(wěn)的序列,因此對(duì)這種動(dòng)態(tài)不平穩(wěn)序列進(jìn)行建模和預(yù)測(cè)非常具有挑戰(zhàn)性。學(xué)術(shù)界曾嘗試對(duì)一定時(shí)間段內(nèi)關(guān)鍵詞的詞頻求差,得到詞頻的波動(dòng)值,取正向波動(dòng)值的平均值為波動(dòng)系數(shù),并用實(shí)證證明根據(jù)波動(dòng)系數(shù)能夠高效地發(fā)現(xiàn)波動(dòng)突然上升的詞[18]。據(jù)此,本研究采用技術(shù)主題詞頻差來(lái)描述詞頻的波動(dòng),利用技術(shù)主題詞頻的波動(dòng)規(guī)律來(lái)預(yù)測(cè)技術(shù)的發(fā)展趨勢(shì)。

        統(tǒng)計(jì)學(xué)中,反映數(shù)據(jù)波動(dòng)特征的指標(biāo)一般分為兩種:(1)集中量數(shù),表示數(shù)據(jù)的一般水平的代表值,通常用算術(shù)平均數(shù)、中位數(shù)、幾何平均數(shù)進(jìn)行描述;(2)差異量數(shù),用于描述數(shù)據(jù)的波動(dòng)性的量數(shù),可以客觀反映數(shù)據(jù)的實(shí)際形態(tài),主要包括標(biāo)準(zhǔn)差、極差、方差等?;诮y(tǒng)計(jì)學(xué)中數(shù)據(jù)波動(dòng)分析指標(biāo),以技術(shù)主題詞頻差值(以下簡(jiǎn)稱“詞頻差”)作為研究數(shù)據(jù)。具體而言,以平均值代表被分析對(duì)象的平均水平;詞頻差與平均值的差值代表波動(dòng)幅度;波動(dòng)幅度的范圍代表波動(dòng)區(qū)間。由于技術(shù)的發(fā)展具有連續(xù)性,本研究通過(guò)量化技術(shù)發(fā)展?fàn)顟B(tài)持續(xù)時(shí)間,以波動(dòng)幅度在波動(dòng)區(qū)間的時(shí)間長(zhǎng)度代表波幅時(shí)長(zhǎng),最終確定以平均值、波動(dòng)區(qū)間、波幅時(shí)長(zhǎng)作為參數(shù),構(gòu)建多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)模型(以下簡(jiǎn)稱“技術(shù)預(yù)測(cè)模型”),用于預(yù)測(cè)技術(shù)的發(fā)展趨勢(shì)以及持續(xù)情況。技術(shù)預(yù)測(cè)模型建立在利用擬合模型進(jìn)行數(shù)據(jù)擬合的基礎(chǔ)上,以擬合模型的擬合結(jié)果計(jì)算模型的參數(shù)值,因此技術(shù)預(yù)測(cè)模型的構(gòu)建主要分成擬合模型選擇、檢驗(yàn)標(biāo)準(zhǔn)設(shè)定、模型參數(shù)確定和檢驗(yàn)幾步。具體建模流程如圖2 所示。

        圖2 多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)模型建模流程

        2.2.1 擬合模型選擇

        時(shí)間序列中曲線擬合方法包括多項(xiàng)式模型、對(duì)數(shù)模型、Logistic 模型、S 模型、冪模型等,其中多項(xiàng)式模型的擬合效果最佳,被廣泛應(yīng)用于對(duì)時(shí)間序列上主題的擬合,因此本研究采用最小二乘法擬合原理作為函數(shù)擬合的方法,按照偏差平方和最小的原則選取擬合曲線,可以快速簡(jiǎn)便求得未知數(shù),是預(yù)測(cè)領(lǐng)域廣泛應(yīng)用的最優(yōu)化方法。最小二乘法表達(dá)式如下:

        多項(xiàng)式函數(shù)表達(dá)式如下:

        當(dāng)t的取值為n時(shí),經(jīng)過(guò)偏導(dǎo)和累加等方式,得到多項(xiàng)式方程矩陣如下:

        2.2.2 檢驗(yàn)標(biāo)準(zhǔn)設(shè)定

        在多項(xiàng)式函數(shù)擬合過(guò)程中,可能會(huì)出現(xiàn)擬合曲線在定義區(qū)間端點(diǎn)處震蕩(過(guò)擬合現(xiàn)象)或?qū)?shù)據(jù)微小變化很敏感的現(xiàn)象(龍格現(xiàn)象)。多項(xiàng)式函數(shù)根據(jù)最高次方數(shù)的不同,分為二次多項(xiàng)式、三次多項(xiàng)式、四次多項(xiàng)式、高階多項(xiàng)式等,項(xiàng)數(shù)越多,最高項(xiàng)的次方數(shù)越大。為了避免出現(xiàn)過(guò)擬合現(xiàn)象,同時(shí)為了使多項(xiàng)式模型的擬合效果達(dá)到最優(yōu),借鑒程月月等[14]的研究,采用機(jī)器學(xué)習(xí)數(shù)據(jù)及分類方法,將詞集分為訓(xùn)練集和驗(yàn)證集。即在已有第1~n年的技術(shù)主題詞頻差數(shù)據(jù)的情況下,以第1~(n-1)年的技術(shù)主題實(shí)際詞頻差作為訓(xùn)練數(shù)據(jù),第n年時(shí)的詞頻差作為測(cè)試數(shù)據(jù)。以訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)之間的誤差值最小為檢驗(yàn)標(biāo)準(zhǔn),得到最優(yōu)多項(xiàng)式模型作為技術(shù)主題時(shí)序擬合的模型。

        2.2.3 預(yù)測(cè)模型參數(shù)確定

        技術(shù)預(yù)測(cè)模型是技術(shù)預(yù)測(cè)的核心,包含平均值、波動(dòng)區(qū)間、波幅時(shí)長(zhǎng)3 個(gè)參數(shù),參數(shù)的取值規(guī)則如下:

        (1)算術(shù)平均值指將全部數(shù)據(jù)相加除以數(shù)據(jù)的個(gè)數(shù),計(jì)算簡(jiǎn)單快捷,運(yùn)用最為廣泛。以平均值來(lái)反映全部技術(shù)主題詞頻差的平均水平,由技術(shù)主題詞頻差的擬合值和時(shí)間得出。則平均值為:

        式(4)中:t為時(shí)間;為t時(shí)的擬合值。

        (2)統(tǒng)計(jì)學(xué)中采用方差來(lái)衡量數(shù)據(jù)波動(dòng)的大小。為了深入研究詞頻波動(dòng)大小的取值范圍,以詞頻差求得平均值、再求差后得到的數(shù)值即波動(dòng)幅度來(lái)確定波動(dòng)區(qū)間,波動(dòng)區(qū)間為詞頻差與平均值的差值即波動(dòng)幅度的范圍,取值與兩個(gè)臨界值有關(guān);s表示波動(dòng)區(qū)間的3 種情況,當(dāng)s=1 時(shí),波動(dòng)區(qū)間為時(shí),波動(dòng)區(qū)間為時(shí),波動(dòng)區(qū)間為的公式分別如下:

        (3)在數(shù)據(jù)分析中,如果數(shù)據(jù)波動(dòng)突破了數(shù)據(jù)波動(dòng)范圍,往往意味著趨勢(shì)的形成,趨勢(shì)一旦形成就不容易再發(fā)生改變。數(shù)據(jù)產(chǎn)生的波動(dòng)情況可分為一次性波動(dòng)、周期性波動(dòng)和持續(xù)性波動(dòng)3 種。若數(shù)據(jù)出現(xiàn)持續(xù)性波動(dòng),且持續(xù)時(shí)間較長(zhǎng)時(shí)需要引起重視,因此可以將數(shù)據(jù)在一定范圍內(nèi)波動(dòng)維持的時(shí)間長(zhǎng)短作為判斷趨向于某一種發(fā)展趨勢(shì)的程度的指標(biāo)。本研究定義波幅時(shí)長(zhǎng)為詞頻差波動(dòng)幅度在波動(dòng)區(qū)間維持的時(shí)間長(zhǎng)度,由時(shí)長(zhǎng)計(jì)算公式可知,時(shí)長(zhǎng)由開(kāi)始時(shí)間和結(jié)束時(shí)間決定,推理可得波幅時(shí)長(zhǎng)T由詞頻差波動(dòng)幅度在波動(dòng)區(qū)間結(jié)束時(shí)間與開(kāi)始時(shí)間的差得出。定義詞頻差預(yù)測(cè)值與平均值的差值為預(yù)測(cè)波動(dòng)幅度,預(yù)測(cè)波幅時(shí)長(zhǎng)T'由預(yù)測(cè)波動(dòng)幅度在波動(dòng)區(qū)間結(jié)束時(shí)間與開(kāi)始時(shí)間的差得出,則波幅時(shí)長(zhǎng)和預(yù)測(cè)波幅時(shí)長(zhǎng)的計(jì)算公式如下:

        式(7)(8)中:T為波動(dòng)幅度在波動(dòng)區(qū)間時(shí)間長(zhǎng)度為波動(dòng)幅度在波動(dòng)區(qū)間內(nèi)變化開(kāi)始時(shí)間為波動(dòng)幅度在波動(dòng)區(qū)間內(nèi)變化結(jié)束的時(shí)間;T'為預(yù)測(cè)波動(dòng)幅度在波動(dòng)區(qū)間時(shí)間長(zhǎng)度;為預(yù)測(cè)波動(dòng)幅度在波動(dòng)區(qū)間內(nèi)變化開(kāi)始時(shí)間為預(yù)測(cè)波動(dòng)幅度在波動(dòng)區(qū)間內(nèi)變化結(jié)束的時(shí)間。

        本研究用波動(dòng)幅度所對(duì)應(yīng)的波動(dòng)區(qū)間推測(cè)技術(shù)的發(fā)展趨勢(shì),波幅時(shí)長(zhǎng)與預(yù)測(cè)波幅時(shí)長(zhǎng)用于測(cè)算持續(xù)處于某一發(fā)展趨勢(shì)的時(shí)間。根據(jù)平均值、波動(dòng)區(qū)間以及波幅時(shí)長(zhǎng)3 個(gè)關(guān)鍵參數(shù)與預(yù)測(cè)值、預(yù)測(cè)波幅時(shí)長(zhǎng)之間的數(shù)量比較關(guān)系構(gòu)建技術(shù)預(yù)測(cè)模型。模型表達(dá)式為:

        技術(shù)預(yù)測(cè)模型以時(shí)間序列數(shù)據(jù)擬合為基礎(chǔ),對(duì)歷史數(shù)據(jù)的擬合建立在不管發(fā)生什么,趨勢(shì)都將持續(xù)到未來(lái)而不減弱的基礎(chǔ)上,那么隨著未來(lái)的時(shí)間的延伸,預(yù)測(cè)結(jié)果會(huì)變得越來(lái)越不穩(wěn)定。基于此,本研究用發(fā)展模式的強(qiáng)度來(lái)量化發(fā)展趨勢(shì)的持續(xù)程度。的取值范圍為,取值越大表明發(fā)展模式持續(xù)時(shí)間越長(zhǎng),即發(fā)展趨勢(shì)的持續(xù)程度越強(qiáng)。

        2.2.4 模型檢驗(yàn)

        技術(shù)預(yù)測(cè)模型檢驗(yàn)即對(duì)模型的有效性檢驗(yàn)。通??梢杂媚P皖A(yù)測(cè)得到的數(shù)據(jù)與實(shí)際數(shù)據(jù)之間的差異程度來(lái)衡量,然而目前的研究中尚未對(duì)技術(shù)預(yù)測(cè)模型預(yù)測(cè)出的結(jié)果誤差設(shè)定參考值,所以無(wú)法通過(guò)預(yù)測(cè)值與參考值之間的差距大小判斷技術(shù)預(yù)測(cè)模型預(yù)測(cè)效果是否良好。由于本研究采用區(qū)間劃分詞頻差的波動(dòng)范圍,因此可以采用訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)的實(shí)際值與預(yù)測(cè)值是否在相同的波動(dòng)區(qū)間來(lái)判斷技術(shù)預(yù)測(cè)模型的有效性。在圖表中采用圓點(diǎn)表示出實(shí)際值與預(yù)測(cè)值的位置,能夠清楚地看出兩者是否在同一個(gè)波動(dòng)區(qū)間以及兩者之間的差距,若存在多個(gè)技術(shù)主題實(shí)際值和預(yù)測(cè)值在相同的波動(dòng)區(qū)間,則說(shuō)明技術(shù)預(yù)測(cè)模型有效,且預(yù)測(cè)結(jié)果的準(zhǔn)確性高。

        2.3 技術(shù)預(yù)測(cè)

        科研界對(duì)發(fā)展趨勢(shì)的劃分主要有以下幾種方法。一是根據(jù)論文的數(shù)量將領(lǐng)域發(fā)展?fàn)顟B(tài)分為3 類:論文發(fā)表量多,未來(lái)發(fā)展呈現(xiàn)上升趨勢(shì);論文發(fā)表量多,增長(zhǎng)趨勢(shì)緩慢;論文發(fā)表量少,未來(lái)增長(zhǎng)趨勢(shì)緩慢[19]。二是根據(jù)主題詞頻隨時(shí)間的變化,將發(fā)展趨勢(shì)分為較快速度上升趨勢(shì)、逐漸上升趨勢(shì)、基本持平狀態(tài)、下降趨勢(shì)4 種。由此可以看出,對(duì)發(fā)展趨勢(shì)的劃分存在較大的主觀因素,因考慮問(wèn)題的角度不同所得到的結(jié)論不盡相同。張?jiān)魄锏龋?0]提出構(gòu)建時(shí)間序列數(shù)學(xué)模型預(yù)測(cè)各指標(biāo)對(duì)時(shí)間的依賴性,從而進(jìn)行趨勢(shì)判斷。借鑒前人相關(guān)研究,本研究根據(jù)波動(dòng)區(qū)間和預(yù)測(cè)波幅時(shí)長(zhǎng)將技術(shù)發(fā)展模式分為6 種:快速上升、快速下降、平穩(wěn)、逐漸上升、逐漸下降、趨勢(shì)突變。

        技術(shù)發(fā)展趨勢(shì)的預(yù)測(cè)是建立在掌握一定時(shí)間內(nèi)技術(shù)發(fā)展規(guī)律的基礎(chǔ)上。根據(jù)相關(guān)原則,技術(shù)主題詞頻差最小的波幅時(shí)長(zhǎng)為2,而預(yù)測(cè)波幅時(shí)長(zhǎng)最小值為1?;谄椒€(wěn)時(shí)間序列均值、方差為常數(shù)的性質(zhì),以波動(dòng)區(qū)間劃分技術(shù)發(fā)展趨勢(shì),利用波幅時(shí)長(zhǎng)確定技術(shù)發(fā)展模式強(qiáng)度,以波幅時(shí)長(zhǎng)、預(yù)測(cè)波幅時(shí)長(zhǎng)最小值為選取原則,取兩個(gè)最小值的比值按0.5 為發(fā)展模式強(qiáng)度的閾值,若發(fā)展模式強(qiáng)度高于閾值,則趨向于某一種技術(shù)發(fā)展模式的趨勢(shì)越明顯?;诓▌?dòng)幅度和預(yù)測(cè)波幅時(shí)長(zhǎng)的定義與取值規(guī)則,預(yù)測(cè)6種技術(shù)發(fā)展模式的具體形式如下:

        (6)當(dāng)T=1 時(shí),且預(yù)測(cè)波幅時(shí)長(zhǎng)為1,表示技術(shù)的發(fā)展趨勢(shì)與前一時(shí)間段的趨勢(shì)相比發(fā)生突變。

        科研界將熱點(diǎn)技術(shù)定義為:受到科研人員廣泛關(guān)注的主要研究方向和技術(shù)主題,能夠反映領(lǐng)域的研發(fā)現(xiàn)狀和技術(shù)結(jié)構(gòu)全貌[21];將突破性技術(shù)發(fā)明定義為:具備新穎性和獨(dú)特性并且對(duì)未來(lái)技術(shù)發(fā)展有重大基礎(chǔ)影響的技術(shù)的發(fā)明[22]?;诖?,本研究定義處于快速上升趨勢(shì)且發(fā)展模式強(qiáng)度大的技術(shù)為突破性技術(shù),該類技術(shù)在領(lǐng)域內(nèi)研究?jī)r(jià)值高、發(fā)展快;處于逐漸上升趨勢(shì)且發(fā)展模式強(qiáng)度大的技術(shù)為熱點(diǎn)技術(shù),該類技術(shù)在領(lǐng)域內(nèi)研究中整體呈現(xiàn)上升趨勢(shì),具有較大的研究?jī)r(jià)值。若預(yù)測(cè)波動(dòng)幅度與此前波動(dòng)幅度所在的波動(dòng)區(qū)間不同,意味著技術(shù)發(fā)展趨勢(shì)出現(xiàn)了突變,那么該技術(shù)可能出現(xiàn)處于上升、下降、平穩(wěn)波動(dòng)區(qū)間3 種情況;若技術(shù)主題預(yù)測(cè)波動(dòng)幅度與此前的波動(dòng)幅度處于正常波動(dòng)區(qū)間,意味著技術(shù)處于一種平穩(wěn)發(fā)展的狀態(tài),那么該技術(shù)未來(lái)將會(huì)保持著平穩(wěn)的趨勢(shì),不會(huì)出現(xiàn)上升、下降的情況。

        3 實(shí)證研究

        3.1 數(shù)據(jù)獲取與處理

        3.1.1 數(shù)據(jù)獲取

        以揮發(fā)性有機(jī)物(volatile organic compounds,VOCs)處理技術(shù)領(lǐng)域作為實(shí)證研究對(duì)象。選擇Scopus 數(shù)據(jù)庫(kù),檢索式為TITLE-ABSKEY(“VOC”or “VOCs”or “volatile organic compound”or “volatile organic compounds”),時(shí)間設(shè)定為1993—2020 年,不設(shè)其他限定條件。其中1993—2019 年的數(shù)據(jù)為訓(xùn)練數(shù)據(jù),2019—2020 年的數(shù)據(jù)為測(cè)試數(shù)據(jù)。

        3.1.2 數(shù)據(jù)處理

        (1)從數(shù)據(jù)庫(kù)中導(dǎo)出文獻(xiàn)信息包括引文信息、題錄信息、摘要和關(guān)鍵詞,文件格式為純文本格式,得到數(shù)據(jù)集A。

        (2)從數(shù)據(jù)集A中提取索引關(guān)鍵詞并統(tǒng)計(jì)詞頻,得到數(shù)據(jù)集B(關(guān)鍵詞集)。

        (3)觀察數(shù)據(jù)集B中的關(guān)鍵詞,發(fā)現(xiàn)有許多詞頻較低的關(guān)鍵詞,由領(lǐng)域?qū)<医槿雽?duì)這些關(guān)鍵詞進(jìn)行觀察并設(shè)定低頻詞詞頻閾值,對(duì)低于閾值的關(guān)鍵詞進(jìn)行刪除,得到數(shù)據(jù)集C。低頻詞如“heart atria”“heart atrium”“extracellular calcium”等。

        (4)根據(jù)領(lǐng)域?qū)<掖_定的無(wú)關(guān)詞創(chuàng)建無(wú)關(guān)詞詞庫(kù),利用Python 對(duì)數(shù)據(jù)集C進(jìn)行無(wú)關(guān)詞刪除,得到數(shù)據(jù)集D。無(wú)關(guān)詞如“article”“female”“animals”和年份、國(guó)家、海洋的名稱、數(shù)據(jù)值等。

        (5)利用Python 對(duì)數(shù)據(jù)集D進(jìn)行同義詞合并,得到數(shù)據(jù)集E。同義詞如“granular activated carbons”“activated carbon”等。

        (6)由領(lǐng)域?qū)<覍?duì)數(shù)據(jù)集E 中的技術(shù)主題詞進(jìn)行識(shí)別,并將屬于同一技術(shù)的主題詞進(jìn)行合并,得到技術(shù)主題詞集F,完成數(shù)據(jù)處理。

        3.2 技術(shù)主題提取

        經(jīng)過(guò)上述數(shù)據(jù)處理,由領(lǐng)域?qū)<以俑鶕?jù)技術(shù)特征將技術(shù)主題詞歸并到相應(yīng)技術(shù)主題,最后得到揮發(fā)性有機(jī)物處理的8 個(gè)技術(shù)主題(以下簡(jiǎn)稱“8 個(gè)技術(shù)主題”),如表1 所示。

        表1 揮發(fā)性有機(jī)物處理的技術(shù)主題

        3.3 多項(xiàng)式函數(shù)時(shí)序擬合

        將1993—2019 年間8 個(gè)技術(shù)主題的時(shí)間序列數(shù)據(jù)進(jìn)行曲線擬合,比較最高項(xiàng)次方數(shù)不同的多項(xiàng)式函數(shù)的誤差,分別對(duì)不同技術(shù)主題選取誤差最小的多項(xiàng)式模型進(jìn)行時(shí)序擬合,得到不同技術(shù)主題時(shí)序詞頻差擬合曲線圖,如圖3 所示。圖3 中,散布在坐標(biāo)軸內(nèi)部的圓點(diǎn)表示技術(shù)主題詞頻的實(shí)際差值,在最大程度上擬合平面上離散的點(diǎn)的線即為多項(xiàng)式函數(shù)擬合出的曲線??梢?jiàn)譜分析技術(shù)主題的詞頻差擬合曲線波動(dòng)最大,在第24 年曲線迅猛攀升,詞頻差激增;熱分解技術(shù)、前處理技術(shù)、生物技術(shù)、光催化技術(shù)等主題的詞頻差擬合曲線在一定范圍內(nèi)上下波動(dòng),詞頻差的變化維持在一個(gè)較為穩(wěn)定的水平;催化氧化技術(shù)、吸附技術(shù)、臭氧氧化技術(shù)、前處理技術(shù)、光催化技術(shù)等主題的詞頻差擬合曲線在第25年達(dá)到峰值,詞頻差值達(dá)到最大值,說(shuō)明這幾項(xiàng)技術(shù)處于快速發(fā)展階段。

        圖3 1993—2019 年8 個(gè)技術(shù)主題時(shí)序詞頻差擬合曲線

        3.4 模型參數(shù)及模型檢驗(yàn)

        采用經(jīng)式(4)至式(8)計(jì)算得出的參數(shù)建立技術(shù)預(yù)測(cè)模型,參數(shù)值決定了后續(xù)代入變量后模型得出的預(yù)測(cè)結(jié)果的準(zhǔn)確性。通過(guò)多次訓(xùn)練,得到8個(gè)技術(shù)主題2020 年的模型參數(shù)及預(yù)測(cè)結(jié)果,如表2所示。

        表2 技術(shù)預(yù)測(cè)模型參數(shù)及8 個(gè)技術(shù)主題2020 年發(fā)展預(yù)測(cè)結(jié)果

        根據(jù)8 個(gè)技術(shù)主題2020 年發(fā)展趨勢(shì)預(yù)測(cè)結(jié)果的有效性,得到技術(shù)主題趨勢(shì)預(yù)測(cè)結(jié)果圖,如圖4 所示。其中,l、g兩條虛線上的點(diǎn)分別表示波動(dòng)區(qū)間的兩個(gè)臨界值??梢钥闯?,譜分析技術(shù)、熱分解技術(shù)、前處理技術(shù)、生物技術(shù)的預(yù)測(cè)值與實(shí)際值落在同一波動(dòng)區(qū)間,且預(yù)測(cè)值與實(shí)際值的誤差較小;催化氧化技術(shù)、臭氧氧化技術(shù)、光催化技術(shù)的預(yù)測(cè)值與實(shí)際值落在同一波動(dòng)區(qū)間,但是預(yù)測(cè)值與實(shí)際值之間存在一定的誤差;吸附技術(shù)主題的預(yù)測(cè)值與實(shí)際值落在不同的波動(dòng)區(qū)間,且預(yù)測(cè)值與實(shí)際值差值較大。由此表明本研究構(gòu)建的技術(shù)預(yù)測(cè)模型雖然存在一定誤差,但整體預(yù)測(cè)結(jié)果較好。

        圖4 8 個(gè)技術(shù)主題2019—2020 年發(fā)展趨勢(shì)預(yù)測(cè)結(jié)果

        3.5 技術(shù)預(yù)測(cè)

        以1993—2020 年間8 個(gè)技術(shù)主題詞頻差數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),得到其2021 年的模型參數(shù)以及預(yù)測(cè)結(jié)果,如表3 所示。

        表3 技術(shù)預(yù)測(cè)模型參數(shù)及8 個(gè)技術(shù)主題2021 年發(fā)展趨勢(shì)預(yù)測(cè)結(jié)果

        根據(jù)表3 中的模型參數(shù)值與預(yù)測(cè)出的2021 年、2020 年技術(shù)主題的詞頻差,對(duì)8 個(gè)技術(shù)主題2020—2021 年的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),如圖5 所示。譜分析技術(shù)和熱分解技術(shù)的預(yù)測(cè)值在直線g 之上,結(jié)合前幾年的波動(dòng)幅度范圍進(jìn)行分析,尤其是譜分析技術(shù)最近5 年的波動(dòng)幅度均處于直線g 上方,雖然詞頻差有小幅度減小,但是整體來(lái)看依然處于逐漸上升趨勢(shì);熱分解技術(shù)的波動(dòng)幅度持續(xù)處于上升趨勢(shì)的波動(dòng)區(qū)間,不存在大幅度驟降的現(xiàn)象,即使是在第26 年詞頻差下降,依然不影響整體的波動(dòng)幅度所在的區(qū)間,相比較于譜分析技術(shù)的發(fā)展模式強(qiáng)度更強(qiáng),可以認(rèn)為該技術(shù)處于快速上升的狀態(tài)。催化氧化技術(shù)達(dá)到了歷年最低值,在2020—2021 年突然出現(xiàn)波動(dòng)幅度大幅下降,甚至突破了下降區(qū)間的臨界值,屬于趨勢(shì)突變的技術(shù)。前處理技術(shù)達(dá)到峰值,相比于前27 年的波動(dòng)幅度都要大,在第26 年的詞頻差小于平均值;而2020—2021 年的預(yù)測(cè)波動(dòng)幅度卻達(dá)到了最小值,雖然在第27 年波動(dòng)幅度有所上升,但是第28 年波動(dòng)幅度再一次大幅度下降,變化趨勢(shì)發(fā)生突變。吸附技術(shù)從第25 年起波動(dòng)幅度就開(kāi)始下降,第26 年的波動(dòng)幅度處于正常平穩(wěn)的波動(dòng)區(qū)間,第27 年的波動(dòng)幅度突破了臨界值,處于下降趨勢(shì)的波動(dòng)區(qū)間;預(yù)測(cè)出的2020—2021 年波動(dòng)幅度同樣處于下降波動(dòng)區(qū)間,并且預(yù)測(cè)波幅時(shí)長(zhǎng)與前27 年的波幅時(shí)長(zhǎng)相同,發(fā)展模式強(qiáng)度為1,說(shuō)明該技術(shù)處于快速下降的狀態(tài)。臭氧氧化技術(shù)在前27 年大部分時(shí)間都處于平穩(wěn)的波動(dòng)區(qū)間,只有部分時(shí)間如第13 年、第15 年、第21 年、第23 年、第25 年波動(dòng)幅度突破了波動(dòng)區(qū)間的兩個(gè)臨界值,第25 年之后波動(dòng)幅度都處于上升趨勢(shì)的波動(dòng)區(qū)間,但是第28 年預(yù)測(cè)波動(dòng)幅度下降為最低值,說(shuō)明該技術(shù)的發(fā)展趨勢(shì)發(fā)生突變,并且波動(dòng)幅度極大。光催化技術(shù)處于下降趨勢(shì)的波動(dòng)區(qū)間,第25 年詞頻差波動(dòng)幅度達(dá)到上升趨勢(shì)波動(dòng)幅度的最大值,第26 年波動(dòng)幅度處于下降波動(dòng)區(qū)間,結(jié)合前27 年的波動(dòng)幅度變化綜合分析可以看出該技術(shù)的發(fā)展趨勢(shì)發(fā)生突變。生物技術(shù)從第13 年到第21 年波動(dòng)幅度均處于上升趨勢(shì)的波動(dòng)區(qū)間,并且此前也有相當(dāng)長(zhǎng)的一段時(shí)間波動(dòng)幅度處于上升趨勢(shì)的波動(dòng)區(qū)間,僅有兩個(gè)時(shí)間段處于下降趨勢(shì)的波動(dòng)區(qū)間,并且發(fā)展模式強(qiáng)度為1,說(shuō)明該技術(shù)處于平穩(wěn)發(fā)展的狀態(tài)。

        圖5 8 個(gè)技術(shù)主題2020—2021 年發(fā)展趨勢(shì)預(yù)測(cè)結(jié)果

        我國(guó)政府發(fā)布的VOCs 治理系列政策涉及的廢氣治理工藝包含吸附、吸收、熱分解等多種技術(shù),溶劑回收套用在可以節(jié)約自然資源同時(shí)也能降低企業(yè)運(yùn)行成本,但是各種工業(yè)規(guī)范的限制使得達(dá)不到行業(yè)標(biāo)準(zhǔn)的大部分企業(yè)采用熱分解工藝燃燒有機(jī)物廢氣,當(dāng)前熱分解工藝是VOCs廢氣治理的主流技術(shù),并且相關(guān)技術(shù)裝備水平已得到了很大發(fā)展提升[23]。結(jié)合技術(shù)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果以及熱分解技術(shù)的研究與實(shí)際發(fā)展現(xiàn)狀,可以說(shuō)明熱分解技術(shù)是一項(xiàng)重點(diǎn)研究技術(shù)。

        4 結(jié)論與展望

        4.1 研究結(jié)論

        (1)技術(shù)發(fā)展的過(guò)程伴隨著詞頻的波動(dòng)。本研究將平均值、波動(dòng)區(qū)間、波幅時(shí)長(zhǎng)3 個(gè)參數(shù)引入技術(shù)預(yù)測(cè)研究中,構(gòu)建了多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)模型,識(shí)別和定義了快速上升、快速下降、平穩(wěn)、逐漸上升、逐漸下降、趨勢(shì)突變等6 種不同的技術(shù)發(fā)展模式。

        (2)熱分解技術(shù)在VOCs 領(lǐng)域是一項(xiàng)重點(diǎn)技術(shù)。本研究運(yùn)用技術(shù)預(yù)測(cè)模型對(duì)VOCs 領(lǐng)域8 個(gè)技術(shù)主題的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),識(shí)別出熱分解技術(shù)為重點(diǎn)技術(shù),結(jié)合該技術(shù)相關(guān)研究及其應(yīng)用實(shí)際,證明多參數(shù)動(dòng)態(tài)時(shí)序技術(shù)預(yù)測(cè)方法可行、有效。

        4.2 未來(lái)展望

        本研究數(shù)據(jù)源尚較為單一,未來(lái)可以從以下幾個(gè)方面進(jìn)一步開(kāi)展相關(guān)研究:(1)與其他技術(shù)預(yù)測(cè)方法進(jìn)行對(duì)比分析,進(jìn)一步擴(kuò)大模型的應(yīng)用范圍;(2)與深度學(xué)習(xí)理論中長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)模型結(jié)合,使技術(shù)預(yù)測(cè)模型具備記憶功能,從真正意義上使用時(shí)間序列的長(zhǎng)距離信息,提高預(yù)測(cè)的準(zhǔn)確性;(3)將論文、多語(yǔ)種的專利文獻(xiàn)等納入數(shù)據(jù)集的范圍,應(yīng)用多源異構(gòu)融合技術(shù),實(shí)現(xiàn)更加全面的技術(shù)預(yù)測(cè)。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        日本久久久免费高清| 亚洲成a人片77777kkkkk| 久久国产精品老人性| av毛片一区二区少妇颜射| 激情偷拍视频一区二区| 少妇被粗大的猛进69视频| 产美女被爽到高潮免费a| 亚洲av永久无码精品古装片| 狠狠色狠狠色综合| 久久青青热| 2020久久精品亚洲热综合一本| 国产又色又爽的视频在线观看91 | 亚洲精品中文字幕乱码二区| av有码在线一区二区三区| 日本妇人成熟免费2020| 99精品欧美一区二区三区| 国产午夜精品一区二区三区不| 亚洲一区二区日韩在线| 欧美亅性猛交内射| 亚洲人成色7777在线观看| 国产乱妇乱子视频在播放| 中日韩欧美成人免费播放| 蜜桃色av一区二区三区麻豆 | 亚洲不卡av二区三区四区| 国产精品一区二区三区卡| 精品国产午夜理论片不卡| 国产内射XXXXX在线| 天堂精品人妻一卡二卡| 国产午夜免费高清久久影院| 无码吃奶揉捏奶头高潮视频| 国产免费一区二区三区在线观看| 九九久久国产精品大片| 在线观看中文字幕不卡二区| 中国杭州少妇xxxx做受| 国产精品久久久久久久久岛| 色综合另类小说图片区| 蜜桃视频在线免费观看完整版| 最新国产不卡在线视频| 午夜精品一区二区三区的区别| 热99精品| 激情内射亚洲一区二区|