劉晉霞 侯倩倩
(太原科技大學(xué)經(jīng)濟(jì)與管理學(xué)院 太原 030024)
隨著科學(xué)研究的迅猛發(fā)展和大數(shù)據(jù)信息化時(shí)代的到來,各學(xué)科領(lǐng)域均產(chǎn)生了大量的學(xué)術(shù)資源,其中科技文獻(xiàn)特別是各領(lǐng)域內(nèi)的核心期刊文獻(xiàn)作為科研成果的重要載體,不僅具有較高的學(xué)術(shù)價(jià)值,同時(shí)也是一個(gè)領(lǐng)域發(fā)展水平的集中體現(xiàn)。通過對研究領(lǐng)域的期刊文獻(xiàn)進(jìn)行文本挖掘,可以發(fā)現(xiàn)其蘊(yùn)含的潛在主題和熱點(diǎn)信息,有效把握領(lǐng)域研究現(xiàn)狀與熱點(diǎn)方向。
當(dāng)前關(guān)于熱點(diǎn)識別的研究成果已有很多,其方法主要分為以下三類:
第一類是引文分析法。它主要是對文獻(xiàn)間的引證關(guān)系與被引關(guān)系進(jìn)行研究,并進(jìn)行描述性統(tǒng)計(jì)或引用網(wǎng)絡(luò)分析,進(jìn)而找到核心文獻(xiàn)或熱點(diǎn)主題,主要包括共被引分析和耦合分析兩種方法。其中共被引分析由Small于1973年提出[1]。隨后Garfield提出文獻(xiàn)的共被引頻次越高,這組文獻(xiàn)對就越可能代表領(lǐng)域內(nèi)一個(gè)確定或新興的主題的觀點(diǎn)[2]。郭伏等采用文獻(xiàn)共被引分析,并對共被引網(wǎng)絡(luò)進(jìn)行可視化,分析了人因工程領(lǐng)域的研究熱點(diǎn)[3]。耦合概念由Kessler于1963年提出[4]。Morris等通過文獻(xiàn)耦合分析,對耦合強(qiáng)度大于閾值的文獻(xiàn)進(jìn)行層次聚類,從時(shí)間變化的角度來展現(xiàn)研究熱點(diǎn)的演化趨勢和信息流動等[5];Liu等在文獻(xiàn)耦合網(wǎng)絡(luò)的基礎(chǔ)上對研究領(lǐng)域展開主路徑分析,揭示了其發(fā)展歷程[6]。
第二類是詞匯分析法。它是將文獻(xiàn)的基本單元詞匯作為分析對象,對其進(jìn)行頻次統(tǒng)計(jì)或共詞聚類來研究領(lǐng)域熱點(diǎn),主要包括詞頻分析和共詞分析兩種方法。其中詞頻分析是找到文章中有意義的詞匯并對其進(jìn)行頻次統(tǒng)計(jì),最為常用的是通過設(shè)定閾值來確定高頻關(guān)鍵詞,進(jìn)而找到研究領(lǐng)域的熱點(diǎn)問題。如高勁松等通過設(shè)定閾值進(jìn)行高頻關(guān)鍵詞的篩選,對學(xué)科熱點(diǎn)進(jìn)行挖掘[7];周琴英等利用頻次統(tǒng)計(jì)獲得了高頻關(guān)鍵詞,通過對其進(jìn)行共詞聚類探測了研究領(lǐng)域的熱點(diǎn)主題[8];陳紅喜等基于高頻關(guān)鍵詞的共現(xiàn)分析,對國內(nèi)科技成果轉(zhuǎn)化研究的熱點(diǎn)進(jìn)行了探析[9]。共詞分析是對同時(shí)出現(xiàn)在一篇文章的兩個(gè)或多個(gè)詞匯進(jìn)行統(tǒng)計(jì)來分析研究領(lǐng)域的熱點(diǎn),通常利用關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖譜對一定時(shí)間內(nèi)的研究熱點(diǎn)進(jìn)行可視化分析。如Peters等利用共詞分析并結(jié)合多維尺度分析繪制了化學(xué)工程領(lǐng)域的知識圖譜,梳理了該領(lǐng)域的研究進(jìn)展和重點(diǎn)問題[10];李慶軍等對關(guān)鍵詞進(jìn)行了共現(xiàn)分析并繪制共現(xiàn)知識圖譜,對虛擬學(xué)術(shù)社區(qū)的研究熱點(diǎn)展開討論[11];李綱等則針對傳統(tǒng)共詞分析法中存在的問題,進(jìn)一步提出了關(guān)鍵詞加權(quán)的共詞分析法[12]。
第三類是主題模型法。該法通過對大規(guī)模文本集合進(jìn)行聚類來發(fā)現(xiàn)隱含的語義結(jié)構(gòu),并在詞袋模型的基礎(chǔ)上進(jìn)行文檔的特征表示,雖然沒有考慮文檔中詞語出現(xiàn)的順序關(guān)系,但其很大程度上彌補(bǔ)了引文分析法和詞匯分析法對文本語義內(nèi)容和語義關(guān)系的忽略。主題模型法的發(fā)展經(jīng)歷了LSA到PLSA,直到目前應(yīng)用最為廣泛且成功的是LDA主題模型[13]。LDA通過概率統(tǒng)計(jì)定量分析和識別研究主題,從語義層面進(jìn)行文本分析,從而得到文檔的潛在主題信息,同時(shí)對抽取出的每個(gè)主題,LDA都會輸出主題下的相關(guān)詞語,這對我們更好理解主題含義并對主題內(nèi)容進(jìn)行分析大有裨益。近年來,已有學(xué)者利用LDA模型展開了各種文本的熱點(diǎn)挖掘工作,如新聞熱點(diǎn)識別[14]、微博熱點(diǎn)挖掘[15]、評論熱點(diǎn)提取[16]等,但對學(xué)科領(lǐng)域的熱點(diǎn)主題進(jìn)行識別的研究尚不多見。譚春輝等借鑒新興主題的指標(biāo)構(gòu)建方法,基于LDA模型抽取研究主題,并通過設(shè)定新穎度指標(biāo)和支持度指標(biāo)的閾值來確定數(shù)據(jù)挖掘領(lǐng)域的熱點(diǎn)主題[17];張斌和岳麗欣等則基于LDA主題識別的結(jié)果,通過設(shè)定主題強(qiáng)度的閾值來發(fā)現(xiàn)熱點(diǎn)主題[18-19];裘惠麟等在LDA模型的基礎(chǔ)上融合了Word2Vec詞向量模型,然后基于LDA2vec模型提取了機(jī)器學(xué)習(xí)領(lǐng)域的熱點(diǎn)主題[20]。
綜上所述,目前進(jìn)行領(lǐng)域熱點(diǎn)識別的研究大多仍以引文分析法、詞匯分析法為主,受方法本身存在的局限性影響,此類研究的熱點(diǎn)識別結(jié)果在準(zhǔn)確性和客觀性方面均有限。而基于主題模型的方法則大多是通過建立時(shí)間和強(qiáng)度方面的指標(biāo)來識別熱點(diǎn),并未關(guān)注到熱點(diǎn)主題自身具有的獨(dú)特特征,使得識別結(jié)果對于熱點(diǎn)問題的指向性不強(qiáng)。另外,設(shè)定指標(biāo)閾值的方式具有一定的主觀性,不同學(xué)者的標(biāo)準(zhǔn)不同,可能會導(dǎo)致識別結(jié)果不夠全面。為改進(jìn)熱點(diǎn)識別研究的上述不足,本文分析了熱點(diǎn)主題所具有的影響力特征和關(guān)注度特征,并基于LDA主題模型構(gòu)建了影響力維度和關(guān)注度維度的識別指標(biāo)體系,以增強(qiáng)識別結(jié)果的熱點(diǎn)指向性。同時(shí)引入了指標(biāo)平均值和線性擬合的斜率進(jìn)行熱點(diǎn)主題的篩選,以使識別結(jié)果更加客觀準(zhǔn)確。
熱點(diǎn)指在某個(gè)時(shí)間段內(nèi)經(jīng)常出現(xiàn)的或受到很高關(guān)注度的詞語、話題[21]。對于科研熱點(diǎn),羅琰欽認(rèn)為其通常是由最能代表領(lǐng)域發(fā)展水平或影響領(lǐng)域發(fā)展趨勢的技術(shù)要點(diǎn)和理論構(gòu)成[22]??梢娨粋€(gè)領(lǐng)域的熱點(diǎn)主題應(yīng)當(dāng)是具有較高影響力水平和受關(guān)注程度的主題,同時(shí)由于主題的受關(guān)注程度受時(shí)間因素影響較大,因此熱點(diǎn)主題還應(yīng)具有良好的關(guān)注度發(fā)展趨勢,由此本文給出熱點(diǎn)主題的定義:熱點(diǎn)主題(Hot Topic, HT)是在所研究時(shí)間跨度內(nèi)具有較高影響力水平和受關(guān)注程度,且受關(guān)注程度具有良好發(fā)展態(tài)勢的主題。
本文界定的熱點(diǎn)主題HT應(yīng)滿足兩方面特征,HT=HT1∩HT2:
(1)主題在時(shí)間跨度內(nèi)的某一時(shí)期達(dá)到了較高的影響力水平,符合該影響力特征的主題屬于HT1;
(2)主題在時(shí)間跨度內(nèi)的某一時(shí)期具有較高的關(guān)注度水平,且受關(guān)注程度具有良好的發(fā)展態(tài)勢,符合該關(guān)注度特征的主題屬于HT2。
根據(jù)熱點(diǎn)主題所具有的特征條件,本文基于LDA主題模型的輸出信息,計(jì)算主題各年發(fā)文量,從而量化主題特征,并構(gòu)建影響力和關(guān)注度兩個(gè)維度的熱點(diǎn)主題識別指標(biāo)體系。通過LDA輸出的文檔-主題概率分布得到各個(gè)主題屬于每篇文檔的概率,當(dāng)這個(gè)概率大于或等于10%時(shí),這篇文檔就是該主題的一個(gè)支持文檔[23],主題在某年的支持文檔數(shù)即該主題在當(dāng)年的發(fā)文量。本文利用主題發(fā)文量的變化來反映主題的各項(xiàng)特征,進(jìn)而構(gòu)建指標(biāo)體系,構(gòu)建過程如下:
圖1 熱點(diǎn)主題識別指標(biāo)體系流程
由此形成熱點(diǎn)主題識別指標(biāo)體系,體系流程如圖1所示。利用LDA模型訓(xùn)練輸出的文檔-主題概率分布,計(jì)算每個(gè)主題的支持文檔數(shù)即主題發(fā)文量,根據(jù)主題每年的發(fā)文量計(jì)算各指標(biāo)值,從而進(jìn)行熱點(diǎn)主題的篩選。
通過LDA模型輸出的文檔-主題概率分布,可獲得主題每年的支持文檔數(shù)即主題發(fā)文量。由于主題發(fā)文量的變化可以體現(xiàn)一個(gè)主題的新穎程度和成熟程度,新穎度和成熟度可以共同反映一個(gè)主題的影響力,因此利用主題在某年的累加發(fā)文量與主題在當(dāng)前年的累加發(fā)文量之比構(gòu)成主題在該年的成熟度指標(biāo)(Maturity Index, MI),并結(jié)合新穎度指標(biāo)(Novelty Index, NI)構(gòu)建主題影響力指標(biāo)TII來對主題的影響力進(jìn)行度量。
a.新穎度指標(biāo)NI。新穎度指標(biāo)(Novelty Index, NI)是根據(jù)主題的年齡對主題的新穎程度進(jìn)行度量的指標(biāo)。當(dāng)主題出現(xiàn)后,隨著時(shí)間推移,主題的新穎度逐年降低,因此主題的新穎度值是一條下降的曲線。一個(gè)主題在t年的新穎度計(jì)算公式為[24]:
(1)
其中FY為主題的起始年(First Year),將主題的支持文檔按時(shí)間切片降序排列,逐年檢查該年的支持文檔數(shù)是否為0,當(dāng)為0時(shí),該年份加一年即可得到主題的起始年。
b.成熟度指標(biāo)MI。成熟度指標(biāo)(Maturity Index, MI)是某一時(shí)間片t下主題的累加支持文檔數(shù)與主題從起始年至當(dāng)前年的總支持文檔數(shù)之比,是對主題的成熟程度進(jìn)行度量的指標(biāo)。固定一個(gè)當(dāng)前年,隨著時(shí)間的推移,主題的累加支持文檔數(shù)增加,其與主題從起始年至當(dāng)前年的總支持文檔數(shù)之比也隨之升高。因此不同當(dāng)前年的成熟度曲線都是一條上升的曲線。主題i在t年的成熟度計(jì)算公式為:
(2)
其中Sumd(t)是主題i在t年的累加支持文檔數(shù),Sumd(i)是主題i在當(dāng)前年的累加支持文檔數(shù)。
(3)
(1)當(dāng)MIy=NIy時(shí) (2)當(dāng)MIy>NIy且MIy-1 (4) 根據(jù)LDA模型輸出的文檔-主題概率分布以及支持文檔的含義,可獲得主題每年的發(fā)文量。由于一個(gè)主題在某年的發(fā)文量占該年的總發(fā)文量的比重可以反映主題在該年的受關(guān)注程度,因此利用主題某年的發(fā)文量與該年所有主題的發(fā)文量總數(shù)之比構(gòu)成主題關(guān)注度指標(biāo)TAI來對主題的受關(guān)注程度進(jìn)行度量。 主題關(guān)注度指標(biāo)(Topic Attention Index, TAI)是同一時(shí)間片下主題的支持文檔數(shù)與該年的文檔總數(shù)之比。TAI越大說明該主題在當(dāng)年具有越高的受關(guān)注程度,將其與指標(biāo)平均值進(jìn)行比較來對具有較高關(guān)注度的主題進(jìn)行識別。主題i在t年的關(guān)注度計(jì)算公式為: (5) 其中N(i)表示主題i在t年的支持文檔數(shù),N(t)表示t年的文檔總數(shù)。 (6) 同時(shí)對主題關(guān)注度指標(biāo)進(jìn)行線性擬合可以發(fā)現(xiàn)主題受關(guān)注程度的發(fā)展態(tài)勢,計(jì)算擬合直線的斜率kTAI,當(dāng)kTAI>0時(shí)說明主題關(guān)注度呈上升趨勢,具有良好的發(fā)展態(tài)勢。 本文研究對象為制氫領(lǐng)域內(nèi)的相關(guān)文獻(xiàn),以該領(lǐng)域的核心中文期刊文獻(xiàn)為數(shù)據(jù)源。由于2000年以前該領(lǐng)域發(fā)文量極少,因此不計(jì)入統(tǒng)計(jì),檢索的時(shí)間跨度為2000—2020年。檢索平臺選擇中國知網(wǎng)(CNKI);使用高級檢索,文獻(xiàn)類型選擇期刊;期刊來源限定為SCI、EI、CSSCI、核心期刊、CSCD;檢索式為“SU=制氫”(SU表示主題)。共檢索得到3 315篇期刊文獻(xiàn),刪除寄語、新聞、動態(tài)等非學(xué)術(shù)類文獻(xiàn),將其以Refworks格式導(dǎo)出題錄信息,并進(jìn)行去重和刪除缺失項(xiàng)操作,最終得到2 988條有效文獻(xiàn)記錄。 a.對得到的2 988條有效文獻(xiàn)記錄,選取每篇文獻(xiàn)的標(biāo)題、摘要和關(guān)鍵詞進(jìn)行信息合并,將其作為LDA主題模型的文檔語料。 b.按照文檔的處理順序來抽取文檔的序號及發(fā)表年份,以便對LDA模型生成的文檔-主題文件進(jìn)行時(shí)間切片,本文設(shè)定時(shí)間切片為1年。 c.使用中文分詞組件Jieba的精確模式對文檔語料進(jìn)行分詞。 d.加載百度停用詞表、中文停用詞表、哈工大停用詞表、四川大學(xué)機(jī)器智能實(shí)驗(yàn)室停用詞庫以及自建停用詞表進(jìn)行停用詞處理。 e.將文獻(xiàn)中的關(guān)鍵詞進(jìn)行匯總,形成自定義詞典,以提高分詞效果。 對上一步預(yù)處理后的語料庫進(jìn)行主題抽取。使用python3作為開發(fā)平臺,選用scikit-learn中的LDA主題模型,其主要基于變分推斷EM算法進(jìn)行參數(shù)估計(jì)[25]。通過計(jì)算困惑度(perplexity)并結(jié)合研究實(shí)際對最優(yōu)主題數(shù)K進(jìn)行選取[26],理論上困惑度越小,模型性能越好,但過多的主題數(shù)易造成數(shù)據(jù)的過擬合,因此一般選擇困惑度最小值或拐點(diǎn)處對應(yīng)的主題數(shù)作為模型的最優(yōu)主題數(shù)。圖3為2~51個(gè)主題數(shù)分別對應(yīng)的困惑度計(jì)算結(jié)果。可以看到,當(dāng)主題數(shù)為18時(shí),perplexity值最小,故設(shè)定K=18。參數(shù)α和β使用默認(rèn)值,文檔迭代次數(shù)為1 000次。 LDA對語料庫進(jìn)行訓(xùn)練后會得到兩個(gè)概率分布。一是文檔-主題概率分布,即各主題屬于每篇文檔的概率,用于計(jì)算各主題的支持文檔數(shù),進(jìn)而計(jì)算熱點(diǎn)主題識別的各項(xiàng)指標(biāo);二是主題-詞概率分布,即組成各主題的主題詞及其概率,并將每個(gè)主題下概率排名前30的主題詞用于主題內(nèi)容分析。 圖3 主題數(shù)K的困惑度曲線 2.4.1影響力維度的識別 因篇幅有限,無需一一羅列所有主題的新穎度、成熟度指標(biāo)數(shù)據(jù),這里僅以Topic5為例,對指標(biāo)計(jì)算過程進(jìn)行演示。為計(jì)算主題影響力指標(biāo)TII,首先根據(jù)LDA模型輸出的文檔-主題概率分布,計(jì)算主題的支持文檔數(shù),并根據(jù)式(1)和式(2)得到主題的新穎度指標(biāo)NI和成熟度指標(biāo)MI。如表1所示,Topic5的成熟度指標(biāo)計(jì)算以2020年為當(dāng)前年,各年度的支持文檔數(shù)、累加支持文檔數(shù)、新穎度指標(biāo)和成熟度指標(biāo)分別計(jì)算列出。 表1 Topic5的各年新穎度指標(biāo)和成熟度指標(biāo) 由于計(jì)算成熟度指標(biāo)時(shí)第一年或第二年的累加支持文檔數(shù)意義不大,故當(dāng)前年應(yīng)從時(shí)間跨度內(nèi)的第3年開始取。但指標(biāo)計(jì)算過程中發(fā)現(xiàn)有主題的起始年為第4年即2003年,意味著其新穎度指標(biāo)在前3年無意義,為計(jì)算主題影響力指標(biāo),本文中的當(dāng)前年從2003年開始取。根據(jù)計(jì)算結(jié)果可得Topic5的新穎度曲線和以各年為當(dāng)前年的成熟度曲線(見圖4)。 圖5 Topic5的新穎度曲線及各當(dāng)前年的成熟度曲線 表及Topic5的TII值對比結(jié)果 2.4.2關(guān)注度維度的識別 同時(shí)根據(jù)主題每年的TAI值繪制主題的關(guān)注度變化趨勢圖,并對其進(jìn)行線性擬合,用擬合直線的斜率kTAI度量其發(fā)展態(tài)勢,kTAI>0說明主題具有良好的發(fā)展態(tài)勢。通過計(jì)算主題關(guān)注度指標(biāo)的擬合直線的斜率kTAI,可以得到受關(guān)注程度具有良好發(fā)展態(tài)勢的主題有: 表及Topic5的TAI值對比結(jié)果 綜合影響力和關(guān)注度兩個(gè)維度的識別結(jié)果,可以得到同時(shí)滿足影響力特征和關(guān)注度特征的熱點(diǎn)主題,即HT=HT1∩HT2={Topic5,Topic8,Topic11,Topic16}。 圖5 Topic5的主題關(guān)注度及其擬合直線 本文通過構(gòu)建的熱點(diǎn)主題識別指標(biāo)體系進(jìn)行主題篩選,得到了同時(shí)具有影響力和關(guān)注度的我國制氫領(lǐng)域的4個(gè)熱點(diǎn)主題。并基于LDA主題模型輸出的主題-詞概率分布,選取每個(gè)主題下概率排名前30且具有代表性的10個(gè)主題詞對主題進(jìn)行標(biāo)識,標(biāo)識結(jié)果如表4所示。根據(jù)主題標(biāo)識,結(jié)合主題詞對熱點(diǎn)主題內(nèi)容進(jìn)行分析。 表4 我國制氫技術(shù)領(lǐng)域的熱點(diǎn)主題 a.Topic5為光催化分解水制氫技術(shù)。光催化分解水制氫的原理是在光催化劑的協(xié)助下利用太陽能分解水產(chǎn)生氫氣。日本學(xué)者Fujishima于1972年首次利用二氧化鈦光催化分解水產(chǎn)氫[27],在世界范圍內(nèi)引起高度關(guān)注,開辟了光解水制氫的研究道路。近年來,隨著“雙碳”目標(biāo)的提出,我國能源結(jié)構(gòu)調(diào)整的步伐加快,大力發(fā)展氫能產(chǎn)業(yè)以代替?zhèn)鹘y(tǒng)的化石能源迫在眉睫。在國家大力發(fā)展可再生能源的低碳經(jīng)濟(jì)背景下,以綠色零排放方式制取“綠氫”將成為制氫研究的重點(diǎn)。光催化分解水制氫由于直接利用了一次能源,且沒有產(chǎn)生能源轉(zhuǎn)換的浪費(fèi),具有簡單高效的特點(diǎn),同時(shí)水的儲量豐富、清潔可持續(xù),這種通過分解水將光能轉(zhuǎn)化為化學(xué)能的制氫方法成為了一種環(huán)境友好的持續(xù)供應(yīng)氫能的方案,被視為最有前景的制氫方法之一。 隨著電極電解水制氫向半導(dǎo)體光解水制氫的發(fā)展,以及二氧化鈦以外的光催化劑的相繼發(fā)現(xiàn),光催化分解水制氫技術(shù)的研究受到了極大關(guān)注。然而當(dāng)前光解水制氫技術(shù)還面臨著一些技術(shù)難點(diǎn),如光催化劑的性能、光生載流子的復(fù)合、光電極對光的利用等因素都會影響其制氫效率,對其應(yīng)用造成一定阻礙。當(dāng)前降低光生電子-空穴的復(fù)合率、光催化材料的帶隙與可見光能量的匹配、光催化材料的能帶位置與反應(yīng)物電極電位的匹配已成為光催化分解水制氫技術(shù)的關(guān)鍵課題。若能成功解決技術(shù)難點(diǎn),該技術(shù)將逐漸滿足商業(yè)化的要求,成為我國能源安全和能源結(jié)構(gòu)調(diào)整的又一生力軍,為能源轉(zhuǎn)型和環(huán)境惡化問題提供有效的解決途徑。 b.Topic8為甲醇制氫技術(shù)。甲醇制氫主要包括甲醇裂解制氫、甲醇水蒸氣重整制氫、甲醇部分氧化制氫三種技術(shù)。其中甲醇水蒸氣重整與大規(guī)模的天然氣、輕油、水煤氣等制氫方法相比,具有流程短、能耗低、成本少、無污染等特點(diǎn),成為了解決質(zhì)子交換膜燃料電池氫源問題的有效途徑。隨著國內(nèi)甲醇生產(chǎn)規(guī)模的擴(kuò)大,甲醇重整制氫工藝發(fā)展迅速,目前已廣泛應(yīng)用于電子、冶金、食品及小型石化行業(yè)。甲醇裂解制氫是甲醇與水經(jīng)過催化裂解生成混合氣體,再通過變壓吸附并改變操作條件提純出高純度氫氣的過程。甲醇裂解制氫的自動化程度較高,成本低且產(chǎn)氫純度高,具有較高的市場應(yīng)用價(jià)值。甲醇部分氧化制氫則具有反應(yīng)條件溫和、反應(yīng)速度快、易操作等特點(diǎn)。將甲醇制氫與質(zhì)子交換膜燃料電池技術(shù)結(jié)合,可以省略分離與純化過程,實(shí)現(xiàn)氫能的“即制即用”。甲醇制氫技術(shù)的特點(diǎn)及多種應(yīng)用場景使其被許多專家學(xué)者認(rèn)為是我國氫能與燃料電池發(fā)展的一大突破口。 目前氫能發(fā)展雖勢頭正足,但其還面臨著安全隱患、儲運(yùn)價(jià)格、基礎(chǔ)設(shè)施投入等方面的瓶頸問題。針對氫能發(fā)展的這些“痛點(diǎn)”,澳大利亞國家工程院外籍院士、南方科技大學(xué)創(chuàng)新創(chuàng)業(yè)學(xué)院院長劉科認(rèn)為,甲醇是目前最好的制氫材料,甲醇制氫是有效解決氫能“痛點(diǎn)”的途徑。甲醇制氫技術(shù)獲得的超高關(guān)注來源于其具有的眾多優(yōu)勢:一是甲醇來源廣泛,可由煤炭、天然氣、氫與二氧化碳反應(yīng)等方式制取得到,實(shí)現(xiàn)了資源的循環(huán)利用,保障了制氫原料的供應(yīng);二是甲醇的液態(tài)形式使其在運(yùn)輸和儲存方面具有很大經(jīng)濟(jì)優(yōu)勢,在未來的市場推廣過程中無需另設(shè)加氫站,而可以依托現(xiàn)有加油站的簡單改造和升級,將其變?yōu)榧幼⑵裼秃图状妓芤旱穆?lián)合加注站;三是隨著二氧化碳合成甲醇技術(shù)的發(fā)展,甲醇制氫可以轉(zhuǎn)變?yōu)榧状純?,在一定程度上達(dá)到低碳減排的目的,符合當(dāng)前我國碳中和的發(fā)展趨勢。 c.Topic11為光催化劑性能及其制備。光催化劑性能及其制備主要是指對以二氧化鈦為主的光催化劑的性能及制備過程的研究。如使用金屬或非金屬摻雜、染料敏化以及半導(dǎo)體復(fù)合等方法來提高催化劑產(chǎn)氫效率的研究,通過X射線衍射、掃描電子顯微鏡等技術(shù)對催化材料的形貌、組成、性能進(jìn)行系統(tǒng)分析的研究等[28]。二氧化鈦由于具有節(jié)能環(huán)保、低廉高效且耐腐蝕等特點(diǎn),至今仍是最受關(guān)注的光催化劑,但光生電子和空穴易復(fù)合等因素使其光催化性能具有一定局限性,因此降低光生電子與空穴的復(fù)合率是光催化劑研究要克服的技術(shù)難關(guān)之一,也是該熱點(diǎn)主題的一個(gè)重要發(fā)展方向。 近年來,隨著研究的深入,光催化劑在合成、改性等方面取得了較大進(jìn)展,但制氫效率低仍是其主要問題。光催化劑的性能主要受其帶隙和其接受光的類型影響,其用于水分解的帶隙能量則決定了催化劑的靈敏度,同時(shí)要產(chǎn)生光催化反應(yīng)必須保持還原及氧化電位在催化劑的帶隙內(nèi),且發(fā)生光催化的帶隙能量須處于一定區(qū)間內(nèi),因此研發(fā)制備帶隙低、催化效率高的光催化劑是必要的。中國氫能聯(lián)盟戰(zhàn)略指導(dǎo)委員會委員、中國工程院院士衣寶廉在《碳中和背景下的可再生能源制氫技術(shù)及產(chǎn)業(yè)發(fā)展》專題講座中提到,隨著光催化劑相關(guān)問題的解決以及能量利用效率的提高,該技術(shù)將成為能源領(lǐng)域的顛覆性技術(shù),對氫能源發(fā)展產(chǎn)生巨大助力。 d.Topic16為光伏發(fā)電制氫技術(shù)。光伏發(fā)電制氫是由光伏發(fā)電系統(tǒng)直接供應(yīng)電解制氫的技術(shù)。光伏發(fā)電制氫可以有效消納光伏發(fā)電,平抑其不穩(wěn)定性,還可以解決光伏發(fā)電的日間或季度不平衡等問題,具有提升儲能效用的特殊優(yōu)勢。同時(shí),光伏制氫路線可以實(shí)現(xiàn)生產(chǎn)源頭上的無碳化制取綠氫,在工業(yè)生產(chǎn)中達(dá)到減碳脫碳的目的。除此之外,光伏發(fā)電由于其制氫規(guī)??呻S場地和需求進(jìn)行模塊化組合,且具有技術(shù)工藝簡單、經(jīng)濟(jì)性強(qiáng)等特點(diǎn),可有效解決燃料電池氫源問題,極大推動新能源應(yīng)用和分布式供能等新興產(chǎn)業(yè)的發(fā)展。 光伏制氫為光伏發(fā)電提供了更廣闊的應(yīng)用場景和市場需求,實(shí)現(xiàn)了光伏與氫能的有效結(jié)合與應(yīng)用。近年來,國家發(fā)改委和能源局出臺了多項(xiàng)支持光伏產(chǎn)業(yè)健康有序發(fā)展的政策,廣東、浙江、天津、河北、山東等多個(gè)省市也陸續(xù)出臺了氫能產(chǎn)業(yè)扶持政策,相關(guān)綠氫項(xiàng)目也陸續(xù)落地,如山西運(yùn)城的陽光能源光伏制氫項(xiàng)目、甘肅蘭州新區(qū)的液態(tài)太陽能燃料合成示范工程項(xiàng)目等。另外,受市場前景吸引,中國石化、隆基股份、寶豐能源等企業(yè)也積極布局光伏制氫市場。隨著光伏組件價(jià)格的下降,光伏發(fā)電成本還會持續(xù)降低,光伏發(fā)電的經(jīng)濟(jì)與市場價(jià)值將逐步顯現(xiàn),使其具有更強(qiáng)的競爭力,“光伏+氫”已經(jīng)成為了未來清潔能源的終極解決方案之一。 為驗(yàn)證本文所提方法的有效性與準(zhǔn)確性,采用共詞分析法對我國制氫領(lǐng)域的文本數(shù)據(jù)進(jìn)行分析,并與本文方法的識別結(jié)果進(jìn)行對比。利用CiteSpace軟件進(jìn)行共詞分析,通過關(guān)鍵詞的共現(xiàn)關(guān)系生成共現(xiàn)網(wǎng)絡(luò)圖譜并進(jìn)行聚類來反映研究熱點(diǎn)問題[29]。本文將我國制氫領(lǐng)域的文獻(xiàn)數(shù)據(jù)導(dǎo)入CiteSpace中進(jìn)行關(guān)鍵詞的共現(xiàn)聚類,在“Node Types”中選擇“Keyword”,并去除“產(chǎn)氫”“制氫”“氫氣”“氫能”4個(gè)與檢索詞相關(guān)的關(guān)鍵詞節(jié)點(diǎn)以免影響聚類結(jié)果,生成聚類標(biāo)簽時(shí)選擇“Keyword”,聚類算法選擇“LLR”。所得關(guān)鍵詞聚類圖譜如圖6所示。 圖6 關(guān)鍵詞聚類網(wǎng)絡(luò)圖譜 分析圖6可知,本文提出的熱點(diǎn)主題識別方法優(yōu)于共詞分析法,不但可以識別出基于共詞分析法所識別出的主題,對于一些相關(guān)性及代表性不足的主題也可以成功篩除。從圖6中可以看到,共詞聚類所得類團(tuán)“0光催化”與本文的熱點(diǎn)主題Topic5光催化分解水制氫技術(shù)相對應(yīng);類團(tuán)“1甲醇”“6甲醇水蒸氣重整制氫”“7甲醇部分氧化制氫”“9加氫裂化”與熱點(diǎn)主題Topic8甲醇制氫技術(shù)相對應(yīng);類團(tuán)“4催化”與熱點(diǎn)主題Topic11光催化劑性能及其制備相對應(yīng);熱點(diǎn)主題Topic16光伏發(fā)電制氫技術(shù)是解決燃料電池氫源問題的主要途徑,也是燃料電池發(fā)展的重要助力與突破口,與類團(tuán)“2燃料電池汽車”具有很強(qiáng)的交叉性。同時(shí),本文的熱點(diǎn)識別結(jié)果均是制氫領(lǐng)域的重要發(fā)展方向,與共詞聚類所得類團(tuán)相比,指向性更強(qiáng),識別結(jié)果更加清晰。此外,共詞分析法識別出的類團(tuán)“3析氫反應(yīng)”對制氫領(lǐng)域的代表性不足,類團(tuán)“5模擬”“8儲氫”與制氫領(lǐng)域的相關(guān)性很低,均是被本文方法成功篩掉的主題??傮w來說,本文提出的熱點(diǎn)主題識別方法不但在識別維度和分析粒度上優(yōu)于共詞分析法,其識別結(jié)果的指向性也更明確,熱點(diǎn)識別效果更為準(zhǔn)確和有效。 在當(dāng)前數(shù)字信息化的時(shí)代背景下,日益龐大的領(lǐng)域信息庫使得科研人員難以及時(shí)高效地跟蹤研究熱點(diǎn),同時(shí)已有的熱點(diǎn)識別方法未考慮到熱點(diǎn)主題的特征,熱點(diǎn)指向性不強(qiáng),且維度較單一、主觀性較強(qiáng)。因此本文首先分析了熱點(diǎn)主題的影響力及關(guān)注度特征,并對其進(jìn)行量化,從影響力和關(guān)注度兩個(gè)維度構(gòu)建了熱點(diǎn)主題識別指標(biāo)體系。通過實(shí)證研究,發(fā)現(xiàn)光催化分解水制氫技術(shù)、甲醇制氫技術(shù)、光催化劑性能及其制備、光伏發(fā)電制氫技術(shù)是我國制氫技術(shù)領(lǐng)域內(nèi)同時(shí)具有影響力和關(guān)注度的熱點(diǎn)主題,同時(shí)通過對比驗(yàn)證體現(xiàn)了該指標(biāo)體系的有效性。 本文構(gòu)建的指標(biāo)體系立足于熱點(diǎn)主題的特征,并根據(jù)其特征構(gòu)建了相應(yīng)指標(biāo)來進(jìn)行主題篩選,提高了熱點(diǎn)識別結(jié)果的準(zhǔn)確性,有助于科研學(xué)者跟蹤領(lǐng)域熱點(diǎn),幫助進(jìn)行科研決策,也為今后熱點(diǎn)主題的識別工作拓展了新的思路和方法。下一步可結(jié)合專利文獻(xiàn)和學(xué)位論文等,融合多源文獻(xiàn)的數(shù)據(jù)進(jìn)行指標(biāo)構(gòu)建,以提高全領(lǐng)域的熱點(diǎn)識別效果。1.2 關(guān)注度特征維度的識別指標(biāo)
2 實(shí)證研究
2.1 數(shù)據(jù)獲取
2.2 文本預(yù)處理
2.3 LDA主題抽取
2.4 熱點(diǎn)主題識別
3 制氫領(lǐng)域的熱點(diǎn)主題分析
3.1 熱點(diǎn)主題內(nèi)容分析
3.2 對比驗(yàn)證
4 結(jié) 語