毛 星,董 里,李艷娜,劉 征
(公安部天津消防研究所《消防科學(xué)與技術(shù)》編輯部 天津300381)
大數(shù)據(jù)時代學(xué)術(shù)傳播主要是通過網(wǎng)絡(luò)平臺,以學(xué)術(shù)成果信息為內(nèi)核挖掘其背景信息及其相關(guān)信息,打破傳統(tǒng)學(xué)術(shù)期刊與數(shù)據(jù)庫的數(shù)據(jù)孤島局面,增強數(shù)字信息使用分析與二次開發(fā)能力,利用數(shù)據(jù)挖掘技術(shù)充分釋放文獻與數(shù)據(jù)的功能,把有意義的每一條數(shù)據(jù)及其數(shù)據(jù)關(guān)系都轉(zhuǎn)換成一個知識群或信息鏈,增強優(yōu)質(zhì)內(nèi)容的增殖與衍生能力,創(chuàng)造更高的附加值[1]。
通過對本研究領(lǐng)域大數(shù)據(jù)相關(guān)研究信息的把握,甚至介入信息數(shù)據(jù)的大數(shù)據(jù)研究中,掌握第一手資料,及時進行選題策劃,可占領(lǐng)學(xué)術(shù)研究的制高點[2]。
基于數(shù)據(jù)挖掘技術(shù),應(yīng)用 CiteSpace軟件,對CNKI中近年所發(fā)表的消防工程類論文的關(guān)鍵詞進行統(tǒng)計,分析近幾年我國在消防方面的研究熱點。利用國家科技報告服務(wù)系統(tǒng),搜索相關(guān)項目申報情況,挖掘研究重點。結(jié)合實際的工作經(jīng)驗,提取合適的研究方向作為專欄報道方向。
CiteSpace是一個引文可視化分析軟件,通過可視化的手段呈現(xiàn)科學(xué)知識的結(jié)構(gòu)、規(guī)律和分布情況。當(dāng)前文獻圖譜軟件有 10余種之多,各個軟件都有其不同的優(yōu)勢。如 VOSviewer在主題聚類方面清晰詳細(xì);SCI2在主題詞分析時更加靈活;HistCite則對所下載數(shù)據(jù)集的文獻互引按照時間以網(wǎng)路形式呈現(xiàn)(目前作者認(rèn)為將很快被 CitNetExplorer tool代替);BibExcel則以數(shù)據(jù)集原始數(shù)據(jù)的Tag為依據(jù),提供了多種多樣的文獻分析功能(需要外部的軟件協(xié)助完成可視化,如 Gephi、VOSviewer、Pajek 等);CiteSpace以其強大的文獻共被引分析而知名(恐怖主義研究和生物大滅絕),且隨著不斷的發(fā)展算法和功能而實現(xiàn)優(yōu)化。
從 CNKI中導(dǎo)出《消防科學(xué)與技術(shù)》(核心期刊,CA、Pж(AJ)收錄)2012—2016年共 5年的發(fā)表論文信息。2012—2016年,《消防科學(xué)與技術(shù)》共發(fā)表論文2,216篇,其中2012年422篇,2013年427篇,2014年452篇,2015年485篇,2016年430篇。
《火災(zāi)科學(xué)》(核心期刊,CA、CSCD 收錄)2012—2016年共發(fā)表172篇論文。
《燃燒科學(xué)與技術(shù)》(核心期刊,CA、JST、CSCD收錄)2012—2016年共發(fā)表454篇論文。
共2,842條信息。
將數(shù)據(jù)導(dǎo)入到 CiteSpace中,經(jīng)過數(shù)據(jù)轉(zhuǎn)換后,用半徑大小不同、顏色各異的年輪形節(jié)點來表示關(guān)鍵詞的共現(xiàn)頻次,節(jié)點顏色代表該關(guān)鍵詞產(chǎn)生共現(xiàn)的年份,節(jié)點半徑大小及連線粗細(xì)程度代表關(guān)鍵詞共現(xiàn)的頻次,節(jié)點半徑越大、節(jié)點間連接線越粗,則該關(guān)鍵詞的共現(xiàn)頻次越高[3],得到結(jié)果如圖1所示。
圖1 關(guān)鍵詞共現(xiàn)分析Fig.1 Cooccurrence analysis of keywords
從圖1中可以看出,半徑較大的節(jié)點對應(yīng)的關(guān)鍵詞有數(shù)值模擬、消防設(shè)計、安全疏散、火災(zāi)調(diào)查、燃燒特性、滅火救援等。表 1為出現(xiàn)頻次排名前 20的關(guān)鍵詞。
表1 關(guān)鍵詞按出現(xiàn)頻次排序Tab.1 Sequencing of keywords in order of frequency of occurrence
關(guān)鍵詞共現(xiàn)圖譜中節(jié)點最外層的深色圓圈顯示關(guān)鍵詞共現(xiàn)的中心性,中心性可以反映某節(jié)點與其他節(jié)點之間的聯(lián)系以及在整個圖譜中的作用和地位。通過對關(guān)鍵詞共現(xiàn)中心性進行分析,可以得到具有重要作用的熱點關(guān)鍵詞,進而得到近些年的研究熱點。表2為按照中心性排序,排名前20的關(guān)鍵詞。
表2 關(guān)鍵詞按中心性排序Tab.2 Sequencing of keywords in order of centrality
對照表1和表2可知,出現(xiàn)頻次和中心性都高的關(guān)鍵詞有:數(shù)值模擬、安全疏散、火災(zāi)調(diào)查、消防設(shè)計、防火分區(qū)、消防安全、建筑防火、熱釋放速率、細(xì)水霧、溫度場、防火分隔、錐形量熱儀。
通過聚類分析,可以考察關(guān)鍵詞之間的相關(guān)性,把聯(lián)系比較密切的關(guān)鍵詞分為一組,從而更加清晰地描述該研究領(lǐng)域的各個熱點研究方向。在共現(xiàn)分析的基礎(chǔ)上進一步進行聚類分析,得到結(jié)果如圖2所示。
圖2 關(guān)鍵詞聚類分析Fig.2 Clustering analysis of keywords
圖 2中,Modularity表示網(wǎng)絡(luò)的模塊度,值越大表示網(wǎng)絡(luò)的聚類結(jié)果越好,這里 Modularity值為0.713,9。Silhouette值(剪影值)是用來衡量網(wǎng)絡(luò)同質(zhì)性的指標(biāo),越接近 1,反映網(wǎng)絡(luò)的同質(zhì)性越高,這里Silhouette的平均值為0.398[4]。表3為聚類分析中包含10個節(jié)點以上的聚類的具體信息。
表3 聚類分析結(jié)果Tab.3 Result of clustering analysis
由表 3,可知幾個較大的聚類分別為煙氣流動、消防設(shè)計、燃燒性能、火災(zāi)風(fēng)險評價、火災(zāi)調(diào)查、滅火劑、工業(yè)火災(zāi)。
結(jié)合表 3和出現(xiàn)頻次及中心性都較高的關(guān)鍵詞分析結(jié)果可知,煙氣運動、消防設(shè)計、燃燒性能、火災(zāi)調(diào)查等幾類是研究的重點。
在 CiteSpace中,采用一種“突發(fā)詞檢測”算法來確定研究前沿中的概念,基本原理就是統(tǒng)計相關(guān)領(lǐng)域論文的標(biāo)題和摘要中詞匯頻率,根據(jù)這些詞匯的增長率來確定哪些是研究前沿的熱點詞匯。根據(jù)這些術(shù)語在同一篇文章中共同出現(xiàn)的情況進行聚類分析后,可以得到“研究前沿術(shù)語的共現(xiàn)網(wǎng)絡(luò)”。因此,研究前沿系指臨時形成的某個研究課題及其基礎(chǔ)研究問題的概念組合,也是正在興起或突然涌現(xiàn)的理論趨勢和新主題,代表一個研究領(lǐng)域的思想現(xiàn)狀。表 4為突發(fā)詞檢測結(jié)果。
將聚類分析結(jié)果、突發(fā)詞檢測結(jié)果與出現(xiàn)頻次和中心性都高的關(guān)鍵詞結(jié)果結(jié)合,綜合考慮后初步選擇如下熱點:消防設(shè)計、火災(zāi)調(diào)查、數(shù)值模擬。
表4 突發(fā)詞檢測Tab.4 Testing of sudden words
表5 熱點相關(guān)項目Tab.5 Hotspot-related projects
為了確定專刊報道方向,利用國家科技報告服務(wù)系統(tǒng)挖掘消防設(shè)計、火災(zāi)調(diào)查、數(shù)值模擬方向的研究熱點。國家科技報告服務(wù)系統(tǒng)是國內(nèi)目前比較完整記載政府科技基金項目的特種文獻系統(tǒng),將國家支持的科研活動產(chǎn)生的資料等向公眾免費開放共享,擁有國家和地方科研計劃及科研投入方向的龐大數(shù)據(jù),可在線瀏覽所有公開的科技報告全文[5]。表5為在系統(tǒng)中檢索到的與前文選定的熱點相關(guān)的項目。
由表 4可知,4個熱點研究方向中,在研和已完成項目最多的是數(shù)值模擬方面的項目。進一步仔細(xì)研究各項目的研究內(nèi)容和所用的研究方法,可以看出,數(shù)值模擬作為研究方法,可用于消防設(shè)計、煙氣運動、安全疏散、燃燒特性等方面的研究。結(jié)合前文關(guān)鍵詞出現(xiàn)頻次、中心性、突發(fā)性的統(tǒng)計結(jié)果,可知數(shù)值模擬軟件如 FDS、BuildingEXODUS、Pathfinder,包括GIS等都得到了廣泛的應(yīng)用,是當(dāng)前研究人員較為關(guān)注的研究方向。因此,初步擬定“數(shù)值模擬”為專欄主題,下設(shè)消防設(shè)計、煙氣運動、安全疏散、燃燒特性等報道方向。
專欄是期刊特色和風(fēng)格的重要體現(xiàn),是期刊的亮點,而大數(shù)據(jù)的迅猛發(fā)展和應(yīng)用為專欄策劃、實施、宣傳提供了廣泛、快捷、便利的渠道。利用數(shù)據(jù)挖掘獲取有用信息,了解期刊學(xué)科熱點及發(fā)展趨勢,確定專題策劃方向,準(zhǔn)確定位高水平作者,實現(xiàn)??珳?zhǔn)宣傳推送等,將成為科技期刊專題策劃的重要發(fā)展方向之一。
筆者通過分析消防工程類期刊近 5年刊登文章的關(guān)鍵詞和相關(guān)項目申報情況,獲取了近年來消防領(lǐng)域報道的重點、熱點內(nèi)容,在此基礎(chǔ)上提出了專欄策劃主題和報道方向。接下來還需針對策劃主題進一步調(diào)研各高校、研究院所的研究人員,為約稿和聯(lián)系審稿人提供支持。
[1]夏登武. 大數(shù)據(jù)時代學(xué)術(shù)期刊的內(nèi)容優(yōu)化與價值重構(gòu)[J]. 中國科技期刊研究,2016,27(3):264.
[2]丁濱,陳曉紅. 芻議期刊文獻的專題大數(shù)據(jù)挖掘價值[J]. 編輯學(xué)報,2016,28(5):488-491.
[3]王春雪,呂淑然. 我國燃?xì)獗ㄑ芯楷F(xiàn)狀及熱點前沿可視化分析[J]. 消防科學(xué)與技術(shù),2016,35(11):1620-1623.
[4]李杰. CiteSpace中文版指南[EB/OL]. (2015-10-27)[2017-06-08]. http://cluster.ischool.drexel.edu/~cchen/citespace/ manual/CiteSpaceChinese.pdf.
[5]白婭娜,武英剛,宮在芹,等. 數(shù)據(jù)挖掘在??M稿策劃中的應(yīng)用[J]. 編輯學(xué)報,2016,28(6):550-553.