◎文/鄒中華(安徽省科學(xué)技術(shù)情報(bào)研究所)
我國(guó)科技查新起源于20世紀(jì)80年代末期,至今已有近30年的歷史[1]??萍疾樾乱?guī)范了我國(guó)的科技活動(dòng),保證了科學(xué)資源的合理配置,成為我國(guó)科技管理體系中的重要環(huán)節(jié)[2]。安徽省科學(xué)技術(shù)情報(bào)研究所是安徽省唯一國(guó)家一級(jí)查新機(jī)構(gòu)。十幾年來(lái),科技查新項(xiàng)目不斷增加,這些查新項(xiàng)目從側(cè)面反映了安徽省創(chuàng)新主體的研發(fā)熱點(diǎn)。本文運(yùn)用共詞分析法與可視化技術(shù)對(duì)查新項(xiàng)目中的高頻詞分布、高頻詞間的內(nèi)在關(guān)聯(lián)進(jìn)行分析,從微觀上揭示安徽省科技創(chuàng)新主體的研發(fā)熱點(diǎn)以及研發(fā)熱點(diǎn)之間的關(guān)聯(lián)。
查新項(xiàng)目的名稱是查新項(xiàng)目?jī)?nèi)容的濃縮與體現(xiàn),因此本文通過(guò)對(duì)查新項(xiàng)目名稱的分析實(shí)現(xiàn)對(duì)查新項(xiàng)目?jī)?nèi)容的分析。針對(duì)安徽省2015—2017年間的科技查新項(xiàng)目,先采用Python編程環(huán)境下的Jieba軟件對(duì)項(xiàng)目的名稱進(jìn)行分詞,再?gòu)姆衷~的結(jié)果中提取所有名詞短語(yǔ)和對(duì)應(yīng)的詞頻,合并意思相似的名詞短語(yǔ),如“電池”和“蓄電池”統(tǒng)一合并為“電池”,“電機(jī)”和“馬達(dá)”統(tǒng)一合并為“電機(jī)”,然后按詞頻由高到低排序,選擇詞頻數(shù)大于50的名詞45個(gè)(見(jiàn)表1)。這些出現(xiàn)頻次較高的名詞及其組合,在一定程度上可以體現(xiàn)最近3年安徽省科技查新項(xiàng)目的研發(fā)熱點(diǎn)。
表1 2015—2017年安徽省科技查新項(xiàng)目的高頻名詞
20世紀(jì)70年代中后期,共詞分析法逐漸興起,其思想依據(jù)是文獻(xiàn)計(jì)量學(xué)中的引文耦合與共被引分析[3],利用文獻(xiàn)中的“名詞短語(yǔ)”或“共現(xiàn)詞匯對(duì)”出現(xiàn)的情況來(lái)判斷它們所代表的各主題間的關(guān)聯(lián)。針對(duì)表1中的45個(gè)高頻名詞短語(yǔ),兩兩統(tǒng)計(jì)其在同一個(gè)查新項(xiàng)目名稱中共現(xiàn)的次數(shù),形成45×45的共詞矩陣??紤]到關(guān)聯(lián)名詞短語(yǔ)間的關(guān)聯(lián)程度及共現(xiàn)頻次對(duì)可視化結(jié)果有一定影響,本文采用關(guān)聯(lián)強(qiáng)度Ochiia系數(shù)[4]來(lái)減少這一影響。Ochiia系數(shù)的計(jì)算公式如下:
表2 高頻名詞的45×45相關(guān)矩陣(部分)
采用上式將共詞矩陣轉(zhuǎn)換成Ochiia系數(shù)相關(guān)矩陣,如表2所示。
在相關(guān)矩陣的基礎(chǔ)上,利用SPSS軟件進(jìn)行聚類分析和多維尺度分析[5],得到可視化的查新高頻關(guān)鍵詞聚類分析樹(shù)形圖(見(jiàn)圖1)與多維尺度圖(見(jiàn)圖2)。
圖1 高頻名詞的聚類分析樹(shù)形圖
在圖1所示的聚類分析樹(shù)形圖中,上端0~25的標(biāo)度代表各類名詞之間的距離,越早被聚為一類的名詞之間的距離越近、關(guān)聯(lián)越緊密[6]。觀察高頻名詞的聚類過(guò)程,同時(shí)參考因子分析結(jié)果,科技查新項(xiàng)目的熱點(diǎn)可分為如下 9 類:(1) 鋼結(jié)構(gòu)、混凝土的施工工法(10、24、4、12);(2)工程線路、裝備的制造工藝和技術(shù)(1、5、31、35、21);(3)玻璃的生產(chǎn)裝置和方法(7、8、22);(4)電動(dòng)汽車的電機(jī)、空調(diào)電機(jī)(6、19、23、28,新能源電動(dòng)汽車是安徽省重點(diǎn)扶持的戰(zhàn)略新興產(chǎn)業(yè),而直流電機(jī)是電動(dòng)汽車的核心部件之一);(5)用于電池和叉車的高性能環(huán)保材料(13、14、15、20、42);(6)鋁合金電力電纜及變壓器(11、30、43、44);(7)信息系統(tǒng)、網(wǎng)絡(luò)平臺(tái)、智能數(shù)據(jù)處理(2、3、9、27、18、25、40);(8)機(jī)器人及其生產(chǎn)線(16、27、41);(9)冰箱制造涉及的壓縮機(jī)和模具(34、37、38、39)。
圖2 高頻名詞的多維尺度圖
圖2展現(xiàn)了科技查新項(xiàng)目高頻名詞在二維空間的分布,圖中有高度相似性的點(diǎn)聚集到一起形成一類,并且越居中的關(guān)鍵詞與其他關(guān)鍵詞的關(guān)聯(lián)越多,在該領(lǐng)域中的地位越核心[7]。由圖2可知,安徽省科技創(chuàng)新主體的研發(fā)熱點(diǎn)可概括分為9個(gè)部分,分別用橢圓標(biāo)出,9個(gè)部分的關(guān)聯(lián)如下:“電機(jī)、叉車、液壓、玻璃、變壓器”區(qū)域和“生產(chǎn)線、裝備、工藝、方法”區(qū)域距離很近,并且這兩個(gè)區(qū)域所占的空間較大,說(shuō)明安徽省的工業(yè)目前仍然以傳統(tǒng)產(chǎn)業(yè)為主;“電動(dòng)汽車”區(qū)域和“網(wǎng)絡(luò)平臺(tái)”區(qū)域關(guān)聯(lián)密切,并存在“軟件”區(qū)域交集。這表明電動(dòng)汽車作為新的高科技熱點(diǎn),在設(shè)計(jì)和生產(chǎn)過(guò)程中充分利用了網(wǎng)絡(luò)和軟件技術(shù);“電力信息系統(tǒng)”區(qū)域和“網(wǎng)絡(luò)平臺(tái)”區(qū)域關(guān)聯(lián)較為密切,說(shuō)明在電力系統(tǒng)中越來(lái)越多地引入了信息化生產(chǎn)和管理方式;“冰箱壓縮機(jī)”“混凝土工法”“鋼結(jié)構(gòu)”3個(gè)區(qū)域,在空間上和別的部分關(guān)聯(lián)不大,具有相對(duì)獨(dú)立性。
本文針對(duì)科技查新項(xiàng)目的熱點(diǎn)進(jìn)行可視化分析,統(tǒng)計(jì)出反映研發(fā)熱點(diǎn)的45個(gè)高頻熱點(diǎn)名詞,并結(jié)合共詞分析法與可視化技術(shù),進(jìn)行主題分析,較為直觀地展示了安徽省創(chuàng)新主體的研發(fā)熱點(diǎn),以及研發(fā)熱點(diǎn)之間的關(guān)聯(lián)。本研究尚有一定的不足之處,如高頻名詞的確定閾值、同義詞歸類標(biāo)準(zhǔn)等仍是有待討論的問(wèn)題。