張曉培
摘 要:文章以CNKI為樣本來(lái)源,運(yùn)用SATI文獻(xiàn)題錄信息統(tǒng)計(jì)分析軟件對(duì)政府信息公開(kāi)與檔案相關(guān)研究文獻(xiàn)分別進(jìn)行高頻關(guān)鍵詞提取和詞頻分析,建立高頻關(guān)鍵詞共詞矩陣;再運(yùn)用UCINET社會(huì)網(wǎng)絡(luò)分析工具繪制高頻關(guān)鍵詞的共詞網(wǎng)絡(luò)圖。而后依據(jù)采集的詞頻分析和建立的高頻詞可視化共詞網(wǎng)絡(luò)圖得到的分析數(shù)據(jù),得出檔案信息、檔案開(kāi)放、現(xiàn)行文件、國(guó)家檔案館、信息查詢、檔案工作、檔案利用是當(dāng)前政府信息公開(kāi)與檔案相關(guān)研究領(lǐng)域研究的重點(diǎn)與熱點(diǎn),而檔案館、檔案、開(kāi)放、知情權(quán)、公開(kāi)、檔案法則可能成為日后研究的方向與趨勢(shì)。
關(guān)鍵詞:檔案;政府信息公開(kāi);網(wǎng)絡(luò);關(guān)鍵詞;詞頻分析
為了解與掌握政府信息公開(kāi)與檔案相關(guān)研究的主要內(nèi)容及趨勢(shì),以中國(guó)知網(wǎng)為樣本來(lái)源,采用高頻關(guān)鍵詞頻分析,建立共詞矩陣,繪制共詞知識(shí)圖譜的方法,對(duì)2003年以來(lái)政府信息公開(kāi)與檔案相關(guān)研究文獻(xiàn)進(jìn)行分析。
1 樣本來(lái)源與分析流程
研究以中國(guó)知網(wǎng)為樣本來(lái)源,以主題為檢索項(xiàng),以條件:主題=政府信息公開(kāi) and 主題=檔案 (精確匹配) 檢索到的657篇文獻(xiàn)為樣本。檢索時(shí)間為2017年3月12日。
樣本的數(shù)據(jù)分析流程,首先從知網(wǎng)數(shù)據(jù)庫(kù)中獲取題錄數(shù)據(jù),使用Excel進(jìn)行整理,而后使用SATI文獻(xiàn)題錄信息統(tǒng)計(jì)分析軟件進(jìn)行詞頻分析和構(gòu)建共詞矩陣[ ],最后使用Ucinet網(wǎng)絡(luò)分析集成軟件和Netdraw可視化軟件構(gòu)建與研究主題相關(guān)的共詞知識(shí)圖譜。
2 詞頻分析
分別將從知網(wǎng)數(shù)據(jù)庫(kù)中獲取的題錄數(shù)據(jù),經(jīng)Excel整理后導(dǎo)入SATI文獻(xiàn)題錄信息統(tǒng)計(jì)分析軟件,去重后,共得到1643個(gè)關(guān)鍵詞。以5次作為高頻詞閾值,得到125個(gè)高頻關(guān)鍵詞(見(jiàn)表-1)。
根據(jù)使用頻次越高說(shuō)明相關(guān)研究越多,表-1所列125個(gè)詞顯示了2003年以來(lái)政府信息公開(kāi)與檔案相關(guān)研究熱點(diǎn)。其中使用頻次在10次以上的45個(gè)詞,是政府信息公開(kāi)與檔案相關(guān)研究的主要熱點(diǎn)方向。
3 建立共詞矩陣
在提取高頻關(guān)鍵詞之后,將使用頻次10次以上的45個(gè)關(guān)鍵詞形成45×45的共詞矩陣。如果某兩個(gè)關(guān)鍵詞同時(shí)出現(xiàn)在一篇文章中時(shí),就表明這兩者之間存在相關(guān)關(guān)系。關(guān)鍵詞右側(cè)或下方對(duì)應(yīng)位置的數(shù)值表示篇數(shù),共詞矩陣中對(duì)角線上的數(shù)值為該關(guān)鍵詞的詞頻。政府信息公開(kāi)與檔案相關(guān)研究文獻(xiàn)高頻詞共詞矩陣見(jiàn)表-2(前20×20)。
表-2數(shù)據(jù)表明,20×20矩陣共現(xiàn)次數(shù)在10次以上的關(guān)鍵詞組合分別為:政府信息公開(kāi)與檔案開(kāi)放(33),政府信息公開(kāi)與檔案利用(14),政府信息公開(kāi)與檔案館(14),檔案開(kāi)放與現(xiàn)行文件(25),檔案開(kāi)放與國(guó)家檔案館(15),檔案開(kāi)放與檔案信息(10),檔案開(kāi)放與國(guó)家檔案局(10),現(xiàn)行文件與檔案利用(17),現(xiàn)行文件與國(guó)家檔案館(17),現(xiàn)行文件與檔案工作(12),現(xiàn)行文件與信息查閱(22),現(xiàn)行文件與公開(kāi)信息(17),檔案利用與國(guó)家檔案館(10),檔案利用與館藏檔案(11),國(guó)家檔案館與檔案信息(10),國(guó)家檔案館與信息查閱(22),信息公開(kāi)與政府信息(12),政府信息與檔案(11),公開(kāi)信息與信息查閱(13)共19組。
4 共詞網(wǎng)絡(luò)圖
將構(gòu)建的2003年以來(lái)政府信息公開(kāi)與檔案相關(guān)研究高頻詞共詞矩陣導(dǎo)入U(xiǎn)cinet社會(huì)網(wǎng)絡(luò)分析軟件,再利用Netdraw可視化軟件生成政府信息公開(kāi)與檔案相關(guān)研究文獻(xiàn)的高頻關(guān)鍵詞的共詞知識(shí)圖譜,分別如圖-1所示。
從2003年以來(lái)政府信息公開(kāi)與檔案相關(guān)研究高頻關(guān)鍵詞的知識(shí)圖譜(圖-1)可以直觀地看出:檔案信息、檔案開(kāi)放、現(xiàn)行文件、國(guó)家檔案館、信息查詢、檔案工作、檔案利用等關(guān)鍵詞不僅圖標(biāo)最大,處于知識(shí)圖譜的中心,相互之間聯(lián)系密切,且與其他關(guān)鍵詞也關(guān)系緊密。表明2003年以來(lái)政府信息公開(kāi)與檔案相關(guān)研究者進(jìn)行研究時(shí)更關(guān)注上述位于中心的詞,是政府信息公開(kāi)與檔案相關(guān)研究的重點(diǎn)與熱點(diǎn)。因此,這些位于中心位置的詞,就是2003年以來(lái)政府信息公開(kāi)與檔案相關(guān)研究領(lǐng)域的研究重點(diǎn)與熱點(diǎn)。而檔案館、檔案、開(kāi)放、知情權(quán)、公開(kāi)、檔案法等關(guān)鍵詞則處于知識(shí)圖譜的邊緣,這些關(guān)鍵詞之間的聯(lián)系也相對(duì)稀疏,表明這些內(nèi)容在研究中處于相對(duì)邊緣的位置,關(guān)注度相對(duì)較低,不是研究的重點(diǎn)與熱點(diǎn)。
參考文獻(xiàn):
[1]劉啟元,葉鷹.文獻(xiàn)題錄信息挖掘技術(shù)方法及其軟件SATI的實(shí)現(xiàn)——以中外圖書(shū)情報(bào)學(xué)為例[J].信息資源管理學(xué)報(bào),2012(01):50~58.
[2]張豪鋒,李海龍.我國(guó)教育技術(shù)學(xué)研究前沿探討——基于核心期刊關(guān)鍵詞的共詞網(wǎng)絡(luò)與聚類(lèi)分析[J]. 電化教育研究,2011(10):26~29+39.
(作者單位:鄭州大學(xué)檔案館 來(lái)稿日期:2017-06-16)endprint