吳雅琴,王曉東
(內(nèi)蒙古醫(yī)科大學(xué)計算機(jī)信息學(xué)院,內(nèi)蒙古 呼和浩特 010110)
《醫(yī)學(xué)信息學(xué)雜志》是國內(nèi)醫(yī)學(xué)信息方面的專業(yè)指導(dǎo)性刊物,也是醫(yī)學(xué)信息領(lǐng)域具有權(quán)威性與專業(yè)指導(dǎo)性的學(xué)術(shù)刊物。近年來未有研究者基于關(guān)鍵詞探討《醫(yī)學(xué)信息學(xué)雜志》發(fā)表論文的研究熱點。關(guān)鍵詞是對文獻(xiàn)研究內(nèi)容的高度凝練,通過高頻關(guān)鍵詞共現(xiàn)分析計算研究熱點的分析指標(biāo)[1]。本文對2010-2019 年《醫(yī)學(xué)信息學(xué)雜志》刊載論文進(jìn)行高頻關(guān)鍵詞聚類分析,通過定量研究,了解醫(yī)學(xué)信息研究領(lǐng)域的熱點內(nèi)容和核心命題。
1.1 數(shù)據(jù)來源 以中國知網(wǎng)(CNKI)期刊數(shù)據(jù)庫為數(shù)據(jù)源,檢索策略設(shè)定為:文獻(xiàn)來源=“醫(yī)學(xué)信息學(xué)雜志”,發(fā)表時間為2010 年1 月1 日-2019 年12 月31 日,檢索時間為2020 年10 月16 日,共獲得文獻(xiàn)3256 篇。
1.2 方法 將所獲得文獻(xiàn)導(dǎo)入NoteExpress,剔除文獻(xiàn)中通訊消息、會議通知、新聞報道,無作者或作者為本刊編輯部等非學(xué)術(shù)論文及重復(fù)文獻(xiàn)。對有效文獻(xiàn)中的同義或近義關(guān)鍵詞進(jìn)行合并,將“互聯(lián)網(wǎng)+醫(yī)療”并入“互聯(lián)網(wǎng)+”醫(yī)療,“軍衛(wèi)1 號”工程并入“軍衛(wèi)1 號”,將“醫(yī)院圖書館”“高校圖書館”“醫(yī)學(xué)圖書館”“醫(yī)學(xué)院校圖書館”并入“圖書館”等。將清洗后的文獻(xiàn)數(shù)據(jù)源調(diào)整成統(tǒng)一的SATI 格式進(jìn)行研究[2],統(tǒng)計關(guān)鍵詞數(shù)量及頻次,根據(jù)Donohue 于1973 年提出的高頻詞低頻詞分界公式:
計算醫(yī)學(xué)信息學(xué)期刊高頻詞閾值,構(gòu)建共詞矩陣,將結(jié)果導(dǎo)入SPSS 23.0 進(jìn)行關(guān)鍵詞聚類,對《醫(yī)學(xué)信息學(xué)雜志》刊載文獻(xiàn)研究熱點進(jìn)行分析。
2.1 基本情況 最終得到有效文獻(xiàn)2599 篇,作者7850 名,每篇文獻(xiàn)平均3.02 名作者,總機(jī)構(gòu)數(shù)3240個,每篇文獻(xiàn)平均1.32 個機(jī)構(gòu),總關(guān)鍵詞數(shù)9263個,每篇文獻(xiàn)平均3.56 個關(guān)鍵詞。
2.2 高頻關(guān)鍵詞 根據(jù)Donohue 高頻詞低頻詞分界公式,高頻關(guān)鍵詞閾值T 為95.23,期刊文獻(xiàn)研究領(lǐng)域僅有3 個高頻詞,不能完全代表研究熱點。根據(jù)經(jīng)驗法則,為更好的研究描述領(lǐng)域內(nèi)的研究熱點,本研究選取20 作為高頻詞閾值對文獻(xiàn)研究熱點進(jìn)行統(tǒng)計分析,共得到32 個關(guān)鍵詞,占總關(guān)鍵詞的0.70%,總頻次1561,見表1?!夺t(yī)學(xué)信息學(xué)雜志》刊載文獻(xiàn)的高頻關(guān)鍵詞頻次時間序列見圖1,結(jié)果顯示,隨著計算機(jī)科學(xué)和信息技術(shù)的快速發(fā)展及其在醫(yī)療健康領(lǐng)域的廣泛應(yīng)用,更多的研究開始關(guān)注新技術(shù)在健康醫(yī)療領(lǐng)域的應(yīng)用實踐。
圖1 高頻關(guān)鍵詞頻次時間序列
表1 2010-2019《醫(yī)學(xué)信息學(xué)雜志》刊載文獻(xiàn)的高頻關(guān)鍵詞(n,%)
2.3 高頻關(guān)鍵詞共現(xiàn)矩陣 將所獲得的高頻關(guān)鍵詞作為詞共現(xiàn)分析基本單元,使用SATI 軟件生成高頻關(guān)鍵詞頻次矩陣,部分結(jié)果見表2。
表2 2010-2019《醫(yī)學(xué)信息學(xué)雜志》刊載文獻(xiàn)高頻關(guān)鍵詞頻次矩陣(部分)
2.4 高頻關(guān)鍵詞因子分析 因子分析結(jié)果顯示,特征值大于1 的有11 個因子,可以解釋高頻關(guān)鍵詞92.0890%的信息,將特征根與累積貢獻(xiàn)率結(jié)合進(jìn)行判斷,11 個因子基本可以說明近10 年《醫(yī)學(xué)信息學(xué)雜志》的研究熱點與領(lǐng)域,見圖2。
圖2 碎石圖
2.5 高頻關(guān)鍵詞聚類分析 將高頻關(guān)鍵詞導(dǎo)入SPSS 23.0 進(jìn)行多維尺度分析,“根據(jù)數(shù)據(jù)創(chuàng)建距離”為“歐氏距離”時,Stress=0.06540,RSQ=0.99497,擬合效果比較理想,可反映《醫(yī)學(xué)信息學(xué)雜志》近10 年文獻(xiàn)高頻關(guān)鍵詞間的聯(lián)系。將高頻關(guān)鍵詞在SPSS 23.0 中進(jìn)行層次聚類分析,聚類譜系圖見圖3。
圖3 聚類譜系圖
因子分析是將具有錯綜復(fù)雜關(guān)系的變量(或案例)綜合為少數(shù)幾個因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系,探討多個能直接測量且具有一定相關(guān)性的實測指標(biāo)是如何受少數(shù)幾個內(nèi)在的獨立因子支配的,并在條件許可時借此嘗試對變量進(jìn)行分類[3]。結(jié)合因子分析,從聚類譜系圖確定聚為5 類較為合適,這些類別基本反映了《醫(yī)學(xué)信息學(xué)雜志》2010-2019 年間的熱點領(lǐng)域,現(xiàn)分析如下。
3.1 文獻(xiàn)計量知識圖譜 科學(xué)知識圖譜的繪制和分析,是從以往發(fā)表的大量科學(xué)研究文獻(xiàn)中,提取并重新組織可視化知識,進(jìn)行知識發(fā)現(xiàn)[4]。科學(xué)知識圖譜涉及的相關(guān)理論及實踐是2010-2019 年醫(yī)學(xué)信息學(xué)領(lǐng)域的研究熱點。各位學(xué)者通過文獻(xiàn)計量法,利用知識圖譜工具展現(xiàn)醫(yī)學(xué)信息學(xué)不同實踐應(yīng)用領(lǐng)域的演進(jìn)路徑、研究熱點、前沿領(lǐng)域、發(fā)展趨勢等,梳理出醫(yī)學(xué)信息技術(shù)在醫(yī)學(xué)科技創(chuàng)新、臨床診療與護(hù)理、疾病預(yù)防控制、藥物研發(fā)、醫(yī)療保險、醫(yī)學(xué)教育等方面的具體應(yīng)用情況。
3.2 圖書館知識服務(wù) 知識管理與知識服務(wù)是我國知識研究領(lǐng)域?qū)W者近年來關(guān)注的熱點,其主要研究內(nèi)容涉及醫(yī)學(xué)圖書館信息服務(wù),知識服務(wù)的精細(xì)化管理,醫(yī)學(xué)圖書館服務(wù)水平提升,醫(yī)學(xué)圖書館信息資源利用和開發(fā),醫(yī)學(xué)信息服務(wù)模式的轉(zhuǎn)變,學(xué)科館員人才隊伍建設(shè),以及新技術(shù)在醫(yī)學(xué)圖書館建設(shè)中應(yīng)用等內(nèi)容。
3.3 信息技術(shù)在健康醫(yī)療領(lǐng)域的深入應(yīng)用 在推動大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等新一代信息技術(shù)融合發(fā)展的過程中,隨著新一代信息技術(shù)在醫(yī)療場景應(yīng)用的不斷深入,相關(guān)的實踐應(yīng)用研究近些年成為越來越多的學(xué)者所關(guān)注的熱點。研究內(nèi)容涵蓋健康醫(yī)療的各個應(yīng)用場景,包括健康大數(shù)據(jù)平臺研發(fā)與應(yīng)用,基于大數(shù)據(jù)的醫(yī)療文本挖掘,遠(yuǎn)程醫(yī)療服務(wù)模式研究,遠(yuǎn)程醫(yī)療會診平臺應(yīng)用研究,基于物聯(lián)網(wǎng)技術(shù)的健康醫(yī)療系統(tǒng)開發(fā)與應(yīng)用,基于大數(shù)據(jù)的移動醫(yī)療、移動護(hù)理實踐應(yīng)用,電子病歷自然語言處理,基于電子病歷的臨床數(shù)據(jù)中心建設(shè),基于移動技術(shù)的新一代醫(yī)院信息系統(tǒng)的設(shè)計與開發(fā),醫(yī)療數(shù)據(jù)挖掘等。大量學(xué)者從各自的醫(yī)療實踐出發(fā),展示了近十年來信息技術(shù)在醫(yī)療領(lǐng)域的實踐應(yīng)用成果。
3.4 信息素養(yǎng)培養(yǎng)研究 信息素養(yǎng)由美國信息產(chǎn)業(yè)協(xié)會主席保羅于1974 年提出的,將其定義為“利用大量的信息工具及主要信息源使問題得到解答的技術(shù)和技能”[5]。學(xué)者主要研究內(nèi)容包括信息素養(yǎng)內(nèi)涵,信息素養(yǎng)評價模型,信息素養(yǎng)培養(yǎng)途徑,醫(yī)學(xué)院校學(xué)生信息素養(yǎng)現(xiàn)狀調(diào)查,醫(yī)務(wù)人員、醫(yī)學(xué)生信息素養(yǎng)培養(yǎng),信息素養(yǎng)培養(yǎng)與學(xué)科課程整合研究等。
3.5 文獻(xiàn)檢索與科技查新 科技查新是文獻(xiàn)檢索和情報調(diào)研相結(jié)合的研究工作,主要研究科技查新服務(wù)、方法,文獻(xiàn)檢索課程現(xiàn)狀、改革等。
綜上所述,本研究對刊載文獻(xiàn)關(guān)鍵詞進(jìn)行了一定的規(guī)范化處理,通過對關(guān)鍵詞的共現(xiàn)分析、因子分析和聚類分析,發(fā)現(xiàn)《醫(yī)學(xué)信息學(xué)雜志》近十年刊載文獻(xiàn)的熱點研究領(lǐng)域主要包括文獻(xiàn)計量知識圖譜,圖書館知識服務(wù),信息技術(shù)在健康醫(yī)療領(lǐng)域的深入應(yīng)用,信息素養(yǎng)培養(yǎng)研究及文獻(xiàn)檢索與科技查新等方面。