李小濤 金心怡 李 艷 張士靖* 關(guān)子易
(1.南京航空航天大學科技信息研究所,江蘇 南京 211106;2.南京航空航天大學工業(yè)和信息化智庫評價中心,江蘇 南京 211106;3.華中科技大學同濟醫(yī)學院醫(yī)藥衛(wèi)生管理學院,湖北 武漢 430030;4.山西醫(yī)科大學公共衛(wèi)生學院,山西 太原 030001)
醫(yī)學信息學是醫(yī)學與圖書情報學科的交叉與融合,其學科結(jié)構(gòu)與研究進展近來受到學術(shù)界的密切關(guān)注。楊穎等[1]以PubMed為數(shù)據(jù)來源,通過共詞聚類分析探索了1999-2008年醫(yī)學信息學學科結(jié)構(gòu)的演變過程。袁曉園等[2]檢索了我國學者被Web of Science收錄的醫(yī)學信息學論文,并通過高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡分析了我國學者在該領(lǐng)域的五大熱點研究主題。曹霞等[3]以Web of Sciences收錄的7種醫(yī)學信息學核心期刊為數(shù)據(jù)來源,分析了該領(lǐng)域合著網(wǎng)絡的整體結(jié)構(gòu)特性。張志強等[4]分析了生物醫(yī)學信息學面臨的機遇與挑戰(zhàn),并給出了發(fā)展建議。前人的研究為探索醫(yī)學信息學的熱點與前沿奠定了基礎,但目前尚未有學者基于該學科的ESI高被引論文進行研究前沿的可視化分析。
ESI(Essential Science Indicators)即基本科學指標數(shù)據(jù)庫,是基于SCI和SSCI的衡量科學研究績效、跟蹤科學發(fā)展趨勢的重要分析評價工具。作為評價一流學科的重要指標之一,ESI高被引論文是各學科被引頻次前1%的論文,其數(shù)量特征可以從宏觀上反映學科發(fā)展水平,評估機構(gòu)的學科競爭力;其內(nèi)容特征可以體現(xiàn)學科的研究熱點與前沿,指引學科發(fā)展方向[5]。
本研究構(gòu)建了基于ESI高被引論文的研究前沿模型,對醫(yī)學信息學2013-2017年的ESI高被引論文及其施引文獻繪制科學知識圖譜,精準揭示了該學科的前沿研究領(lǐng)域,為國內(nèi)研究機構(gòu)整體把握醫(yī)學信息學學科結(jié)構(gòu)、跟蹤學科發(fā)展動態(tài)提供參考與借鑒。
研究前沿的識別與探測是圖書情報領(lǐng)域關(guān)注的焦點之一,國內(nèi)外學者對研究前沿的界定大致有3類:第一類將一組高被引文獻定義為研究前沿[6];第二類將一組施引文獻定義為研究前沿[7];第三類將一組突現(xiàn)的動態(tài)概念和潛在的研究問題定義為研究前沿[8]。陳超美教授是支持第三類觀點的代表性學者之一,他提出的Citespace概念模型將一個研究領(lǐng)域概念化成從研究前沿Ψ(t)到知識基礎Ω(t)的時間映射Φ(t),即Φ(t):Ψ(t)→Ω(t)[9]。本研究沿用陳超美教授對研究前沿的界定,并以該概念模型為基礎對研究前沿進行識別與探測。
ESI高被引論文是在其發(fā)表年份和所屬學科領(lǐng)域被引次數(shù)位于前1%的論文,ESI數(shù)據(jù)庫通過對近5年的ESI高被引論文進行共被引分析和聚類分析識別各學科領(lǐng)域研究前沿[10]。ESI高被引論文在揭示研究前沿中的重要作用已得到廣泛認可,Citespace的概念模型也已廣泛應用于科學知識圖譜分析中,將ESI高被引論文與Citespace的概念模型相結(jié)合,可構(gòu)建基于ESI高被引論文的研究前沿模型(見圖1),更好地對研究前沿進行探測和可視化展示。
圖1 基于ESI高被引論文的研究前沿模型
圖1中模型以ESI高被引論文為核心,ESI高被引論文通過共被引聚類形成不同的前沿研究領(lǐng)域(共被引聚類A、共被引聚類B),ESI高被引論文是各研究領(lǐng)域的知識基礎,ESI高被引論文的施引文獻則代表各前沿研究領(lǐng)域的新進展。通過對ESI高被引論文及其施引文獻的可視化分析,可以得到各前沿研究領(lǐng)域的發(fā)展現(xiàn)狀和趨勢。
本研究的數(shù)據(jù)來源于Web of Science(WOS)核心合集。首先在WOS核心合集中檢索醫(yī)學信息學的研究論文,檢索式為WC=“Medical Informatics”,共得到86 199篇文獻;然后在檢索結(jié)果頁面中選擇“ESI精煉”(購買ESI數(shù)據(jù)庫后,檢索結(jié)果頁面才會有此選項),將論文發(fā)表年份限定為2013-2017年后,得到該學科領(lǐng)域近5年的ESI高被引論文158篇。進一步對158篇ESI高被引論文的施引文獻進行檢索,去除自引后的施引文獻共有8 046篇,其中1 152篇施引文獻來自“Medical Informatics”學科。158篇ESI高被引論文及其1 152篇施引文獻即為本文的分析對象。
根據(jù)本文對研究前沿的界定和圖1中的模型,158篇ESI高被引論文可被視為醫(yī)學信息學的知識基礎,ESI高被引論文通過施引文獻形成的多個共被引聚類即為醫(yī)學信息學的前沿研究領(lǐng)域,前沿研究領(lǐng)域的最新進展蘊含在1 152篇施引文獻中。通過Citespace V從施引文獻的標題、摘要中提取的專業(yè)術(shù)語和出現(xiàn)頻率突然增加的術(shù)語作為聚類標簽,可對各前沿研究領(lǐng)域的研究內(nèi)容進行標識和概括。本研究通過科學知識圖譜對醫(yī)學信息學各個前沿領(lǐng)域的重要文獻進行內(nèi)容分析,深入細致地識別與監(jiān)測該學科的發(fā)展動態(tài)。
將醫(yī)學信息學158篇ESI高被引論文及其1 152篇施引文獻(合計1 310篇文獻)導入采用Citespace V,節(jié)點類型設置為Cited References,閾值為Top 50,時間段(Slice)設置為1年,進行文獻共被引分析,結(jié)果見圖2。圖2中形成了5個明顯的文獻聚類,每個聚類的標簽都用“#”號和阿拉伯數(shù)字進行編號,分別代表醫(yī)學信息學領(lǐng)域的5個前沿研究領(lǐng)域。聚類標簽來源選擇為施引文獻的標題(Title),標簽抽詞算法設置為LSI。根據(jù)聚類標簽和重要節(jié)點文獻的內(nèi)容分析,可知這5個前沿領(lǐng)域分別是:電子健康檔案(Electronic Health Records,EHR)、移動App(Mobile Apps)、病人門戶系統(tǒng)(Patient Portals)、臨床決策支持(Clinical Decision Support,CDS)、社交媒體(Social Media)。下面分別對5個前沿領(lǐng)域的最新進展進行分析。
圖2 醫(yī)學信息學前沿研究領(lǐng)域
這一前沿領(lǐng)域由圖2中的“#0 electronic health records”聚類中的ESI高被引論文及其施引文獻構(gòu)成,其研究內(nèi)容主要包括以下兩個方面:
2.1.1 電子健康檔案的數(shù)據(jù)共享與交互
Mandel等[11]介紹了從哈佛醫(yī)學院和波士頓兒童醫(yī)院開始的替代醫(yī)學應用和可復用技術(shù)(SMART)項目,其目標是開發(fā)一個平臺,讓醫(yī)療應用程序能夠在不同的醫(yī)療IT系統(tǒng)中一次性編寫和運行。在2013年下半年,他們采用快速衛(wèi)生互操作資源(FHIR)對SMART進行了升級。FHIR是由衛(wèi)生信息交換標準(Health Level 7,HL7)組織借鑒最新的Web技術(shù)創(chuàng)建的一套醫(yī)療信息規(guī)范,用于醫(yī)療數(shù)據(jù)的交換和共享。FHIR能夠和不同應用環(huán)境兼容,例如手機上的App、云通訊及電子病歷共享系統(tǒng)和大型醫(yī)療機構(gòu)的服務器等。Wolff等[12]研究了電子健康檔案在醫(yī)生、患者及其護理伙伴間的共享問題。他發(fā)現(xiàn)向患者及其護理伙伴提供醫(yī)生對其電子健康檔案的訪問記錄后,患者對自己的健康管理能力更有信心,護理伙伴也可以更好地訪問和使用病人門戶系統(tǒng)功能,并改善和患者的溝通效果。
EHR反映了衛(wèi)生保健提供者的部分觀點,患者沒有控制或與他們的數(shù)據(jù)進行交互的能力,因此Roehrs等[13]認為需要一種綜合的方法來儲存與健康有關(guān)的數(shù)據(jù),即個人健康記錄(PHR),可以由衛(wèi)生保健提供者和病人使用。提供者不僅可以使用以前的健康相關(guān)記錄,還可以通過病人的交互作用來擴展他們的數(shù)據(jù)。PHR的另一個優(yōu)勢是患者可以與他們的健康數(shù)據(jù)交互,做出可能對他們的健康有積極影響的決定。
2.1.2 機器學習與數(shù)據(jù)挖掘
EHR越來越多地作為臨床風險預測的數(shù)據(jù)來源,通過機器學習和數(shù)據(jù)挖掘可以更加有效地從EHR數(shù)據(jù)中發(fā)現(xiàn)新知識。Goldstein等[14]通過文獻回顧分析了EHR應用中的機會和挑戰(zhàn)。他發(fā)現(xiàn)現(xiàn)有的研究并沒有充分利用EHR數(shù)據(jù)的廣度,只有較少的研究是通過網(wǎng)站進行驗證的,而且許多研究并沒有完全解決EHR的數(shù)據(jù)偏倚問題。Zheng T等[15]提出了一種數(shù)據(jù)信息框架,通過特征工程和機器學習,從EHR中識別出2型糖尿病患者。他們評估和對比了該框架內(nèi)使用的機器學習模型的識別性能,包括k-近鄰、樸素貝葉斯、決策樹、隨機森林、支持向量機和邏輯回歸。該框架獲得了較高的識別性能(平均AUC為0.98),遠遠高于當前最先進的算法(AUC 0.71)。
這一前沿領(lǐng)域由圖2中的“#1 mobile app”聚類中的ESI高被引論文及其施引文獻構(gòu)成,其研究內(nèi)容主要包括以下4個方面:
2.2.1 移動App的應用研究
Dennison等[16]調(diào)查了年輕人對支持健康行為干預的App的看法,發(fā)現(xiàn)他們對這類App有一定的興趣,準確性、合法性、安全性是影響年輕人使用這類App的主要因素。因此在研發(fā)健康行為應用程序時應充分考慮用戶的這些需求。Fiordelli等[17]對智能手機在醫(yī)療保健中的影響進行系統(tǒng)的文獻綜述,發(fā)現(xiàn)智能手機應用于醫(yī)療保健的范圍非常廣泛,而慢性病是其應用的重點。
2.2.2 移動App對健康的影響研究
移動App對健康的效用主要體現(xiàn)在肥胖干預、促進心理健康等方面。人們對利用信息傳播技術(shù)來治療肥胖越來越感興趣,智能手機的干預可能是一種方便的、具有潛在成本效益的、廣泛的體重管理策略。TurnerMcGrievy等[18]研究了通過App進行自我監(jiān)測對飲食和運動行為的影響,發(fā)現(xiàn)App用戶的自我監(jiān)測意愿更強,減肥效果也更明顯,證明了手機App監(jiān)測方法在減肥試驗中的潛在益處。Carter等[19]則研究了通過智能手機應用對肥胖患者進行體重自我監(jiān)控的和醫(yī)療干預的可行性,他們研發(fā)了名為“My Meal Mate”的體重管理App,通過對128名肥胖患者應用該App的情況進行隨機抽樣調(diào)查,證明了該App是一種可接受的、可行的減肥干預措施。Donker等[20]系統(tǒng)地回顧了研究移動設備(如智能手機和平板電腦)上的心理健康類App的文獻,發(fā)現(xiàn)有8篇相關(guān)論文分別介紹了5款針對抑郁、焦慮和藥物濫用的App,結(jié)果顯示這類App確實有助于緩解抑郁、壓力,讓患者藥物使用顯著減少。
2.2.3 移動App的評估量表研究
智能手機App應用于醫(yī)療衛(wèi)生領(lǐng)域越來越多,但對這類App進行評估的量表還很少見。Stoyanov等[21]開發(fā)了一個對健康應用類App進行測試、分類和評級的多維量表(Mobile App Rating Scale,MARS),23個評價條目涵蓋了4類客觀指標(參與度、功能性、美觀、信息質(zhì)量)和1類主觀指標,他驗證了MARS作為移動健康類App的分類和質(zhì)量評估工具,是簡單、客觀、可靠的。
2.2.4 隱私問題研究
移動App涉及的健康隱私問題也開始引起學術(shù)界關(guān)注。Sunyaev等[22]評估了移動健康App隱私條款在iOS和Android上的可用性、范圍和透明度,發(fā)現(xiàn)只有30.5%的移動健康App有隱私條款,他認為應該采取措施解決移動健康App在隱私保護方面的問題。
支持病人與醫(yī)師在線交流的病人信息門戶系統(tǒng)可以降低成本,改善病人的醫(yī)療服務質(zhì)量,與電子病歷集成并支持雙向通信是病人門戶系統(tǒng)未來的主要發(fā)展方向。當前國外對病人門戶系統(tǒng)的研究主要集中于系統(tǒng)的效用及影響因素上。這一前沿領(lǐng)域由圖2中的“#2 patient portals”聚類中的ESI高被引論文及其施引文獻構(gòu)成,其研究內(nèi)容主要包括以下兩個方面:
2.3.1 病人門戶系統(tǒng)對健康產(chǎn)出的影響
Kruse等[23]回顧了病人信息門戶系統(tǒng)對醫(yī)療服務質(zhì)量影響的文獻,發(fā)現(xiàn)該系統(tǒng)確實提高了病人的滿意度,但是對提高健康產(chǎn)出并沒有明顯的幫助,該系統(tǒng)當前最有意義的作用是讓病人在線查看自己的健康信息記錄。Kelly等[24]以一個為父母提供兒童住院信息的門戶系統(tǒng)為研究對象,調(diào)查了該系統(tǒng)的作用及父母的滿意度。結(jié)果發(fā)現(xiàn)系統(tǒng)易于使用,改善了醫(yī)療服務,90%的父母對系統(tǒng)表示滿意。
2.3.2 應用病人門戶系統(tǒng)的影響因素
Irizarry等[25]研究了病人信息門戶系統(tǒng)使用的影響因素,發(fā)現(xiàn)患者的興趣和應用能力受到年齡、民族、教育程度、健康素養(yǎng)、健康狀況和護理者角色等個人因素的強烈影響,門戶系統(tǒng)需要同時滿足醫(yī)療機構(gòu)和病人的信息需求才能得到更大的認可。Tieu等[26]研究了弱勢群體通過病人信息門戶獲取電子健康記錄中遇到的困難,發(fā)現(xiàn)計算機操作困難、閱讀寫作困難和醫(yī)學知識缺乏都影響了弱勢群體對門戶系統(tǒng)的使用,他認為應為弱勢群體提供更多的培訓和支持。
這一前沿領(lǐng)域由圖2中的“#4 clinical decision support”聚類中的ESI高被引論文及其施引文獻構(gòu)成,其研究內(nèi)容主要包括以下兩個方面:
2.4.1 醫(yī)患共同決策模式
作為一種新的醫(yī)療文化模式,醫(yī)患共同決策(Shared Decision Making,SDM)越來越受到學術(shù)界的關(guān)注。醫(yī)患共同決策即醫(yī)務人員充分告知患者各種治療方法的好處和壞處,知情的患者權(quán)衡利弊并與醫(yī)務人員充分交流后共同作出決策,但這種決策模式對于改善患者愈后的效果尚未得到公認。Shay等[27]的研究表明SDM可以有效地促進患者對醫(yī)療的正面情感認知,但促進患者改善健康行為和健康產(chǎn)出比例分別僅為37%和25%,因此SDM的效果還有待進一步驗證。
2.4.2 電子處方應用
在各國政府的支持和鼓勵下,電子處方被廣泛地使用,臨床決策支持系統(tǒng)(CDS)常常為電子處方顯示過多的警報,導致警報疲勞。Nanji等[28]研究了門診中藥物相關(guān)的CDS警報的覆蓋率,發(fā)現(xiàn)最常見的警報是重復用藥(33.1%)、患者過敏(16.8%)和藥物相互作用(15.8%),他認為應該對CDS的警報進行細化,提高這些警報信息的相關(guān)性和針對性。Payne等[29]探索了藥物交互作用(DDI)臨床決策支持警報的首選策略,討論了三個關(guān)鍵問題:如何顯示DDI臨床決策支持信息?DDI臨床決策支持的表達形式是否要因人而異?如何評估DDI臨床決策支持的有效性?他的結(jié)論是臨床決策支持警報需要重大改進,應減少警報疲勞、提高患者安全。
基于EHR的積極臨床決策支持(CDS)可以在基因藥物治療及病人護理中得到應用。Bell等[30]設計了基于EHR的臨床決策支持系統(tǒng),應用于多種藥物遺傳監(jiān)測,該系統(tǒng)針對高風險藥物向臨床醫(yī)生提供警報。他通過實驗驗證了開發(fā)該系統(tǒng)的可行性,可為臨床醫(yī)生提供基于基因的藥物處方警報。Hoffman等[31]認為藥物基因組學要成功地應用于日常的臨床護理,需要一種機器可讀的、適用于EHR和CDS的藥物基因組知識數(shù)據(jù)庫。他概述了這種知識庫的關(guān)鍵特征,并討論了這些知識資源應用于藥物基因組學和精準醫(yī)學的重要性。
這一前沿領(lǐng)域由圖2中的“#5 social media”聚類中的ESI高被引論文及其施引文獻構(gòu)成,其研究內(nèi)容主要包括以下兩個方面:
2.5.1 社交網(wǎng)絡對健康行為的影響
Maher等[32]系統(tǒng)地回顧了關(guān)于在線社交網(wǎng)絡對健康行為干預有效性的文獻,發(fā)現(xiàn)只有非常少量的證據(jù)表明,納入在線社交網(wǎng)絡的干預措施可能是有效的。但他同時也承認,這一領(lǐng)域的研究還處于起步階段,需要進一步地研究來確定如何利用在線社交網(wǎng)絡實現(xiàn)大眾傳播。Laranjo等[33]通過Meta分析評估了基于社交網(wǎng)站的干預措施在健康行為改變中的有效性,發(fā)現(xiàn)社交網(wǎng)站對健康行為改變的干預是有效的,但納入分析的文獻之間存在較大的異質(zhì)性。
2.5.2 社交媒體在醫(yī)療服務中的應用
Moorhead等[34]總結(jié)了社交媒體在公眾、患者和醫(yī)療衛(wèi)生專業(yè)人員之間進行健康交流的用途、優(yōu)勢和局限性。他認為社交媒體在衛(wèi)生服務中的優(yōu)勢在于可加強與他人的互動,能促進、分享和獲取健康信息,后續(xù)研究應評估不同類型的社交媒體對健康傳播的有效性,并探索利用社交媒體監(jiān)測和提高健康信息傳播質(zhì)量和可靠性的潛在機制。Grajales等[35]認為大量的利益相關(guān)者(如臨床醫(yī)生、衛(wèi)生管理人員、專業(yè)院校、學術(shù)機構(gòu)、衛(wèi)生部等)不知道社交媒體的應用途徑和潛在的風險,以及這些風險是如何減弱的。他通過文獻回顧研究了醫(yī)療和衛(wèi)生保健部門中使用社交媒體的方式、地點和原因??陀^的社會媒體作為個人健康信息共享平臺正變得越來越受歡迎,Nikfarjam等[36]認為社交媒體的信息通過自然語言處理(NLP)技術(shù)可以用于公共衛(wèi)生監(jiān)測,尤其是應用于藥物安全監(jiān)視。他設計了一種基于機器學習的從社交媒體上提取藥物不良信息的方法,并驗證了其有效性。
本研究以Citespace的概念模型為參照,提出了基于ESI高被引論文的研究前沿模型,從ESI高被引論文及其施引文獻入手繪制科學知識圖譜,發(fā)現(xiàn)了醫(yī)學信息學5大前沿研究領(lǐng)域:電子健康檔案、移動App、病人門戶系統(tǒng)、臨床決策支持、社交媒體。通過對上述前沿領(lǐng)域的進一步分析,總結(jié)出醫(yī)學信息學研究的3個趨勢:1)重視信息行為對健康產(chǎn)出的影響。移動App對健康的影響、病人門戶系統(tǒng)對健康的影響和社交網(wǎng)絡對健康的影響是各個前沿領(lǐng)域的重要研究內(nèi)容;2)密切關(guān)注新興技術(shù)在醫(yī)療領(lǐng)域的應用。移動app在醫(yī)療中的應用研究、應用病人門戶系統(tǒng)的影響因素研究、電子處方應用研究等新興技術(shù)在醫(yī)療服務中的應用研究成效顯著;3)數(shù)據(jù)科學對醫(yī)學信息學研究的影響日益明顯。無論是對電子健康檔案進行機器學習與數(shù)據(jù)挖掘,還是在社交媒體研究中引入自然語言處理技術(shù)進行公共衛(wèi)生預測,都是數(shù)據(jù)科學在醫(yī)學信息學研究中的具體應用。
本研究將基于ESI高被引論文的研究前沿模型應用于醫(yī)學信息學,揭示了該學科的前沿研究領(lǐng)域及其發(fā)展動態(tài)。ESI高被引論文是各學科領(lǐng)域?qū)W術(shù)影響力最高的文獻,也是一流學科的重要評價指標之一,因此基于ESI高被引論文的學科前沿分析能更好地適應“雙一流”背景下學科建設的需要。該模型能幫助相關(guān)高校精準識別學科研究前沿,監(jiān)測學科研究動態(tài),洞察學科發(fā)展趨勢,在制定學科發(fā)展規(guī)劃、凝練學科研究方向等過程中有著廣闊的應用前景。此模型不僅適用于醫(yī)學信息學領(lǐng)域,也可應用于其他學科的研究前沿探測。