摘 要:梳理并分析健康醫(yī)療大數(shù)據(jù)應(yīng)用領(lǐng)域研究發(fā)展現(xiàn)狀和發(fā)展趨勢,運用CiteSpace軟件對中國知網(wǎng)(CNKI)和Web of Science核心合集數(shù)據(jù)庫中2013—2022年的健康醫(yī)療大數(shù)據(jù)應(yīng)用研究文獻進行可視化分析,共納入中國知網(wǎng)(CNKI)文獻1 164篇,Web of Science文獻1 187篇。通過可視化分析發(fā)現(xiàn)該領(lǐng)域發(fā)文數(shù)量逐年穩(wěn)定增長,研究機構(gòu)單一缺乏深度合作,研究熱點主要為大數(shù)據(jù)技術(shù)在該領(lǐng)域的應(yīng)用。
關(guān)鍵詞:健康醫(yī)療;大數(shù)據(jù);CiteSpace;可視化分析
中圖分類號:R-058 文獻標識碼:A Doi:10.3969/j.issn.1672-2272.202210026
A Visual Analysis of Healthcare Big Data Application Research Based on CiteSpace
Chen Lei,Zhang Xing
(School of Management,Wuhan Textile University,Wuhan 430200, China)
Abstract:Sort out and analyze the current research development status and development trend of health care big data application field . Using CiteSpace software to visualize and analyze the literature related to healthcare big data applications in the core collection databases of China National Knowledge Infrastructure and Web of Science from 2013-2022. A total of 1164 CNKI documents and 1187 Web of Science documents were included. Through visual analysis, we found that the number of articles published in this field has been growing steadily year by year, the research institutions are single and lack of in-depth cooperation, and the research hotspots are mainly the application of big data technology in this field.
Key Words:Healthcare; Big Data; CiteSpace; Visualization Analysis
0 引言
健康醫(yī)療大數(shù)據(jù)是指由于計算機科學(xué)以及信息技術(shù)快速發(fā)展,健康醫(yī)療信息化得到廣泛應(yīng)用導(dǎo)致在健康保健和衛(wèi)生管理過程中產(chǎn)生的海量數(shù)據(jù)集[1]。目前已運用到諸多領(lǐng)域中,例如運營大數(shù)據(jù)、生物大數(shù)據(jù)、臨床大數(shù)據(jù)、健康大數(shù)據(jù)等[2],影響著整個醫(yī)療行業(yè)的變革。它不僅具備大數(shù)據(jù)的5V特征,同時具有時效性、階段性等特點[3]。在醫(yī)藥衛(wèi)生服務(wù)水平提升、促進健康產(chǎn)業(yè)發(fā)展等方面,健康醫(yī)療大數(shù)據(jù)發(fā)展與應(yīng)用都起到了不可忽視的作用[4]。
2016年國務(wù)院辦公廳發(fā)布《關(guān)于促進和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》指出,要以“互聯(lián)網(wǎng)+健康醫(yī)療”的方式探索醫(yī)療服務(wù)新模式。 2016年中共中央國務(wù)院印發(fā)的《“健康中國2030”規(guī)劃綱要》提出健康醫(yī)療大數(shù)據(jù)是國家基礎(chǔ)性戰(zhàn)略資源,從投資、創(chuàng)新等多方面領(lǐng)域?qū)ζ浒l(fā)展應(yīng)用予以強有力的支持,使“健康中國戰(zhàn)略”與我國整體發(fā)展戰(zhàn)略相結(jié)合,發(fā)揮其支撐作用[5]。醫(yī)療健康大數(shù)據(jù)不僅能促進傳統(tǒng)醫(yī)療產(chǎn)業(yè)發(fā)展,也在日常醫(yī)療工作中起著重要作用。任何事物在發(fā)展過程中總會遇到各種挑戰(zhàn)與難題,隨著健康醫(yī)療大數(shù)據(jù)的應(yīng)用愈加廣泛,個人信息安全泄露、知情權(quán)益侵犯、人文關(guān)懷缺失等問題也開始顯現(xiàn),并且由于健康醫(yī)療大數(shù)據(jù)應(yīng)用尚未得到充分發(fā)展,我國現(xiàn)行法規(guī)尚無法涵蓋涉及健康醫(yī)療大數(shù)據(jù)研究提出的倫理審查和管理要求,倫理審查工作缺乏可操作化的審查標準與程序[6]。
1 數(shù)據(jù)來源與方法
1.1 數(shù)據(jù)來源
以CNKI和Web of Science (WOS)核心合集為數(shù)據(jù)源,選擇高級檢索方式,中國知網(wǎng)(CNKI)中搜索關(guān)鍵詞為健康大數(shù)據(jù)+ 醫(yī)療大數(shù)據(jù)應(yīng)用,文獻類型設(shè)定為學(xué)術(shù)期刊,語言選擇中文;WOS核心合集數(shù)據(jù)庫中檢索關(guān)鍵詞為TS=(health medical big data OR healthcare big data) AND TS=application,文獻類型設(shè)定為 Article 或 Review,語言設(shè)定為English,檢索年限范圍都設(shè)置為2013-01-01至2022-9-20,共檢出相關(guān)文獻2 831篇。
1.2 研究方法
本研究運用CiteSpace V6.1.3R對下載文獻數(shù)據(jù)進行分析[7],繪制關(guān)鍵詞共現(xiàn)圖譜了解健康醫(yī)療大數(shù)據(jù)應(yīng)用領(lǐng)域近10年的研究熱點與現(xiàn)狀;繪制關(guān)鍵詞突現(xiàn)圖譜探究此領(lǐng)域的研究前沿與發(fā)展趨勢。
2 健康醫(yī)療大數(shù)據(jù)應(yīng)用研究現(xiàn)狀
2.1發(fā)文時間分布
某一研究領(lǐng)域發(fā)文量隨時間的演變趨勢從側(cè)面反映出該領(lǐng)域研究主題的受關(guān)注程度,對其進行分析可更好地挖掘該領(lǐng)域研究發(fā)展趨勢[8]。CNKI中收錄的健康醫(yī)療大數(shù)據(jù)應(yīng)用主題相關(guān)文獻中最高被引文獻發(fā)表于2013年,主要探討大數(shù)據(jù)在醫(yī)療衛(wèi)生領(lǐng)域的應(yīng)用前景與存在的問題[9];WOS中收錄的相關(guān)文獻中最高被引文獻發(fā)表于2019年,主要探討大數(shù)據(jù)技術(shù)如人工智能、深度學(xué)習(xí)等在醫(yī)療健康領(lǐng)域應(yīng)用存在的問題及未來發(fā)展[10]。如圖1所示,該領(lǐng)域在近10年文獻發(fā)表的數(shù)量隨時間推移整體上升。
2.2 期刊分布
中國知網(wǎng)(CNKI)健康醫(yī)療大數(shù)據(jù)應(yīng)用研究領(lǐng)域文獻量前10的期刊排名見表1。表1中10種期刊發(fā)表文獻量占總文獻量的92.9%,其中《中國數(shù)字醫(yī)學(xué)》排名第一,發(fā)文101篇。按照期刊類別來看,以醫(yī)學(xué)信息學(xué)領(lǐng)域為主,其它有醫(yī)院管理、圖書情報及計算機類等期刊。
WOS中健康醫(yī)療大數(shù)據(jù)應(yīng)用研究領(lǐng)域文獻量前十的期刊排名見表2。其中《IEEE ACCESS》位列第一,發(fā)文多達73篇。由可視化展示結(jié)果可以得出,WOS中該研究領(lǐng)域發(fā)文期刊主要是美國期刊;期刊類型主要有計算機科學(xué)、醫(yī)學(xué)信息學(xué)等。在該領(lǐng)域的相關(guān)研究中,學(xué)科類型較為單一,可以考慮多學(xué)科融合進行探索。
2.3 機構(gòu)分布
如表3所示,中國知網(wǎng)(CNKI)文獻量前10的研究機構(gòu)中有5所均為高等院校,3所為醫(yī)院,其余2所機構(gòu)分別為國家機構(gòu)和企業(yè)。WOS該研究領(lǐng)域共1 187篇文獻,來自2 231個研究機構(gòu)。美國發(fā)文量最多,為314篇;中國排名第2位,共發(fā)文224 篇。從研究機構(gòu)來看,加州大學(xué)、哈佛大學(xué)排名前2位,在該領(lǐng)域發(fā)文超過25篇。排名前10的機構(gòu)中有4 所來自美國。排名前10的機構(gòu)中有8所均為高等院校,其余2所機構(gòu)分別為埃及知識銀行和梅約醫(yī)學(xué)中心。因此,在該領(lǐng)域的研究進程中,研究機構(gòu)種類較為單一,缺乏不同行業(yè)機構(gòu)的合作見表4。
3 研究熱點與發(fā)展趨勢分析
3.1 關(guān)鍵詞共現(xiàn)
關(guān)鍵詞是一篇文獻中最能體現(xiàn)其核心研究內(nèi)容的部分,是作者對核心研究主題的高度概括表達[11]。運用 CiteSpace 制作關(guān)鍵詞共現(xiàn)圖譜,來挖掘這一領(lǐng)域的熱門研究內(nèi)容(圖2、圖3)。CNKI形成的關(guān)鍵詞共現(xiàn)圖譜中最顯著的6個關(guān)鍵詞為人工智能、云計算、數(shù)據(jù)挖掘、智慧醫(yī)療、物聯(lián)網(wǎng)、健康管理。WOS數(shù)據(jù)庫形成的關(guān)鍵詞共現(xiàn)圖譜中圖譜中最顯著的 6 個關(guān)鍵詞為artificial intelligence、machine learning、system、challenge、health care、deep learning。
由圖3可見,關(guān)鍵詞根據(jù)其內(nèi)部連接關(guān)系分為了3個較大的聚類,與圖2展現(xiàn)相似。artificial intelligence、machine learning等詞形成的聚類代表健康醫(yī)療大數(shù)據(jù)應(yīng)用的相關(guān)技術(shù)研究,其中關(guān)鍵詞artificial intelligence位列第 1,表明人工智能在健康醫(yī)療大數(shù)據(jù)的應(yīng)用是研究的熱點問題;precision medicine、smart city等詞反映健康醫(yī)療大數(shù)據(jù)的相關(guān)應(yīng)用場景,其中關(guān)鍵詞smart city表明健康醫(yī)療大數(shù)據(jù)愈發(fā)成為智慧城市構(gòu)建中不可忽視的一部分;privacy、system、prediction等詞代表健康醫(yī)療大數(shù)據(jù)相關(guān)具體的研究內(nèi)容與應(yīng)用目的;關(guān)鍵詞 privacy 近幾年出現(xiàn)頻次較高,表明康醫(yī)療大數(shù)據(jù)應(yīng)用中的信息隱私問題越來越受到學(xué)術(shù)界關(guān)注。
3.2 關(guān)鍵詞突現(xiàn)
關(guān)鍵詞突現(xiàn)分析是指通過CiteSpace軟件的突現(xiàn)詞檢測功能來探測、分析短期內(nèi)出現(xiàn)頻次有顯著變化的關(guān)鍵詞,來反映不同時間段內(nèi)研究主題發(fā)展趨勢,并以此探索未來的研究方向[12]。綜合從CNKI和WOS核心合集數(shù)據(jù)庫中得到的相關(guān)研究文獻關(guān)鍵詞突現(xiàn)圖譜(圖4、圖5)可知,結(jié)合突現(xiàn)強度與突現(xiàn)時間來看,“人工智能”“區(qū)塊鏈”的突現(xiàn)強度分別為5.84、4.6,突現(xiàn)開始時間為2019年和2020年并且持續(xù)至今,說明如何將人工智能技術(shù)和區(qū)塊鏈技術(shù)與健康醫(yī)療大數(shù)據(jù)應(yīng)用相結(jié)合得到越來越多學(xué)者的關(guān)注,是該領(lǐng)域未來的一大研究趨勢; “疫情防控” “遠程醫(yī)療”“智慧醫(yī)院”“醫(yī)學(xué)診斷成像”的突現(xiàn)強度分別為4.93、2.68、2.35、2.3,突現(xiàn)開始時間為2020年并且持續(xù)至今,說明在該領(lǐng)域未來的研究中健康醫(yī)療大數(shù)據(jù)在實際生活中的應(yīng)用會得到進一步探索;其它一些突現(xiàn)強度較大并在近年開始突現(xiàn)的詞,如“電子病歷”“決策支持”“預(yù)測分析”表明健康監(jiān)測是該領(lǐng)域未來發(fā)展的研究趨勢之一。
4 結(jié)語
本研究通過運用 CiteSpace軟件對近10年中國知網(wǎng)(CNKI)和WOS核心合集中收錄的健康醫(yī)療大數(shù)據(jù)應(yīng)用相關(guān)研究文獻進行可視化分析,探索該領(lǐng)域的研究現(xiàn)狀、關(guān)注熱點以及前沿發(fā)展趨勢。主要結(jié)論如下:
從研究現(xiàn)狀來看,目前該領(lǐng)域重點關(guān)注的研究主題是挖掘健康醫(yī)療大數(shù)據(jù)在衛(wèi)生保健方面的巨大潛在價值。細分來說,主要有結(jié)合大數(shù)據(jù)信息技術(shù)的電子健康病歷、智慧醫(yī)院、精準診療、健康管理等。從關(guān)鍵詞共現(xiàn)圖譜可以看出,結(jié)合大數(shù)據(jù)技術(shù)與醫(yī)療技術(shù)來提供快速精準的相關(guān)醫(yī)療服務(wù)是目前該領(lǐng)域的研究熱點。
從研究發(fā)展趨勢來看,該領(lǐng)域存在許多問題和挑戰(zhàn)。主要分為以下3個方面,首先,數(shù)據(jù)的獲取問題。雖然“互聯(lián)網(wǎng)+”時代的到來使得大數(shù)據(jù)技術(shù)飛速發(fā)展,但相關(guān)技術(shù)人才仍然短缺,未來還需要解決如何提高數(shù)據(jù)長期獲取、儲存和運算能力,突破技術(shù)瓶頸以提高健康醫(yī)療大數(shù)據(jù)的有效利用;其次,數(shù)據(jù)的共享問題。由于健康醫(yī)療大數(shù)據(jù)來源廣泛,且管理標準不同,相關(guān)法律不完善等原因,致使跨領(lǐng)域、跨機構(gòu)、跨行業(yè)的實踐應(yīng)用無法落實;第三,應(yīng)用過程中的數(shù)據(jù)安全與個人隱私問題。健康醫(yī)療大數(shù)據(jù)集源自人們的各類健康或醫(yī)療活動,其中包含著許多個人信息,在將這些數(shù)據(jù)采集、處理、信息化直至應(yīng)用于各個領(lǐng)域的過程中,數(shù)據(jù)的泄露問題令人不安,而平臺監(jiān)管不嚴、現(xiàn)行相關(guān)法律法規(guī)的缺失等問題更加劇關(guān)于個人隱私安全的擔(dān)憂。因此,完善法律法規(guī),以及加強平臺監(jiān)管是未來該領(lǐng)域的重點研究方向。
參考文獻:
[1]代濤.健康醫(yī)療大數(shù)據(jù)發(fā)展應(yīng)用的思考[J].醫(yī)學(xué)信息學(xué)雜志,2016,37(2):2-8.
[2]孟群,畢丹,張一鳴,等.健康醫(yī)療大數(shù)據(jù)的發(fā)展現(xiàn)狀與應(yīng)用模式研究[J].中國衛(wèi)生信息管理雜志,2016,13(6):547-552.
[3]張振,楊翠湄,徐靜,等.健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展現(xiàn)狀與數(shù)據(jù)治理[J].醫(yī)學(xué)信息學(xué)雜志,2022,43(7):2-8.
[4]楊善林,丁帥,顧東曉,等.醫(yī)療健康大數(shù)據(jù)驅(qū)動的知識發(fā)現(xiàn)與知識服務(wù)方法[J].管理世界,2022,38(1):219-229.
[5]柴國榮,汪佳穎.“健康中國”戰(zhàn)略下醫(yī)療健康大數(shù)據(jù)的價值挖掘與實現(xiàn)[J].電子政務(wù),2022(6):99-110.
[6]謝小萍,何曉波,高雅潔,等.涉及健康醫(yī)療大數(shù)據(jù)研究的倫理審查問題思考[J].中國醫(yī)學(xué)倫理學(xué),2021,34(3):309-313.
[7]李亞京,馬海群.基于文獻計量的我國科學(xué)數(shù)據(jù)研究綜述[J].圖書館研究與工作,2017(12):46-51.
[8]肖明.信息計量學(xué)[M].北京: 中國鐵道出版社,2014: 277.
[9]周光華,辛英,張雅潔,等.醫(yī)療衛(wèi)生領(lǐng)域大數(shù)據(jù)應(yīng)用探討[J].中國衛(wèi)生信息管理雜志,2013,10(4):296-300,304.
[10]TOPOL E J. High-Performance medicine: the convergence of human and artificial intelligence[J]. Nature medicine, 2019, 25(1): 44-56.
[11]吉亞力,田文靜,董穎.基于關(guān)鍵詞共現(xiàn)和社會網(wǎng)絡(luò)分析法的我國智庫熱點主題研究[J].情報科學(xué),2015,33(3):108-111.
[12]王知津,吳東穎.我國信息行為研究現(xiàn)狀與趨勢分析[J].情報資料工作,2018(6):43-51.
(責(zé)任編輯:要 毅)
基金項目:國家自然科學(xué)基金項目“醫(yī)療眾籌中的信息機制:眾籌信息的內(nèi)容、表達及擴散研究”(71974152)
作者簡介:陳磊(1997-),女,武漢紡織大學(xué)管理學(xué)院碩士研究生,研究方向:知識管理;張星(1981-),男,博士,武漢紡織大學(xué)管理學(xué)院教授,研究方向:在線健康與醫(yī)療眾籌、知識管理、互聯(lián)網(wǎng)用戶信息行為。本文通訊作者:張星。