陳建昌
(重慶市醫(yī)藥衛(wèi)生學(xué)校,重慶 408000)
大數(shù)據(jù)特征為:一是數(shù)據(jù)量大,起始計(jì)量單位至少是P (1 000 個(gè)T) ;二是數(shù)據(jù)類型繁多, 包括表格、圖片、文本信息等;三是數(shù)據(jù)價(jià)值密度相對(duì)較低, 需要強(qiáng)大的機(jī)器算法迅速完成數(shù)據(jù)價(jià)值的“提純”;四是處理速度快, 時(shí)效性要求高[1]。
醫(yī)療大數(shù)據(jù)指的是在醫(yī)療行業(yè)中產(chǎn)生的大量數(shù)據(jù)[2]。如何利用這些海量的信息資源為醫(yī)療衛(wèi)生行業(yè)的管理、醫(yī)院的診療、科研和教學(xué)服務(wù),逐漸成為人們關(guān)注的熱點(diǎn)[3]。 為此,該研究以中國(guó)知網(wǎng)為檢索源,借助Citespace 可視化分析軟件,以共現(xiàn)、聚類、突現(xiàn)的新視角對(duì)近十年來(lái)國(guó)內(nèi)醫(yī)療大數(shù)據(jù)相關(guān)文獻(xiàn)進(jìn)行關(guān)鍵詞分析,旨為國(guó)內(nèi)相關(guān)學(xué)者提供參考。
以中國(guó)知網(wǎng)為數(shù)據(jù)來(lái)源。在中國(guó)知網(wǎng)中,限定主題為“醫(yī)療大數(shù)據(jù)”,時(shí)間為“2009—2019”,共得到747 條記錄,去掉新聞報(bào)道及信息不全的74 條記錄,共分析了673 條記錄。 下載全部文獻(xiàn)題錄并以refworks 格式保存作為數(shù)據(jù)集。 檢索時(shí)間為2019年4月16日。
采用文獻(xiàn)計(jì)量學(xué)方法并運(yùn)用Citespace 5.3.R4 信息可視化軟件,對(duì)國(guó)內(nèi)醫(yī)療大數(shù)據(jù)研究進(jìn)行分析。文獻(xiàn)計(jì)量學(xué)就是借助文獻(xiàn)的各種特征數(shù)量,采用數(shù)學(xué)與統(tǒng)計(jì)學(xué)方法來(lái)進(jìn)行描述、評(píng)價(jià)和預(yù)測(cè)科學(xué)技術(shù)的現(xiàn)狀與發(fā)展趨勢(shì)的科學(xué)[4]。 Citespace 是由美國(guó)德雷塞爾大學(xué)信息科學(xué)與技術(shù)學(xué)院陳超美博士開(kāi)發(fā), 運(yùn)用共現(xiàn)、聚類、突現(xiàn)的方法對(duì)文獻(xiàn)進(jìn)行可視化分析的Java 應(yīng)用程序。 該研究設(shè)置閾值:Slice Length =1,Selection Criteria選擇TOP100,選擇“Keyword”節(jié)點(diǎn)分析了醫(yī)療大數(shù)據(jù)領(lǐng)域近十年來(lái)的研究熱點(diǎn)及前沿。
文獻(xiàn)中的關(guān)鍵詞是文獻(xiàn)內(nèi)容中重要信息的體現(xiàn),是該文獻(xiàn)內(nèi)容中出現(xiàn)頻次相對(duì)較高的核心詞匯的代表,是反映文獻(xiàn)內(nèi)容的重要標(biāo)簽之一[5]。 研究文獻(xiàn)關(guān)鍵詞的共線、聚類網(wǎng)絡(luò),可總結(jié)出近年來(lái)的研究熱點(diǎn)。
研究文獻(xiàn)的突變?cè)~可預(yù)測(cè)該領(lǐng)域的研究前沿。 某主題一段時(shí)間內(nèi)的突變?cè)~是該領(lǐng)域熱點(diǎn)突然增長(zhǎng)的標(biāo)志,是該主題未來(lái)發(fā)展趨勢(shì)的重要量度。 CiteSpace 軟件將詞頻變化率高的術(shù)語(yǔ)從大量的術(shù)語(yǔ)中檢測(cè)出來(lái),依靠頻次的變動(dòng)趨勢(shì)來(lái)確定某領(lǐng)域的研究前沿, 其內(nèi)嵌突變?cè)~算法思想主要源于2003年KLEINBERG 提出的“突變偵測(cè)算法”。突變的大小用突變值表示,突變值越大,表明與該突變?cè)~相關(guān)的主題發(fā)展趨勢(shì)越明顯。
從關(guān)鍵詞共現(xiàn)圖譜(見(jiàn)圖1)可看到,除去檢索詞“醫(yī)療大數(shù)據(jù)”,健康醫(yī)療、數(shù)據(jù)挖掘、醫(yī)療數(shù)據(jù)、健康醫(yī)療大數(shù)據(jù)、人工智能、大數(shù)據(jù)應(yīng)用、醫(yī)療健康、云計(jì)算、智慧醫(yī)療等詞字體較大, 反映出醫(yī)療大數(shù)據(jù)的主要研究熱點(diǎn)為數(shù)據(jù)挖掘、人工智能、大數(shù)據(jù)應(yīng)用、云計(jì)算及智慧醫(yī)療等方面的內(nèi)容。
醫(yī)療大數(shù)據(jù)研究領(lǐng)域關(guān)鍵詞被聚類成7 類(見(jiàn)圖2),聚類標(biāo)簽為:大數(shù)據(jù)、全民健康、數(shù)據(jù)采集、大數(shù)據(jù)應(yīng)用、電子病歷、大數(shù)據(jù)平臺(tái)、信息平臺(tái)。提示國(guó)內(nèi)醫(yī)療大數(shù)據(jù)的研究熱點(diǎn)為醫(yī)療大數(shù)據(jù)的采集、平臺(tái)搭建及應(yīng)用。
近十年來(lái)該領(lǐng)域的突顯詞共有3 個(gè)(見(jiàn)圖3)。 分別為:大數(shù)據(jù)、醫(yī)療、云計(jì)算。 突變年份都為2013年至2015年。 提示隨著醫(yī)療大數(shù)據(jù)的深入研究,數(shù)據(jù)存儲(chǔ)及運(yùn)算(云計(jì)算)開(kāi)始成為該領(lǐng)域的研究前沿。
圖1 醫(yī)療大數(shù)據(jù)研究領(lǐng)域關(guān)鍵詞共現(xiàn)圖譜
圖2 醫(yī)療大數(shù)據(jù)研究領(lǐng)域關(guān)鍵詞聚類圖譜
圖3 醫(yī)療大數(shù)據(jù)研究領(lǐng)域關(guān)鍵詞突現(xiàn)
通過(guò)以上可視化分析, 得出醫(yī)療大數(shù)據(jù)的研究熱點(diǎn)為數(shù)據(jù)采集及大數(shù)據(jù)平臺(tái)搭建、數(shù)據(jù)挖掘、人工智能、大數(shù)據(jù)應(yīng)用、云計(jì)算及智慧醫(yī)療;研究趨勢(shì)是云計(jì)算。
分析醫(yī)療大數(shù)據(jù)研究熱點(diǎn)及趨勢(shì)的形成原因,可以看出我國(guó)醫(yī)療大數(shù)據(jù)的發(fā)展任重而道遠(yuǎn), 需要結(jié)合大數(shù)據(jù)的特征不斷進(jìn)行探索。
大數(shù)據(jù)有數(shù)據(jù)量大、數(shù)據(jù)類型繁多的特征,且醫(yī)療領(lǐng)域的大數(shù)據(jù)覆蓋范圍很廣, 相應(yīng)的數(shù)據(jù)資源分散在不同的數(shù)據(jù)池中,信息孤島普遍存在。 因此,迫切需要搭建醫(yī)療大數(shù)據(jù)平臺(tái),從而有針對(duì)性地采集、存儲(chǔ)海量醫(yī)療數(shù)據(jù),并且進(jìn)行標(biāo)準(zhǔn)化處理,讓醫(yī)療數(shù)據(jù)在聚合、分析后,能夠驅(qū)動(dòng)臨床醫(yī)學(xué)、精準(zhǔn)醫(yī)學(xué)等實(shí)踐應(yīng)用。 此外, 醫(yī)療大數(shù)據(jù)信息的采集不可避免會(huì)和患者隱私產(chǎn)生沖突,因此,在大數(shù)據(jù)采集的工作中,如何平衡信息安全與數(shù)據(jù)共享之間的關(guān)系, 也是廣大研究者的討論重點(diǎn)。
由于大數(shù)據(jù)價(jià)值密度較低, 醫(yī)療信息存在大量非結(jié)構(gòu)化數(shù)據(jù)。如何進(jìn)行有效的挖掘,需要強(qiáng)大的機(jī)器算法迅速完成數(shù)據(jù)價(jià)值的“提純”工作。 在醫(yī)療大數(shù)據(jù)中使用數(shù)據(jù)挖掘技術(shù), 不僅能夠提升整個(gè)醫(yī)療事業(yè)的服務(wù)質(zhì)量與水平, 還能提高治療效率與質(zhì)量。由此數(shù)據(jù)挖掘成為該領(lǐng)域的研究熱點(diǎn)。此外,如何將醫(yī)療大數(shù)據(jù)用起來(lái),目前面臨著諸多挑戰(zhàn),包括:數(shù)據(jù)標(biāo)準(zhǔn)開(kāi)發(fā)和應(yīng)用、合理的數(shù)據(jù)技術(shù)、嚴(yán)格的數(shù)據(jù)安全、完善的數(shù)據(jù)治理、適宜的應(yīng)用場(chǎng)景等。
由于大數(shù)據(jù)處理速度快、時(shí)效性要求高的特征,云計(jì)算可確保數(shù)據(jù)信息與后臺(tái)同步,方便醫(yī)護(hù)人員更加快捷地得到相關(guān)消息,提升醫(yī)院信息使用率。 此外,云計(jì)算數(shù)據(jù)處理是當(dāng)前運(yùn)用最為廣泛地?cái)?shù)據(jù)處理平臺(tái),對(duì)于醫(yī)療大數(shù)據(jù)這種有巨大信息量的數(shù)據(jù)而言, 云計(jì)算數(shù)據(jù)處理?yè)碛懈咝?、綜合性、靈敏性等特點(diǎn)。 隨著我國(guó)醫(yī)療事業(yè)的不斷發(fā)展, 信息化建設(shè)的步伐不斷加快, 大數(shù)據(jù)以及大數(shù)據(jù)處理技術(shù)的運(yùn)用勢(shì)在必行。
人工智能是應(yīng)用數(shù)字計(jì)算機(jī)或數(shù)字計(jì)算機(jī)控制的機(jī)器模擬、延伸和擴(kuò)展人的智能, 感知環(huán)境、學(xué)習(xí)知識(shí),并進(jìn)而應(yīng)用知識(shí)獲得最佳結(jié)果的理論、方法、技術(shù)以及應(yīng)用系統(tǒng)。
智慧醫(yī)療是指頂層設(shè)計(jì)下的區(qū)域性醫(yī)療信息平臺(tái), 以互聯(lián)網(wǎng)為載體, 以移動(dòng)通信、云計(jì)算和大數(shù)據(jù)等新技術(shù)為手段, 在物聯(lián)網(wǎng)框架下,實(shí)現(xiàn)醫(yī)生與患者、患者與醫(yī)療機(jī)構(gòu)、患者與醫(yī)療設(shè)備間的信息聯(lián)通, 構(gòu)建起人—人、物—物、人與物理社會(huì)間的實(shí)時(shí)和時(shí)時(shí)的診療信息互聯(lián)互通。 而醫(yī)療領(lǐng)域的人工智能及智慧醫(yī)療的基礎(chǔ)是醫(yī)療大數(shù)據(jù)。
醫(yī)療大數(shù)據(jù)對(duì)于提升醫(yī)療質(zhì)量,有效控制費(fèi)用,保障醫(yī)療安全具有潛在的價(jià)值。 也可廣泛應(yīng)用于疾病流行預(yù)測(cè),臨床治療服務(wù),改善居民健康方式,對(duì)于提升人民健康福祉,滿足人民日益增長(zhǎng)的健康需求,可發(fā)揮出重要作用。 該研究對(duì)醫(yī)療大數(shù)據(jù)領(lǐng)域的關(guān)鍵詞進(jìn)行分析后得出:數(shù)據(jù)采集及大數(shù)據(jù)平臺(tái)搭建、數(shù)據(jù)挖掘、人工智能、大數(shù)據(jù)應(yīng)用、云計(jì)算及智慧醫(yī)療是醫(yī)療大數(shù)據(jù)領(lǐng)域研究的重點(diǎn)與熱點(diǎn), 需要各部門(mén)及相關(guān)研究者不斷進(jìn)行探索,以發(fā)揮醫(yī)療大數(shù)據(jù)的最大作用。
創(chuàng)新創(chuàng)業(yè)理論研究與實(shí)踐2019年16期