摘 要:為響應(yīng)“健康中國”建設(shè)號召,文章以專利數(shù)據(jù)為依據(jù)揭示我國智慧健康服務(wù)領(lǐng)域當(dāng)前的研究熱點,探索智慧健康服務(wù)領(lǐng)域發(fā)展趨勢。以Innojoy專利數(shù)據(jù)庫中的智慧健康相關(guān)數(shù)據(jù)為數(shù)據(jù)來源,通過LDA模型對原始語料進行主題識別提取,運用主題強度計算公式得出熱點主題進行分析。智慧健康服務(wù)處于發(fā)展的平穩(wěn)時期,并向著多技術(shù)融合、多部門聯(lián)合的方向發(fā)展,現(xiàn)階段共有智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺、智慧健康信息服務(wù)平臺、智慧醫(yī)療設(shè)備、智慧醫(yī)療文本處理系統(tǒng)四大研究熱點。今后智慧健康服務(wù)的發(fā)展應(yīng)以用戶為中心,提供供需適配的服務(wù),且需不斷完善相關(guān)法律法規(guī)以創(chuàng)造一個規(guī)范有序的發(fā)展環(huán)境。
關(guān)鍵詞:專利數(shù)據(jù);數(shù)據(jù)挖掘;LDA主題模型;智慧健康服務(wù)
中圖分類號:TP391 文獻標(biāo)識碼:A 文章編號:2096-4706(2024)08-0161-06
DOI:10.19850/j.cnki.2096-4706.2024.08.035
0 引 言
自《“健康中國2030”規(guī)劃綱要》發(fā)布,至黨的十九大對“健康中國戰(zhàn)略”作出全面部署,以習(xí)近平同志為中心的黨中央堅持把保障人民健康放在優(yōu)先發(fā)展的戰(zhàn)略位置,從源頭維護人民群眾的生命健康?!丁敖】抵袊?030”規(guī)劃綱要》中指出“要推動‘互聯(lián)網(wǎng)+健康醫(yī)療’服務(wù)、加強健康醫(yī)療大數(shù)據(jù)應(yīng)用體系建設(shè)從而推進醫(yī)療健康大數(shù)據(jù)開放共享、深度挖掘和廣泛應(yīng)用”[1]。隨著人工智能技術(shù)、大數(shù)據(jù)分析技術(shù)、機器學(xué)習(xí)等技術(shù)的不斷發(fā)展進步,中國迎來了數(shù)智化轉(zhuǎn)型的新路徑、新挑戰(zhàn)。充分融合當(dāng)前5G、大數(shù)據(jù)、區(qū)塊鏈等技術(shù),建立集成共享、業(yè)務(wù)協(xié)同的健康信息服務(wù)平臺,實現(xiàn)從醫(yī)療健康服務(wù)到智慧健康服務(wù)的轉(zhuǎn)型,為國民帶來便利的同時滿足國民個性化的健康服務(wù)需求。新興技術(shù)的應(yīng)用給予了智慧健康服務(wù)更豐富的服務(wù)場景,與此同時也給智慧健康服務(wù)提出了更高的要求,如何在快速更新迭代的技術(shù)中找尋關(guān)鍵技術(shù)以及創(chuàng)新技術(shù)是當(dāng)前智慧健康服務(wù)面臨的一個重點難題。專利是技術(shù)情報較有效的載體和來源之一,通過對專利信息的計量,能夠識別技術(shù)領(lǐng)域發(fā)展?fàn)顩r,探查競爭對手及其技術(shù)創(chuàng)新活動和能力,并判斷技術(shù)競爭態(tài)勢[2]。因此本文將基于專利數(shù)據(jù)庫中的專利數(shù)據(jù),應(yīng)用LDA主題模型對其中智慧健康服務(wù)專利進行主題識別并分析當(dāng)前的技術(shù)熱點,了解智慧健康服務(wù)發(fā)展現(xiàn)狀,結(jié)合當(dāng)前政策信息提出建議供參考。
1 相關(guān)研究
1.1 專利數(shù)據(jù)挖掘
專利挖掘是在技術(shù)研發(fā)中,對所取得的技術(shù)成果從技術(shù)和法律層面進行剖析、整理、分析和篩選,從而確定用以申請專利的技術(shù)創(chuàng)新點和技術(shù)方案[3]。當(dāng)前專利挖掘的應(yīng)用主要分為5個方面,即專利知識表示、專利相似度計算、專利聚類、技術(shù)主題識別以及鏈路預(yù)測[4]。在專利知識表示方面,學(xué)者通常采用自然語言處理技術(shù)對專利文本內(nèi)的知識進行編碼識別,如Word2Vec [5]、Sentence-BERT [6]、Context-LDA [7]算法等。專利相似度的計算則主要通過余弦相似度計算,如向姝璇通過結(jié)合專利IPC分類相似度計算以及對獨立權(quán)利要求相似度計算對我國5G領(lǐng)域企業(yè)現(xiàn)有或潛在的競爭對手進行挖掘發(fā)現(xiàn)[8],李家全等人利用知識圖譜的方法計算專利文本之間的相似度來判斷專利是否侵權(quán)[9]。專利聚類以及專利主題識別則分別幫我們解決了如何識別關(guān)鍵技術(shù)集群、如何識別熱門核心技術(shù)主題的問題,以輔助我們掌握專利技術(shù)發(fā)展的態(tài)勢。專利聚類以及專利主題識別常用的方法有LDA算法[10]、深度文本聚類模型[11]、決策樹[12]等。專利鏈路預(yù)測則通過當(dāng)前技術(shù)的關(guān)聯(lián)關(guān)系來預(yù)測網(wǎng)絡(luò)中尚未連接的兩個技術(shù)節(jié)點之間產(chǎn)生鏈接的可能性[13]。
1.2 智慧健康服務(wù)
智慧健康服務(wù)從傳統(tǒng)的健康服務(wù)演變而來,其強調(diào)的是數(shù)智時代中物聯(lián)網(wǎng)技術(shù)、人工智能技術(shù)、云計算技術(shù)等新興技術(shù)在健康服務(wù)中的應(yīng)用。馬費成教授指出智慧健康是一門交叉學(xué)科,涵蓋較多領(lǐng)域,包括“互聯(lián)網(wǎng)醫(yī)療”“移動健康”“智慧醫(yī)療”等概念,其核心都是利用現(xiàn)代化信息技術(shù)和智能技術(shù),對傳統(tǒng)醫(yī)療健康管理模式進行改進[14]。目前國內(nèi)學(xué)者對于智慧健康服務(wù)的研究主要集中于健康大數(shù)據(jù)研究、智慧健康服務(wù)平臺的建設(shè)、智慧健康服務(wù)影響因素研究。隨著在線健康社區(qū)、電子健康檔案、遠(yuǎn)程服務(wù)等方式被人們所接受,個人健康數(shù)據(jù)的存儲和分析成為研究的熱點之一,如利用醫(yī)療大數(shù)據(jù)構(gòu)建人機協(xié)同醫(yī)療案例庫[15]、利用大數(shù)據(jù)對高血壓癥候進行分析[16]。智慧健康服務(wù)平臺的建設(shè)則是以健康大數(shù)據(jù)為基礎(chǔ)建立智能服務(wù)平臺為服務(wù)對象提供一個便利的應(yīng)用平臺,如夏思洋等學(xué)者以多源數(shù)據(jù)融合技術(shù)為基礎(chǔ)構(gòu)建了面向老年人的智慧健康信息服務(wù)系統(tǒng)[17],初佃輝等學(xué)者研發(fā)開放式智能服務(wù)平臺架構(gòu)實現(xiàn)醫(yī)療健康與養(yǎng)老服務(wù)的深度融合[18]。智慧健康服務(wù)影響因素研究以被服務(wù)對象的需求為導(dǎo)向探究影響智慧健康服務(wù)能否被接受的主要因素。
通過上述梳理可發(fā)現(xiàn),當(dāng)前國內(nèi)學(xué)者將專利挖掘應(yīng)用于多領(lǐng)域的技術(shù)主題識別中,但是僅有較少的學(xué)者以專利挖掘為基礎(chǔ)研究智慧健康服務(wù)領(lǐng)域的相關(guān)技術(shù)。因此本文將以專利數(shù)據(jù)庫中的專利文本數(shù)據(jù)為基礎(chǔ),運用LDA主題模型識別專利數(shù)據(jù)中的技術(shù)主題并提取該領(lǐng)域的熱點研究主題進行分析,以掌握當(dāng)前智慧健康服務(wù)領(lǐng)域的研究熱點、發(fā)展現(xiàn)狀,探尋未來研究導(dǎo)向。
2 研究思路及研究方法
2.1 研究思路
本文擬從Innojoy專利數(shù)據(jù)庫檢索得到相關(guān)智慧健康服務(wù)相關(guān)專利發(fā)明數(shù)據(jù),導(dǎo)出專利所對應(yīng)的分類號、摘要、時間等信息,對所得的相關(guān)專利文本進行切分詞、去除停用詞等文本與處理得到原始語料。通過LDA模型對原始語料進行主題識別提取,并運用困惑度指標(biāo)來確定最優(yōu)主題數(shù),根據(jù)提取的主題詞對各主題進行標(biāo)識,最后對主題強度進行計算得到智慧健康服務(wù)領(lǐng)域熱點主題進行分析。
2.2 LDA主題模型
LDA模型是一種無監(jiān)督學(xué)習(xí)技術(shù),通過吉布斯采樣算法識別分析非結(jié)構(gòu)化文本數(shù)據(jù)中的詞語信息對一系列文檔中的主題進行抽象和聚類,是當(dāng)前文本主題挖掘最常用的方法。LDA模型主要包含特征詞、主題、文檔三層結(jié)構(gòu),模型假設(shè)每一文檔均由一定數(shù)量的隱含主題構(gòu)成,每一主題又由一定數(shù)量的特征詞構(gòu)成,并根據(jù)主題對文檔的支持權(quán)重、特征詞對主題的選擇概率來判斷三者之間的關(guān)聯(lián)程度。LDA模型示例圖如圖1所示,其中D是文檔集合。首先從狄利克雷分布α中選取生成文檔d的主題分布θ,再從主題分布θ中選取生成文檔d第n個詞的主題Z,接著從狄利克雷分布β中選取生成主題Z的詞語分布φ,再從詞語分布φ中生成詞語W。重復(fù)以上過程至得到文檔D中每一個特征詞為止。
LDA模型主題的最佳個數(shù)本文將采用困惑度(Perplexity)來進行確定。困惑度通常用于衡量主題模型在新文本數(shù)據(jù)上的擬合程度,是當(dāng)前公認(rèn)判斷最優(yōu)主題數(shù)的重要指標(biāo),其計算式如下:
其中D是測試文檔集合,N是測試文檔數(shù)量,Nd是第d個文檔中單詞的數(shù)量,Wd是第d個文檔中的單詞序列,p(Wd)是模型對文檔Wd的似然概率。困惑度越小則代表模型對樣本文檔集的分類效果越好,反之困惑度越大則模型效果越差。
主題強度通常情況下由一定時間范圍內(nèi)與主題相關(guān)的文檔數(shù)量來表示,主題強度越大則代表當(dāng)前對于該主題的關(guān)注度越高,其熱度也越高,因此通過對主題強度的計算可得出在特定時間內(nèi)的熱點主題,其計算式如下:
其中θ是第d個文檔中第z個主題的比例,Dt是時間段t內(nèi)的文檔數(shù)目,主題閾值計算式如下:
3 實證研究
3.1 數(shù)據(jù)來源
本文以Innojoy專利數(shù)據(jù)庫中的專利數(shù)據(jù)作為數(shù)據(jù)來源,Innojoy專利數(shù)據(jù)庫是集專利文獻技術(shù)信息、法律信息和市場分布信息為一體的專利綜合應(yīng)用平臺。平臺中收錄一百多個國家地區(qū)的專利數(shù)據(jù),具有多字段檢索、同組追蹤、數(shù)據(jù)分析等優(yōu)勢。綜合參考其他學(xué)者的檢索關(guān)鍵詞得到智慧健康服務(wù)領(lǐng)域?qū)@麢z索式:TS =智慧健康or智慧醫(yī)療or移動健康,檢索范圍為中國,共得到3 892條專利數(shù)據(jù),經(jīng)過同族合并以及無關(guān)專利篩除后導(dǎo)出3 872條數(shù)據(jù)。
基于檢索到專利技術(shù)年度公開的數(shù)量繪制如圖2所示的專利年度公開量分布圖。從圖中可發(fā)現(xiàn)智慧健康服務(wù)領(lǐng)域?qū)@夹g(shù)的發(fā)展可分為三個階段。首先,自2007年智慧健康服務(wù)專利出現(xiàn)以來至2012年為專利發(fā)展的初期;2013年至2020年為智慧健康服務(wù)專利發(fā)展的上升階段,隨著各類健康政策的提出與實施,國家對國民健康狀況的重視程度逐漸提升,結(jié)合IBM公司提出的“智慧地球”理念,更多學(xué)者、技術(shù)人員將目光轉(zhuǎn)向智慧健康領(lǐng)域,使得智慧健康成為研究熱點,相關(guān)成果井噴式產(chǎn)出;2021年至2023年為智慧健康服務(wù)專利發(fā)展的平穩(wěn)時期,國民健康狀況依舊是當(dāng)前國家、人民關(guān)注的熱點,因此智慧健康領(lǐng)域的專利數(shù)量仍較大,但是相比于上升階段其專利年度公開量較平均,發(fā)展較平穩(wěn)。
3.2 模型識別結(jié)果
本文采用困惑度指標(biāo)來確定最優(yōu)主題數(shù),利用Python對實驗數(shù)據(jù)進行困惑度計算并得到如圖3所示的不同主題數(shù)量下困惑度的變化情況。從圖中可看出當(dāng)主題數(shù)目達到8以后模型困惑度下降幅度明顯減小且趨于穩(wěn)定,初步確定LDA模型的最優(yōu)主題數(shù)為8。選取主題數(shù)目8,利用pyLDAvis對詞與主題關(guān)系進行可視化展示,如圖4所示,可以看出主題數(shù)目為8時,各主題之間重合較少,區(qū)分度明顯,因此確定最優(yōu)主題數(shù)目為8。
確定主題數(shù)目為8后利用LDA主題模型方法得到如表1所示的8大類主題,并提取了各主題下前25的高頻關(guān)鍵詞。結(jié)合高頻關(guān)鍵詞與智慧健康服務(wù)專利文本將八大類主題歸納為:智慧醫(yī)療調(diào)度技術(shù)、智慧藥品管理技術(shù)、智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺、智慧監(jiān)測技術(shù)、智慧檢測技術(shù)、智慧健康信息服務(wù)平臺、智慧醫(yī)療設(shè)備、智慧醫(yī)療文本處理系統(tǒng)。
基于LDA模型運行所得的文檔-主題分布概率可獲得每個樣本文檔屬于八個不同主題的概率,結(jié)合主題強度計算公式得到各個主題的強度,將其與主題閾值進行比較得到如圖5所示的主題強度圖。
3.3 熱點主題分析
主題強度大于主題閾值即為熱點主題,由此從圖5可得到四個智慧健康服務(wù)專利領(lǐng)域熱點主題,分別為主題2智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺、主題5智慧健康信息服務(wù)平臺、主題6智慧醫(yī)療設(shè)備、主題7智慧醫(yī)療文本處理系統(tǒng)。結(jié)合熱點主題下的專利文獻以及相關(guān)參考文獻,對熱點主題進行分析。
3.3.1 智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺
醫(yī)療大數(shù)據(jù)是涉及與自然人醫(yī)療健康相關(guān)的多種數(shù)據(jù),在數(shù)智化的大背景下包含互聯(lián)網(wǎng)+醫(yī)療健康、物聯(lián)網(wǎng)+醫(yī)療健康和人工智能+醫(yī)療健康等新興領(lǐng)域所產(chǎn)生的與健康領(lǐng)域相關(guān)的數(shù)據(jù)[19]。智慧醫(yī)療數(shù)據(jù)大平臺的建立對于用戶、健康服務(wù)提供相關(guān)機構(gòu)均有利。首先,用戶可以通過可佩戴的便攜裝置,如心率環(huán)、計步器等,快速直接地從自身健康數(shù)據(jù)中知曉當(dāng)前健康狀況,并以此為依據(jù)合理調(diào)整飲食作息以保護自己身體健康,維持一個良好的身體狀況。其次,對于如醫(yī)療機構(gòu)、研發(fā)機構(gòu)等相關(guān)服務(wù)提供者,通過大數(shù)據(jù)服務(wù)平臺中共享的多樣化健康數(shù)據(jù)了解當(dāng)前特定區(qū)域內(nèi)甚至國家范圍內(nèi)居民的健康狀況,以此來做出及時、精準(zhǔn)的決策,從而為國民健康保駕護航。然而醫(yī)療大數(shù)據(jù)除了具有海量、異構(gòu)性、多源性等大數(shù)據(jù)所具有的特點之外,還有隱私性、專業(yè)性的特點,這都對醫(yī)療大數(shù)據(jù)平臺的構(gòu)建提出了較高的要求。智慧醫(yī)療大數(shù)據(jù)平臺的建設(shè)需要多部門聯(lián)合,需要信息技術(shù)機構(gòu)來構(gòu)建平臺并維護平臺的運行,需要醫(yī)療機構(gòu)提供相關(guān)專業(yè)知識的指導(dǎo),需要平臺用戶共享健康數(shù)據(jù)。如何聯(lián)合多部門綜合利用新興技術(shù)、法律、政策文本加強對智慧醫(yī)療大數(shù)據(jù)平臺的宣傳以及建設(shè)完善,使健康大數(shù)據(jù)真正成為保護國民健康的資源是今后醫(yī)療大數(shù)據(jù)平臺發(fā)展的方向與重點。
3.3.2 智慧健康信息服務(wù)平臺
隨著國民對自身健康狀況重視度的不斷提升,其對健康信息的需求也逐漸加強,為滿足國民需求,健康信息服務(wù)平臺隨之產(chǎn)生。健康信息服務(wù)平臺是一個集健康管理、疾病預(yù)防、健康教育、醫(yī)療服務(wù)功能為一體的綜合性服務(wù)平臺,智慧健康信息服務(wù)平臺則是在健康信息平臺的基礎(chǔ)上融入前沿技術(shù),如云計算、人工智能、5G等,致力于為國民提供個性化、專業(yè)的健康服務(wù),其中在線健康服務(wù)平臺,如好大夫在線、丁香園等,是當(dāng)前人們常用的具有代表性的智慧健康信息服務(wù)平臺之一。融合多種新興技術(shù)構(gòu)建一個真正智慧的健康信息服務(wù)平臺是當(dāng)前研究的熱點。夏思洋等學(xué)者融合利用區(qū)塊鏈、云計算等智能技術(shù)構(gòu)建了基于多源數(shù)據(jù)的智慧健康信息服務(wù)系統(tǒng)框架,旨在為老年人提供更加智慧化的健康服務(wù)[17];高靖超等學(xué)者結(jié)合用戶畫像、聚類分析、情感分析等多種深度學(xué)習(xí)算法,探究在線醫(yī)療社區(qū)健康焦慮用戶情感及其他特征表現(xiàn),為健康服務(wù)平臺提供較全面的用戶畫像標(biāo)簽類型解釋,為其管理提供指導(dǎo)意見[20]。然而信息真?zhèn)坞y辨、服務(wù)質(zhì)量參差不齊是當(dāng)前平臺中仍存在并將長期存在的問題,如何融合多元技術(shù)構(gòu)建一個高質(zhì)量、可靠的智慧健康信息服務(wù)平臺、推進線上線下服務(wù)共同發(fā)展是其今后發(fā)展的重點。
3.3.3 智慧醫(yī)療設(shè)備
智慧醫(yī)療設(shè)備是將智能傳感器、大數(shù)據(jù)、云計算等新興技術(shù)與傳統(tǒng)醫(yī)療設(shè)備相結(jié)合,主要用于監(jiān)測、診斷、分析患者病情的設(shè)備,如可穿戴康復(fù)設(shè)備、細(xì)胞形態(tài)學(xué)識別裝置、遠(yuǎn)程手術(shù)機器人等。智慧醫(yī)療設(shè)備突破了時空限制能為患者提供更加精準(zhǔn)、全面的服務(wù),如AI智能機器人的出現(xiàn)能幫助醫(yī)生對患者病況進行更加準(zhǔn)確、高效的判斷。通過智能手環(huán)等可佩戴設(shè)備監(jiān)測用戶心率、血壓、血氧等指標(biāo),及時發(fā)現(xiàn)其存在的健康問題進而來預(yù)防疾病的發(fā)生。與此同時智慧醫(yī)療設(shè)備產(chǎn)生收集的健康數(shù)據(jù)能夠為醫(yī)療大數(shù)據(jù)平臺提供其所需數(shù)據(jù),不僅能監(jiān)測分析設(shè)備數(shù)據(jù)、優(yōu)化設(shè)備使用效果,還能監(jiān)測分析用戶健康數(shù)據(jù)為其提供個性化的服務(wù)。順應(yīng)國家“十四五規(guī)劃”中構(gòu)建基于5G的應(yīng)用場景和產(chǎn)業(yè)生態(tài),在智慧醫(yī)療領(lǐng)域展開試點示范的要求,賦能智慧醫(yī)療設(shè)備建立從預(yù)防到篩查到診斷再到護理的全過程醫(yī)療生態(tài)系統(tǒng)是當(dāng)前發(fā)展的重要方向。然而醫(yī)療設(shè)備資源在地區(qū)間分布不均衡仍是當(dāng)前存在的問題,如何真正做到醫(yī)療設(shè)備資源下沉,使不同地區(qū)人民都能平等享受智慧醫(yī)療設(shè)備是當(dāng)前急需解決的問題之一。
3.3.4 智慧醫(yī)療文本處理系統(tǒng)
醫(yī)療文本包括患者電子病歷、診斷報告等,不同于其他類型的文本,醫(yī)療文本中包含大量具有特殊含義的醫(yī)療命名實體(例如疾病、癥狀、身體部位等),且醫(yī)療文本通常以非結(jié)構(gòu)化的形式出現(xiàn)[21],對其進行識別處理產(chǎn)生了一定的困難。然而醫(yī)療文本作為醫(yī)療大數(shù)據(jù)平臺的數(shù)據(jù)來源,在較多領(lǐng)域中都起著不可或缺的作用,如通過對同一患者不同時間段病歷的識別分析可以知曉其既往病史、家族病史等為醫(yī)生提供決策支持、對特定時間段內(nèi)患者病因識別可以判斷傳染病暴發(fā)跡象,提前進行防控。醫(yī)療領(lǐng)域的命名實體識別方法經(jīng)歷了從基于規(guī)則的方法到基于傳統(tǒng)機器學(xué)習(xí)的方法再到現(xiàn)在基于深度學(xué)習(xí)的方法的轉(zhuǎn)變[22]。機器深度學(xué)習(xí)技術(shù)的不斷發(fā)展完善從一定程度上解決了醫(yī)療文本識別困難的問題,成為當(dāng)前學(xué)術(shù)界研究的熱點。許浪等學(xué)者利用BERT訓(xùn)練詞向量結(jié)合CNN和BiLSTM構(gòu)建了醫(yī)學(xué)文本分類模型,完善了傳統(tǒng)分析忽略上下文關(guān)系的不足,提高了醫(yī)療文本分類的準(zhǔn)確率[23]。林令德等學(xué)者提出預(yù)訓(xùn)練模型多層動態(tài)融合方法對醫(yī)療文本中的醫(yī)療實體進行準(zhǔn)確識別,并從中獲取有價值的信息,為健康服務(wù)相關(guān)人員提供決策支持[24]。
4 結(jié) 論
本研究利用LDA主題識別模型對智慧健康服務(wù)領(lǐng)域?qū)@麛?shù)據(jù)進行挖掘識別,探究了智慧健康服務(wù)領(lǐng)域當(dāng)前的研究熱點及其發(fā)展趨勢。研究得出智慧醫(yī)療大數(shù)據(jù)服務(wù)平臺、智慧健康信息服務(wù)平臺、智慧醫(yī)療設(shè)備、智慧醫(yī)療文本處理系統(tǒng)四大類主題為當(dāng)前該領(lǐng)域研究熱點,且正在向著多技術(shù)融合、多部門聯(lián)合的方向發(fā)展。但是當(dāng)前較多智慧健康服務(wù)領(lǐng)域的發(fā)展仍局限于相關(guān)機構(gòu)本身,存在忽視用戶真正需求的問題,相關(guān)法律法規(guī)依然存在欠缺。未來的發(fā)展需深入用戶群體,以用戶為中心,綜合利用當(dāng)前前沿技術(shù)深入挖掘用戶需求以提供與其需求相適配的健康服務(wù)。此外,參考國內(nèi)外相關(guān)案例結(jié)合國內(nèi)智慧健康領(lǐng)域背景構(gòu)建完善的法律框架體系,為智慧健康服務(wù)的發(fā)展提供規(guī)范有序的環(huán)境。
參考文獻:
[1] 中國政府網(wǎng).“健康中國2030”規(guī)劃綱要 [EB/OL].(2016-10-28)[2023-11-24].https://www.sport.gov.cn/n10503/c772727/content.html.
[2] 崔遵康,李丹陽,徐小婷,等.糧食作物生物育種技術(shù)全球創(chuàng)新布局與競爭態(tài)勢研究——基于核心專利數(shù)據(jù)挖掘的視角 [J].中國農(nóng)業(yè)科技導(dǎo)報,2022,24(5):1-14.
[3] 陳亮,陳利利,許海云,等.國內(nèi)外專利挖掘研究進展與前瞻 [J].圖書情報工作,2024,68(2):110-133.
[4] 韋婷婷,馮丹鈺,宋世領(lǐng),等.技術(shù)機會發(fā)現(xiàn)領(lǐng)域?qū)@诰蚍椒ㄑ芯渴鲈u [J].情報學(xué)報,2023,42(10):1238-1250.
[5] 張鈺玲,彭麗徽,張艷豐,等.基于專利數(shù)據(jù)挖掘的我國智慧應(yīng)急關(guān)聯(lián)技術(shù)識別與發(fā)展趨勢研究 [J].情報科學(xué),2023,41(8):139-146.
[6] 阮光冊,周萌葳.基于Sentence-BERT的專利技術(shù)主題聚類研究——以人工智能領(lǐng)域為例 [J].情報雜志,2024,43(2):110-117.
[7] 伊惠芳,劉細(xì)文.一種專利技術(shù)主題分析的IPC語境增強Context-LDA模型研究 [J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2021,5(4):25-36.
[8] 向姝璇,李睿.基于專利文獻整體相似度計算的競爭對手發(fā)現(xiàn)——以5G領(lǐng)域為例 [J].情報理論與實踐,2021,44(5):100-105.
[9] 李家全,李寶安,游新冬,等.基于專利知識圖譜的專利術(shù)語相似度計算研究 [J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2020,4(10):104-112.
[10] 孫瑞英,陳宜泓.基于LDA主題模型的國內(nèi)智慧閱讀研究熱點及發(fā)展導(dǎo)向研判 [J].圖書館建設(shè),2023(3):82-93+103.
[11] 謝士堯,王小梅.基于深度文本聚類的論文與專利數(shù)據(jù)融合方法研究 [J/OL].數(shù)據(jù)分析與知識發(fā)現(xiàn):1-17(2023-09-28).http://kns.cnki.net/kcms/detail/10.1478.g2.20230927.0845.002.html.
[12] 陳浩,張夢毅,程秀峰.融合主題模型與決策樹的跨地區(qū)專利合作關(guān)系發(fā)現(xiàn)與推薦——以廣東省和武漢市高校專利庫為例 [J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2021,5(10):37-50.
[13] YOON B ,MAGEE C L. Exploring Technology Opportunities by Visualizing Patent Information Based on Generative Topographic Mapping and Link Prediction [J].Technological Forecasting and Social Change,2018,132(7):105-117.
[14] 馬費成,周利琴.面向智慧健康的知識管理與服務(wù) [J].中國圖書館學(xué)報,2018,44(5):4-19.
[15] 顧天陽,趙旺,曹林.跨組織醫(yī)療健康大數(shù)據(jù)聚合與案例知識推理方法研究 [J].情報科學(xué),2022,40(3):40-44.
[16] 馬金輝,王志飛,謝雁鳴,等.基于大型電子醫(yī)療數(shù)據(jù)的高血壓中醫(yī)證候分析 [J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2014,20(9):1236-1238.
[17] 夏思洋,朱學(xué)芳.面向老年人的智慧健康信息服務(wù)系統(tǒng)研究——基于多源數(shù)據(jù)融合技術(shù) [J/OL].情報科學(xué),2023:1-14(2023-09-18).http://kns.cnki.net/kcms/detail/22.1264.G2.20230915.1530.027.html.
[18] 初佃輝,吳軍,劉志中,等.智能化醫(yī)養(yǎng)融合服務(wù)平臺關(guān)鍵技術(shù)及應(yīng)用研究 [J].智能系統(tǒng)學(xué)報,2021,16(5):972-988.
[19] 李岳峰,胡建平,張學(xué)高.中國健康醫(yī)療大數(shù)據(jù)資源目錄體系與技術(shù)架構(gòu)研究 [J].中國衛(wèi)生信息管理雜志,2019,16(3):249-256.
[20] 高靖超,彭麗徽,張艷豐,等.在線醫(yī)療社區(qū)健康焦慮用戶畫像模型構(gòu)建及實證研究 [J].圖書情報工作,2023,67(16):124-134.
[21] 閆璟輝,宗成慶,徐金安.中文醫(yī)療文本中的嵌套實體識別方法 [J/OL].軟件學(xué)報,2023:1-13(2023-08-28).https://doi.org/10.13328/j.cnki.jos.006927.
[22] 楊波,孫曉虎,黨佳怡,等.面向醫(yī)療問答系統(tǒng)的大語言模型命名實體識別方法 [J].計算機科學(xué)與探索,2023,17(10):2389-2402.
[23] 許浪,李代偉,張海清,等.基于神經(jīng)網(wǎng)絡(luò)的醫(yī)療文本分類研究 [J].計算機工程與科學(xué),2023,45(6):1116-1122.
[24] 林令德,劉納,徐貞順,等.基于多層動態(tài)融合的中文醫(yī)療命名實體識別 [J/OL].計算機工程與應(yīng)用,2023:1-13(2023-08-25).http://kns.cnki.net/kcms/detail/11.2127.TP.20230825.1143.006.html.
作者簡介:陳天怡(1998—),女,漢族,浙江寧波人,碩士研究生在讀,研究方向:健康信息。
收稿日期:2024-01-26
Research on the Development Trend of Chinese Intelligent Health Services
Based on Patent Data Mining
CHEN Tianyi
(School of Public Administration, Xiangtan University, Xiangtan 411105, China)
Abstract: In order to respond to the call for the construction of “Healthy China”, this paper reveals the current research hotspots in the field of intelligent health services in China based on patent data, and explores the development trend of intelligent health services field. The intelligent health related data in Innojoy patent database is taken as the data source, and the original corpus is extracted for topic recognition by LDA model. It applies the topic intensity formula to derive hot topics and analyzes them. The intelligent health services is at a plateau of development, and is moving towards multi-technology convergence and multi-sectoral integration. The intelligent medical Big Data service platform, intelligent health information service platform, intelligent medical equipment, and intelligent medical text processing system are the four research hotspots at present. The development of intelligent health services should be user-centered, providing services that match supply and demand, and it also need to continuously improve relevant laws and regulations to create a standardized and orderly development environment.
Keywords: patent data; data mining; LDA topic model; intelligent health services