戴飛,焦攀科,程子航,程穎
(1.河北省衛(wèi)生健康委員會(huì)統(tǒng)計(jì)信息中心,河北石家莊 050000;2.石家莊工程職業(yè)學(xué)院,河北石家莊 050000)
現(xiàn)如今的遠(yuǎn)程會(huì)診中大多利用多學(xué)科協(xié)作診治模式的方法進(jìn)行會(huì)診,這種模式也是當(dāng)前醫(yī)療行業(yè)中最重要的治療模式[1],這種診治方法將傳統(tǒng)的以個(gè)人為單位的診療方法轉(zhuǎn)換成以多科室成立小組的形式進(jìn)行治療,這種方式可以更加全面也更加準(zhǔn)確地確診病情和制定治療方案,以此提高治療水平[2],在診治過程中很容易出現(xiàn)患者身患多種疾病,不可避免的需要會(huì)診,因此如何在多學(xué)科模式下將所有遠(yuǎn)程會(huì)診進(jìn)行準(zhǔn)確的分診是目前醫(yī)療中的一大問題[3],就此問題展開研究。
文獻(xiàn)[4]提出基于關(guān)聯(lián)規(guī)則的醫(yī)療遠(yuǎn)程會(huì)診自動(dòng)分診方法,獲取遠(yuǎn)程會(huì)診的分診屬性組合,實(shí)現(xiàn)遠(yuǎn)程會(huì)診自動(dòng)分診,該方法在數(shù)據(jù)傳輸路徑出現(xiàn)沖突時(shí)路徑無法自動(dòng)擴(kuò)展,造成數(shù)據(jù)擁堵,部分正確數(shù)據(jù)被排除,因此分診值過低。文獻(xiàn)[5]提出模糊積分集成重復(fù)訓(xùn)練極限學(xué)習(xí)機(jī)的遠(yuǎn)程會(huì)診自動(dòng)分診方法,該方法運(yùn)用極限學(xué)習(xí)機(jī)多次進(jìn)行單隱含層前饋神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,實(shí)現(xiàn)遠(yuǎn)程會(huì)診自動(dòng)分診,該方法直接利用概率分布實(shí)現(xiàn)遠(yuǎn)程會(huì)診的分診,而不是在采集醫(yī)療數(shù)據(jù)后融合相同數(shù)據(jù)后進(jìn)行分診,因此無法減少需要分診的數(shù)據(jù)數(shù)量,存在分診敏感性低的問題。文獻(xiàn)[6]提出基于緊密度的模糊加權(quán)kNN 醫(yī)療遠(yuǎn)程會(huì)診自動(dòng)分診方法,找出等待劃分的病例樣本所在類別的隸屬度確定出樣本的最終類別,實(shí)現(xiàn)遠(yuǎn)程會(huì)診自動(dòng)分診,該方法冗余數(shù)據(jù)過多,降低系統(tǒng)運(yùn)行時(shí)間,無法均勻分布醫(yī)療數(shù)據(jù)分診,導(dǎo)致CPU 的利用率過高,存在CPU穩(wěn)定性差的問題。
為了解決上述方法中存在的問題,提出多學(xué)科協(xié)作診治模式下遠(yuǎn)程會(huì)診自動(dòng)分診技術(shù)研究。
在進(jìn)行多學(xué)科協(xié)作診治模式下的遠(yuǎn)程會(huì)診時(shí),為完善會(huì)診流程,需要在多學(xué)科的建設(shè)中逐漸完成,導(dǎo)致其中攜帶大量混合學(xué)科的醫(yī)療數(shù)據(jù),因此在合理調(diào)度海量醫(yī)療混合數(shù)據(jù)時(shí),需要建立一個(gè)醫(yī)療遠(yuǎn)程會(huì)診的海量動(dòng)態(tài)數(shù)據(jù)傳輸模型,此模型可對多條路徑上的數(shù)據(jù)特性進(jìn)行分析,當(dāng)數(shù)據(jù)傳輸路徑發(fā)生沖突時(shí),數(shù)據(jù)傳輸模型將普通傳輸路徑自動(dòng)轉(zhuǎn)換成擴(kuò)展式的傳輸路徑[7],在傳輸模型中加入適應(yīng)度函數(shù),形成遠(yuǎn)程會(huì)診的數(shù)據(jù)采集目標(biāo)函數(shù),以此滿足大量醫(yī)療數(shù)據(jù)的自適應(yīng)調(diào)度需求。則數(shù)據(jù)采集的目標(biāo)函數(shù)表達(dá)式為:
式中,f 表示多路徑分布網(wǎng)絡(luò)下的醫(yī)療數(shù)據(jù)安全屬性,a表示采集大量混合學(xué)科醫(yī)療數(shù)據(jù)的開銷代價(jià),t表示采集大量混合學(xué)科醫(yī)療數(shù)據(jù)的時(shí)間間隔,φ表示醫(yī)療數(shù)據(jù)的訪問質(zhì)量。
當(dāng)數(shù)據(jù)采集的約束條件是分布式網(wǎng)絡(luò)路徑的安全性能必須是最高級別時(shí),根據(jù)信道分配原理提出適合醫(yī)療數(shù)據(jù)的適應(yīng)調(diào)度的多學(xué)科醫(yī)療數(shù)據(jù)采集算法[8],并對所有傳輸路徑上的特性進(jìn)行特征分解,獲取出大量混合學(xué)科醫(yī)療數(shù)據(jù)調(diào)度迭代公式為:
式中,g表示醫(yī)療數(shù)據(jù)特征權(quán)值,表示醫(yī)療數(shù)據(jù)權(quán)重值,表示醫(yī)療數(shù)據(jù)特征項(xiàng),表示醫(yī)療數(shù)據(jù)特征空間的維數(shù)。
在醫(yī)療數(shù)據(jù)調(diào)度迭代公式的基礎(chǔ)上得出多條路徑發(fā)生沖突時(shí)的大量混合學(xué)科醫(yī)療數(shù)據(jù)發(fā)送的信道模型,將模型描述成離散系統(tǒng),其公式為:
式中,i表示離散系統(tǒng)內(nèi)含有的i個(gè)簇,xi表示簇中醫(yī)療數(shù)據(jù)的離散度,wi表示簇中醫(yī)療數(shù)據(jù)的相似度。
根據(jù)上述的離散系統(tǒng)公式優(yōu)化醫(yī)療數(shù)據(jù)調(diào)度的優(yōu)先級,同時(shí)對每個(gè)簇內(nèi)的混合學(xué)科醫(yī)療數(shù)據(jù)進(jìn)行采集處理,其采集后的公式為:
式中,ω表示隨機(jī)醫(yī)療樣本數(shù)據(jù),v(t)表示全部醫(yī)療數(shù)據(jù)的信息,x(t)表示醫(yī)療數(shù)據(jù)集群的規(guī)模大小。
在多學(xué)科協(xié)作診治模式下采集到的遠(yuǎn)程會(huì)診醫(yī)療數(shù)據(jù)中含有大量重復(fù)數(shù)據(jù),將數(shù)據(jù)進(jìn)行融合降維后不僅能降低數(shù)據(jù)分類的工作壓力,也能提高分診速度,假設(shè)醫(yī)療數(shù)據(jù)樣本集合記為X,則其集合表達(dá)式為:
式中,n表示醫(yī)療數(shù)據(jù)樣本個(gè)數(shù),sj表示由不同特征向量組成的醫(yī)療數(shù)據(jù)特征樣本,L表示醫(yī)療數(shù)據(jù)特征個(gè)數(shù),Xi表示特征向量。
在實(shí)數(shù)表現(xiàn)形式的基礎(chǔ)上進(jìn)行重復(fù)數(shù)據(jù)的檢測不需要將原始特征醫(yī)療數(shù)據(jù)進(jìn)行轉(zhuǎn)換,因此利用實(shí)數(shù)表示形式進(jìn)行重復(fù)數(shù)據(jù)的檢測,從小到大排列Xi中的所有元素,則特征元素之間的差值公式為:
經(jīng)過上述計(jì)算,可獲取出醫(yī)療數(shù)據(jù)樣本集Xi內(nèi)的子集個(gè)數(shù),并利用子集個(gè)數(shù)構(gòu)建醫(yī)療數(shù)據(jù)特征融合模型。假設(shè)遠(yuǎn)程會(huì)診醫(yī)療數(shù)據(jù)子數(shù)據(jù)集的相應(yīng)類特征值是c,則子數(shù)據(jù)集的標(biāo)識(shí)為:
式中,特征元素中只有一個(gè)元素是L,其中c大于等于1但小于等于L,子數(shù)據(jù)集Xc內(nèi)的特征向量的子集數(shù)是。所有經(jīng)過融合后成為單一樣本的數(shù)據(jù)集只要滿足上述權(quán)重要求即可得到降維后所要提取的遠(yuǎn)程會(huì)診醫(yī)療數(shù)據(jù)。
將多學(xué)科協(xié)作診治模式下遠(yuǎn)程會(huì)診中的重復(fù)數(shù)據(jù)進(jìn)行融合后,其中仍含有一些無效數(shù)據(jù),因此需要對數(shù)據(jù)進(jìn)行有效查詢。由于查詢有效醫(yī)療數(shù)據(jù)的線性樹和濃密樹兩種方法中分別含有查詢有效數(shù)據(jù)性能低和查詢效率低的問題,因此將兩種方法結(jié)合在一起即可完整地查詢有效醫(yī)療數(shù)據(jù)。
兩種查詢方法結(jié)合后會(huì)出現(xiàn)多個(gè)數(shù)據(jù)間的基本關(guān)系,且基本關(guān)系間可以同時(shí)實(shí)施指令,其中鄰近基本關(guān)系之間還含有互相關(guān)系,根據(jù)數(shù)據(jù)間的互相關(guān)系對分類后的醫(yī)療數(shù)據(jù)進(jìn)行有效查詢可縮小醫(yī)療數(shù)據(jù)分類的空間范圍,其查詢過程為:
假設(shè)線性樹和濃密樹查詢方法是一個(gè)多元組,其集合為U=U1,U2,…,Un,且n的取值范圍是[1,-1],若線性樹和濃密樹之間的基本關(guān)系過多時(shí),可通過遞歸原理設(shè)置醫(yī)療數(shù)據(jù)可查詢的上限,其上限公式為:
式中,ko表示線性樹和濃密樹中含有o個(gè)帶有基本關(guān)系的右濃密子樹,hn表示線性樹和濃密樹中每個(gè)基本關(guān)系之間的聯(lián)絡(luò)結(jié)果,sm表示線性樹和濃密樹中含有m個(gè)帶有基本關(guān)系的左濃密子樹。
通過醫(yī)療數(shù)據(jù)可查詢的上限公式,得出醫(yī)療數(shù)據(jù)可查詢的下限公式為:
式中,wh表示線性樹和濃密樹中基本關(guān)系間的穩(wěn)定系數(shù),wk表示線性樹和濃密樹中基本關(guān)系間出現(xiàn)沖突的大小范圍。在分診過程中想要確定其分診技術(shù)是否適合所有環(huán)境,因此需要判斷分診的F值,F(xiàn)值是分診查準(zhǔn)率與召回率的一個(gè)調(diào)和平均比值,F(xiàn) 值越大說明分類器越好,即分診效果越好,其公式為:
通常情況下將混合醫(yī)療數(shù)據(jù)劃分成數(shù)量分類醫(yī)療信息和類型分類醫(yī)療信息,它們分別指的是量值和空間維度,即醫(yī)療數(shù)據(jù)的個(gè)數(shù)和醫(yī)療數(shù)據(jù)的類別,中和兩種數(shù)據(jù)分類方法,即可獲取有效混合醫(yī)療數(shù)據(jù)的分類結(jié)果,則兩者結(jié)合的公式為:
通過求解出的醫(yī)療數(shù)據(jù)查詢結(jié)果,利用粒度計(jì)算方法分類混合醫(yī)療數(shù)據(jù)。若任意數(shù)據(jù)都是一元基本元,則任意數(shù)據(jù)都可利用粒度來描述,當(dāng)存在任意數(shù)據(jù)d,其中d屬于D,且D和d都含有粒度,則可用dmax代表醫(yī)療數(shù)據(jù)的粒度最大值,其支持度是1。因?yàn)榱6却嬖谶m應(yīng)性,所以利用粒度表述醫(yī)療數(shù)據(jù)時(shí),其支持度越小越好,則可得出醫(yī)療數(shù)據(jù)的極小粒度計(jì)算公式為:
式中,表示醫(yī)療數(shù)據(jù)中整體可接受的粒度。
防止出現(xiàn)粒度過大對數(shù)據(jù)分類產(chǎn)生影響,因此對粒度進(jìn)行切分,其切分公式為:
通過上述粒度計(jì)算獲取出混合醫(yī)療數(shù)據(jù)的粒度表現(xiàn)形式,雖然粒度值越高醫(yī)療數(shù)據(jù)的支持度越高,但高粒度容易出現(xiàn)粒度過界的情況,因此需要在粒度可取范圍之內(nèi)自大到小找出相似的粒度值,以此實(shí)現(xiàn)相似數(shù)據(jù)的分類,獲取出遠(yuǎn)程會(huì)診醫(yī)療數(shù)據(jù)的類別,以此精確地劃分醫(yī)療數(shù)據(jù)實(shí)現(xiàn)醫(yī)療分診。
為了驗(yàn)證所提方法的整體有效性,需要在云平臺(tái)Vmmaster 系統(tǒng)中對多學(xué)科協(xié)作診治模式下遠(yuǎn)程會(huì)診自動(dòng)分診方法、文獻(xiàn)[4]方法和文獻(xiàn)[5]方法進(jìn)行F 值、分診敏感性低和CPU穩(wěn)定性的測試。
由圖1中的數(shù)據(jù)可知,在相同環(huán)境下對比三種方法的遠(yuǎn)程會(huì)診分診F 值,無論選取的數(shù)據(jù)量多或少,所提方法的分診F值一直保持在0.8以上,文獻(xiàn)[4]方法和文獻(xiàn)[5]方法的分診F 值均不固定,且低于所提方法的F 值,因?yàn)樗岱椒ㄔ谶M(jìn)行遠(yuǎn)程會(huì)診分診前對遠(yuǎn)程會(huì)診數(shù)據(jù)進(jìn)行了預(yù)處理,因此可在數(shù)據(jù)傳輸路徑出現(xiàn)沖突時(shí)將傳輸路徑自動(dòng)進(jìn)行擴(kuò)展,因此可更大范圍的接受信息,防止正確信息因?yàn)樾畔矶卤慌懦瑥亩岣吡薋值。
圖1 不同方法的F值
敏感性指的是分診正確的會(huì)診病例與全部病例的比值,分析圖2中的數(shù)據(jù)可知,經(jīng)過多次迭代后發(fā)現(xiàn)所提方法的遠(yuǎn)程會(huì)診分診敏感性都在0.9以上,而其他兩種方法的會(huì)診分診敏感性雖然都在0.7 以上,但都遠(yuǎn)遠(yuǎn)低于所提方法,之所以所提方法的分診敏感性如此之高是因?yàn)樵摲椒ㄔ谧罱K進(jìn)行分診前對采集到的數(shù)據(jù)中的相同數(shù)據(jù)進(jìn)行了融合,減少了需要分診的數(shù)據(jù)數(shù)量,以此提高了分診的敏感性。
圖2 不同方法的分診敏感性
在進(jìn)行遠(yuǎn)程會(huì)診時(shí)會(huì)出現(xiàn)海量醫(yī)療數(shù)據(jù)等待分診,目前的分診技術(shù)很容易出現(xiàn)不均衡分配數(shù)據(jù)導(dǎo)致運(yùn)行緩慢,某段時(shí)間的分診數(shù)據(jù)過多或過少,由圖3可知,文獻(xiàn)[4]方法和文獻(xiàn)[5]方法就存在這種問題,因?yàn)槠浞椒ǚ峙鋽?shù)據(jù)不均勻,導(dǎo)致某段時(shí)間CPU利用率過高或過低,而所提方法的CPU利用率在運(yùn)行過程中雖有所波動(dòng)但始終保持在25S~30S之間,因?yàn)樗岱椒ㄔ趯?shí)現(xiàn)醫(yī)療數(shù)據(jù)分診前,通過線性樹和濃密樹查詢方法對遠(yuǎn)程會(huì)診中的數(shù)據(jù)進(jìn)行有效查詢,排除不必要的數(shù)據(jù),加速分診,降低運(yùn)行時(shí)間,均勻分布醫(yī)療數(shù)據(jù)分診,保證CPU的穩(wěn)定性。
圖3 三種方法的CPU使用率
為更加完善現(xiàn)有遠(yuǎn)程分診的自動(dòng)分診方法,提出多學(xué)科協(xié)作診治模式下遠(yuǎn)程會(huì)診自動(dòng)分診方法,該方法首先對采集到遠(yuǎn)程會(huì)診數(shù)據(jù)進(jìn)行了降低維度等預(yù)處理,再利用粒度描述數(shù)據(jù)的方法分類醫(yī)療數(shù)據(jù),從而實(shí)現(xiàn)遠(yuǎn)程分診的自動(dòng)分診,解決了F值低、分診敏感性低和CPU穩(wěn)定性差的問題,更加完善醫(yī)療工作,更加有效地為醫(yī)生與患者服務(wù)。