亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于風(fēng)險(xiǎn)處理機(jī)制的醫(yī)療數(shù)據(jù)挖掘算法研究

        2014-08-16 01:08:46范爍楠
        關(guān)鍵詞:數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)挖掘病情

        范爍楠

        (廣東省第二中醫(yī)院,廣東 廣州510095)

        近年來,針對醫(yī)療IT信息化系統(tǒng)產(chǎn)生的海量數(shù)據(jù)信息無法得到高效利用的問題,為了提高醫(yī)療IT系統(tǒng)中對病情數(shù)據(jù)信息的高效深度控制,國內(nèi)外學(xué)者們做了深入研究與分析,提出一系列醫(yī)療數(shù)據(jù)處理算法,形成一些新型的、高效的醫(yī)療數(shù)據(jù)挖掘結(jié)構(gòu)模型,例如應(yīng)用于醫(yī)療結(jié)構(gòu)診斷分析的C4.5決策控制樹算法。然而過于精確地衡量尺碼的缺陷阻礙了此算法在醫(yī)療IT系統(tǒng)數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用與拓展。另一種是在醫(yī)療數(shù)據(jù)挖掘領(lǐng)域研究較深的關(guān)聯(lián)規(guī)則算法,此算法的原理是利用不同特征關(guān)系的數(shù)據(jù)信息規(guī)則項(xiàng)進(jìn)行挖掘研究,現(xiàn)已廣泛應(yīng)用于醫(yī)學(xué)臨床領(lǐng)域。目前典型的關(guān)聯(lián)規(guī)則算法主要有Apriori和FP-growth方法。但在低符合率的條件下,關(guān)聯(lián)規(guī)則算法會(huì)產(chǎn)生過多無用或冗余規(guī)則信息,而且存在可識別程度與效率過低的問題。

        目前,基于安全風(fēng)險(xiǎn)參數(shù)與比值概率的醫(yī)療數(shù)據(jù)挖掘也已經(jīng)應(yīng)用于IT系統(tǒng)模型中。在此前提下,參考文獻(xiàn)[1-2]都已設(shè)計(jì)出基于最優(yōu)化安全風(fēng)險(xiǎn)結(jié)構(gòu)模型數(shù)據(jù)挖掘算法,然而其缺陷都是冗余數(shù)據(jù)信息過多,且數(shù)據(jù)模型與信息展示過于復(fù)雜。

        在上述研究成果的基礎(chǔ)之上,本文設(shè)計(jì)出一種基于風(fēng)險(xiǎn)處理機(jī)制的醫(yī)療數(shù)據(jù)挖掘算法MRPM(Medical Risk Processing Mechanism),引入病情特征碼值,使用權(quán)重參數(shù)抽取及病情有關(guān)的安全風(fēng)險(xiǎn)、預(yù)防與診斷因素。該算法在醫(yī)療IT系統(tǒng)數(shù)據(jù)挖掘與分析中數(shù)據(jù)信息冗余度較低、效率高,并且展現(xiàn)方式更加立體、直觀。

        1 相關(guān)研究

        1.1 相關(guān)算法

        1.1.1 最優(yōu)化安全風(fēng)險(xiǎn)模型算法

        病情種類情況從醫(yī)療數(shù)據(jù)信息角度可以分為惡性與良性兩種。模型一般被說明為:特征碼值的集合,最優(yōu)化安全風(fēng)險(xiǎn)模型獲取的結(jié)果是惡性,而其預(yù)防與診斷模型出現(xiàn)的結(jié)果是良性。針對此種情況,參考文獻(xiàn)[3]提出了一種MORE算法,用于得到最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型。

        MORE算法一方面采取部分支持度挖掘使用頻率較高的數(shù)據(jù)結(jié)構(gòu)模型,再采用病理學(xué)中對應(yīng)于安全風(fēng)險(xiǎn)指標(biāo)項(xiàng)得到最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型。為了使模型更加直觀,本文通過病情特征碼值的長度設(shè)置操作模型坐標(biāo)值項(xiàng),該模型滿足反單調(diào)原則。

        1.1.2 醫(yī)療數(shù)據(jù)挖掘算法

        基于最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型盡管能識別典型病情數(shù)據(jù)結(jié)構(gòu),但其結(jié)構(gòu)存在明顯的誤區(qū),影響醫(yī)療IT系統(tǒng)病情診斷環(huán)節(jié)。針對這一缺陷,本文設(shè)計(jì)了一種基于風(fēng)險(xiǎn)處理機(jī)制(包含最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防能力)的醫(yī)療數(shù)據(jù)挖掘算法。此算法創(chuàng)造性地加入病情特征碼值,形成了最優(yōu)化風(fēng)險(xiǎn)集合與預(yù)防集合。并采用權(quán)重參數(shù)對每個(gè)集合進(jìn)行度量,使集合中每個(gè)病情特征碼值的權(quán)重參數(shù)與病情數(shù)據(jù)信息使用頻率構(gòu)成正比函數(shù)關(guān)系,從而體現(xiàn)出每個(gè)病情特征碼值對醫(yī)療診斷與預(yù)防方面貢獻(xiàn)程度[4]。

        1.2 MRPM算法

        相關(guān)符號的定義如下:m1是最優(yōu)化安全風(fēng)險(xiǎn)結(jié)構(gòu)模型的數(shù)量;m2是最優(yōu)化預(yù)防結(jié)構(gòu)模型的數(shù)量;spt是部分支持度的參數(shù)值;m1*spt是初始化安全風(fēng)險(xiǎn)集合的期望使用頻率參數(shù)標(biāo)準(zhǔn)值;m2*spt是初始化預(yù)防集合期望使用頻率參數(shù)標(biāo)準(zhǔn)值;R1、R2是初始化安全風(fēng)險(xiǎn)與預(yù)防集合中病情特征碼值數(shù)量;R1′、R2′是非初始化安全風(fēng)險(xiǎn)與預(yù)防集合中病情特征碼值數(shù)量。為了方便,分別使用 IRS、IPS、RS、PS代表初始化安全風(fēng)險(xiǎn)與預(yù)防集合以及非初始化狀態(tài)的安全風(fēng)險(xiǎn)與預(yù)防集合,RFS、PFS分別表示安全風(fēng)險(xiǎn)與預(yù)防使用頻率指標(biāo)項(xiàng),RSM、PSM分別表示安全風(fēng)險(xiǎn)分?jǐn)?shù)矩陣與預(yù)防分?jǐn)?shù)矩陣 (RSM、PSM分別對應(yīng)RS、PS中每個(gè)病情特征碼值參數(shù)項(xiàng))。

        若 IRS=[IRi1,IRi2,…,IRiR1]T、IPS=[IPi1,IPi2,…,IPiR2]T,對應(yīng)的 IRFS=[IRf1,IRf2, …,IRfR1]T、IPFS=[IPf1,IPf2, …,IPfR2]T。其中集合滿足以下特性:

        (1)IRf1≥IRf2≥…≥IRfR1≥m1*spt

        (2)IPf1≥IPf2≥…≥IPfR2≥m2*spt

        若IRS與IPS有交集,且不為空,因?yàn)?IRS與 IPS彼此矛盾,因而需要將其公共特征值參數(shù)鏟除,則可以得到包括RS、PS、RFS、PFS集合,它們之間的相互關(guān)系如下:RS?IRS;RFS?IRFS;PS?IPS 以 及 PFS?IPFS。 若RS=[Ri1,Ri2,… ,RiR1]T、PS=[Pi1,Pi2,… ,PiR2]T, 對 應(yīng) 于 RS、PS 的 RFS=[Rf1,Rf2,…,RfR1]T、PFS=[Pf1,Pf2,…,PfR2]T。 其中滿足以下特性:

        (3)Rf1≥Rf2≥…≥RfR1≥m1*spt

        (4)Pf1≥Pf2≥ … ≥PfR2≥m2*spt

        RSM與PSM則滿足以下特性:

        若病情特征碼值權(quán)重參數(shù)≥式(5)中第一項(xiàng)與第二項(xiàng)之和,則可以判定病者存在一定安全風(fēng)險(xiǎn),與之相對應(yīng),當(dāng)病情特征碼值權(quán)重參數(shù)≥式(6)中第一項(xiàng)與第二項(xiàng)之和,則可以判定病者暫無安全風(fēng)險(xiǎn)。

        MRPM算法中包含兩個(gè)核心函數(shù)機(jī)制,一個(gè)產(chǎn)生(IRS、IPS),另一個(gè)產(chǎn)生帶有病情特征碼值權(quán)重參數(shù)的(RS、PS)。這兩個(gè)函數(shù)的機(jī)制原理分析如下。

        1.2.1 函數(shù) 1:產(chǎn)生(IRS、IPS)

        輸入?yún)?shù):最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型、m1*spt、m2*spt;輸出參數(shù):IRS 與 IPS。

        (IRS、IPS)輸出過程如下:

        (1)得到最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型,計(jì)算出初始化與非初始化安全風(fēng)險(xiǎn)集合的期望使用頻率參數(shù)標(biāo)準(zhǔn)值 m1*spt、m2*spt。

        (2)對病情特征碼值進(jìn)行使用頻率統(tǒng)計(jì),過濾其中期望使用頻率值小于期望使用頻率參數(shù)標(biāo)準(zhǔn)值。

        (3)對統(tǒng)計(jì)的期望使用頻率值進(jìn)行降序排列,其中IRS由最優(yōu)化安全風(fēng)險(xiǎn)數(shù)據(jù)結(jié)構(gòu)模型中病情特征碼值參數(shù)項(xiàng)構(gòu)成,IPS由最優(yōu)化預(yù)防數(shù)據(jù)結(jié)構(gòu)模型中病情特征碼值參數(shù)項(xiàng)構(gòu)成。

        盡管函數(shù)1得到(IRS、IPS),然而它們之間的公共特征參數(shù)項(xiàng)會(huì)給安全風(fēng)險(xiǎn)與預(yù)防機(jī)制帶來數(shù)據(jù)誤差,因此需要預(yù)先鏟除。

        1.2.2 函數(shù) 2:產(chǎn)生(RS、PS)

        輸 入 參 數(shù) : (IRS、IPS); 輸 出 參 數(shù) : (RS、PS、RSM、PSM)。 (RS、PS、RSM、PSM)輸出的過程如下:

        (1)鏟除(IRS、IPS)的公共特征參數(shù)項(xiàng)。

        (2)重新對病情特征碼值進(jìn)行使用頻率統(tǒng)計(jì),且降序排列,得到 RS=IRS、PS=IPS。

        (3)依次計(jì)算RS和PS的病情特征碼值權(quán)重參數(shù),獲取 RSM、PSM。

        步驟(3)過程是通過 1.2節(jié)的步驟(5)、(6)推導(dǎo)得出的,其中100為總權(quán)重參數(shù)值。

        2 測試結(jié)果與應(yīng)用分析

        本文使用了兩組UCI數(shù)據(jù)庫中取得的醫(yī)療數(shù)據(jù)信息基準(zhǔn)集合以及最典型的最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型[5],采用對比論證方式進(jìn)行測試應(yīng)用與分析,其中數(shù)據(jù)信息說明如表1所示。

        表1 UCI醫(yī)療數(shù)據(jù)信息說明

        2.1 安全風(fēng)險(xiǎn)與預(yù)防模型對比分析

        由UCI醫(yī)療數(shù)據(jù)信息說明中可知,本文依次使用了類比率為30的免疫系統(tǒng)功能衰退與類比率為4的淋巴癌示例進(jìn)行測試,為了保證實(shí)驗(yàn)的廣泛性,使用了不同的類比分布概率。兩種醫(yī)療數(shù)據(jù)信息集合分別進(jìn)行了最小熵離散化與隔離分布處理,數(shù)據(jù)信息集合中的spt的最小值分別為7%和33%,病情特征碼參數(shù)值度量分別為L=6、L=7,相對安全風(fēng)險(xiǎn)參數(shù)最小值為1.2。

        在取得最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型以及從核心函數(shù)機(jī)制中輸出的病情特征碼參數(shù)項(xiàng)的前提下,采用MRPM算法在醫(yī)療數(shù)據(jù)信息中深度挖掘帶有權(quán)重參數(shù)值的安全風(fēng)險(xiǎn)與預(yù)防集合。

        為了對比最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型、最典型的安全風(fēng)險(xiǎn)和預(yù)防數(shù)據(jù)結(jié)構(gòu)模型以及 (RS、PS)中的病情特征碼參數(shù)值,當(dāng)數(shù)據(jù)源為免疫系統(tǒng)功能衰退時(shí),與最優(yōu)化安全風(fēng)險(xiǎn)和預(yù)防數(shù)據(jù)結(jié)構(gòu)模型相關(guān)的病情特征碼值分別是334和194,典型性安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型涉及的病情特征碼值分別是13和4。相類似,當(dāng)數(shù)據(jù)源為淋巴癌時(shí),與最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型相關(guān)的病情特征碼值分別是714和296,典型性安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型涉及的病情特征碼值分別是45和57,而RS、PS中涉及的病情特征碼值分別是13和4。

        上述病情特征碼值對比結(jié)果說明:在最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型相關(guān)的病情特征碼值、典型性安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型涉及的病情特征碼值遠(yuǎn)遠(yuǎn)大于(RS、PS)中的相關(guān)病情特征碼值。其中帶有權(quán)重參數(shù)值越大,病情特征碼值影響程度就越高,對病情影響也越大,反之一樣。從而表達(dá)了(RS、PS)能夠深度挖掘出與病情最具有關(guān)聯(lián)[6]的安全風(fēng)險(xiǎn)及預(yù)防因子。

        2.2 (RS、PS)中每個(gè)病情特征碼值的權(quán)重參數(shù)

        對于病情特征碼值而言,其內(nèi)部的權(quán)重參數(shù)出自于(RS、PS)中的百分比率。它能夠判定其病情特碼值的影響程度,并且也能夠通過它來觀察病者病情的安全風(fēng)險(xiǎn)權(quán)重參數(shù)與預(yù)防權(quán)重參數(shù)。MRPM算法在免疫系統(tǒng)功能衰退數(shù)據(jù)信息集合中的 RS、PS如圖 1、圖 2所示,其中spt=0.06,L=5,圖中下面一欄統(tǒng)一是病情特征碼值。

        圖1 RS中病情特征碼值權(quán)重參數(shù)

        從圖1可以得出結(jié)論:RS中最大的兩個(gè)病情特征碼值權(quán)重參數(shù)是immune_surgery=r(18.315 0)和query_hypoimmune=r(12.087 9)。所以,相對于免疫系統(tǒng)功能衰退,兩個(gè)最大的病情特征碼值的權(quán)重之和為30.402 9。依據(jù)上述推理論證說明此病者的病情特征碼值的權(quán)重參數(shù)之和≥30.402 9,此病情患有免疫系統(tǒng)功能衰退的安全風(fēng)險(xiǎn);但是在PS中,最大的兩個(gè)病情特征碼值權(quán)重參數(shù)分別是 immune_surgery=p(23.7 624)、immunty=p(20.792 1)。可知其權(quán)重參數(shù)之和為44.554 5。因此,若病者病情特征碼值的權(quán)重參數(shù)<44.554 5,則患有免疫系統(tǒng)功能衰退的概率較高。

        圖2 PS中病情特征碼值權(quán)重參數(shù)

        在最優(yōu)化安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型及最具典型的安全風(fēng)險(xiǎn)與預(yù)防數(shù)據(jù)結(jié)構(gòu)模型的基礎(chǔ)之上,本文在醫(yī)療數(shù)據(jù)挖掘中創(chuàng)造性地引入了病情特征碼值,并對其設(shè)置相關(guān)權(quán)重參數(shù),且通過權(quán)重參數(shù)判定其病情特征碼值的安全風(fēng)險(xiǎn)與預(yù)防影響程度,對醫(yī)療數(shù)據(jù)信息進(jìn)行深度挖掘。測試結(jié)果顯示,所設(shè)計(jì)出的MRPM算法可以深度挖掘具有典型性質(zhì)的病情特征碼值,且展示立體、直觀,對醫(yī)療工作者提供了更加有效的參考價(jià)值。

        [1]Wang Guoyin.Rough reduction in algebra view and information view[J].International Journal of Intelligent System,2003,18(3):679-688.

        [2]葉明全,伍長榮,胡學(xué)剛.基于粗糙集的醫(yī)療數(shù)據(jù)挖掘研究與應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(21):232-237.

        [3]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社,2003.

        [4]KANTARDZIC M.Data mining concept,models,methods and algorithms[M].IEEE Press,2002,12(4):223-263.

        [5]張俊鵬,賀建峰,馬磊.基于最優(yōu)風(fēng)險(xiǎn)與預(yù)防模型的醫(yī)療數(shù)據(jù)挖掘算法[J].計(jì)算機(jī)工程,2011,37(22):33-37.

        [6]Li Jiuyong,F(xiàn)u Waichee,F(xiàn)AHEY P.Mining risk patterns in medical data[C].Proceeding of the 7thACM SIGKDD International Conference on Knowledge Discovery in Data Mining,New York,USA:ACM Press,2005:770-775.

        猜你喜歡
        數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)挖掘病情
        冠心病支架后病情穩(wěn)定,何時(shí)能停藥
        不戒煙糖友病情更難控制
        中老年保健(2021年7期)2021-12-02 16:50:22
        低GI飲食模式或能顯著改善糖尿病病情
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        “翻轉(zhuǎn)課堂”教學(xué)模式的探討——以《數(shù)據(jù)結(jié)構(gòu)》課程教學(xué)為例
        高職高專數(shù)據(jù)結(jié)構(gòu)教學(xué)改革探討
        中國市場(2016年45期)2016-05-17 05:15:48
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        不寐的病情觀察和護(hù)理
        TRIZ理論在“數(shù)據(jù)結(jié)構(gòu)”多媒體教學(xué)中的應(yīng)用
        亚洲精品国产一二三无码AV| 亚洲av精品一区二区三区| 亚洲伊人色欲综合网| 四虎成人免费| 亚洲区1区3区4区中文字幕码| 国产亚洲精品在线视频| 夜夜躁狠狠躁日日躁2022| 亚洲av色无码乱码在线观看| 国产欧美激情一区二区三区| 亚洲中文字幕一区二区三区多人| 豆国产96在线 | 亚洲| 精品久久久久久久久久中文字幕| 欧美高清视频一区| 黄页免费人成网址大全| 久久人人爽人人爽人人片av高请 | √最新版天堂资源在线| 日本久久一级二级三级| 国产偷国产偷亚洲高清视频 | 乱码午夜-极国产极内射| 国产好片日本一区二区三区四区| 日韩精品中文字幕一区二区| av无码av天天av天天爽| 黄色资源在线观看| 蜜桃av区一区二区三| 免费人成视频网站在线不卡| 亚洲成av人片在线观看ww| 亚洲AⅤ无码片一区二区三区| 在线观看视频亚洲| 涩涩国产在线不卡无码| 美女脱掉内裤扒开下面让人插| 国精品人妻无码一区免费视频电影| 日韩精品无码一区二区三区免费| 久久亚洲中文字幕精品一区四| 国产一区二区三区在线大屁股| 成人毛片无码一区二区三区| 四虎精品成人免费观看| 91久久国产精品综合| 日本丰满少妇裸体自慰| 内射后入在线观看一区| 国产激情视频免费观看| 国产毛片av最新视频|