亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于卷積神經(jīng)網(wǎng)絡(luò)的健康大數(shù)據(jù)智能分析方法研究

        2021-06-14 13:02:24白賀伊
        電子設(shè)計(jì)工程 2021年10期

        白賀伊

        (西安廣播電視大學(xué),陜西西安 710002)

        隨著我國(guó)醫(yī)療衛(wèi)生事業(yè)的不斷發(fā)展,越來(lái)越多的醫(yī)療健康數(shù)據(jù)被存儲(chǔ)在數(shù)據(jù)庫(kù)中。這些數(shù)據(jù)具有規(guī)模大、增長(zhǎng)迅速、結(jié)構(gòu)復(fù)雜等特點(diǎn)[1-3]。目前,我國(guó)對(duì)醫(yī)療健康大數(shù)據(jù)的挖掘與應(yīng)用正處于起步階段,醫(yī)療數(shù)據(jù)的深度挖掘與分析關(guān)系到全民健康的發(fā)展,如何利用人工智能技術(shù)對(duì)龐大的醫(yī)療數(shù)據(jù)進(jìn)行智能化分析,挖掘其中有效信息,從而更好地服務(wù)于醫(yī)護(hù)人員與廣大人民群眾,是目前醫(yī)療事業(yè)發(fā)展與數(shù)據(jù)應(yīng)用面臨的重要挑戰(zhàn)[4]。

        針對(duì)上述所提到的問(wèn)題,該文基于人工智能深度學(xué)習(xí)領(lǐng)域中的卷積神經(jīng)網(wǎng)絡(luò)技術(shù),提出了一種適用于對(duì)醫(yī)療健康大數(shù)據(jù)進(jìn)行智能化分析的方法。該方法通過(guò)詞向量訓(xùn)練、CNN特征學(xué)習(xí)以及疾病風(fēng)險(xiǎn)評(píng)估等步驟,完成對(duì)各種疾病的風(fēng)險(xiǎn)評(píng)估,能夠利用不同疾病的訓(xùn)練數(shù)據(jù)集得到與之匹配的分析模型。實(shí)驗(yàn)結(jié)果表明,該文提出的方法以及建立的模型能夠?qū)崿F(xiàn)對(duì)不同數(shù)據(jù)集、不同疾病的智能化分析,能更好地適用于常見疾病的風(fēng)險(xiǎn)評(píng)估,具有較高實(shí)用性與可靠性。隨著日益增加的醫(yī)療健康大數(shù)據(jù)處理與分析的需求,該文所提方法具有應(yīng)用價(jià)值,對(duì)其進(jìn)一步的發(fā)展與完善也將更有意義。

        1 卷積神經(jīng)網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種建立在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)上,包含卷積結(jié)構(gòu)的深度學(xué)習(xí)算法[5]。與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,卷積神經(jīng)網(wǎng)絡(luò)在傳統(tǒng)多層神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入了特征學(xué)習(xí)部分,利用空間相對(duì)關(guān)系減少參數(shù)數(shù)目以此提高算法的訓(xùn)練性能。具體實(shí)現(xiàn)方式就是在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的全連接層前面增加部分連接的卷積層。卷積神經(jīng)網(wǎng)絡(luò)解決了人工智能領(lǐng)域中的一個(gè)重要問(wèn)題就是將復(fù)雜問(wèn)題簡(jiǎn)化,最大程度減少參數(shù)數(shù)量,進(jìn)而大幅提升算法表現(xiàn)性能。

        典型的卷積神經(jīng)網(wǎng)絡(luò)通常由卷積層(C)、池化層(S)以及全連接層(F)所組成。其結(jié)構(gòu)如圖1所示[6-8]。

        圖1 典型卷積神經(jīng)網(wǎng)絡(luò)

        其中,卷積層負(fù)責(zé)提取輸入數(shù)據(jù)的特征;池化層負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行降維;全連接層則實(shí)現(xiàn)最終處理結(jié)果的輸出。通常在實(shí)際使用中,CNN 中包含有若干卷積層與池化層,且采用相互交替的形式進(jìn)行設(shè)計(jì),即卷積層后面連接著池化層,池化層后面又連著卷積層,上述交替循環(huán)的結(jié)構(gòu)以池化層結(jié)尾,最后再連接至全連接層結(jié)束整個(gè)網(wǎng)絡(luò)。卷積層與池化層的堆疊次數(shù)越多,CNN 所提取出的特征就越復(fù)雜、表達(dá)能力就越強(qiáng),分類效果越明顯[9],進(jìn)而使得利用其所實(shí)現(xiàn)的功能和效果就越好。

        1)卷積層

        卷積層又稱之為特征提取層,是卷積神經(jīng)網(wǎng)絡(luò)CNN 架構(gòu)中最為關(guān)鍵的一部分,同時(shí)也是區(qū)別于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)最為顯著的特征[10]。該層包括多個(gè)卷積核濾波器,各卷積核與輸入數(shù)據(jù)或特征圖進(jìn)行卷積運(yùn)算來(lái)實(shí)現(xiàn)特征提取的功能。為了降低神經(jīng)網(wǎng)絡(luò)的過(guò)擬合,卷積層通常采用局部連接的方式。即每個(gè)神經(jīng)元只需連接附近的局部區(qū)域,而不需要與特征圖中的所有特征點(diǎn)進(jìn)行連接。同時(shí),為盡可能減少網(wǎng)絡(luò)運(yùn)行參數(shù)。在卷積運(yùn)算中,使每個(gè)卷積核濾波器的參數(shù)實(shí)現(xiàn)共享,可使最后得到的結(jié)果泛化能力更強(qiáng)。

        卷積過(guò)程如圖2所示。其中,輸入的是大小為5×5的數(shù)據(jù)信息,卷積濾波器的大小為3×3,步長(zhǎng)為1,對(duì)應(yīng)的卷積表達(dá)式[11]如式(1)所示。

        圖2 卷積運(yùn)算過(guò)程

        其中,yj表示第j個(gè)輸出特征圖,(f)代表所用到的激活函數(shù),*代表卷積操作,pi為需要進(jìn)行卷積的第i個(gè)特征圖,wij為當(dāng)前卷積核所對(duì)應(yīng)的權(quán)值,bj為當(dāng)前輸出特征圖的偏置。

        2)池化層

        池化層也稱為下采樣層,該層主要是用來(lái)對(duì)前面卷積層所得到的高維特征進(jìn)行降維處理,從而大幅減少網(wǎng)絡(luò)的參數(shù)數(shù)量,有效提高神經(jīng)網(wǎng)絡(luò)的運(yùn)行速度以及避免數(shù)據(jù)間過(guò)擬合的情況發(fā)生。目前,常用的池化方法為最大池化(max-pooling)和平均池化(mean-pooling)[12-14]。

        兩種池化方式對(duì)應(yīng)的過(guò)程如圖3 所示。在該示意圖中,所需池化的數(shù)據(jù)大小假設(shè)為4×4,池化核為2×2,步長(zhǎng)通常與池化核的長(zhǎng)或?qū)捪嗤?,設(shè)置為2,最后所得到兩種分別由最大值與平均值所組成2×2 的池化結(jié)果。綜合考慮兩種方式的優(yōu)缺點(diǎn),該文的仿真實(shí)驗(yàn)將采用最大池化的方法對(duì)數(shù)據(jù)進(jìn)行處理。

        圖3 池化過(guò)程示意圖

        3)全連接層

        輸入的數(shù)據(jù)經(jīng)過(guò)多重卷積層與池化層之后,提取出表達(dá)能力強(qiáng)且十分抽象的特征表示[15]。全連接層作為整個(gè)卷積神經(jīng)網(wǎng)絡(luò)的最后一層,其最重要的功能就是將提取到的特征按照一定規(guī)則進(jìn)行整合,同時(shí)映射到樣本標(biāo)記空間,形成相應(yīng)的一維向量,最后經(jīng)過(guò)層內(nèi)激活函數(shù)進(jìn)行輸出。

        2 大數(shù)據(jù)智能分析模型

        2.1 健康數(shù)據(jù)特征學(xué)習(xí)

        1)詞向量及文本表示

        利用卷積神經(jīng)網(wǎng)絡(luò)算法對(duì)醫(yī)療健康數(shù)據(jù)進(jìn)行處理時(shí),首先需要將文本數(shù)據(jù)中包括的各詞利用詞向量方法進(jìn)行數(shù)字化處理。

        詞向量法可以簡(jiǎn)單理解為通過(guò)建立詞表將文本數(shù)據(jù)中各詞與詞表中向量一一對(duì)應(yīng)的方法[16]。如圖4所示,n個(gè)詞60 維的詞向量,這些詞向量組合成為一個(gè)詞表矩陣。

        圖4 詞向量法示意圖

        目前,詞向量法大體可以分為離散表示法和分布式表示法兩類。其中,離散表示法是一種基于規(guī)則或者統(tǒng)計(jì)的簡(jiǎn)單方法,將每個(gè)詞表示為一個(gè)長(zhǎng)向量,并且該向量中有且只有一個(gè)維度的值為1,其余值則全部為0。該方法的缺點(diǎn)在于所建立的詞表矩陣規(guī)模一般較大,而且不能較好地表示各詞之間的相對(duì)關(guān)系,因此不滿足該文研究的要求。分布式表示法則是通過(guò)訓(xùn)練將各詞表示為一個(gè)定長(zhǎng)的連續(xù)稠密向量,圖5 所示為利用分布式表示法所建立的詞表以及“頭疼”“頭暈”等詞所對(duì)應(yīng)的詞向量表示。相較于離散表示法,該方法能夠較優(yōu)地表示文本數(shù)據(jù)各詞之間的相似關(guān)系,同時(shí)在有限維度下可以包含更多的信息。為此文中使用分布式表示法,對(duì)醫(yī)療數(shù)據(jù)中各詞進(jìn)行數(shù)字化處理。

        圖5 分布式表示法示意圖

        2)CNN 設(shè)計(jì)及詞向量訓(xùn)練

        該文所設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)共5 層:卷積層1、池化層1、卷積層2、池化層2、全連接層,用來(lái)進(jìn)行醫(yī)療健康數(shù)據(jù)的詞向量訓(xùn)練及最后的疾病風(fēng)險(xiǎn)評(píng)估。

        進(jìn)行詞向量訓(xùn)練時(shí),要求訓(xùn)練的醫(yī)療文本數(shù)據(jù)語(yǔ)料的純度越高越好,即訓(xùn)練數(shù)據(jù)應(yīng)具有較強(qiáng)的專業(yè)性。該文用從某三甲醫(yī)院數(shù)據(jù)庫(kù)中提取的近10 年來(lái)所有臨床記錄作為詞向量訓(xùn)練的原始數(shù)據(jù)。在訓(xùn)練過(guò)程中,CNN 所有相關(guān)參數(shù)定義為集合φ,φ中參數(shù)首先全部隨機(jī)初始化,然后利用梯度下降法對(duì)參數(shù)進(jìn)行更新,直到最終參數(shù)使得所對(duì)應(yīng)的對(duì)數(shù)似然函數(shù)值達(dá)到最大為止,所用到的公式如式(2)所示。

        式中,A為訓(xùn)練樣本數(shù)據(jù)集,class 為訓(xùn)練樣本數(shù)據(jù)的正確分類,若用γ代表學(xué)習(xí)率,則梯度下降法更新參數(shù)的公式如式(3)所示。

        2.2 健康大數(shù)據(jù)分析模型

        該文基于卷積神經(jīng)網(wǎng)絡(luò)所建立的健康大數(shù)據(jù)智能分析模型如圖6 所示。

        圖6 健康大數(shù)據(jù)分析模型

        在該模型里,數(shù)據(jù)庫(kù)中保存著醫(yī)院進(jìn)行診治的所有醫(yī)療數(shù)據(jù)。其中,包括患者的自述病情、醫(yī)生的問(wèn)診、體格檢查、各項(xiàng)化驗(yàn)檢查結(jié)果、服用藥品、治療方案以及最終的診斷結(jié)果等。該模型利用數(shù)據(jù)庫(kù)中的歷史醫(yī)療文本數(shù)據(jù)不斷進(jìn)行自學(xué)習(xí)與優(yōu)化,最終得到的訓(xùn)練模型用來(lái)實(shí)現(xiàn)對(duì)新傳入健康數(shù)據(jù)的智能分析以及疾病的風(fēng)險(xiǎn)評(píng)估。

        模型主要由詞向量訓(xùn)練、CNN 特征學(xué)習(xí)以及疾病風(fēng)險(xiǎn)評(píng)估3 個(gè)模塊所組成。詞向量訓(xùn)練模塊負(fù)責(zé)將數(shù)據(jù)庫(kù)中的專業(yè)醫(yī)療歷史數(shù)據(jù)進(jìn)行預(yù)處理,并用處理后的數(shù)據(jù)作為語(yǔ)料進(jìn)行文本數(shù)據(jù)的數(shù)字化表示及詞向量的訓(xùn)練;CNN 特征學(xué)習(xí)模塊負(fù)責(zé)將訓(xùn)練后的詞向量輸入到CNN 中,進(jìn)行分析模型的學(xué)習(xí)與訓(xùn)練,最后得到效果最優(yōu)的健康大數(shù)據(jù)分析模型;疾病風(fēng)險(xiǎn)評(píng)估模塊則是利用訓(xùn)練好的模型對(duì)新輸入數(shù)據(jù)進(jìn)行健康評(píng)估,并輸出最終結(jié)果。

        3 實(shí)驗(yàn)測(cè)試

        3.1 數(shù)據(jù)集選取

        為了驗(yàn)證該文所提方法在醫(yī)療健康大數(shù)據(jù)分析中的有效性,與國(guó)內(nèi)某三甲醫(yī)院合作,從其中心數(shù)據(jù)庫(kù)中選取了近十年該醫(yī)院冠心病、肺部感染、腦梗死以及高血壓等4 種常見慢性疾病的醫(yī)療數(shù)據(jù),組成以下4 種樣本數(shù)據(jù)集。

        A1:該數(shù)據(jù)集中包含1 457 名患者就診記錄、主述病情、生命體征等醫(yī)療數(shù)據(jù),其中984 個(gè)冠心病患者數(shù)據(jù),473 個(gè)非冠心病患者數(shù)據(jù)。隨機(jī)挑選85%作為模型訓(xùn)練數(shù)據(jù),剩下數(shù)據(jù)用來(lái)測(cè)試。

        A2:該數(shù)據(jù)集中包含2 083 名患者問(wèn)診記錄、主述病情等醫(yī)療數(shù)據(jù),其中1 128 個(gè)肺部感染患者數(shù)據(jù),955 個(gè)非肺部感染患者數(shù)據(jù)。隨機(jī)挑選85%作為模型訓(xùn)練數(shù)據(jù),剩下數(shù)據(jù)用來(lái)測(cè)試。

        A3:該數(shù)據(jù)集中包含1 074 名患者就診記錄、治療方案、化驗(yàn)結(jié)果等醫(yī)療數(shù)據(jù),其中537 個(gè)腦梗死患者數(shù)據(jù),537 個(gè)非腦梗死患者數(shù)據(jù)。隨機(jī)挑選85%作為模型訓(xùn)練數(shù)據(jù),剩下數(shù)據(jù)用來(lái)測(cè)試。

        A4:該數(shù)據(jù)集中包含1 074 名患者就診記錄、化驗(yàn)結(jié)果等醫(yī)療數(shù)據(jù),其中537 個(gè)腦梗死患者數(shù)據(jù),537 個(gè)高血壓患者數(shù)據(jù)。隨機(jī)挑選85 %作為模型訓(xùn)練數(shù)據(jù),剩下數(shù)據(jù)用來(lái)測(cè)試。該數(shù)據(jù)集為腦梗死與高血壓的對(duì)比數(shù)據(jù)集,這樣設(shè)置的原因在于兩者具有相似的發(fā)病癥狀,且大部分腦梗死患者同時(shí)伴有高血壓,極大增加了疾病風(fēng)險(xiǎn)評(píng)估難度。

        3.2 實(shí)驗(yàn)及結(jié)果

        進(jìn)行實(shí)驗(yàn)時(shí),首先需要確定CNN 訓(xùn)練卷積滑動(dòng)窗口的大小,為此,設(shè)置窗口大小為2~8,以步長(zhǎng)2 進(jìn)行滑動(dòng),分析討論窗口大小對(duì)準(zhǔn)確率、召回率等風(fēng)險(xiǎn)評(píng)估指標(biāo)的影響,數(shù)據(jù)集使用A1與A2集。實(shí)驗(yàn)結(jié)果如圖7 所示。

        圖7 滑動(dòng)窗口對(duì)評(píng)估指標(biāo)的影響

        由圖7 可以看出,當(dāng)窗口大小設(shè)置為6 時(shí),兩個(gè)數(shù)據(jù)集對(duì)應(yīng)的各項(xiàng)風(fēng)險(xiǎn)評(píng)估指標(biāo)均較優(yōu)于其他窗口設(shè)置。因此,后面的實(shí)驗(yàn)也將CNN 滑動(dòng)窗口大小設(shè)置為6。

        利用選定的滑動(dòng)窗口大小與數(shù)據(jù)集中的訓(xùn)練數(shù)據(jù),建立基于卷積神經(jīng)網(wǎng)絡(luò)的健康大數(shù)據(jù)智能分析模型,并用剩余數(shù)據(jù)作為測(cè)試數(shù)據(jù),各數(shù)據(jù)集對(duì)應(yīng)的各項(xiàng)疾病風(fēng)險(xiǎn)評(píng)估指標(biāo)結(jié)果,如表1 所示。

        表1 疾病風(fēng)險(xiǎn)評(píng)估結(jié)果

        分析表1 可知,該文所提出的基于卷積神經(jīng)網(wǎng)絡(luò)的健康大數(shù)據(jù)智能分析方法,適用于對(duì)多種常見疾病的風(fēng)險(xiǎn)評(píng)估。對(duì)A1、A2 與A3 數(shù)據(jù)集的測(cè)試實(shí)驗(yàn)中,準(zhǔn)確率、召回率以及精確度三項(xiàng)評(píng)估結(jié)果均可達(dá)到90 %以上。同時(shí)也可以看出,使用A4對(duì)比數(shù)據(jù)集進(jìn)行的疾病風(fēng)險(xiǎn)評(píng)估結(jié)果雖略低于其他數(shù)據(jù)集,但是也可以達(dá)到較高的水平。綜上所述,各數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果充分驗(yàn)證了所提方法的有效性、可靠性及通用性。同時(shí)也說(shuō)明,該方法在分析相關(guān)聯(lián)疾病中已取得較優(yōu)的效果,但仍有一定的進(jìn)步空間。

        4 結(jié)束語(yǔ)

        該文通過(guò)介紹卷積神經(jīng)網(wǎng)絡(luò)CNN 基本理論[7-18],提出了一種醫(yī)療健康大數(shù)據(jù)智能分析方法。該方法將CNN 文本分析技術(shù)運(yùn)用于疾病風(fēng)險(xiǎn)評(píng)估中,且不同的疾病特征提取使用相同的方法,保證了所提方法的通用性。不同數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果說(shuō)明,該文的方法能夠較優(yōu)地適用于常見疾病的風(fēng)險(xiǎn)評(píng)估,具有較高的可靠性。同時(shí),該方法在進(jìn)一步研究與分析關(guān)聯(lián)疾病中仍有較大的提升空間。

        人妻中文字幕一区二区视频| 精品乱码一区二区三区四区| 人妻色综合网站| 免费观看又污又黄的网站| 国产精品三级在线专区1| 91精品国产综合久久青草| 久久久精品国产亚洲av网麻豆| 日本精品少妇一区二区三区| 色欲av自慰一区二区三区| 亚洲精品国产品国语在线app| 青青草视频在线观看9| 人妻熟妇乱又伦精品视频| 好屌草这里只有精品| 久久久国产精品免费无卡顿| 色偷偷亚洲精品一区二区| 日本一级二级三级不卡| 精品无码国产自产拍在线观看 | 97人妻精品一区二区三区男同| 黑人巨大精品欧美一区二区| 国产日韩在线播放观看| 一区二区日本影院在线观看| 成人av资源在线观看| 粗大的内捧猛烈进出少妇| 欧美婷婷六月丁香综合色| 一区二区三区婷婷中文字幕| av中国av一区二区三区av | 日韩av无卡无码午夜观看| 人妻少妇被粗大爽视频| 国产成人综合亚洲看片| 日韩另类在线| 精品蜜臀国产av一区二区| 蜜臀av在线观看| 国产白嫩美女在线观看| 亚洲精品2区在线观看| 男女18视频免费网站| 亚洲av成人无码网站大全| 粗大挺进尤物人妻一区二区| 国产自拍一区在线视频| 欧美精品亚洲精品日韩专区| 可以免费在线看黄的网站| 狠狠久久av一区二区三区|