阿依圖爾蓀·喀迪爾
摘要:電子病歷不僅對(duì)門診、住院患者治療具有指導(dǎo)與干預(yù)作用,更能以數(shù)字化形式呈現(xiàn)當(dāng)前醫(yī)療服務(wù)內(nèi)容與記錄,為患者提供更為高效的醫(yī)療服務(wù)。為進(jìn)一步強(qiáng)化深度學(xué)習(xí)能力,提取有效醫(yī)療信息?;诖?,結(jié)合深度學(xué)習(xí)計(jì)算方式,對(duì)電子病歷醫(yī)療命名實(shí)體的識(shí)別工作進(jìn)行分析,借助BP網(wǎng)絡(luò)構(gòu)建基本數(shù)據(jù)模型,希望借助已標(biāo)注病歷數(shù)據(jù)進(jìn)行再次訓(xùn)練與測(cè)試,強(qiáng)化電子病歷命名實(shí)體識(shí)別工作開展,為現(xiàn)代醫(yī)療服務(wù)提供精準(zhǔn)服務(wù)。
關(guān)鍵詞:深度學(xué)習(xí);電子病歷;命名實(shí)體識(shí)別
中圖分類號(hào):TP393? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)16-0195-03
隨著科技水準(zhǔn)不斷攀升,醫(yī)療行業(yè)獲得全新發(fā)展契機(jī),在醫(yī)療行業(yè)中,傳統(tǒng)病歷模式逐漸被優(yōu)化為電子病歷。電子病歷集合計(jì)算機(jī)技術(shù)、智能產(chǎn)品,含有大量患者信息與專業(yè)醫(yī)療知識(shí)。對(duì)疾病治療與疾病分析具有重要關(guān)聯(lián),對(duì)國(guó)內(nèi)醫(yī)療水準(zhǔn)提升具有積極作用。對(duì)命名實(shí)體識(shí)別進(jìn)行分析,國(guó)外命名實(shí)體識(shí)別出現(xiàn)較早、相對(duì)成熟,具有良好監(jiān)督與學(xué)習(xí)效果。對(duì)國(guó)內(nèi)命名實(shí)體識(shí)別進(jìn)行分析,國(guó)內(nèi)起步相對(duì)較晚。但是,在科技迅速發(fā)展過程中,命名實(shí)體識(shí)別取得較好成果。為進(jìn)一步提升命名實(shí)體識(shí)別能力,充分發(fā)揮電子病歷價(jià)值,本文結(jié)合深度學(xué)習(xí)中的LSTM與MLP對(duì)電子病歷進(jìn)行基本識(shí)別,希望能夠進(jìn)一步提升深度學(xué)習(xí)電子病歷識(shí)別有效性,為現(xiàn)代醫(yī)療服務(wù)發(fā)展做出重要貢獻(xiàn)。
1電子病歷醫(yī)療命名實(shí)體識(shí)別以及深度學(xué)習(xí)基本概述
1.1命名實(shí)體識(shí)別基本概述
對(duì)命名實(shí)體識(shí)別進(jìn)行分析,命名實(shí)體識(shí)別具有信息提取、機(jī)器翻譯、句法分析作用,是現(xiàn)代應(yīng)用領(lǐng)域重要部分。將其與電子病歷相結(jié)合,不僅能容納大量的人名、時(shí)間、地點(diǎn)與日期、百分比等,更能明確實(shí)體類別,解決醫(yī)院傳統(tǒng)病歷應(yīng)用存在的問題。相對(duì)于英語的識(shí)別方式,在國(guó)內(nèi)醫(yī)療電子病歷識(shí)別過程中,漢語識(shí)別難度更大。因此,應(yīng)結(jié)合深度學(xué)習(xí)計(jì)算方式,構(gòu)建專屬國(guó)內(nèi)電子病歷實(shí)體識(shí)別方式,應(yīng)用不同模型,提升電子病歷醫(yī)療命名實(shí)體識(shí)別能力,進(jìn)一步推動(dòng)現(xiàn)代醫(yī)療服務(wù)工作開展。
1.2深度學(xué)習(xí)基本概述
對(duì)深度學(xué)習(xí)進(jìn)行分析,深度學(xué)習(xí)為一種機(jī)器學(xué)習(xí)方式,此種學(xué)習(xí)方式,在實(shí)際應(yīng)用過程中,主要通過神經(jīng)網(wǎng)絡(luò)加以實(shí)現(xiàn),對(duì)“深度”一詞的解釋,可以將“深度”理解為不同的神經(jīng)網(wǎng)絡(luò)分層,傳統(tǒng)的機(jī)器學(xué)習(xí)深度網(wǎng)絡(luò)多為2-3層,而深度學(xué)習(xí)網(wǎng)絡(luò)輻射廣,甚至可以達(dá)到成百上千層。深度學(xué)習(xí)方式,相對(duì)于單一的計(jì)算方式,此種計(jì)算方式更為準(zhǔn)確、迅速,能夠在極短時(shí)間內(nèi)處理大量數(shù)據(jù)信息,并得到精準(zhǔn)數(shù)據(jù)結(jié)果。究其原因,主要源于深度學(xué)習(xí)集合大數(shù)據(jù)、強(qiáng)大的計(jì)算資源以及訓(xùn)練模式。而CNN[1]作為深度學(xué)習(xí)中的基本圖像處理方式,也是較為常見的神經(jīng)網(wǎng)絡(luò),此種神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的提取與分層能力,能夠進(jìn)行重復(fù)提取,從而針對(duì)想要解決的問題,進(jìn)行多次實(shí)驗(yàn)。只要具有充分訓(xùn)練時(shí)間,就能夠解決復(fù)雜問題,將邏輯不清晰、關(guān)系不明確問題進(jìn)行分化,最終得到精準(zhǔn)數(shù)據(jù)結(jié)果,為結(jié)論研究提供強(qiáng)有力數(shù)據(jù)支持。
2命名實(shí)體識(shí)別所應(yīng)用的MLP、LSTM神經(jīng)網(wǎng)絡(luò)計(jì)算方式
2.1 MLP神經(jīng)網(wǎng)絡(luò)計(jì)算方式
MLP[2]為多層神經(jīng)網(wǎng)絡(luò)簡(jiǎn)稱,亦被稱之為人工神經(jīng)網(wǎng)絡(luò)。MLP神經(jīng)網(wǎng)絡(luò)包含多個(gè)節(jié)點(diǎn),其中,以ANN結(jié)構(gòu)為例,每個(gè)節(jié)點(diǎn)之間相互銜接。在不同階段的銜接部分,這些節(jié)點(diǎn)根據(jù)不同關(guān)系與全新,對(duì)偏置處加以關(guān)聯(lián),從而解決一些特定問題。在此種應(yīng)用過程中,應(yīng)給予偏置開展特定訓(xùn)練,并借助多個(gè)輸入與輸出層,構(gòu)建完善神經(jīng)網(wǎng)絡(luò),從而對(duì)神經(jīng)網(wǎng)絡(luò)內(nèi)部多層信息以及隱藏內(nèi)容加以識(shí)別。
2.2 LMTS神經(jīng)網(wǎng)絡(luò)計(jì)算方式
對(duì)LMTS進(jìn)行分析,此種方式,更是適合處理間隔時(shí)間較長(zhǎng)的問題。在短期記憶網(wǎng)絡(luò)中,R為輸入層、輸出層以及隱藏層。其中,隱藏層主要借助RNN隱藏處理方式,對(duì)不同結(jié)構(gòu)進(jìn)行計(jì)算,并將得到的結(jié)果與新的數(shù)值一起作用于隱藏層,從而形成最終的輸出結(jié)構(gòu)。在此項(xiàng)計(jì)算方式中,既能展現(xiàn)基本的RNN結(jié)構(gòu),又能對(duì)RNN結(jié)構(gòu)進(jìn)行改進(jìn)。LSTM優(yōu)化RNN結(jié)構(gòu),解決RNN依賴的問題,將歷史信息作為不同介質(zhì)進(jìn)行傳遞,確保數(shù)據(jù)傳遞過程不受任何因素影響,這也是LSTM計(jì)算重要內(nèi)容。
3電子病歷醫(yī)療實(shí)體是被模型構(gòu)建
對(duì)最初序列標(biāo)注進(jìn)行分析,最初的序列需要?jiǎng)邮诌M(jìn)行標(biāo)注,不僅需要投入大量人力資源、投入較高成本,整體標(biāo)注效率較低。因此,在不斷發(fā)展過程中,電子病歷中的標(biāo)注工作逐漸引入神經(jīng)網(wǎng)絡(luò),對(duì)不同的特征進(jìn)行選取,并將其作為輸入框架,構(gòu)建基本識(shí)別模型。其中,輸入層最主要作用,就是將不同患者名稱、疾病名稱以及治療記錄輸入其中,與此同時(shí),在輸入完成后,將每個(gè)輸入轉(zhuǎn)換為所對(duì)應(yīng)的序號(hào)。而查找層可以通過ID轉(zhuǎn)換多為向量,在這一層進(jìn)行查找工作,將每個(gè)索引作為多維向量。為了獲得更多上下關(guān)聯(lián)信息,應(yīng)在字前以及字后,對(duì)不同向量進(jìn)行拼接,從而為網(wǎng)絡(luò)層輸入工作奠定良好基礎(chǔ)。對(duì)命名實(shí)體識(shí)別網(wǎng)絡(luò)層加以分析,在命名實(shí)體識(shí)別網(wǎng)絡(luò)層中,主要應(yīng)用LSTM與MLPS[3]神經(jīng)網(wǎng)絡(luò)計(jì)算特征,輸入相關(guān)向量,并在不斷轉(zhuǎn)換過程中,對(duì)每一個(gè)輸出的內(nèi)容進(jìn)行標(biāo)準(zhǔn)與分類,從而實(shí)現(xiàn)電子病歷命名實(shí)體識(shí)別工作,在不同的計(jì)算方式與控制網(wǎng)格中,能夠根據(jù)維特比計(jì)算方式,得到最佳識(shí)別方式,獲得最終明確標(biāo)注序列,并借助網(wǎng)絡(luò)層所提供的數(shù)據(jù)內(nèi)容,獲得更為精準(zhǔn)序列過程,獲得精準(zhǔn)識(shí)別方式。
4基于深度學(xué)習(xí)的命名實(shí)體識(shí)別實(shí)驗(yàn)
4.1訓(xùn)練集
在命名實(shí)體識(shí)別中,所采取的方式主要為隔準(zhǔn)訓(xùn)練方法,為了進(jìn)一步降低最小化帶來的函數(shù)損失,因此,在命名實(shí)體識(shí)別實(shí)驗(yàn)中,應(yīng)當(dāng)結(jié)合最新計(jì)算方式,結(jié)合優(yōu)化AdaGrad[4]算法,充分運(yùn)用minibathc傳播方式,對(duì)傳播算法進(jìn)行深入研究,獲得最終的bathc數(shù)值。
4.2實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
要想更好地發(fā)揮命名實(shí)體識(shí)別效果,在實(shí)際工作中,應(yīng)當(dāng)以醫(yī)院內(nèi)部病歷為主,對(duì)這些電子病歷進(jìn)行實(shí)名標(biāo)注,將其中的150分電子病歷作為訓(xùn)練集,將50分作為測(cè)試級(jí),并在實(shí)際的測(cè)試過程中,選擇適合本次測(cè)試框架結(jié)構(gòu),本文選擇谷歌提供的TensorFlow為主,選擇Python此類開發(fā)軟件,并選用Windows系統(tǒng)。在此次實(shí)驗(yàn)中,以三個(gè)指標(biāo)為衡量標(biāo)準(zhǔn),分別為準(zhǔn)確率、召回率以及F1數(shù)值,作為重要的衡量實(shí)體識(shí)別標(biāo)志指標(biāo),實(shí)驗(yàn)公式如下所示: