亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工神經(jīng)網(wǎng)絡(luò)在肺癌風(fēng)險(xiǎn)預(yù)測(cè)中的研究與應(yīng)用

        2018-01-04 11:35:20陳國旺蔣進(jìn)李帆王大龍
        計(jì)算機(jī)時(shí)代 2018年11期
        關(guān)鍵詞:人工神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)

        陳國旺 蔣進(jìn) 李帆 王大龍

        摘 要: 在現(xiàn)代醫(yī)療衛(wèi)生系統(tǒng)中,主要從預(yù)防、診斷、治療三個(gè)方面對(duì)疾病進(jìn)行處理。尤其對(duì)于癌癥這類疾病,早期預(yù)防的效果遠(yuǎn)大于治療。隨著算法研究的深入與技術(shù)領(lǐng)域的拓展,機(jī)器學(xué)習(xí)在預(yù)測(cè)領(lǐng)域卓有成效。文章旨在以一種科學(xué)的方法,實(shí)現(xiàn)對(duì)肺癌患病風(fēng)險(xiǎn)的預(yù)測(cè)。以肺癌為例,利用已有的醫(yī)療數(shù)據(jù),設(shè)計(jì)合適的預(yù)測(cè)算法并用實(shí)驗(yàn)加以驗(yàn)證。最終的結(jié)果顯示了基于神經(jīng)網(wǎng)絡(luò)算法預(yù)測(cè)患癌風(fēng)險(xiǎn)的可行性。

        關(guān)鍵詞: 癌癥預(yù)測(cè); 機(jī)器學(xué)習(xí); 人工神經(jīng)網(wǎng)絡(luò); 標(biāo)準(zhǔn)化處理

        中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2018)11-56-04

        Abstract: In the modern medical and health system, the disease is treated mainly from three aspects of prevention, diagnosis and treatment. Early prevention is more effective than treatment especially for diseases such as cancer. With the deepening of algorithm research and the expansion of technology, machine learning has been effective in the field of prediction. This article is aimed at succeeding in predicting the risk of lung cancer by means of a scientific method. It takes lung cancer as an example, uses existing medical data, designs appropriate prediction algorithms and demonstrate it with experiments. The final result reflects the feasibility of predicting cancer risk based on neural network algorithms.

        Key words: cancer prediction; machine learning; artificial neural networks; standardized processing

        0 引言

        肺癌是發(fā)病率最高,死亡率增速最快的惡性腫瘤之一,對(duì)人類身體健康構(gòu)成了極大的威脅。醫(yī)學(xué)類研究表明:肺癌的發(fā)病與種族、家屬史、吸煙情況等因素有很大關(guān)聯(lián)。再者,肺癌患者痊愈的幾率很低,這表明人們對(duì)于肺癌這一惡性疾病,應(yīng)該持有預(yù)防大于救治的態(tài)度。提及預(yù)防,人們亟需一種簡單方便、科學(xué)精準(zhǔn)的工具來預(yù)測(cè)患癌風(fēng)險(xiǎn),進(jìn)一步自身調(diào)整,達(dá)到預(yù)防的效果。近年來APP的普及,加上機(jī)器學(xué)習(xí)在輔助預(yù)測(cè)中的顯著效果,使筆者聯(lián)想到將機(jī)器學(xué)習(xí)應(yīng)用于肺癌的風(fēng)險(xiǎn)預(yù)測(cè)中,通過建模并制作成相應(yīng)的軟件,投入民用。

        經(jīng)過研究,筆者采用人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)本質(zhì)就是模擬人類的思維[1],具有自學(xué)習(xí)、自操作、自應(yīng)用的表現(xiàn)形式[2]。信息的分布式存儲(chǔ)和并行處理是它最主要的特點(diǎn)[3]。其中,按照科學(xué)正確的原則進(jìn)行學(xué)習(xí)是核心關(guān)鍵點(diǎn),也是人工神經(jīng)網(wǎng)絡(luò)的工作前提。

        1 人工神經(jīng)網(wǎng)絡(luò)算法數(shù)據(jù)模型簡介

        人工神經(jīng)網(wǎng)絡(luò)是一種模仿動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,分布式信息處理的一種數(shù)學(xué)模型。這種算法憑借復(fù)雜的系統(tǒng)結(jié)構(gòu)對(duì)內(nèi)部節(jié)點(diǎn)之間的權(quán)重進(jìn)行修正,從而達(dá)到處理信息的目的[4]。人工神經(jīng)網(wǎng)絡(luò)可以通過預(yù)先提供的一批正確的數(shù)據(jù),分析其潛在規(guī)律。此過程稱為“訓(xùn)練”[5]。反向傳播(Back Propagation,簡稱BP)算法提出后,其非線性映射和泛化能力解決了許多非線性問題,比如在臨床輔助決策和波形分析等方向都取得了較好的成效[6]。

        BP神經(jīng)網(wǎng)絡(luò)共分為三層:輸入層、隱藏層、輸出層。下圖1展示具有兩層隱藏層的神經(jīng)網(wǎng)絡(luò)。感知器是神經(jīng)網(wǎng)絡(luò)的基本組成單位。它是由權(quán)值w,偏置b以及傳遞函數(shù)g(x)組成。其中b為偏置,bi為上一個(gè)感知器“釋放”的輸入信號(hào),x為經(jīng)過線性處理獲得值,f(x)為經(jīng)過傳遞函數(shù)處理后的最終值。即:

        其中傳遞函數(shù)是對(duì)所求出來的值進(jìn)行一個(gè)非線性變換。例如、等。通俗來講,傳遞函數(shù)就是將上一層傳入的信號(hào)進(jìn)行選擇性的通過。若不添加傳遞函數(shù),對(duì)于多隱藏層的學(xué)習(xí)跟只有一層的隱藏函數(shù)效果是一樣的。例如:

        因此每次處理都必須要經(jīng)過傳遞函數(shù)。

        一個(gè)感知器的值是由前一層所有感知器加權(quán)求和后,經(jīng)過傳遞函數(shù)的處理而得出的[7]。通過層層處理后,從而獲得輸出值。緊接著進(jìn)行反向傳播,修正權(quán)值。多次迭代后,當(dāng)訓(xùn)練集訓(xùn)練完畢后,算法會(huì)更新學(xué)習(xí)次數(shù),當(dāng)學(xué)習(xí)次數(shù)在閾值內(nèi),訓(xùn)練過程便全部完成[8]。此時(shí)從輸入層輸入信號(hào),經(jīng)過層層計(jì)算,便可得出最終的預(yù)測(cè)結(jié)果。

        2 神經(jīng)網(wǎng)絡(luò)在肺癌風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用與研究

        2.1 標(biāo)準(zhǔn)化處理

        搜集到的數(shù)據(jù)由于量綱不同,所以需要將數(shù)據(jù)做標(biāo)準(zhǔn)化處理。

        屬性類型可分為效益型、成本型、區(qū)間型等。其中,效益型為屬性值越大越好的屬性,區(qū)間型屬性為在某一區(qū)間內(nèi)越好的屬性[13]。每種屬性標(biāo)準(zhǔn)化處理的方式不同。

        將數(shù)據(jù)代入到公式中,即可完成。

        2.2 算法推導(dǎo)

        設(shè)輸入層為a1,隱藏層為b2、b3…bn-1,輸出層為cn。設(shè)輸入層每個(gè)感知器的值為a1n(n=1,2,3…),其余各層類似。設(shè)權(quán)重為第k層第a個(gè)感知單元與第k+1層第b個(gè)感知單元間的權(quán)重。偏置為b',由感知器原理可知,偏置可作為上一層的一個(gè)權(quán)重為1,信號(hào)為b'的感知器,故以下推導(dǎo)不額外考慮偏置b'。

        BP神經(jīng)網(wǎng)絡(luò)有前置輸出、反向傳播、更新權(quán)值以及其他參數(shù)[9],簡要步驟如下。

        步驟1 設(shè)輸入層的各個(gè)單元接收的輸入信號(hào)為x1、x2、x3…xn,并對(duì)w進(jìn)行隨機(jī)賦值。按上述過程計(jì)算,最后在輸出層可得出一組計(jì)算結(jié)果。

        步驟2 求出預(yù)測(cè)值以及真實(shí)值之間的誤差并反向進(jìn)行計(jì)算,求出最終誤差與初始權(quán)值之間的關(guān)系。

        步驟3 使用隨機(jī)梯度下降算法(Stochastic gradient descent,SGD)求誤差E最小值。

        步驟4 通過迭代并更新w,訓(xùn)練完成[10],獲得預(yù)測(cè)結(jié)果。

        針對(duì)步驟1,輸入值經(jīng)過權(quán)值計(jì)算到達(dá)隱藏層b2的第一個(gè)神經(jīng)單元b21的值為,經(jīng)過傳遞函數(shù)g(x)可得b21的輸入信號(hào)值為。

        針對(duì)步驟2,設(shè)標(biāo)簽為,可以求單個(gè)輸出層誤差Ei為,總誤差為。將隱藏層的單元代入:,可得總誤差E為:

        2.3 實(shí)驗(yàn)過程以及結(jié)果

        肺癌高危人群為長期吸煙的中老年人群、慢性肺部疾病患者以及家族遺傳者等[11]。筆者進(jìn)一步研究得出導(dǎo)致肺癌的因素主要包括出生年月、BMI、呼吸系統(tǒng)狀況、是否患有其他癌癥、近親患癌、慢性肺部疾病、是否吸煙、日均吸煙量、吸煙年數(shù)、二手煙狀況、油煙狀況等[12]。由于篇幅所限,我們僅列出部分?jǐn)?shù)據(jù)。

        設(shè)出生年份為Y1,BMI為Y2,慢性肺部疾病為Y3,日均吸煙數(shù)量為Y4,吸煙年數(shù)為Y5,患癌真實(shí)值為P1,預(yù)測(cè)值為P2。其中BMI是用于衡量人體胖瘦程度以及健康狀況的國際標(biāo)準(zhǔn)。設(shè)身高為h,體重為w,則BMI指數(shù)a為:

        由于量綱不同,需對(duì)所有搜索數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。根據(jù)查詢相關(guān)資料可得,BMI在[18.5,23.9]處于正常狀態(tài)。年齡越小,即出生年份數(shù)值越大,患有癌癥的可能性越小,因此出生年份屬于效益型,其余屬性同理分析。將各屬性做如上標(biāo)準(zhǔn)化處理,現(xiàn)展示部分?jǐn)?shù)據(jù)。

        將數(shù)據(jù)代入算法中,得出最終預(yù)測(cè)結(jié)果。將數(shù)據(jù)源部分用于訓(xùn)練,部分用于預(yù)測(cè)。通過部分?jǐn)?shù)據(jù)集的訓(xùn)練之后,可得預(yù)測(cè)結(jié)果。

        由表中數(shù)據(jù)可得,大多數(shù)預(yù)測(cè)值與真實(shí)值相差較小,說明該算法具有較大潛力。但少數(shù)預(yù)測(cè)數(shù)據(jù)與真實(shí)值相差較大,說明在該算法中,如何選擇傳遞函數(shù),選擇有效的訓(xùn)練數(shù)據(jù)及次數(shù)等還有待研究。

        2.4 實(shí)驗(yàn)在APP中的應(yīng)用

        將神經(jīng)網(wǎng)絡(luò)算法與APP進(jìn)行結(jié)合,便成為可以為用戶服務(wù)的一個(gè)工具。用戶安裝后,回復(fù)有大量科學(xué)研究作為基礎(chǔ)的問題,通過輸入個(gè)人數(shù)據(jù),便可得出預(yù)測(cè)結(jié)果。APP接受用戶提交的數(shù)據(jù)后,通過計(jì)算,可得最終的預(yù)測(cè)結(jié)果。

        圖4、圖5為制作完成的APP界面。

        3 結(jié)束語

        本文將機(jī)器學(xué)習(xí)領(lǐng)域中的經(jīng)典算法應(yīng)用于肺癌發(fā)病風(fēng)險(xiǎn)的預(yù)測(cè)。在提取各種特征的基礎(chǔ)上,搜集了大量數(shù)據(jù)并將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,選取部分?jǐn)?shù)據(jù)作為訓(xùn)練集,其余數(shù)據(jù)用于預(yù)測(cè)。通過對(duì)預(yù)測(cè)結(jié)果的分析,可以得出兩個(gè)重要結(jié)論:一推導(dǎo)出高幾率患病人群,比如長期吸煙的中老年人群、慢性肺部疾病患者等,確定的影響因素包括吸煙情況、身高體重指數(shù)、慢性疾病與肺病史、油煙暴露狀況等。二是該算法的預(yù)測(cè)準(zhǔn)確率大致符合真實(shí)情況,可以作為神經(jīng)網(wǎng)絡(luò)在肺癌預(yù)測(cè)中的成功應(yīng)用。但是該算法預(yù)測(cè)中,也存在部分記錄預(yù)測(cè)值與真實(shí)值有一定誤差的問題,可見該算法在數(shù)據(jù)集、傳遞函數(shù)選取等細(xì)節(jié)方面還有待進(jìn)一步研究,準(zhǔn)確性仍有提升的空間。

        現(xiàn)實(shí)使用中,用戶只需下載APP應(yīng)用,輸入個(gè)人數(shù)據(jù),即可得知自身患肺癌風(fēng)險(xiǎn),發(fā)病誘因等,非常方便,實(shí)用性強(qiáng),免去實(shí)體醫(yī)院的檢查流程,省時(shí)省力,還節(jié)省可觀的財(cái)產(chǎn)支出。正因?yàn)槠浜啽阋子?,平民大眾,迎合“互?lián)網(wǎng)+”浪潮,可以預(yù)見其會(huì)在市場、社會(huì)中的廣泛應(yīng)用,可以說前景十分廣闊。

        雖然當(dāng)前的算法仍存在一些問題,應(yīng)用系統(tǒng)還不夠完善,但是筆者相信經(jīng)過算法的再研究、再改進(jìn),以及日后神經(jīng)網(wǎng)絡(luò)算法的必然優(yōu)化與發(fā)展,利用神經(jīng)網(wǎng)絡(luò)精準(zhǔn)預(yù)測(cè)肺癌風(fēng)險(xiǎn)將會(huì)有很大的概率實(shí)現(xiàn)和普及,并且在其他領(lǐng)域,神經(jīng)網(wǎng)絡(luò)也將“大放光彩”。

        參考文獻(xiàn)(References):

        [1] Mitchell T. Machine learning[M]. Beijing: China MachinePress,2003.

        [2] Ganesan K, Acharya U R,Chua C K,et al.Computer-aided breast cancer detection using mammograms:A review[J].IEEE Reviews in Biomdical Engineering,2013.6(77):98

        [3] Orozco H M,Villegas O V,Maynez L O,et al. Lung noduleclassification in frequency domain using support vector machines[C]//Proc of 2012 llth International Conference on Information Science,Signal Processing and their Applications (ISSPA),2012:870-875

        [4] Pinheiro F M R,kuo M H.Poster:Applying data miningalgorithms to early detection of liver cancer[C]//Proc of 2012 IEEE 2nd International Conference on Computational Advances in Bio and Medical Sciences (ICCABS),2012:1

        [5] Cruz JA, Wishart DS. Applications of Machine Learning in Cancer Prediction and Prognosis[J]. Cancer Informatics,2007.2(1):59-77

        [6] Fakoor R, Ladhak F, Nazi A, et al. Using Deep Learning to Enhance Cancer Diagnosis and Classification[C].Atlanta:The International Conference on Machine Learning,2013.

        [7] Mitchell T M. Machine learning [M]. Burr Ridge, IL:MC Graw Hill,1977.

        [8] Graves A, Mohamed A, Hinton CE. Speech recognition with deep recurrent neural networks [C]. IEEE International Conference on Acoustics, Speech and Signal Processing,2013:6645-6649

        [9] Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks[C]. Advances in Neural Information Processing Systems,2012:1097-1105

        [10] 倪然.人工神經(jīng)網(wǎng)絡(luò)聯(lián)合腫瘤標(biāo)志對(duì)肺癌和大腸癌的預(yù)警 [D].鄭州大學(xué),2009.

        [11]馬莉,高曉虹,王猛,李曉楓.肺癌影響因素病例對(duì)照研究[J].中國公共衛(wèi)生,2012.28(1):90-91

        [12] Crippa A, Salvatore C, Perego P, et al.Use of machine learning to identity children with autism and their motor abnormalities [J]. J Autism Dev Disord,2015.45:2146-2156

        猜你喜歡
        人工神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)
        利用人工神經(jīng)網(wǎng)絡(luò)快速計(jì)算木星系磁坐標(biāo)
        人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)簡單字母的識(shí)別
        電子制作(2019年10期)2019-06-17 11:45:10
        滑動(dòng)電接觸摩擦力的BP與RBF人工神經(jīng)網(wǎng)絡(luò)建模
        基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
        前綴字母為特征在維吾爾語文本情感分類中的研究
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
        人工神經(jīng)網(wǎng)絡(luò)和安時(shí)法電池SOC估計(jì)
        在线看片免费人成视频电影| 蜜桃在线观看免费高清完整版| 亚洲国产夜色在线观看| 国语对白做受xxxxx在线中国| 国产精品露脸视频观看| 欧美视频第一页| 99热高清亚洲无码| 日产一区二区三区的精品| 国产亚洲精品一区二区在线观看| 成年人视频在线观看麻豆| 国产午夜视频在线观看免费| 日本强伦姧人妻一区二区| 激情综合色综合啪啪开心| 性高湖久久久久久久久| 欧美一区二区三区激情| 91网站在线看| 亚洲国产一区二区三区在线视频| 欧美中出在线| 亚洲视频一区二区三区免费 | 91精品国产乱码久久中文| 日本大乳高潮视频在线观看| 无码人妻丰满熟妇区毛片| 蜜桃精品免费久久久久影院 | 亚洲欧洲国无码| 久久中文字幕国产精品| 日韩亚洲中文有码视频| 欧美亚洲一区二区三区| 亚洲香蕉成人av网站在线观看| 午夜亚洲av永久无码精品| 久久久久成人精品免费播放| 人妻少妇精品视频一区二区三区| 在线观看国产一区二区av | 中文字幕精品亚洲无线码二区| 男女互舔动态视频在线观看| 成人国产激情自拍视频| 欧美人与禽zozzo性伦交| 韩国无码av片在线观看网站| 亚洲欧美国产日产综合不卡| 国产精品狼人久久久影院| 国产精品一区二区三区av在线| 一色桃子中文字幕人妻熟女作品|