喬豐,孫澤鵬,馬建均
(中移(成都)信息通信科技有限公司 研發(fā)一部,四川 成都 610041)
自2019 年底暴發(fā)至今,新型冠狀病毒引發(fā)的肺炎疫情席卷全球,嚴(yán)重危害了人們的生命健康。中國(guó)國(guó)家衛(wèi)生健康委員會(huì)在第五版新冠肺炎診療方案已經(jīng)提出,胸部CT(Computed Tomography)是新冠肺炎臨床診斷的重要依據(jù)[1]。但在疫情大爆發(fā)期,影像篩查基本由影像科醫(yī)生人工完成,由于患者數(shù)量多、肺內(nèi)病灶多、進(jìn)展變化快、短時(shí)間內(nèi)需要多次復(fù)查、醫(yī)生資源緊缺、醫(yī)生臨床經(jīng)驗(yàn)與判斷標(biāo)準(zhǔn)不能同質(zhì)化等多種原因,影像科醫(yī)生閱片數(shù)量大、閱片周期長(zhǎng),常常嚴(yán)重超負(fù)荷工作、身心疲憊、診斷效率低下、結(jié)果容易誤判,導(dǎo)致未能及時(shí)篩查出已感染的患者,不利于快速控制疫情。
為了充分發(fā)揮人工智能(Artificial Intelligence,AI)技術(shù)賦能醫(yī)學(xué)影像篩查,協(xié)力抗擊新型冠狀病毒肺炎疫情,工業(yè)和信息化部倡議充分挖掘新冠肺炎診療及疫情防控的應(yīng)用場(chǎng)景,攻關(guān)并批量生產(chǎn)一批用于輔助診斷、快速測(cè)試、精準(zhǔn)測(cè)溫與目標(biāo)識(shí)別等方面的智能化產(chǎn)品。目前,國(guó)內(nèi)外有大量科技公司和研究機(jī)構(gòu)都在致力于將人工智能技術(shù)應(yīng)用于醫(yī)療行業(yè),但主要集中在互聯(lián)網(wǎng)問(wèn)診、肺結(jié)節(jié)檢測(cè)、心腦血管檢測(cè)、癌癥靶區(qū)勾勒、病理切片識(shí)別等領(lǐng)域[2]。基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的醫(yī)學(xué)影像分割處理技術(shù)目前已經(jīng)針對(duì)多種病種進(jìn)行了具體應(yīng)用,來(lái)輔助醫(yī)生對(duì)病癥進(jìn)行診斷;利用經(jīng)過(guò)醫(yī)生對(duì)具體病灶標(biāo)注過(guò)的圖像進(jìn)行訓(xùn)練,CNN 模型可以學(xué)習(xí)到醫(yī)生對(duì)具體病種病灶的判別方式,樣本數(shù)量越多,同病種多專家標(biāo)注方式和類別越全,訓(xùn)練好的AI 模型的輸出結(jié)果就越準(zhǔn)確[3-4]。由于新型冠狀病毒肺炎的突發(fā)性,研發(fā)智能的新型冠狀病毒肺炎篩查系統(tǒng)來(lái)服務(wù)醫(yī)生和患者,減輕醫(yī)生負(fù)擔(dān),助力醫(yī)療機(jī)構(gòu)實(shí)現(xiàn)大量新冠肺炎快速早期篩查變得十分緊迫。
本文在深入抗擊新型冠狀病毒肺炎疫情一線的實(shí)踐基礎(chǔ)上,設(shè)計(jì)并研發(fā)5G 網(wǎng)絡(luò)下新冠病人AI 智能初篩系統(tǒng),旨在為疫情防控及重大傳染病篩查系統(tǒng)設(shè)計(jì)提供參考。內(nèi)容主要包括新冠病人胸部CT 特征分析、人工智能和5G 技術(shù)應(yīng)用的必要性與可行性論證、新冠病人AI 智能初篩系統(tǒng)設(shè)計(jì)、系統(tǒng)性能驗(yàn)證和結(jié)論。
研發(fā)新冠病人AI 智能初篩系統(tǒng)的關(guān)鍵是正確認(rèn)識(shí)新冠病人胸部CT 特征,這對(duì)于人工智能數(shù)據(jù)標(biāo)注、模型訓(xùn)練和系統(tǒng)性能具有極其重要的意義。新冠病人病情發(fā)展主要分為早期、進(jìn)展期和重癥期[5-6],各階段的胸部CT 特征如表1 所示。
表1 新冠病人胸部CT 特征
在必要性方面,每位新冠病人的胸部高分辨率CT 影像在300 張左右,這為醫(yī)生臨床診斷帶來(lái)巨大壓力。醫(yī)生對(duì)一個(gè)病例的CT 影像肉眼分析耗時(shí)大約為5~15min。而人工智能技術(shù)具備一定的學(xué)習(xí)能力,可通過(guò)學(xué)習(xí)含有醫(yī)生經(jīng)驗(yàn)的數(shù)據(jù),具備病灶的快速檢測(cè)識(shí)別能力,能極大提升醫(yī)生診斷效率和診斷準(zhǔn)確率;同時(shí),CT 影像數(shù)據(jù)量大,為了實(shí)現(xiàn)數(shù)據(jù)高速率、低時(shí)延傳輸與交互,采用5G 技術(shù)是一個(gè)必要選擇。在可行性方面,目前人工智能技術(shù)特別是深度學(xué)習(xí)技術(shù)[7-8]在圖像識(shí)別領(lǐng)域應(yīng)用廣泛,算法相對(duì)成熟,可結(jié)合新冠病人胸部CT 篩查具體應(yīng)用輸入高質(zhì)量標(biāo)注的訓(xùn)練數(shù)據(jù)并調(diào)整算法參數(shù)從而獲得較好的模型;同時(shí),5G 技術(shù)天然具備高速率、低時(shí)延數(shù)據(jù)傳輸特性[9-10],通過(guò)5G 網(wǎng)絡(luò)傳輸大量CT 影像數(shù)據(jù)是可行的。
新冠病人AI 智能初篩系統(tǒng)的應(yīng)用場(chǎng)景如圖1 所示,面對(duì)龐大的就診人群,通過(guò)批量輸入發(fā)熱病人的CT 影像數(shù)據(jù),快速獲得新冠肺炎疑似患者名單,解決發(fā)熱群體大與醫(yī)生資源緊缺之間的矛盾,從而減輕醫(yī)生閱片壓力、縮短醫(yī)生閱片周期、減少疲勞導(dǎo)致的數(shù)據(jù)誤判。
圖1 新冠病人AI 智能初篩系統(tǒng)應(yīng)用場(chǎng)景
系統(tǒng)功能主要包括批量病例CT 數(shù)據(jù)導(dǎo)入、高速的圖像處理、精準(zhǔn)的病灶定位及標(biāo)注、批量疑似患者報(bào)表輸出、數(shù)據(jù)可視化等。批量病例CT 數(shù)據(jù)導(dǎo)入功能支持批量導(dǎo)入DICOM3.0 原圖,最大支持超過(guò)上千患者數(shù)據(jù)同時(shí)上傳,通過(guò)后臺(tái)存儲(chǔ)進(jìn)行保存。高速圖像處理功能支持超大文件放大、縮小與標(biāo)注。精準(zhǔn)病灶定位功能支持在海量數(shù)據(jù)中精準(zhǔn)篩選、標(biāo)記并分析出疑似新冠病例,同步將疑似病例的數(shù)據(jù)置頂,方便醫(yī)生進(jìn)行閱片復(fù)核。批量疑似患者報(bào)表輸出功能支撐將疑似患者基本信息及分析結(jié)果數(shù)據(jù)以報(bào)表的形式輸出,供醫(yī)務(wù)人員快速定位疑似患者。數(shù)據(jù)可視化功能支持將判讀異常的數(shù)據(jù)統(tǒng)一以數(shù)據(jù)報(bào)表的格式進(jìn)行展示,方便疫情防控工作進(jìn)行下一步計(jì)劃決策。
根據(jù)應(yīng)用場(chǎng)景和系統(tǒng)功能,系統(tǒng)由業(yè)務(wù)子系統(tǒng)、安全存儲(chǔ)子系統(tǒng)、人工智能(AI)處理子系統(tǒng)三個(gè)部分組成,如圖2 所示。業(yè)務(wù)子系統(tǒng)主要完成數(shù)據(jù)導(dǎo)入、高速圖像處理、批量疑似患者報(bào)表輸出、數(shù)據(jù)可視化等功能。安全存儲(chǔ)子系統(tǒng)主要完成患者數(shù)據(jù)安全存儲(chǔ)及災(zāi)備保護(hù)功能。人工智能處理子系統(tǒng)通過(guò)分析肺實(shí)變、磨玻璃影、鋪路石等典型特征完成患者病灶A(yù)I 智能分析、模型演化、數(shù)據(jù)聚合、數(shù)據(jù)訓(xùn)練等功能。系統(tǒng)前端采用Vue 及商業(yè)數(shù)據(jù)圖片組件Echarts,后臺(tái)采用Java 和Python 混合實(shí)現(xiàn),后臺(tái)框架由SpringCloud、Docker 服務(wù)抽離和Python TensorFlow 組成。
圖2 新冠病人AI 智能初篩系統(tǒng)組成
為了解決大量醫(yī)學(xué)圖像數(shù)據(jù)從醫(yī)生端到云數(shù)據(jù)中心的高速低延遲傳輸問(wèn)題,系統(tǒng)采用了5G 網(wǎng)絡(luò)技術(shù)。具體地,需要解決終端接入5G 網(wǎng)絡(luò)的問(wèn)題和數(shù)據(jù)在網(wǎng)絡(luò)中安全、高速、低延遲傳輸問(wèn)題。對(duì)于終端接入5G 網(wǎng)絡(luò),我們采用自研5G CPE 設(shè)備將醫(yī)生端設(shè)備快速接入5G 網(wǎng)絡(luò),5G CPE 設(shè)備是一種將5G信號(hào)與WiFi 和以太網(wǎng)信號(hào)進(jìn)行相互轉(zhuǎn)換的設(shè)備,可快速將醫(yī)療行業(yè)設(shè)備接入5G 網(wǎng)絡(luò)。為了達(dá)到部署快、成本低的目標(biāo),我們采用了5G 虛擬專網(wǎng)技術(shù),即完全復(fù)用面向公眾的無(wú)線資源,包括基站設(shè)備和頻率資源,利用端到端切片等方式保障醫(yī)學(xué)圖像業(yè)務(wù)數(shù)據(jù)與公網(wǎng)數(shù)據(jù)隔離,提供服務(wù)等級(jí)協(xié)議(Service-Level Agreement,SLA)SLA 保障。
為了驗(yàn)證該新冠病人AI 智能初篩系統(tǒng)的性能,我們開(kāi)展了系統(tǒng)性能測(cè)試。實(shí)驗(yàn)條件:GPU 型號(hào)為GeForce GTX 1080 Ti,內(nèi)存為11172 MiB,最大時(shí)鐘頻率為Graphics:1911 MHz、SM:1911 MHz、Memory:5505 MHz、Video:1708 MHz。
首先,我們測(cè)試了系統(tǒng)對(duì)病灶檢測(cè)和標(biāo)注的準(zhǔn)確性,如圖3 所示。在圖3 中,左圖為人工標(biāo)注結(jié)果,右圖是AI 系統(tǒng)自動(dòng)識(shí)別和標(biāo)注結(jié)果,可以看出,系統(tǒng)能夠以劃定范圍和標(biāo)記置信度的方式準(zhǔn)確識(shí)別出病灶區(qū)域,不但準(zhǔn)確識(shí)別出較大的病灶區(qū)域,而且能識(shí)別人工常常容易遺漏的病灶區(qū)域(如右圖中白色虛線圈出的兩處病灶區(qū)域)。
圖3 標(biāo)注結(jié)果對(duì)比
為了量化評(píng)估系統(tǒng)性能,我們對(duì)比了采用本系統(tǒng)輔診與未采用本系統(tǒng)輔助情況下醫(yī)生的診斷準(zhǔn)確率和診斷時(shí)間,如表2 所示,從表中可以看出,在系統(tǒng)輔助下醫(yī)生的診斷準(zhǔn)確率從90% 提升到98%、診斷效率從2s/病灶提升到0.19s/病灶。這是因?yàn)樵谙到y(tǒng)輔助下,系統(tǒng)快速檢測(cè)出了病灶(特別是小病灶),醫(yī)生只需在此基礎(chǔ)上進(jìn)行二次診斷驗(yàn)證,診斷時(shí)間得到極大縮減,同時(shí)由于醫(yī)生的二次驗(yàn)證外加系統(tǒng)能很好地檢測(cè)出小病灶,診斷準(zhǔn)確率也得以提升。隨著診斷病例的增加,無(wú)系統(tǒng)輔助的醫(yī)生疲勞加劇,診斷準(zhǔn)確率和診斷效率隨時(shí)間降低,而有系統(tǒng)輔助的醫(yī)生診斷優(yōu)勢(shì)會(huì)進(jìn)一步擴(kuò)大。
表2 系統(tǒng)輔助診斷性能對(duì)比
本文從新冠肺炎疫情防控的實(shí)際經(jīng)驗(yàn)出發(fā),結(jié)合新冠肺炎患者胸部CT 醫(yī)學(xué)特征,利用人工智能和5G 技術(shù)設(shè)計(jì)和研發(fā)了新冠病人AI 智能初篩系統(tǒng),通過(guò)試驗(yàn)驗(yàn)證了系統(tǒng)的有效性和實(shí)用性,該系統(tǒng)輔助醫(yī)生提高了診斷效率和準(zhǔn)確率為重大傳染病智能篩查系統(tǒng)設(shè)計(jì)提供了有價(jià)值的參考。