武文杰,宋文愛,高雪梅,楊吉江,王 青,黃麗萍,雷 毅
1.中北大學 軟件學院,太原030000
2.北京大學口腔醫(yī)院 正畸科,北京100089
3.清華大學 自動化系,北京100089
阻塞性睡眠呼吸暫停綜合征是一種上呼吸道反復出現(xiàn)部分或完全衰竭的一類疾病,大多數(shù)的阻塞性睡眠呼吸暫停都與不同程度的頭顱骨骼變化有關,包括上頜骨和下頜骨之間的距離變化以及舌骨的尾側移位等[1-4]。夜間睡眠期間呼吸暫?;蛘吆粑鼤r較低的通氣量都會阻礙或減少流入體內(nèi)的空氣體積[5],導致軀體缺氧。該疾病輕則影響患者的夜間睡眠質(zhì)量[6],重則會誘發(fā)其他種類疾病,影響身體健康。阻塞性睡眠呼吸暫停的癥狀主要包括白天過度嗜睡[7]、出現(xiàn)神經(jīng)認知障礙,以及導致糖尿病、高血壓、增加心血管疾病發(fā)病率,甚至出現(xiàn)全因死亡等[8-11],部分患者還出現(xiàn)聽力下降或有中耳功能障礙等[12]。在30 歲至60 歲的中青年群體中,男性和女性的阻塞性睡眠呼吸暫停綜合征的患病率分別為4%和2%;隨著年齡的增長,老年群體(大于60 歲)中的患病率也相應地增加:其中男性為28%~67%,女性為20%~54%[13]。在兒童中的阻塞性睡眠呼吸暫停綜合征也不罕見,嚴重的阻塞性睡眠呼吸暫停綜合征與小孩的學習能力不足、注意力缺陷或多動癥等問題明顯相關,也和小孩遺尿現(xiàn)象有著一定的關系[14]。由于阻塞性睡眠呼吸暫停綜合征居高不下的發(fā)病率,導致該疾病具有很大的潛在風險,而且發(fā)病緣由尚不明確,只能早發(fā)現(xiàn)早治療。因此,如何高效快捷地檢測診斷阻塞性睡眠呼吸暫停綜合征成為了目前學者研究的主要方向。
目前,阻塞性睡眠呼吸暫停的主要檢測手段是利用多導睡眠監(jiān)測和X 線片的顱骨測量等方法[15]。根據(jù)阻塞性睡眠呼吸暫停低通氣綜合征診治指南[16],利用多導睡眠監(jiān)測法對阻塞性睡眠呼吸暫停綜合征進行診斷評估,依據(jù)呼吸暫停-低通氣指數(shù)(Apnea-Hypopnea Index,AHI)可將OSA嚴重程度可以分為四類,如表1。多導睡眠監(jiān)測是目前診斷阻塞性睡眠呼吸暫停的唯一標準,因此,對OSA患者進行多導睡眠監(jiān)測是絕對有必要的,但是它的實用性非常有限、成本高昂而且耗時長,因此仍需尋找一種新的診斷方式來彌補多導睡眠監(jiān)測的不足。
表1 OSA嚴重程度與呼吸暫停次數(shù)關系表
利用X 射線技術診斷阻塞性睡眠呼吸暫停是目前臨床醫(yī)學檢查中的另一項重要的診斷方式,其主要是憑借X 線的強穿透性、攝影效應、熒光效應等特點。當X射線穿過肌體之后,因為肌體內(nèi)的各器官組織對X射線的吸收存在著一定的差異,此外,人體各組織器官的密度及厚度也是存在差別的,所以它可以形成不同的對比度圖像。在過去的十年間,頭影側位測量片被用來評估OSA患者的骨骼,以及在較小的程度上評估面部和上氣道的軟組織解剖狀況。盡管顱面?zhèn)任籜 線片是在受試者日間清醒且直立的狀態(tài)下拍攝的,這相對于在夜間進行診斷的多導睡眠監(jiān)測有明顯的局限性,但是基于顱面?zhèn)任籜 線片的診斷方式相對簡單且成本較低,此外,側位頭影測量參數(shù)與阻塞性睡眠呼吸暫停診斷標準的相關性也在大量研究中得到了認證[17-19],因此X 射線成為了評估阻塞性睡眠呼吸暫停嚴重程度的有效工具。
人工智能的問世,使得僅基于X線片數(shù)據(jù)進行輔助診斷的系統(tǒng)有了實現(xiàn)的可能,患者僅需拍攝顱面?zhèn)任黄到y(tǒng)根據(jù)所得圖片即可對疾病做出診斷,這種診斷方式有著易推廣、易實施的特點,具有良好的應用前景。該方式可以有效地推廣向基層,還可以進一步提升診斷識別的能力,對緩解醫(yī)療資源不足的問題有著重要意義。
阻塞性睡眠呼吸暫停綜合征(Obstructive Sleep Apnea Syndrome,OSAS)患者主要表現(xiàn)癥狀為夜間睡眠期間上呼吸道反復出現(xiàn)阻塞,若要對阻塞性睡眠呼吸暫停做出精確的診斷,首先需要制定一個嚴格的評估標準,Lee等人[20]研究發(fā)現(xiàn),不同種族之間的平均年齡和身體質(zhì)量指數(shù)相似。但是中國患者的OSA 癥狀更為嚴重。因為中國人的頭顱骨骼局限性更大一些,其中包括較短的顱底、上頜骨和下頜骨長度。由于種族之間存在著的差異,在研究中國OSA患者時,建立我國本民族本地區(qū)無鼾癥即正常人群的側位顱面X 線頭影測量參考值是非常有必要的。劉月華等人[21]通過選擇北京地區(qū)的100 名健康的在校大學生,對他們進行了側位顱面X線數(shù)據(jù)測量和統(tǒng)計分析。Chang等人[15]對參與者進行了多導睡眠檢測和頭部側位掃描,通過對顱面X 線片、年齡、身體質(zhì)量指數(shù)以及頸圍等數(shù)據(jù)記錄分析,發(fā)現(xiàn)顱面?zhèn)任籜線片測量是評價中國OSA患者的一種有效的臨床診斷工具,而且OSA 患者也需要同時測量骨骼結構以及軟組織結構,這樣才能得到最佳的診斷結果。
眾所周知,肥胖也是誘發(fā)阻塞性睡眠呼吸暫停綜合征中最常見的因素之一。它對睡眠呼吸障礙的影響似乎也超越了其他的已經(jīng)被確定的容易誘導睡眠呼吸障礙的因素,比如遺傳、上呼吸道異常或者是顱面表型。在Sutherland 等人[22]的研究中,他們證實對于比白種人的骨骼限制更大的亞洲人來說,肥胖是加劇阻塞性睡眠呼吸暫停病情的一個非常重要的原因。
隨著人工智能的發(fā)展,越來越多的機器學習以及深度學習模型運用在阻塞性睡眠呼吸暫停診療中,Marcos等人[23]對149 名參加測試的患者進行了研究分析,通過對他們進行夜間多導睡眠監(jiān)測和血氧飽和度檢測,得到對阻塞性睡眠呼吸暫停的首次分析結果。繼而對檢測結果進行特征提取,并將提取的特征做歸一化處理。然后將所得數(shù)據(jù)傳入支持向量機(Support Vector Machine,SVM)中作為其輸入數(shù)據(jù),最終得到OSA 的診斷結果。研究者發(fā)現(xiàn)該算法診斷阻塞性睡眠呼吸暫停的靈敏度為84.44%、特異性為93.33%。Ho[24]提出了一種全新的方法,其方法思想是利用卷積神經(jīng)網(wǎng)絡和單通道鼻壓力信號進行實時呼吸暫?;蚝粑蛔闶录臋z測。將179個多導睡眠監(jiān)測記錄作為研究的數(shù)據(jù)集,其中訓練集數(shù)量為50,驗證集數(shù)量為25,測試集數(shù)量為104。根據(jù)逐段的分析,該方法顯示的結果對診斷OSA有很大的幫助,其中靈敏度為81.1%,特異性為98.5%以及準確度為96.6%,為診斷分析OSA 提出了一種有效的深度學習解決方案,并為深度學習應用于診斷OSA打下了良好的基礎。
目前,阻塞性睡眠呼吸暫停的診斷主要是依靠醫(yī)生對受試者進行人工的多導睡眠監(jiān)測,由于多導睡眠監(jiān)測的醫(yī)療費用高昂、診斷分析耗時長以及對醫(yī)師的專業(yè)水平要求較高等局限性,利用機器輔助診斷分析越來越受到人們的重視。阻塞性睡眠呼吸暫停人工智能輔助診斷的方式大致可以分為兩種:(1)基于傳統(tǒng)方式診斷;(2)基于深度學習方式診斷。
2.1.1 基于關鍵點
由于深度學習領域的發(fā)展,早期傳統(tǒng)診斷方法的使用已逐漸減少。由于基于關鍵點的傳統(tǒng)診斷方式主要是研究顱面骨骼或軟組織異常程度與阻塞性睡眠呼吸暫停之間的相關性,所以該診斷方式在醫(yī)學上的解釋性高,因此該診斷方式依舊具有很大的研究價值。
早在20 世紀80 年代末,研究者就開始利用顱面?zhèn)任黄嘘P鍵點之間的差異,來診斷阻塞性睡眠呼吸暫停綜合征。Deberry-Borowiecki等[25]分析了30位OSA患者和12個年齡及性別相似的健康受試者的顱面?zhèn)任籜線片。統(tǒng)計結果表明,OSA患者的測量數(shù)據(jù)在五個方面與健康組不同。這也證實了基于顱面關鍵點研究的可行性。
Banabilh等人[26]使用MorphoStudio軟件分析顱面?zhèn)任籜線片中的27個標志點。計算平均阻塞性睡眠呼吸暫停和平均二維控制氣道構型,并進行t 檢驗和有限元分析,其中通過有限元分析可以使兩組(OSA與非OSA組)間關鍵點測量數(shù)據(jù)的差異以圖形化展示,尺寸和形狀的變化使結果更明顯。研究結果顯示,OSA組的測量數(shù)據(jù)在多方面與健康組存在明顯差異。
Ryu等[27]利用Pearson二元相關分析、判別函數(shù)分析以及交叉驗證等,對140名參與者進行顱面?zhèn)任怀上窈投鄬弑O(jiān)測評估。在側位頭顱造影上總共進行了29次測量(24 個距離和5 個角度)。對顱面測量和多導睡眠圖參數(shù)進行分析,分離出9 個與OSA 相關的變量,結果表明:頭顱側位X射線可用于評估顱面及軟組織畸形與OSA嚴重程度的關系。
Gungor等[28]使用頭顱測量分析程序(Dolphin Imaging Cephalometric and Tracing Software)測量分析了16 名OSA患者和16名健康受試者的顱面情況,并通過Mann-Whitney U檢驗分析了25個測量參數(shù)在OSA患者和健康受試者間的區(qū)別,發(fā)現(xiàn)兩組數(shù)據(jù)在幾個顱面測量參數(shù)中存在顯著差異。
Hoekema等[29]使用顱面?zhèn)任籜線片測量技術,對比分析了31 名男性OSA 患者與37 名健康男性受試者的顱面形態(tài),并確定了16 個顱面測量數(shù)據(jù),利用student t檢驗分析了OSA 患者組與健康組測量數(shù)據(jù)之間的差異,通過多元回歸分析評估所選測量數(shù)據(jù)的預測值,得到了一個優(yōu)秀的篩選OSA的模型,如表2。
表2 關鍵點模型
綜上所述,容易發(fā)現(xiàn),(如圖1)基于關鍵點診斷方式對阻塞性睡眠呼吸暫停診斷的步驟大致如下:
(1)對受試者做頭顱側位X 射線檢查,圖像主要區(qū)域包括顱面骨骼以及軟組織。
(2)設計算法,提取X 線片中的相關特征點并做記錄,測量計算相關特征點間的距離或角度。
(3)最終將提取數(shù)據(jù)與非OSA數(shù)據(jù)進行對比分析,得出評估結果。
圖1 傳統(tǒng)方式對OSA診斷步驟
阻塞性睡眠呼吸暫?;陉P鍵點的診斷方式,需要對每一個受試者的顱面?zhèn)任籜線片進行測量,為了提取更好的特征表示,其主要特點是使用的關鍵點都是專業(yè)醫(yī)師手工設計的,往往成本高且耗時長,這也成為了該診斷方式的主要缺陷。基于關鍵點的傳統(tǒng)診斷方法基本上還是利用的比較淺層的特征,然后使用設計好的算法對空間位置關系進行建模,而深度學習方法將二者合為一體,這樣的優(yōu)勢是便于設計和優(yōu)化。
2.1.2 基于傳統(tǒng)機器學習
近幾年,深度學習掩蓋了經(jīng)典機器學習的風采,成為了解決人工智能類型問題的首選技術,原因是深度學習在各方面任務中出色的表現(xiàn),其中包括但不限于自然語言和視覺處理等。然而,傳統(tǒng)的機器學習與高性能的深度學習相比并不是一無是處的,例如使用線性回歸和支持向量機同樣可以得出好結果。
Marcos 等人[23]對149 名參加測試的患者進行了研究,由于血氧測量數(shù)據(jù)存在不準確性,因此對患者進行夜間多導睡眠監(jiān)測以及對患者血氧飽和度(SaO2)檢測記錄做了光譜分析,以量化健康組與OSA 組之間的差異。繼而對檢測結果特征提取及歸一化處理。將所得數(shù)據(jù)傳入給予優(yōu)化的支持向量機中作為其輸入數(shù)據(jù),最終得到很好的OSA檢測結果。但是其研究也存在著一些局限性,首先Marcos的研究數(shù)據(jù)集規(guī)模很小,對測試集的優(yōu)化需要更大的數(shù)據(jù)集作為支撐;其次對血氧飽和度信號做光譜分析,雖然OSA 組和非OSA 組的血氧飽和度信號有著明顯區(qū)別,但是SaO2 信號可能受到噪聲的干擾。
由于多導睡眠監(jiān)測需要受試者進行整夜的睡眠檢測,這意味著耗時長且成本相對較高,而且與白種人相比,在年齡和身體質(zhì)量指數(shù)相似時,中國OSA患者的癥狀更為嚴重,Ting等[30]驗證了一個基于專家的特征提取與自動特征選擇決策樹相結合的診斷系統(tǒng),用于診斷中國臺灣地區(qū)的中度及重度阻塞性睡眠呼吸暫停綜合征患者。并與反向逐步多變量邏輯回歸模型、決策樹等算法進行了比較,發(fā)現(xiàn)其提出的算法診斷準確率為96.9%,是所有評估比較的算法里效果最好的。但研究數(shù)據(jù)集是由診所患者組成的,使其診斷OSA 的患病率高達73%,這與中國人的OSA患病率嚴重不符,因此該研究的結果并不能代表全體中國人。
Hajipour等[31]研究人員利用受試者白天清醒時的氣管呼吸音以及夜間多導睡眠檢查數(shù)據(jù),利用不同的特征提取方式提取特征,評估比較了隨機森林(Random Forest,RF)和正則化邏輯回歸(Logistic Regression,LR)兩種機器學習算法對阻塞性睡眠呼吸暫停的診斷結果。研究表明,在診斷阻塞性睡眠呼吸暫停綜合征時這兩種機器學習算法都各有優(yōu)勢,隨機森林方法精度較高,因此是醫(yī)學診斷的首選方式;但如果數(shù)據(jù)集過大時,正則化邏輯回歸方式可以更快地得出診斷結果,并且準確性也滿足診斷需求。
Lee 等[32]為了尋找耗時較短的算法,分析比較了支持向量機和模糊支持向量機(Fuzzy Support Vector Machine,F(xiàn)SVM)兩種算法的性能。數(shù)據(jù)集為32例睡眠呼吸暫停患者的多導睡眠監(jiān)測記錄以及使用Pan 和Tompkins算法提取的心跳信號,通過將模糊支持向量機的模糊隸屬函數(shù)參數(shù)n由1 上調(diào)為500,雖然最大分類準確率與支持向量機同為93.23%,但FSVM 的學習時間較SVM 減少了一萬余倍,為篩選OSA 開創(chuàng)了一個高效的模糊支持向量機算法。如表3。
表3 傳統(tǒng)機器學習模型
在基于傳統(tǒng)機器學習的方法中,使用的分類器主要是SVM、決策樹或隨機森林等,相對深度學習方法,傳統(tǒng)機器學習方式的可解釋性更強,在理論分析上更有優(yōu)勢。
基于深度學習的診斷方式自2012 年Krizhevsky[33]提出后,便成為了研究的熱門,Ibragimov[34]首次研究了深度卷積神經(jīng)網(wǎng)絡(Deep Convolution Neural Network,DCNN)在全自動定量顱骨測量中的應用。深度卷積神經(jīng)網(wǎng)絡是人工智能機器學習中的一部分,它是一種深度學習體系結構,用于自主學習圖像的局部特征,并進行分類[35-36]。因此,利用深度學習來分析診斷OSA將會漸漸取代原始的機器學習以及特征點提取方式。
卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)是一類包含卷積計算且具有深度結構的前饋式神經(jīng)網(wǎng)絡,是深度學習代表算法之一,經(jīng)常被用來處理圖像。卷積神經(jīng)網(wǎng)絡通常由幾種不同類型的層組合而成,其中有數(shù)據(jù)輸入層、卷積層、激活函數(shù)、池化層、全連接層等。卷積神經(jīng)網(wǎng)絡通過卷積層中的卷積核進行特征提??;經(jīng)過池化層省略掉圖像中相鄰像素間的相似值,其原理是減少待處理的數(shù)據(jù)量,得以提高計算效率;其次利用激活函數(shù)實現(xiàn)梯度下降;最后通過全連接層實現(xiàn)結果的輸出。另一方面,卷積神經(jīng)網(wǎng)絡具有很強的容錯能力,并且在訓練和優(yōu)化方面也有很大的優(yōu)勢。
2.2.1 診斷成人OSA的深度學習方案
目前,診斷分析阻塞性睡眠呼吸暫停綜合征的深度學習方式大部分是以血氧飽和度信號、多導睡眠圖作為研究數(shù)據(jù)集,基于顱面?zhèn)任籜射線診斷阻塞性睡眠呼吸暫停綜合征的深度學習診斷還很少見。Ho[24]使用多導睡眠監(jiān)測記錄及預處理后的鼻壓力傳感器信號作為數(shù)據(jù)集,多導睡眠監(jiān)測記錄分為訓練集、模型驗證集、獨立測試集。根據(jù)驗證集測試得到最優(yōu)參數(shù)組合,將測試集傳入CNN 模型進行分類,取得了很好的篩選結果。值得一提的是,CNN模型是全自動的,并沒有手動設計特征提?。徊⑶铱梢赃M行實時監(jiān)測。另一方面,該研究并不支持睡眠呼吸暫停的多分類,只能精確地檢測到呼吸暫停低通氣事件;此外由于鼻壓力信號較為微弱的特殊性,這將影響到后期的檢測結果,這些問題使得該研究也存在著一些局限性。
Vaquerizo-Villar等[37]將746位受試者經(jīng)過預處理的夜間血氧飽和度信號作為數(shù)據(jù)集,利用卷積神經(jīng)網(wǎng)絡來自動估計小孩睡眠呼吸暫停低通氣綜合征(Sleep Apnea-Hypopnea Syndrome,SAHS)的嚴重程度,其使用的卷積神經(jīng)網(wǎng)絡模型由λ個CNN 塊組成,每塊又由包含16 個濾波器及內(nèi)核為6 的卷積層、整流線性單元(ReLU)層及系數(shù)為2的池化層合并組成。最終通過深度學習技術證明了從血氧飽和度信號中提取的信息有助于評估兒童SAHS 的嚴重程度。雖然該研究在敏感性、特異性等方面有卓越的表現(xiàn),但是數(shù)據(jù)集中非SAHS 的受試者數(shù)量居多,這將影響到CNN 評估結果;另一方面,并沒有利用常規(guī)的血氧飽和度信號作為數(shù)據(jù)集與該研究診斷結果進行比較。
Kim[38]對測試者進行了整夜的多導睡眠監(jiān)測,在受試者睡眠期間記錄他們的呼吸聲,通過頻譜減法、濾波法進行信號預處理并提取出音頻特征,使用了三種分類模型來執(zhí)行篩選OSA的任務。其中Simple Logistics模型的性能表現(xiàn)最好,深度神經(jīng)網(wǎng)絡模型由于數(shù)據(jù)集小而表現(xiàn)欠佳。在之前的許多研究中都只是將診斷結果進行二分類,而該研究實現(xiàn)了OSA 的四分類,這是少見的;而樣本數(shù)量與特征提取方面限制了深度神經(jīng)網(wǎng)絡模型的性能,因此擁有大規(guī)模數(shù)據(jù)集將會使得深度神經(jīng)網(wǎng)絡預測模型表現(xiàn)更好。
Haidar[39]的研究從100名受試者的鼻氣流信號中提取了24 480 個樣本作為數(shù)據(jù)集,提出了一種基于CNN的解決方案,使用Back Propagation 算法和Adam 優(yōu)化器對模型優(yōu)化訓練,與有優(yōu)秀表現(xiàn)的SVM 模型進行了比較。結果顯示,卷積神經(jīng)網(wǎng)絡模型不僅不需要人工設計特征提取,而且測試精確率等數(shù)據(jù)也優(yōu)于SVM。但該研究也存在著一些局限性,新設計的CNN 模型只能對睡眠呼吸暫停和呼吸不足事件做二分類,并不能做到呼吸不足嚴重程度的細分類;另外樣本數(shù)量較少的問題也影響到該模型的表現(xiàn)。
為了提高分類器的性能,Li[40]在研究中,提出了一種使用單導聯(lián)心電圖信號作為數(shù)據(jù)集的基于深度神經(jīng)網(wǎng)絡(DNN)和隱馬爾可夫模型(HMM)的OSA 檢測方法,使用邏輯回歸層的監(jiān)督模式和newton 方法對模型進行了優(yōu)化,利用無監(jiān)督機器學習算法通過稀疏自動編碼器對DNN 模型進行建模,并將HMM 與DNN 相融合以至于提高模型的性能。結果表明,該模型的敏感性為88.9%,在不漏診方面相對之前的研究表現(xiàn)十分出色,這在臨床實踐中尤為重要;但遺憾的是,雖然該研究篩選OSA 患者的準確率很高,但也沒有實現(xiàn)OSA 嚴重程度的多分類。
2.2.2 基于X線片診斷其他疾病
現(xiàn)階段,基于X線片的診斷技術大多被運用在胸肺等部位疾病中,2019年底出現(xiàn)的一種新型冠狀病毒疾?。–OVID-19)在全世界蔓延,Al-antari[41]提出一種基于YOLO預測器的深度學習診斷系統(tǒng),通過數(shù)據(jù)的平衡與隨機縮放擴充策略來微調(diào)優(yōu)化深度學習模型。YOLO預測器有著可以同時檢索潛在疾病并預測患病概率的優(yōu)勢,這較其他方法有著顯著的優(yōu)勢。雖然COVID-19與其他肺部疾病有較高的相似度,極易造成誤診,但是通過五次測試結果分析發(fā)現(xiàn),該輔助診斷系統(tǒng)正確篩選COVID-19的準確率為96.31%,有效地從其他肺部疾病中篩選出了COVID-19。
Chen[42]為了使用X 射線診斷兒童急性下呼吸道感染,提出了一種深度學習方案。其訓練了基于YOLOv3架構的模型以自動切分肺部視野,并分析比較了一對一、一對多以及基于深度學習的卷積神經(jīng)網(wǎng)絡三種方案,在CNN模型中,利用基于殘差學習ResNet方案解決了降級問題,并使用逐個元素添加連接前層的手段,使得模型更薄且更為緊密,但是由于樣本數(shù)量較少的問題,研究者只能通過五次重復交叉的方式對模型進行訓練。然而最終得出的最優(yōu)方案為一對一模型,其準確率為92.47%。雖然CNN 模型的表現(xiàn)欠佳,但也為診斷兒童急性下呼吸道感染疾病提出了一個可行的深度學習方案。
為了建立一種基于深度學習的檢測心力衰竭的研究方案,Matsumoto[43]使用美國國立衛(wèi)生研究院的638例胸部X線片作為數(shù)據(jù)集,建立深度學習模型得到74%的診斷準確率。為了提高準確率,研究者將數(shù)據(jù)重新標記去除噪聲,利用數(shù)據(jù)擴充與遷移學習技術彌補數(shù)據(jù)集小的缺陷,并且避免了由數(shù)據(jù)集小造成過擬合的現(xiàn)象,最終得出診斷心力衰竭準確率為82%的優(yōu)秀結果。但另一方面,該研究數(shù)據(jù)集較小的問題還是對診斷準確率造成了不小的影響,提升樣本數(shù)量會使得研究結果更佳;并且該研究只能通過識別由心力衰竭造成的“心臟肥大或充血”來篩選該疾病,而除了心力衰竭也有別的疾病癥狀與之相似,所以這也是該研究的一個局限性。
在另一項判斷骨骼生長潛力的研究中,Chen[44]提出了一種基于X 射線的深度學習解決方案。該方法首先利用深度卷積神經(jīng)網(wǎng)絡對手骨X 線片進行自動特征提取,利用支持向量機對所提取的特征再次進行分類,并評測了該模型與傳統(tǒng)特征提取再分類的性能,發(fā)現(xiàn)該系統(tǒng)具有更高的準確率。因此基于深度神經(jīng)網(wǎng)絡的特征提取方式較傳統(tǒng)的人工特征提取方式有很大的優(yōu)勢,可以提取到更多有用的特征。另一方面,雖然該方法擁有更好的性能,但是人們只能關注到系統(tǒng)的輸入以及輸出,至于內(nèi)部過程及原理是完全不了解的。
通過總結X 射線以及阻塞性睡眠呼吸暫停的深度學習相關研究,基于顱面?zhèn)任黄腛SA 診斷系統(tǒng)的分析檢測過程大致分為以下四個步驟:
(1)對所有測試者(其中包括非OSA 群體)進行側位頭顱X線檢查,并通過多導睡眠監(jiān)測記錄所有測試者的呼吸暫停低通氣指數(shù)(非OSA、輕度、中度、重度)。
(2)保留屬于重度OSA 的患者信息和非OSA 者的信息,并將數(shù)據(jù)集中的部分無用數(shù)據(jù)清除,如年齡小于20歲的測試者還處在生長發(fā)育階段,其骨骼尚未發(fā)育完全,考慮其骨骼可能會繼續(xù)生長發(fā)育的因素,將其信息清除,不做考慮。
(3)為了減少后期的訓練時間,考慮將數(shù)據(jù)集中的X 線片進行裁剪,來減小X 線片的大小,以至縮短計算機的訓練時長。分組大致為:A組原始圖像;B組將原始的X線片進行裁剪。
(4)最后,將數(shù)據(jù)集中75%的數(shù)據(jù)設為訓練集;25%的數(shù)據(jù)設為測試集。通過對不同組進行訓練、測試,繼而對比A、B兩組,分析不同組之間在耗時長短、準確度等方面的優(yōu)勢與劣勢,如圖2所示。
圖2 深度學習診斷步驟
關鍵點診斷方式是傳統(tǒng)診斷方式中的一種,通過分析顱面?zhèn)任籜線片中相關的特征點來診斷阻塞性睡眠呼吸暫停綜合征,其有著價格低廉、解釋性較高等優(yōu)點。但是關鍵點的提取十分依賴專業(yè)知識以及特定的分類器,而特定的分類算法又依賴于大量的訓練以及調(diào)試工作,因此基于關鍵點的診斷方式泛化能力及魯棒性較差。
而基于機器學習的傳統(tǒng)診斷方式,技術相對成熟,效率高,但是任意一種機器學習算法都有各自的優(yōu)缺點,比如決策樹由于無約束,可能出現(xiàn)過擬合的現(xiàn)象;支持向量機在圖像處理中又不利于處理較大的數(shù)據(jù)集。
對于深度學習方式,該方式主要是依靠大量的數(shù)據(jù)樣本作為基礎,雖然對數(shù)據(jù)的準確度要求很高,但是對數(shù)據(jù)的測試結果更準確、更高效,并且由于深度學習獨特的特征提取技術,使得其泛化能力極高。但是也不能忽視深度學習對數(shù)據(jù)集和計算機設備的嚴苛要求,以及訓練所需的時間更長等缺點,如表4。
回顧之前的相關研究,Bhatt[45]發(fā)現(xiàn)深度學習雖然可以為不同的醫(yī)學研究(如圖像分類、組織分類、癌細胞特征、檢測和分割)得出樂觀的結果。但深度學習模型主要取決于系統(tǒng)的功能和針對研究課題的數(shù)據(jù)獲取,這將會使系統(tǒng)變得更為復雜,對研究所需數(shù)據(jù)的準確性要求也非常高[46],而且標記過程仍然需要專業(yè)的知識作為基礎?;陲B面?zhèn)任黄某扇薕SA深度學習輔助診斷系統(tǒng),訓練模型的數(shù)據(jù)集不僅需要大量的顱面?zhèn)任籜 線片,同時需要與之一一對應的AHI 診斷結果,以明確OSA 嚴重程度。而AHI 診斷結果又將依賴于多導睡眠監(jiān)測,實現(xiàn)基于深度學習方法的系統(tǒng)成本將會很高,所以成本因素仍然是面臨的一個不可忽視的挑戰(zhàn)。模型如何利用較少的樣本進行有效的學習是十分重要的,比如利用少量的邏輯知識替代大規(guī)模的數(shù)據(jù)堆積,將深度學習與知識圖譜、邏輯推理等理論相互結合,以至在有限的數(shù)據(jù)集中訓練出優(yōu)秀的深度學習模型。
此外,深度學習主要依靠隨機梯度法來訓練深度卷積神經(jīng)網(wǎng)絡,該方式不能同時運行在多個計算機之間。而且利用CPU 來訓練傳統(tǒng)的深度卷積神經(jīng)網(wǎng)絡模型,將面臨著耗時長的問題,用單個處理器訓練如此大的數(shù)據(jù)集也是一項非常有挑戰(zhàn)性的任務。因此,需要使用Adam 等自適應優(yōu)化算法來對深度學習模型進行優(yōu)化,以至提高學習效率減少訓練時間,另一方面,計算機硬件與軟件的設計都是必須的,只有性能更好的硬、軟件設備和優(yōu)秀的算法,才能使得訓練耗時長的問題得以解決。
深度學習雖然可以發(fā)現(xiàn)事物之間存在的關聯(lián)性,并建立起來一一對應的映射關系,但是深度學習并不能解釋其中的因果關系,即與醫(yī)師進行分析診斷不同的是,雖然它的篩選結果十分優(yōu)秀,但沒有辦法為已處理圖像做出有利的醫(yī)學解釋,這也是一項具有挑戰(zhàn)性的任務。因此在未來的工作中,對模型內(nèi)部事務運作原理的探究是非常有必要的。并改進模型算法,在系統(tǒng)給出輔助診斷結果的同時,也給出相應的醫(yī)學解釋。
表4 不同診斷方式的優(yōu)缺點
本文的研究中,主要分析了傳統(tǒng)方式和深度學習方式在診斷阻塞性睡眠呼吸暫停中的應用。也是阻塞性睡眠呼吸暫停綜合征人工智能診斷系統(tǒng)實現(xiàn)的重點研究方向。傳統(tǒng)方式主要分為兩類,一類為基于關鍵點的傳統(tǒng)方式來OSA,關鍵點分析診斷主要是人工設計特征提取器進行特征提取,進而通過和標準值對比得出最終的診斷結果;另一類為機器學習方式主要是利用傳統(tǒng)的機器學習算法如:支持向量機、決策樹等,與多導睡眠監(jiān)測結果相結合,再對阻塞性睡眠呼吸暫停做出最終診斷結果。
深度學習使用神經(jīng)網(wǎng)絡技術來生成“程序”,這種技術只會將結果與圖像之間建立一個一對一的映射關系,它對執(zhí)行任務的底層原理是不知所以然的。雖然深度學習已經(jīng)成為圖像分析處理領域的一個重要的組成部分。但傳統(tǒng)的機器學習方法并沒有完全被深度學習所取代,而且傳統(tǒng)的機器學習仍然可以對一些特定的問題作出很好的分析。雖然人們設計的基于傳統(tǒng)機器學習的分類器在處理相關問題時沒有深度學習那么優(yōu)秀,但是它可以保證很好的可理解性。深度學習可以通過強大的處理能力給出很好的結果,但仍然需要大量的絕對準確的數(shù)據(jù)集作為基礎,并且對硬件的要求遠遠高于傳統(tǒng)的機器學習。
阻塞性睡眠呼吸暫停綜合征人工智能診斷系統(tǒng)的開發(fā)還面臨著諸多的難點和挑戰(zhàn),深度學習自動化診斷必然是目前研究的主要方向之一,深度學習技術的客觀性,以及更少的勞動力需求,更快的效率和更高的準確率等優(yōu)勢,必將為診斷阻塞性睡眠呼吸暫停綜合征帶來更好的前景和未來。