馬瑞民 謝銳濤 黃 瑩 郗文輝 魏彥杰* 潘 毅,3*
1(中國科學院深圳先進技術研究院 深圳 518055)
2(中國科學院大學 北京 100049)
3(深圳市智能生物信息學重點實驗室 深圳 518055)
孤獨癥譜系障礙(autism spectrum disorder,ASD),簡稱孤獨癥,也稱孤獨癥,是一種復雜的神經(jīng)發(fā)育障礙,其特點包括社交障礙、刻板行為和興趣狹隘等[1]?;純涸谟變簳r期便開始出現(xiàn)單一或多種特征,影響社交、溝通、學習、適應性發(fā)展等功能[2]。ASD 的確切病因尚不清楚,目前研究認為是由遺傳、大腦發(fā)育、免疫、家庭及生活習慣等多種因素導致的復雜疾病,ASD個體間的連續(xù)性變異可能反映了這些因素和相關機制不同程度的表達[3-4]。ASD 是患病率攀升速度最快的兒童精神疾?。簱?jù)美國疾病控制與預防中心 2020 年的統(tǒng)計數(shù)據(jù),美國兒童患 ASD 的人數(shù)比例為 2.76%,即每 36 個兒童中就有 1 位確診[5];在我國,ASD 的患病率在 0.7%~1%,保守估計每年將有約十萬的新生潛在患兒[6-7]。ASD 造成世界范圍內(nèi)的巨大經(jīng)濟損失和社會負擔,然而,目前,ASD 的臨床診斷缺乏高效靈敏的生物標記物,多數(shù)情況下依賴于醫(yī)生的臨床癥狀評估量表,一般依照《精神疾病診斷與統(tǒng)計手冊》(第五版)的診斷標準,結合數(shù)種常用的ASD 評定量表,如《ASD 診斷觀察量表》《孤獨癥診斷訪談量表》(修訂版)等[8-10]來對 ASD進行診斷。由于 ASD 診斷沒有相關的病理生理標志物來幫助診斷,其癥狀常與其他精神疾病如智力殘疾、精神分裂等重合,因此導致基于行為量表的 ASD 診斷存在一定的誤診率[11]?;诠陋毎Y檢測的當前困境,需要發(fā)展行為量表之外的生物特征來提高孤獨癥檢測的精度,降低誤診率。
隨著神經(jīng)影像學的發(fā)展,研究者開始探索使用神經(jīng)影像數(shù)據(jù)來對 ASD 進行診斷。早期基于神經(jīng)影像的 ASD 診斷通過分析大腦區(qū)域的結構連接、活動性能及功能連接來進行[12-13]。臨床醫(yī)生基于神經(jīng)影像的常規(guī) ASD 診斷方法存在一系列的問題,如圖片分辨率低、對運動偽影敏感等,歸根結底在于人眼對影像的處理能力有限,圖像信息的特征提取精度低、嚴重依賴經(jīng)驗判斷。隨著人工智能方法的快速發(fā)展,許多研究開始采用機器學習的方法提升影像特征提取精度,已發(fā)展出多種類型的機器學習方法,以提升醫(yī)學影像的自動分析能力,輔助醫(yī)生進行診斷[14-15]。影像學數(shù)據(jù)存在空間依賴性,可以使用二維卷積網(wǎng)絡進行特征提取,二維卷積網(wǎng)絡可在實現(xiàn)數(shù)據(jù)降維的同時保留部分空間依賴信息[16]。對于功能磁共振影像(functional magnetic resonance imaging,fMRI)這類同時擁有空間依賴性和時間依賴性的影像數(shù)據(jù)而言,可采用三維卷積網(wǎng)絡來進行特征提取,保留特征中的空間和時間依賴性信息[17]。對于大量沒有標注的影像學數(shù)據(jù)來說,可以利用自動編碼器等無監(jiān)督學習方法進行特征提取,進而用于 ASD 診斷[18]。
基于機器學習的 ASD 診斷研究大多集中在提升特征提取精度上,但是作為一種數(shù)據(jù)驅動方法,機器學習很難在訓練數(shù)據(jù)外的區(qū)域進行外推;當訓練數(shù)據(jù)過少時,高精度特征提取效果并不顯著。加之神經(jīng)影像數(shù)據(jù)的收集較為昂貴,通過收集更多數(shù)據(jù)的方式來提高 ASD 檢測準確率的研究思路在許多場景中不具備客觀條件。因此,通過提升已有數(shù)據(jù)的質(zhì)量來提升模型訓練精度是一種有效的改進方法。數(shù)據(jù)增強方法是通過添加已存在數(shù)據(jù)的略微修改副本或從現(xiàn)有數(shù)據(jù)中新創(chuàng)建合成數(shù)據(jù)來增加數(shù)據(jù)量的技術,發(fā)揮了類似正則器的作用,有助于在訓練機器學習模型時減少過度擬合問題[19]?;诖殴舱裼跋駭?shù)據(jù)驅動的 ASD 診斷領域時常面臨數(shù)據(jù)量不足的問題,數(shù)據(jù)增強技術有助于提升機器學習模型的泛化性能,改進測試集上的預測準確率。J?nemo 等[20]利用三維卷積神經(jīng)網(wǎng)絡對 ASD 患者的 fMR 進行分類,通過圖片的反轉、旋轉、縮放、亮度調(diào)控、彈性形變等數(shù)據(jù)增強技術提升可用于訓練的fMRI 數(shù)據(jù)量,然而,分類準確率的提升效果并不明顯。Eslami 等[21]利用特征間線性插值的方式生成新的 fMRI 特征,并通過偽標注的數(shù)據(jù)增強方式將 ASD 的分類準確率提升至 28%~82%。另有研究者對 fMRI 使用合成少數(shù)過采樣技術(synthetic minority oversampling technique,SMOTE)進行數(shù)據(jù)增強,提升了 ASD 分類的準確率[22-23]。
數(shù)據(jù)增強方法通過增加合成數(shù)據(jù)來提升分類準確率,提升的效果各不相同,并不總能獲得顯著提升。關鍵點在于所增添的數(shù)據(jù)既會提供任務相關信息,也會引入無關噪聲,信噪比決定了分類準確率的提升效果,引入信噪比小的合成數(shù)據(jù)并無益處?;诖竽X磁共振影像的 ASD 診斷通常面臨數(shù)據(jù)集小、合成數(shù)據(jù)信噪比小等問題,因此需要發(fā)展有效的數(shù)據(jù)增強方法。同時,傳統(tǒng)的ASD 腦影像標注通常基于專家對患者的行為觀察,存在一定的誤診情況,使得數(shù)據(jù)標注存在一定的偏差,即引入了原始標注的噪聲。如果能夠自動糾正這些錯誤的標注,則將有助于提升數(shù)據(jù)質(zhì)量及分類準確率。本文提出一種新的數(shù)據(jù)增強模型,自動對原始磁共振影像特征生成一組新的標注,在不增加新合成數(shù)據(jù)的前提下,提升數(shù)據(jù)質(zhì)量及分類準確率。與原始磁共振影像特征和原始標注的預測結果相比,本文發(fā)展的數(shù)據(jù)增強方法引入的新標注顯著提升了 ASD 分類預測的準確率;與其他同類機器學習模型相比,準確率提升了 10%~20%。
本研究將孤獨癥腦成像交換數(shù)據(jù)庫 I(autism brain imaging data exchange I,ABIDE I)[24]中的密西根大學樣本庫 1(University of Michigan: sample 1,UM1)[25]作為研究數(shù)據(jù)集。UM1 數(shù)據(jù)集共包含 109 個樣本,其中:54 個為 ASD 患者,年齡范圍為 8.5~18.6 歲;55 個為對照組,年齡范圍為8.2~19.2 歲。無論是 ASD 患者,還是對照組,均要求智商大于 85?;颊叩脑\斷結果是密西根大學孤獨癥和溝通障礙中心的醫(yī)生基于《自閉癥診斷訪談量表》(修訂版)和《孤獨癥診斷觀察量表》的結果進行判定的。采集 MRI 的儀器型號為 3 Tesla GE Signa,109 個樣本的數(shù)據(jù)包括 fMRI 和結構性磁共振成像,本工作中所有的數(shù)據(jù)分析均基于 UM1 的 fMRI 數(shù)據(jù)集。
本研究中提出的數(shù)據(jù)增強模型的流程和提升目標如圖1 所示。首先,將數(shù)據(jù)/影像特征輸入數(shù)據(jù)增強模型中,產(chǎn)生新的標注,接著將數(shù)據(jù)特征和新標注輸入隨機森林模型中,采用十折交叉驗證(十次切分數(shù)據(jù)進行訓練和驗證,每次的訓練集占比均為 0.9,驗證集占比均為 0.1),輸出新的分類準確率S2。將相同的數(shù)據(jù)特征及其原始標注輸入隨機森林模型中,同樣采用十折交叉驗證輸出原始的分類準確率S1。本研究的目標是通過比較兩組結果的分類準確率,尋到數(shù)據(jù)增強模型中可以使新的分類準確率有所提升的新標注,這里的提升閾值設置為 10%~20%。為了進行多輪實驗獲得具有統(tǒng)計意義的結果,該流程被執(zhí)行 500次,通過隨機丟棄部分原始數(shù)據(jù)特征(78 個樣本被留下),使得每輪實驗過程中輸入增強模型和隨機森林模型的數(shù)據(jù)特征集都不一樣,統(tǒng)計不同數(shù)據(jù)集輸入產(chǎn)生的實驗結果,增強實驗的可靠性。
圖1 數(shù)據(jù)增強流程和提升目標Fig.1 Data augmentation process and goals to optimize
整個數(shù)據(jù)增強模型的算法實現(xiàn)采用 PyTorch語言[26],算法流程圖包含兩個階段,如圖2 所示。第一階段,使用監(jiān)督學習方法來學習影像特征的分布,即P(Y|X),其中,Y為標注(孤獨癥/非孤獨癥),X為原始磁共振影像特征。學習到的模型將作為后期強化學習的先驗,用于防止強化學習過程中生成過度不合理的標注。為了更好地模仿專家的標注行為,將雙向循環(huán)神經(jīng)網(wǎng)絡(bidirectional recurrent neural network,bi-RNN)作為先驗模型[27],即使用遞歸任務標記一批醫(yī)學圖像,專家對每個圖像依次標記,但標注行為不會只進行一次,專家可能會在一輪標注后回溯結果,以確保診斷足夠準確。在一批圖像的標注過程中,使用 bi-RNN 模型能夠有效實現(xiàn)其中任何一個圖像均可將之前和/或之后觀察到的圖像作為參考(雙向)。這里選用門控循環(huán)單元作為 bi-RNN 的基本單元,門控循環(huán)單元采用單層隱藏層網(wǎng)絡,其大小為 3。Adam 優(yōu)化器[28]對 bi-RNN優(yōu)化 1 000 步,盡可能地捕獲影像特征的數(shù)據(jù)分布,學習率為 0.005,每次輸入模型訓練的數(shù)據(jù)批次大小為原始數(shù)據(jù)的大小,超參數(shù)通過網(wǎng)格搜索選擇。
圖2 用于獲取提升分類準確率新標注的數(shù)據(jù)增強框架Fig.2 Data augmentation framework used for generation of new annotations that can improve the accuracy of classification
數(shù)據(jù)增強算法的第二個階段是對代理模型進行訓練。該代理模型具備與先驗模型相同的架構,是尋找提升分類準確率的新標注的代理人(agent)。在訓練該代理模型的每一步中,將原始磁共振影像特征輸入到代理模型中,由代理模型輸出新標注,使用隨機森林[29]模型量化原始磁共振影像和新標注之間的關系,并計算十折交叉驗證準確率(S)。隨后,S會被用作強化學習的激勵或者反饋。bi-RNN 的輸出是 logits,其值在0 和 1 之間,表示預測為孤獨癥(標為 1)的可能性。將原始磁共振影像特征分別輸入代理模型和訓練好的先驗模型中,計算它們預測孤獨癥的對數(shù)概率,表示為 logProbprior和 logProbagent。強化學習的損失函數(shù)定義為
其中, 為可以調(diào)整的超參數(shù),本研究通過多組實驗對比,將該值設置為 200。訓練代理模型所采用的優(yōu)化器和學習率跟訓練先驗模型時的一致,訓練的迭代輪次(epoch)設置為 100,每輪(epoch)訓練過程中,被輸入網(wǎng)絡的數(shù)據(jù)批次大小(batch size)為原始樣本數(shù)據(jù)的大小。為了防止代理模型生成無意義的標注分布,這里通過設計損失函數(shù),使代理模型產(chǎn)生的新標注分布盡可能地接近訓練好的先驗模型產(chǎn)生的標注分布。
為了更好地呈現(xiàn)整個算法的流程,表1 展示了數(shù)據(jù)增強算法實現(xiàn)的偽代碼。
表1 數(shù)據(jù)增強算法的偽代碼Table 1 Pseudocode of data augmentation algorithm
本研究將隨機挑選的磁共振影像樣本特征作為輸入。如圖1 所示,數(shù)據(jù)增強流程經(jīng)過 500 次重復,每次隨機挑選樣本產(chǎn)生不同的數(shù)據(jù)集,使得結果更具統(tǒng)計意義。在每一次重復數(shù)據(jù)增強的流程中,分別記錄原始分類準確率和新的分類準確率,并對兩者進行比較。圖3(a)為 500 次重復實驗過程中原始分類準確率的分布(藍色),圖3(b)為 500 次重復實驗過程中新的分類準確率的分布(綠色)。如圖3(a)所示,原始分類準確率分布在 60% 左右;如圖3(b)所示,新的分類準確率分布在 80% 左右。為了更精準地量化新分類的準確率提升,計算了新的分類準確率和原始分類準確率之差,并按照降序重新排列,如圖3(c)所示(紅色)。為了便于對照,圖3(a)和 3(b)的橫坐標排列順序與圖3(c)遵循相同的規(guī)則。假設醫(yī)生在標注過程中不會出現(xiàn)過多的失誤,不能無限度提升準確率,而訓練增強算法可能會因過度擬合現(xiàn)有數(shù)據(jù),造成在現(xiàn)有數(shù)據(jù)上效果很好,但在其他數(shù)據(jù)集上效果就很差的現(xiàn)象。因此,需要對增強算法在現(xiàn)有數(shù)據(jù)集上的性能進行約束,將新的分類準確率的提升約束在 10%~20% 之間,即在 500 次實驗中,如果找到提升分類準確率介于 10%~20% 的新標注,則輸出新的分類準確率;反之,則輸出 0。在實驗中存在少數(shù)沒有找到提升分類準確率介于10%~20% 之間的新標注的情況,因此,圖3(c)中的末尾部分存在少量的負數(shù)例子。除此之外的其他新標注的分類準確率提升在 10.2%~20.0%之間不等。在所有實驗中,共有 494 次(98% 以上)實驗找到可以提升分類準確率 10%~20% 的新標注,即對于不同的數(shù)據(jù)集而言,本方法都能夠比較穩(wěn)定地通過數(shù)據(jù)增強的方式提升其分類準確率。為了更加直觀地說明本研究提出算法的有效性,500 次實驗的量化比較結果如表2 所示。從表2 可以看出,500 次實驗中,數(shù)據(jù)增強算法產(chǎn)生的平均準確率為 83.8%,而不進行數(shù)據(jù)增強產(chǎn)生的平均準確率為 66.5%,比引入數(shù)據(jù)增強算法的實驗結果低 17.3% 的準確率。
表2 500 次實驗數(shù)據(jù)增強得到的平均準確率與不進行數(shù)據(jù)增強(原始)得到的平均準確率結果Table 2 Mean accuracies obtained from methods with/without data augmentation in 500 experiments
圖3 500 次實驗中的分類準確率Fig.3 Classification accuracy in 500 trials
為了進一步闡明準確率提升與標注之間的關系,圖3(d)展示了原始分類準確率和新舊二者之差(新的分類準確率-原始分類準確率)的配對關系。對于原始分類準確率較低的區(qū)域(<0.6)來說,提升準確率的效果較為顯著,集中于 0.2左右(藍色區(qū)域左部)。而對于原始分類準確率較高的區(qū)域(>0.6)而言,準確率的提升效果開始下降,具體表現(xiàn)為準確率提升的變化幅度變大(藍色區(qū)域右部)。一種可能的解釋是,對于原始分類準確率較高的數(shù)據(jù)集來說,特征和標注間的關系簡單,決策邊界清晰,可能歸因于標注中的噪聲比較小,準確率的提升空間較??;反之,對于原始分類準確率較低的數(shù)據(jù)集來說,標注中的噪聲比較大,準確率的提升空間較大。
在證實了模型可以穩(wěn)定提升準確率之后,在固定數(shù)據(jù)集的基礎上,本研究著眼于從可以提升準確率的標注分布候選中尋找最合理的標注分布,并進行可解釋分析。對于生成的新的標注分布來說,不同的標注分布可以提升相似的準確率,但不是所有能夠提升分類準確率的標注分布都是合理的,即統(tǒng)計意義上的準確率提升并不能保證模型能夠糾正醫(yī)學上的錯誤標簽,因而需要對生成的標注分布進行后篩選,并嘗試進行解釋。用上述的數(shù)據(jù)增強模型進行新的標注生成,并計算使用原始磁共振影像特征和原始標注在隨機森林模型上能達到的孤獨癥分類性能(十折交叉驗證準確率),以及使用原始磁共振影像特征和新的標注在隨機森林模型上能達到的孤獨癥分類性能。通過比較新的分類準確率和原始分類準確率,保留能將分類準確率提升 0~10% 的新的標注分布。選擇該范圍是為了在初期盡可能減少新的標注和原始標注之間的差異,從而便于追蹤造成差異的原因。上述過程重復了 50 000 次,以確保找到盡可能多地滿足指定條件的新的標注分布。
在 50 000 次的實驗當中,共找到了 70 個滿足指定條件的新標注分布。將這 70 個標注分布與原始標注進行比較,并計算新的標注分布較之原始標注分布的改變比例,標注改變比例和準確率提升的配對圖如圖4 所示。通過生成新的標注分布來將分類準確率提升 0~10%,標注改變比例可以從 40.37% 變化到 57.80%,有著較大的改變。同時,當標注改變比例R較小時(40.37%≤R<45.00%),準確率提升變化幅度較小,在 7%~10% 之間;而當標注改變比例較大時(45.00%≤R≤57.80%),準確率提升變化幅度較大,為 2%~10% 之間??梢钥闯?,當生成的新的標注分布和原始標注分布之間的差異較大時,即過多地改動原始的標注分布時,不一定能穩(wěn)定且顯著地提升分類準確率。另一個問題在于,新的標注分布較原始標注分布的改變比例較大,最小的也有 40.37%,使得追蹤和驗證生成的新標注是否合理具有一定的挑戰(zhàn)性。
圖4 標注改變比例和準確率提升的配對圖Fig.4 Pair plot between label-change-ratio and classification-accuracy-improvement
增強 ABIDE 結構磁共振影像數(shù)據(jù)進行孤獨癥分類的研究較少,現(xiàn)有的數(shù)據(jù)增強方法主要有兩種。一種是對原始影像進行編輯轉換,擴增影像的數(shù)量。有研究者提出了動態(tài)數(shù)據(jù)增強的方法,每次訓練網(wǎng)絡前,將 ABIDE I 訓練集中的結構磁共振影像進行隨機 0~15°范圍內(nèi)的旋轉、隨機水平或豎直方向偏移 20%、隨機 0~15% 的放大或縮小、隨機 0.1~1(1 代表原始亮度)的亮度變化,使得每次訓練網(wǎng)絡時輸入的影像數(shù)據(jù)都不一致,擴增了訓練影像的數(shù)量,提出的模型和數(shù)據(jù)增強方法在 ABIDE I 影像上達到約 80%的孤獨癥檢測準確率[30]。相似地,Nogay 等[31]將 ABIDE 上的結構磁共振影像分別進行水平翻轉、右旋轉 90°和 180°、加入噪聲,使得增強后的訓練數(shù)據(jù)量是原先的 5 倍,在孤獨癥檢測上取得不錯的結果。另一種是基于生成對抗網(wǎng)絡產(chǎn)生新的影像。Liu 等[32]提出了一個多輸出的條件對抗生成網(wǎng)絡,用于生成新的功能和結構磁共振影像特征。該生成網(wǎng)絡采用底部全連接層共享的策略,學習不同模態(tài)數(shù)據(jù)的聯(lián)合表征,接著使用兩個獨立的全連接網(wǎng)絡模塊分別生成新的功能和結構磁共振影像特征,原始和新生成的特征被輸入到分類網(wǎng)絡中。實驗結果表明,采用多輸出條件生成對抗網(wǎng)絡產(chǎn)生新特征的數(shù)據(jù)增強方式,在 ABIDE I 上能夠提升 4% 的孤獨癥檢測準確率(達到 72.9%)。雖然這些數(shù)據(jù)增強方法能夠給模型帶來一定程度的性能提升,但提升效果并不明顯,而且這些方法都基于原始影像和特征進行數(shù)據(jù)擴充,增加訓練數(shù)據(jù)量的同時也使得訓練過程變慢、訓練難度增大,且盲目地擴增數(shù)據(jù)也容易引入一些不必要,甚至是干擾的信息。與這些方法不同的是,本文提出的數(shù)據(jù)增強新范式基于修正數(shù)據(jù)標簽進行,能夠在不增加數(shù)據(jù)量的情況下明顯提升孤獨癥檢測的準確率(10%~20%)。且由于本文提出的方法并無引入其他數(shù)據(jù)信息,因此不容易受干擾,使得數(shù)據(jù)增強帶來的模型性能提升效果更加穩(wěn)定。在 500 次實驗中,模型性能提升 10%~20% 的次數(shù)達到了 494 次,進一步說明基于修正數(shù)據(jù)標簽的數(shù)據(jù)增強算法的穩(wěn)定性和可靠性。
為了進一步驗證所提出的算法的優(yōu)越性,本研究采用現(xiàn)有數(shù)據(jù)增強方法進行實驗,分別對影像特征進行水平翻轉和添加隨機噪聲的操作。實驗結果表明,水平翻轉的數(shù)據(jù)增強方式在 500 次實驗過程中提升 10% 以上準確率的次數(shù)為 8,而隨機添加噪聲的數(shù)據(jù)增強方式在 500 次實驗過程中提升 10% 以上準確率的次數(shù)為 50,驗證了本研究提出的增強算法在孤獨癥分類方面的優(yōu)越性(500 次實驗提升準確率在 10%~20% 的次數(shù)為 494)。為了進一步驗證所提出算法的普適性,本文在 ABIDE I 另一個中心(CMU)數(shù)據(jù)集進行實驗,在 500 次實驗中能有效提升準確率在10%~20% 的次數(shù)達到 500。除此之外,不同的分類算法也被應用到本研究提出的數(shù)據(jù)增強算法中。具體地,原始的影像特征和數(shù)據(jù)增強模型產(chǎn)生的新標注也被輸進 SVM、XGBoost 和 GBDT分類器中。實驗結果表明,本文提出的數(shù)據(jù)增強算法在其他分類器上也能產(chǎn)生較好的結果,500次實驗提升準確率在 10%~20% 的次數(shù)分別為499(SVM)、492(XGBoost)、486(GBDT),這說明本研究提出的算法具備較好的普適性。
本研究聚焦于利用大腦結構磁共振影像進行孤獨癥分類的人工智能算法改進,提出了一種新的數(shù)據(jù)增強模型。與現(xiàn)有的通過擴增結構磁共振影像或特征進行數(shù)據(jù)增強的算法不同,該模型采用修正數(shù)據(jù)標簽的思想,能夠在不增加數(shù)據(jù)量的情況下提升數(shù)據(jù)質(zhì)量,明顯提升了孤獨癥分類的準確率。且由于本文提出的增強算法沒有盲目引入其他數(shù)據(jù)信息,不易于受干擾,因此效果更加穩(wěn)定。ASD 的傳統(tǒng)診斷依賴臨床行為量表,存在誤診的情況,即原始標注之中可能會有噪聲,本文通過為原始特征生成新的標注來提升數(shù)據(jù)質(zhì)量,并基于 ABIDE I 中的 UM1 數(shù)據(jù)集進行訓練、模型測試,結果證實,新的標注分布確實能夠帶來分類準確率的提升。同時,對于提升相似的分類準確率來說,可以有不同的新的標注分布。在臨床醫(yī)學的診斷上,并不是所有的標注分布都是合理的,即分類準確率的提升不等價于對原始標注的成功糾錯。例如,將標注中的 0 和 1顛倒,并不會損失分類準確率,但是卻是完全錯誤的標注。本文的研究結果表明,新標注分布與原始標注分布之間的差異較大,這為標注的驗證帶來了極大的挑戰(zhàn),擬在未來工作中,與臨床醫(yī)生建立進一步的聯(lián)合分析,借助于臨床醫(yī)生的診斷經(jīng)驗,進一步分析和驗證標注的數(shù)據(jù)增強方法的可靠性和可解釋性。