高 原,楊 嬌,趙 凌,溫川飆,張藝凡,羅 悅**
(1. 成都中醫(yī)藥大學醫(yī)學信息工程學院 成都 611137;2. 成都中醫(yī)藥大學針灸推拿學院 成都 611137;3. 成都市第一人民醫(yī)院 成都 610016)
發(fā)表于Nature Reviews Cardiology的文章指出“急性冠脈疾病主要是由于斑塊破裂和血栓引起,而侵入性診斷手段具有造成斑塊破裂的風險,這為冠心病的無創(chuàng)檢測提供了獨特的機會”[1]。慢性穩(wěn)定性心絞痛(Chronic Stable Angina,CSA)是指由心肌缺血缺氧引起的典型心絞痛發(fā)作,其主要表現(xiàn)為在1-3 個月內心絞痛發(fā)作的頻率、程度、誘發(fā)及緩解因素相對穩(wěn)定的冠心病類型,也是嚴重危害人類健康的主要心血管疾病。目前冠心病診斷的“金標準”仍是冠狀動脈造影和血管內皮超聲,但其皆為有創(chuàng)性檢查,且可能具有造影劑過敏、腎毒性、心律失常等副作用[2]。最新的《冠心病合理用藥指南》(2018版)[3]指出冠脈造影臨床上主要應用于危險分層較高的患者,而對高?;颊邉t慎用(高危檢查),這嚴格限制了適用的人群,在臨床上并不做常規(guī)推薦;其檢測成本較高,加重了患者的經濟負擔。因此,探索建立一種無創(chuàng)、安全、簡便、低成本的CSA 疾病輔助診斷方法,彌補當前冠狀動脈造影檢測的局限性將具有良好的臨床運用價值。
人工神經網絡(Artificial Neural Network,ANN)是由大量處理單元(或稱“神經元”)在系統(tǒng)內部廣泛互連而成的可訓練網絡,是在現(xiàn)代神經科學研究成果的基礎上提出的能模擬人腦智能和形象思維能力的一條重要途徑和方法[4]。ANN 通過模擬人腦神經系統(tǒng)的組織方式來構成的非線性自適應信息處理系統(tǒng),具有強大的學習和自我組織能力,是現(xiàn)代信息技術的研究熱點?;贏NN 的模式分類,已經實現(xiàn)了各類復雜問題的分類應用,如圖像分類[5]、自然語言處理[6]、語音識別等[7]。在醫(yī)學領域,尚宇等[8]采用誤差反向傳播網絡(Back Propagation,BP)及其改進算法,實現(xiàn)了對HRV信號的初步識別。王振飛等[9]提出了1 種自適應模塊化神經網絡結構模型(AMNN)用來預測心血管疾病的方法。實驗結果表明,該模型相對標準的隨機森林算法預測疾病準確率高、收斂速率快。安瑩等[10]提出1種基于電子病歷數(shù)據(jù)挖掘的心血管疾病風險預測模型,該模型利用循環(huán)神經網絡等技術對患者的歷史電子病歷數(shù)據(jù)進行表征學習,不僅能有效捕獲電子病歷數(shù)據(jù)中的時序特征,而且其特征工程無需人工干預。葉學松等[11]基于整周期心音信號小波分析提取冠狀動脈疾病心音特征,并將CAD 病人組及非冠心病對照組提取的心音特征結合人體的個體特征參數(shù)輸入到神經網絡進行學習,最后實現(xiàn)冠狀動脈疾病的智能化診斷。徐冠等[12]提出了1 種基于優(yōu)化算法的神經網絡智能診斷系統(tǒng),即首先采用LM 算法對網絡進行訓練,然后通過黃金分割優(yōu)選法對網絡隱含層節(jié)點數(shù)進行優(yōu)選。
綜上可見,ANN 技術為包括冠心病在內的多種心臟疾病輔助診斷提供了新思路。本文以ANN 技術為技術基礎,同時以中醫(yī)經絡腧穴理論(穴位敏化)為理論基礎,提出了1種CSA疾病輔助預測模型構建思路。
人工智能技術是當前國內外信息技術領域的研究熱點。廣義上講,人工智能技術包括傳統(tǒng)機器學習技術與ANN 技術。相較于以統(tǒng)計學理論為基礎的傳統(tǒng)機器學習技術[13](如支持向量機、貝葉斯網絡、決策樹),ANN 技術基于仿生學理論,該技術通過模擬大腦神經元的感知方式,能更加逼近人類真實的思維活動,特別是隨著網絡深度的增加,ANN 表現(xiàn)出了強大的特征提取能力[14]。由于連接方式的不同,典型的神經網絡可分為多層感知器神經網絡(MLP)、卷積神經網絡(CNN)、循環(huán)遞歸神經網絡(RNN)等[15-17]。從結構上講,ANN 由大量的神經元組合而成,各神經元之間通過帶可變權重的有向弧連接。網絡通過對已知樣本數(shù)據(jù)反復學習訓練,逐步調整神經元連接權重,達到信息處理目的[18]。
真實世界中,很多事務之間都存在著特定的高維多階復雜映射關系,而ANN 提供了一種基于樣本驅動的方式擬合高維多階復雜映射函數(shù)的通用方法。該方法使計算機具有極好的數(shù)據(jù)處理能力和自我組織學習能力,能在大量樣本集訓練和學習后自動找出運算需要的參數(shù)和模式,最終實現(xiàn)模式分類[19]。神經網絡通過不斷自我學習和修正,最終擬合出以特定事務為輸入、特定事務為輸出的高維多階復雜映射函數(shù)[20]。
穴位是動態(tài)的,其開合狀態(tài)和功能強弱與內臟功能變化密切相關。腧穴是人體臟腑經絡氣血輸注出入的特殊部位,具有反映病癥、協(xié)助診斷的雙重作用?!鹅`樞·九針十二原》篇云:“五臟有六腑,六腑有十二原……明知其原,睹其應,而知五臟之害矣?!笨梢姡斉K腑發(fā)生病變時,就會在相應的穴位上出現(xiàn)可感知的異常反應(壓痛、硬結、感覺敏感、色素沉著、溫度變化等)。例如,《靈樞·背腧》篇亦云:“欲得而驗之,按其處,應在中而痛解,乃其腧也。”指出背俞穴往往是內臟疾患的病理反應點,通過體表按壓可進行精準定位。臨床上也常根據(jù)腧穴和臟腑的相關性,通過觀察腧穴的色澤、寒溫、結節(jié)、皮疹、壓痛、腫脹、凹陷、血絡浮沉等異常變化現(xiàn)象來判斷疾病的病變臟腑等。
穴位敏化是指在疾病狀態(tài)下患者體表特定區(qū)域發(fā)生了感覺異常,使得其對各種刺激敏感度增加。研究發(fā)現(xiàn)[21]敏化穴局部出現(xiàn)肥大細胞聚集數(shù)量和脫顆粒及其局部P物質(P-substance,SP)的表達增加等變化,這可能是穴位出現(xiàn)敏化現(xiàn)象的生物學基礎。研究發(fā)現(xiàn)[22-24]隨著臟腑功能的變化,穴位功能從相對“沉寂”狀態(tài)向相對“激活”狀態(tài)轉化。在病理情況下,即穴位“激活”狀態(tài)時,通過經絡相連和對應的某些穴位出現(xiàn)體表感受野擴大以及形敏、熱敏、痛敏、電敏等敏化現(xiàn)象,穴位的功能強弱和范圍大小發(fā)生變化。當內在臟腑發(fā)生病變后,可在本臟腑相關腧穴上出現(xiàn)陽性反應,如腧穴表面絡脈色澤變化、壓痛、皮下結節(jié)、皮膚隆起、凹陷,以及皮膚電阻變化等穴位敏化現(xiàn)象。研究發(fā)現(xiàn)[25-28]臟腑發(fā)生病變時,相關腧穴可能出現(xiàn)感受野擴大、痛敏、熱敏等多種形式的敏化現(xiàn)象。傳統(tǒng)中醫(yī)理論認為經穴能夠反映病情,能夠用于疾病輔助診斷,腧穴診斷是中醫(yī)診斷的重要特色,敏化腧穴在臟腑病的診斷過程中發(fā)揮了重要作用。
圖1 CSA患者與健康人群穴位壓痛閾值和溫度值差異對比
CSA 是臨床常見病、多發(fā)病,具有明確的體表-臟腑關聯(lián)性,是探索臟腑病穴位敏化特異性規(guī)律的良好載體。國內學者研究[29-31]發(fā)現(xiàn):冠心病心肌缺血缺氧病理狀態(tài)下,在神門、大陵等特定穴體表可出現(xiàn)皮膚色澤、痛敏、熱敏、紅外輻射改變,其中神門敏化發(fā)生率達到52.8%,大陵高達54%。蓋國才等[32]對48 例冠心病病人進行臨床壓診的診療過程中,發(fā)現(xiàn)93%左右的冠心病病人,左手少陰心經的靈道穴,有明顯壓痛反應。施靜等[33]通過觀察1000 余例心絞痛患者體表壓痛點發(fā)現(xiàn),左胸部及左上肢尺側,類似心經、心包經循行部位壓痛點出現(xiàn)比例最高。由上述可見,臟腑發(fā)生病變時,相關腧穴可能出現(xiàn)感受野擴大、痛敏、熱敏等多種形式的敏化現(xiàn)象。
根據(jù)2018 年《蘇格蘭校際指南網絡》(Scottish Intercollegiate Guidelines Network, SIGN)中對 CSA 患者管理指南,心絞痛發(fā)作最常發(fā)生在胸骨后區(qū)或左側胸部,并可輻射至左臂和背部[34],這些部位與中醫(yī)心經、心包經、膀胱經的循行一致,這些經絡的循行都與CSA 疾病密切相關?;诖?,課題組選擇左胸、左臂內側和背部3 個區(qū)域常見穴位,同時結合前期相關文獻[35-37],最終篩選確定出12個最常用穴位:極泉、神門、陰郄、少海、內關、郄門、曲澤、膻中、巨闕、厥陰俞、心俞、督俞。同時采集多中心的CSA 患者“痛敏,熱敏”樣本數(shù)據(jù),其中使用Wagner壓痛儀進行壓痛閾值的標準化檢測與采集,使用Fotric 全平臺熱像儀進行溫度值的標準化檢測與采集。圖1 與表1 分別描述了317例CSA患者和200例健康人群穴位壓痛閾值和溫度值的統(tǒng)計學結果。
現(xiàn)代針灸臨床研究已發(fā)現(xiàn)大量的穴位敏化現(xiàn)象[38-43],至今已有100多種循環(huán)、呼吸、消化等系統(tǒng)的器質和功能性病變被觀察到痛敏、熱敏、形敏、電敏等形式的敏化穴位。通過對圖1 與表1 的分析,CSA 患者和健康人群具有明顯的壓痛閾和溫度差異,說明CSA患者具有顯著的穴位敏化現(xiàn)象,這為穴位敏化理論用于CSA 疾病的輔助預測提供了理論支撐?;诖?,本文提出一種基于ANN 技術結合穴位敏化理論構建CSA疾病輔助預測模型的思路和方法。
ANN 技術結合穴位敏化數(shù)據(jù)構建CSA 疾病輔助預測模型的研究思路和方法如框圖2所示,包括數(shù)據(jù)采集和模型構建。
高質量的數(shù)據(jù)樣本是構建CSA 疾病輔助預測模型的前提。在構建數(shù)據(jù)集的過程中,首先需明確CSA人群和健康人群的納入標準和排除標準,具體參考2007 年聯(lián)合頒布的《慢性穩(wěn)定型心絞痛指南》以及中國心血管相關專家小組2010年頒布的《慢性穩(wěn)定性冠心病管理中國共識》。同時根據(jù)確定的優(yōu)勢穴位,完成對目標人群的“熱敏、形敏、痛敏、電敏”的數(shù)字化信息采集,需要強調的是采集過程中要嚴格數(shù)據(jù)采集標準和規(guī)范數(shù)據(jù),制定CSA 穴位敏化的臨床操作方案。其中采用Fotric 全平臺熱像儀采集穴位熱敏特征數(shù)據(jù),采用形態(tài)學檢測方法記錄穴位形敏特征數(shù)據(jù),采用Wagner壓痛儀采集穴位壓痛特征數(shù)據(jù),采用穴位阻抗測定儀采集穴位電敏特征數(shù)據(jù)。
表1 CSA患者與健康人群穴位壓痛及溫度敏化比較統(tǒng)計
圖2 ANN技術結合穴位敏化數(shù)據(jù)構建CSA疾病輔助預測模型邏輯圖
最后需對采集到的數(shù)據(jù)進行預處理、清洗、降維等,分類建立CSA 人群和健康人群數(shù)據(jù)集。具體包括:去除內容不完整、有誤的數(shù)據(jù)并進行數(shù)據(jù)脫敏;基于AUC(Area Under the Curve)曲線明確形態(tài)學檢測值、體表感覺檢測值和皮膚電阻值的最佳判定點(Cut-off point);基于聚類分析、主成分分析等方法對原始數(shù)據(jù)進行降維,初步篩選穴位敏化表征下的CSA關鍵指標。最終對形敏、痛敏、熱敏、電敏等不同模態(tài)數(shù)據(jù)作歸一化處理,建立包含健康人群與CSA 人群的穴位痛敏、熱敏、形敏、電敏等特征大數(shù)據(jù)集。
圖3 模型網絡示例
合適的算法網絡是構建CSA 疾病預測模型的關鍵。首先基于多層感知器、卷積神經網絡等基礎網絡類型搭建項目所需的網絡結構(模型網絡示例如圖3所示),同時嘗試對不同的網絡類型、不同的網絡深度(即隱含層或卷積層、池化層數(shù)目)、不同的神經元數(shù)目進行組合。其次將樣本數(shù)據(jù)分為訓練集與驗證集,把穴位敏化特征數(shù)據(jù)作為輸入,診斷結果作為輸出,采用有監(jiān)督學習算法進行訓練。訓練由信號的正向傳播和誤差的反向傳播兩個過程組成,正向傳播算法即輸入向量通過若干個權值矩陣與若干偏重向量進行一系列線性運算和激活運算,從輸入層開始,一層層向后計算,一直運算到輸出層,最終得到輸出向量。反向傳播算法即通過鏈式法則逐層求出損失函數(shù)對各層權值(或偏重)的偏導數(shù),構成損失函數(shù)對權值(或偏重)的梯度,然后通過優(yōu)化方法對權值(或偏重)進行修改。整個訓練過程涉及到sigmoid、tanh、relu 等激活函數(shù)的選擇,交叉熵、均方差等損失函數(shù)的選擇,BGD、MBGD、Adagrad 等優(yōu)化方法的選擇,正則化、Dropout 等防止過擬合方案的選擇,以及學習率、批量大小、正則項系數(shù)等超參數(shù)的選擇。
最后需對完成的模型進行評價。CSA 疾病輔助預測模型為二分類模型,輸出結果為CSA(是)和健康(否),評價指標選擇精準率、召回率、F1-score、ROC 曲線等。同時基于上述評價結果對網絡結構、超參數(shù)等進行反復優(yōu)化或組合,最終得到表現(xiàn)最佳的模型作為CSA 疾病輔助預測模型。假定構建的模型性能表現(xiàn)優(yōu)秀,則能夠實現(xiàn)基于穴位敏化表征的CSA 疾病輔助預測。
本文以穴位敏化和中醫(yī)腧穴診斷為理論基礎,選取穴位敏化特征有明顯差異的CSA 疾病為研究載體,結合目前信息技術領域研究熱點ANN 技術,探索構建CSA 疾病輔助預測模型,提出一個新的無創(chuàng)、安全、低成本的輔助檢查方法。該方法促進和豐富了針灸經絡診斷理論的現(xiàn)代研究和臨床運用,亦為針灸學科的穴位敏化理論和計算機學科的ANN 技術的學科交叉提供了思路。目前CSA 疾病的診斷雖已有“金標準”,但存在的負面效應給本文提出以ANN 技術構建慢性穩(wěn)定性心絞痛疾的穴位敏化輔助預測模型提供了機會。但該模型在構建過程還需充分考慮到ANN 的技術要求,如:構建的數(shù)據(jù)集要具有足夠的學習樣本;數(shù)據(jù)采集要求具有統(tǒng)一的方法和標準;學習樣本要具有可靠的數(shù)據(jù)質量;模型訓練過程中注意避免出現(xiàn)欠擬合和過擬合;模型推理過程中保證足夠的推理性能等。