王浩,孟祥峰,劉艷珍,任海萍
中國食品藥品檢定研究院 光機(jī)電室,北京 100050
醫(yī)療器械中人工智能方法檢驗(yàn)策略的研究
王浩,孟祥峰,劉艷珍,任海萍
中國食品藥品檢定研究院 光機(jī)電室,北京 100050
人工智能在醫(yī)療器械、康復(fù)輔具和一般健康產(chǎn)品領(lǐng)域發(fā)展迅速,對于實(shí)現(xiàn)醫(yī)學(xué)診療與健康服務(wù)的自動(dòng)化與智能化,提高服務(wù)效率和質(zhì)量具有重大意義。人工智能算法自身的安全性和有效性,是影響該類醫(yī)療器械的安全性和有效性的重要因素,對于醫(yī)療器械的質(zhì)控提出新的挑戰(zhàn)。目前國內(nèi)外缺少針對人工智能方法的標(biāo)準(zhǔn)和測試方法。本文對醫(yī)療器械相關(guān)的常見人工智能方法進(jìn)行了分類討論,分析了不同場景下該類醫(yī)療器械檢驗(yàn)的策略,為進(jìn)一步開發(fā)和完善測試方法提供了參考。
醫(yī)療器械;質(zhì)量控制;人工智能;統(tǒng)計(jì)分類
隨著數(shù)學(xué)、計(jì)算科學(xué)與信息技術(shù)的發(fā)展,人工智能算法在現(xiàn)代工業(yè)和醫(yī)學(xué)中發(fā)揮著越來越大的作用,在醫(yī)療器械、康復(fù)輔具和一般健康產(chǎn)品方面的應(yīng)用在不斷取得突破。作為模式識別、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、信號處理、并行計(jì)算等理論的結(jié)晶,人工智能算法在醫(yī)學(xué)影像、手術(shù)導(dǎo)航、神經(jīng)電生理、腦機(jī)接口、智能康復(fù)、體外診斷、健康大數(shù)據(jù)等領(lǐng)域與醫(yī)療器械深度融合[1-5],在疾病診斷、治療、康復(fù),慢病管理、預(yù)防等方面顯示了巨大的潛力。
目前,國內(nèi)外醫(yī)療器械質(zhì)控領(lǐng)域針對醫(yī)療器械中的人工智能算法的有效性和安全的評價(jià)方法和測試規(guī)范尚不完善,也沒有相關(guān)標(biāo)準(zhǔn)。作為醫(yī)療器械評價(jià)人工智能方法的典型案例之一,美國食品藥品監(jiān)督管理局(FDA)在2012年針對放射類影像和數(shù)據(jù)的計(jì)算機(jī)輔助檢測(Computerassisted Detection,CAD)裝置發(fā)布了指導(dǎo)原則[6-7],覆蓋上市前申請、售前通知和臨床性能評價(jià)。這一類裝置主要采用模式識別和數(shù)據(jù)分析的方法處理CT、MRI、PET、DR等放射類影像設(shè)備的數(shù)據(jù),目的是輔助診斷,其評價(jià)主要依賴于臨床試驗(yàn),需要的時(shí)間、數(shù)據(jù)量和人力成本較高,缺乏直接的技術(shù)手段。
為研究直接評價(jià)醫(yī)療器械中的人工智能方法的可行性,提煉解決方案,本文對常見的人工智能方法、應(yīng)用情景進(jìn)行了分類討論,對測試策略和需要的條件和資源進(jìn)行了分析,為進(jìn)一步開展深入研究和開發(fā)測試平臺提供了參考。
1.1 概述
在醫(yī)療器械領(lǐng)域,人工智能方法的主要應(yīng)用是使機(jī)器根據(jù)獲取的健康信息實(shí)現(xiàn)統(tǒng)計(jì)分類,作為診療和決策的依據(jù)。醫(yī)療器械對統(tǒng)計(jì)分類功能的需求,包含了各層面的典型案例(圖1)。在分子層面,不同致病基因、生物標(biāo)記物的分析需要統(tǒng)計(jì)分類的支持;在細(xì)胞層面,病理分析、血液分析等需要借助統(tǒng)計(jì)分類自動(dòng)測量細(xì)胞的種類、分布;在組織層面,醫(yī)學(xué)影像和電生理等需要統(tǒng)計(jì)分類方法建立圖像、電生理信號與組織和病灶的關(guān)聯(lián);在系統(tǒng)層面,循環(huán)系統(tǒng)、神經(jīng)系統(tǒng)的功能評價(jià)和疾病診療需要用統(tǒng)計(jì)分類方法挖掘系統(tǒng)生理參數(shù)與疾病之間的聯(lián)系;在行為層面,統(tǒng)計(jì)分類方法可用于將不同傳感器或傳感器網(wǎng)絡(luò)采集的數(shù)據(jù)與人的體態(tài)進(jìn)行關(guān)聯(lián),并指導(dǎo)康復(fù)訓(xùn)練和病人照護(hù)。
圖1 醫(yī)療器械對統(tǒng)計(jì)分類功能在不同層面的需求
按照機(jī)器學(xué)習(xí)的理論,統(tǒng)計(jì)分類方法主要包括監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩大類,以及它們的結(jié)合,兩者的主要區(qū)別在于是否需要訓(xùn)練集[8-9]。監(jiān)督學(xué)習(xí)利用已知類別的樣本集(訓(xùn)練集)調(diào)整分類器的參數(shù),使其達(dá)到所要求性能。其工作流程包括:首先采集已知類別的原始數(shù)據(jù),建立訓(xùn)練集,并對數(shù)據(jù)進(jìn)行降噪和降冗余處理;構(gòu)建映射關(guān)系對數(shù)據(jù)進(jìn)行降維,將原高維空間中的數(shù)據(jù)點(diǎn)投影到低維度的空間中,以便將不同類別的數(shù)據(jù)點(diǎn)的差異最大化;開發(fā)分類器,在低維度空間上將映射后的點(diǎn)進(jìn)行歸類;最終使用分類器對測試集中的樣本進(jìn)行分類,分類結(jié)果與測試集的已知類別進(jìn)行對比驗(yàn)證,評價(jià)特異度、敏感度等關(guān)鍵性能指標(biāo)。
非監(jiān)督學(xué)習(xí)不需要訓(xùn)練集,而是根據(jù)樣本間的相似性尋找樣本集的規(guī)律,對樣本集進(jìn)行分類(例如聚類),分類的依據(jù)是類內(nèi)差距的最小化和類間差距的最大化。非監(jiān)督學(xué)習(xí)不與事先規(guī)定的標(biāo)簽掛鉤,從數(shù)據(jù)分布的規(guī)律性出發(fā),除了統(tǒng)計(jì)分類之外,也可用于分析數(shù)據(jù)集的特點(diǎn),用途廣泛。上述兩種方法在醫(yī)療器械中都有廣泛應(yīng)用。
1.2 一維數(shù)據(jù)集合相關(guān)人工智能方法
一維數(shù)據(jù)處理中的人工智能方法起步較早,也是二維和高維數(shù)據(jù)處理的基礎(chǔ)。在體外診斷領(lǐng)域,化學(xué)計(jì)量學(xué)方法[10]常用于從近紅外光譜、可見光吸收譜等光譜中分析不同化學(xué)物質(zhì)的濃度或區(qū)分生物成分;在電生理領(lǐng)域,心電、腦電、腦機(jī)接口等研究方向需要對生理電信號進(jìn)行歸類,提取病理信息和生理活動(dòng)信息,為診斷和治療提供參考;超聲成像過程中的RF信號可用于區(qū)分被測組織的機(jī)械特性;光學(xué)相干層析成像(Optical Coherence Tomography,OCT)中掃描線的特征可用于區(qū)分組織顯微結(jié)構(gòu)。
上述領(lǐng)域雖然數(shù)據(jù)來源和物理含義各不相同,但數(shù)據(jù)處理方式相似,常用的人工智能算法包括主成分分析(Principle Component Analysis,PCA)、獨(dú)立成分分析(Independent Component Analysis,ICA)、偏最小二乘(Partial Least Squares,PLS)、線性判別分析(Linear Discriminant Analysis,LDA)、支持向量機(jī)(Support Vector Machine,SVM)、K-均值聚類(K-means clustering)、K最近鄰(k-Nearest Neighbor,kNN)分類算法等[11-13]。
1.3 醫(yī)學(xué)影像中的人工智能方法
二維和高維數(shù)據(jù)分析以醫(yī)學(xué)影像為代表,圖像分割、邊緣提取、圖像拼接與配準(zhǔn)、三維圖像重建等功能的實(shí)現(xiàn)都需要人工智能方法的支持,以提供病灶識別與標(biāo)記、手術(shù)導(dǎo)航、預(yù)后評價(jià)、介入治療定位、病理切片分析等服務(wù)。醫(yī)學(xué)影像中的人工智能方法既包括了前面所述各種一維數(shù)據(jù)處理方法的高維擴(kuò)展,也包括決策樹、分類和回歸樹(Classif cation and Regression Trees,CART)算法、基于信息熵的決策樹算法ID3、神經(jīng)網(wǎng)絡(luò)方法、模擬退火算法、貝葉斯學(xué)習(xí)等[14]。此外,醫(yī)學(xué)影像還應(yīng)用了集成學(xué)習(xí)算法,特點(diǎn)是使用一系列學(xué)習(xí)器進(jìn)行學(xué)習(xí),將各個(gè)學(xué)習(xí)結(jié)果按照一定規(guī)則進(jìn)行整合,學(xué)習(xí)效果強(qiáng)于單個(gè)學(xué)習(xí)器,主要代表有Bagging和Boosting算法族[14]。
1.4 傳感器網(wǎng)絡(luò)中的人工智能方法
可穿戴設(shè)備、體域網(wǎng)的發(fā)展促使傳感器網(wǎng)絡(luò)在醫(yī)療健康中發(fā)揮積極作用,以帕金森患者的體態(tài)步態(tài)分析和跌倒預(yù)防為典型案例。一種思路是讓患者四肢或關(guān)節(jié)佩戴加速度傳感器、角傳感器、陀螺儀等可穿戴傳感器,這些傳感器之間用藍(lán)牙、ZigBee等無線通訊協(xié)議組成體域網(wǎng),共同測量患者的體態(tài)步態(tài)信息[15]。步態(tài)分析需要建立訓(xùn)練集,由患者反復(fù)重復(fù)各種基本動(dòng)作如站立、行走、上下樓梯、坐、臥等等,使用卡爾曼濾波器等算法挖掘不同傳感器網(wǎng)絡(luò)數(shù)據(jù)與動(dòng)作的關(guān)聯(lián),建立分類器,從而在患者日?;顒?dòng)中預(yù)測運(yùn)動(dòng)趨勢、預(yù)防跌倒和發(fā)生干預(yù)。另一種思路是在患者四肢或關(guān)節(jié)佩戴不同的標(biāo)記物,由攝像頭陣列(例如OptiTrack紅外相機(jī)系統(tǒng))記錄標(biāo)記物的運(yùn)動(dòng)軌跡[16]。這些標(biāo)記物之間的關(guān)系類似于傳感器網(wǎng)絡(luò),訓(xùn)練集和分類器的建立方法也與前者相通。
針對上述應(yīng)用情景,醫(yī)療器械中的人工智能方法的性能評價(jià)策略(主要是統(tǒng)計(jì)分類的準(zhǔn)確性的測試),見圖2。性能評價(jià)以臨床數(shù)據(jù)為最終的金標(biāo)準(zhǔn),使用多種手段建立測試集,開展評價(jià)。
首先應(yīng)了解被測設(shè)備的工作原理和機(jī)器學(xué)習(xí)的類型。如果統(tǒng)計(jì)分類算法屬于非監(jiān)督學(xué)習(xí),那么應(yīng)根據(jù)臨床數(shù)據(jù)分布的實(shí)際特點(diǎn),選擇有代表性的測試點(diǎn)組成測試集。例如對病理切片或血液涂片的顯微圖像進(jìn)行自動(dòng)細(xì)胞分類和計(jì)數(shù)時(shí),可根據(jù)聚類分析觀察不同類型細(xì)胞的大小和形狀的分布特點(diǎn),然后根據(jù)這些特點(diǎn)選取靠近各聚類中心的數(shù)據(jù)點(diǎn)設(shè)計(jì)測試集或測試用切片,最后對算法進(jìn)行測試。
圖2 醫(yī)療器械中的人工智能算法評價(jià)策略流程圖
下一步,對于監(jiān)督學(xué)習(xí),首先判斷該類設(shè)備是否具有標(biāo)準(zhǔn)數(shù)據(jù)庫,有數(shù)據(jù)庫則直接從中抽取數(shù)據(jù)組成測試集。例如心電類設(shè)備可以采用麻省理工學(xué)院開發(fā)的MIT-BIH數(shù)據(jù)庫中的心律失常波形來測試設(shè)備自身的心律失常檢測算法;腦電領(lǐng)域也在建立針對癲癇的腦電波形數(shù)據(jù)庫,如波士頓兒童醫(yī)院和麻省理工學(xué)院聯(lián)合開發(fā)的頭皮腦電數(shù)據(jù)庫,包含了各種癲癇發(fā)作時(shí)不同部位的腦電特征,可用于腦電類算法的測試。在具備一致性比對條件的應(yīng)用領(lǐng)域,比如麻醉?xiàng)l件下的腦電測量,有必要加強(qiáng)標(biāo)準(zhǔn)數(shù)據(jù)庫的建設(shè)。
在沒有數(shù)據(jù)庫依據(jù)的情況下,對于傳感器網(wǎng)絡(luò)而言,可研發(fā)多傳感器協(xié)同測試工裝。例如對于帕金森患者的步態(tài)分析,可根據(jù)人體力學(xué)和運(yùn)動(dòng)學(xué)特性搭建仿人體運(yùn)動(dòng)模擬工裝,直接安裝傳感器網(wǎng)絡(luò)并測量不同步態(tài)或姿態(tài)下的基礎(chǔ)數(shù)據(jù),即可用于測試。這種方式既保持了同臨床數(shù)據(jù)的一致性,又便于實(shí)現(xiàn)測試的自動(dòng)化和可比性,同時(shí)可以與醫(yī)用機(jī)器人、康復(fù)機(jī)器人的測試相結(jié)合,前景廣闊。
在沒有數(shù)據(jù)庫可依據(jù)的情況下,對于一般的采用監(jiān)督學(xué)習(xí)方法的醫(yī)療器械而言,如果其測量結(jié)果可以分解為基本物理元素的疊加,那么可運(yùn)用基本物理元素的組合設(shè)計(jì)標(biāo)準(zhǔn)物質(zhì)、標(biāo)準(zhǔn)器或體模。例如生物醫(yī)學(xué)光譜檢測得到的結(jié)果可看做基本化學(xué)物質(zhì)光譜的疊加,那么在測試光譜分析算法時(shí),可以參考實(shí)驗(yàn)設(shè)計(jì)、均勻設(shè)計(jì)、正交設(shè)計(jì)等方法的思路,按照不同配比制備標(biāo)準(zhǔn)物質(zhì),通過試驗(yàn)評價(jià)算法結(jié)果與實(shí)際成分之間的誤差,在保證分布均勻的同時(shí)將配比的種類最小化。類似,在醫(yī)學(xué)影像領(lǐng)域,可根據(jù)空間頻譜特性、對比度、輪廓、尺寸等信息提煉圖像的基本元素,并按照實(shí)驗(yàn)設(shè)計(jì)的思想研發(fā)體模,用于測試成像系統(tǒng)及算法。
反之,如果測量結(jié)果不能直接分解為基本物理元素的組合,那么測試集的設(shè)計(jì)仍主要依據(jù)臨床數(shù)據(jù)。例如腦機(jī)接口領(lǐng)域,中風(fēng)患者的腦電信號容易受病情影響出現(xiàn)畸變,使得想象運(yùn)動(dòng)引發(fā)的腦電信號缺乏一致性,無法直接分解為基本腦電特征的組合。腦機(jī)接口算法的測試,因此需要通過在人為的訓(xùn)練過程中采集和篩選腦電信號來生成測試集,以便在同樣的硬件設(shè)置下測試不同人工智能算法的性能。
本文從機(jī)器評價(jià)的角度出發(fā),將醫(yī)療器械中的人工智能算法評價(jià)作為共性問題進(jìn)行探討,出發(fā)點(diǎn)是將質(zhì)量控制前移,為下一步開發(fā)測試平臺和測試規(guī)范做準(zhǔn)備,緩解臨床評價(jià)的壓力,并不是直接取代臨床評價(jià)??紤]到個(gè)體差異性和實(shí)際應(yīng)用的復(fù)雜性,臨床測試中出現(xiàn)的問題應(yīng)及時(shí)反饋到機(jī)器評價(jià)端,形成協(xié)同發(fā)展。
值得注意的是,本文討論的人工智能方法與醫(yī)療健康大數(shù)據(jù)中的人工智能方法存在明顯的區(qū)別與聯(lián)系。本文的人工智能方法主要面向統(tǒng)計(jì)分類,而醫(yī)療健康大數(shù)據(jù)中的人工智能方法不僅研究分類,還研究回歸分析;本文的數(shù)據(jù)處理終端主要是醫(yī)療器械本身,而醫(yī)療健康大數(shù)據(jù)依托大型服務(wù)器和云存儲空間;無論是診斷還是治療,本文的人工智能方法應(yīng)用預(yù)期結(jié)果相對固定,而醫(yī)療健康大數(shù)據(jù)主要是從海量數(shù)據(jù)中挖掘未知的關(guān)聯(lián)和線索,對研究和應(yīng)用提供新的視角;本文介紹的各種人工智能方法可以用于醫(yī)療健康大數(shù)據(jù)的處理過程之中,但后者的數(shù)據(jù)采集、數(shù)據(jù)格式整合、數(shù)據(jù)傳輸、共享、數(shù)據(jù)去噪和數(shù)據(jù)挖掘算法本身的難度與復(fù)雜度高得多,帶有四V特征,即數(shù)量(Volume)、多樣性(Variety)、速度(Velocity)和真實(shí)性(Veracity)。
本文對醫(yī)療器械領(lǐng)域常見的人工智能方法的應(yīng)用場景和實(shí)現(xiàn)方式進(jìn)行了歸納和總結(jié),從共性特征出發(fā),對人工智能方法的測試策略進(jìn)行了分組討論,提出了多種測試方法,如引用或建立數(shù)據(jù)庫、研發(fā)標(biāo)準(zhǔn)物質(zhì)標(biāo)準(zhǔn)器體模、開發(fā)仿人體測試工裝等等。這些方法有助于將人工智能算法的質(zhì)控前移,節(jié)省測試的時(shí)間和成本。在根據(jù)本文的思路進(jìn)一步設(shè)計(jì)研發(fā)具體質(zhì)控平臺的同時(shí),需要結(jié)合大數(shù)據(jù)的思想深入挖掘臨床測試的數(shù)據(jù),提煉更多的基本元素,以便分解現(xiàn)有的復(fù)雜信號或圖像,繼續(xù)簡化人工智能方法的性能評價(jià)。
[1] Amato F,Lopez AM,Penamendez EM,et al.Artificial neural networks in medical diagnosis[J].J Appl Biomed,2013,11(2):47-58.
[2] Cooper RA,Dicianno BE,Brewer BR,et al.A perspective onintelligent devices and environments in medical rehabilitation[J]. Med Eng Phys,2008,30(10):1387-1398.
[3] Dilsizian SE,Siegel EL.Artif cial intelligence in medicine and cardiac imaging: harnessing big data and advanced computing to provide personalized medical diagnosis and treatment[J]. Curr Cardiol Rep,2013,16(1):1-8.
[4] Carmena JM.Advances in neuroprosthetic learning and control[J].Plos Biol,2013,11(5):e1001561.
[5] Peng X,Lin P,Zhang T,et al.Extreme Learning Machine-based Classif cation of ADHD Using Brain Structural MRI Data[J]. PLoS One,2013,8(11):e79476.
[6] Food and Drug Administration.Guidance for Industry and Food and Drug Administration Staff: Computer-Assisted Detection Devices Applied to Radiology Images and Radiology Device Data - Premarket Notif cation,2012[S].
[7] Submissions. Food and Drug Administration.Guidance for Industry and FDA Staff: Clinical Performance Assessment: Considerations for Computer-Assisted Detection Devices Applied to Radiology Images and Radiology Device Data-Premarket Approval (PMA) and Premarket Notif cation,2012[S].
[8] Bishop CM,Nasrabadi NM.Pattern Recognition and Machine Learning[J].J Elect Imaging,2007,16(4):20-25.
[9] Hastie T,Tibshirani R,Friedman JH,et al.The elements of statistical learning: data mining, inference, and prediction[J]. Math Intell,2001,27(2): 83-85.
[10] Reich G.Near-infrared spectroscopy and imaging: Basic principles and pharmaceutical applications[J].Adv Drug Deliv Rev,2005,57 (8):1109-1143.
[11] Jolliffe IT.Principal component analysis[J].Technometrics,2005, 44(5):594-609.
[12] Hyvarinen A,Oja E.Independent component analysis: algorithms and applications[J].Neural Netw,2000,13(4):411-430.
[13] Roggo Y,Chalus P,Maurer L,et al.A review of near infrared spectroscopy and chemometrics in pharmaceutical technologies[J]. J Pharm Biomed Anal,2007,44(3):683-700.
[14] 王婷,張寧,后桂榮,等.幾種機(jī)器學(xué)習(xí)方法在黑色素瘤計(jì)算機(jī)輔助診斷中的性能比較[J].計(jì)算機(jī)應(yīng)用研究,2013,30(6):1731-1733.
[15] 鄒亞,汪豐,高帥鋒,等.基于可穿戴系統(tǒng)的PD病人運(yùn)動(dòng)功能評價(jià)系統(tǒng)[J].中國醫(yī)療設(shè)備, 2015,30(1):10-14.
[16] 文龍,錢晉武,沈林勇,等.帕金森病患者步態(tài)測量與定量分析[J].中國康復(fù)醫(yī)學(xué)雜志,2014,29(7):637-641.
Study of the Testing Strategy of Artificial Intelligence Methods in Medical Devices
WANG Hao, MENG Xiang-feng, LIU Yan-zhen, REN Hai-ping
Division of Active Medical Device and Medical Optics, National Institutes for Food and Drug Control, Beijing 100050, China
Artificial intelligence (AI) in medical devices, rehabilitation devices and general wellness products is developing fast. It has great impact on the automation and intelligentization of medical diagnostics, treatment and health service, and signif cantly improves service quality and eff ciency. The safety and effectiveness of the AI algorithm is an important factor that affects the safety and effectiveness of medical devices, which poses a new challenge for the quality control of medical devices.Currently, no standard has been established to test AI methods in medical devices. In this paper, the testing of AI methods in common medical devices were divided and discussed separately, according to the application scenarios. The summary provides reference for further development of methodology and platforms to establish AI testing norms for medical devices.
medical device; quality control; artif cial intelligence; statistical classif cation
TP181;TH772;TH776
A
10.3969/j.issn.1674-1633.2016.10.020
1674-1633(2016)10-0067-04
2016-08-11
國家科技支撐計(jì)劃項(xiàng)目“經(jīng)皮腎鏡手術(shù)系統(tǒng)及質(zhì)控系統(tǒng)的研發(fā)”(2015BAI43H00);中國食品藥品檢定研究院中青年基金項(xiàng)目“可穿戴式光電醫(yī)療器械的有效性檢驗(yàn)研究”(2015C02)。
任海萍,中國食品藥品檢定研究院醫(yī)療器械檢定所光機(jī)電室主任,主要研究方向?yàn)獒t(yī)療器械檢定。
通訊作者郵箱:renhaiping@nifdc.org.cn