嚴(yán)舒,陳娟,歐陽昭連
中國醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院 醫(yī)學(xué)信息研究所/圖書館,醫(yī)療器械與藥物戰(zhàn)略情報(bào)研究室,北京 100020
人工智能(Artificial Intelligence,AI)是在計(jì)算機(jī)科學(xué)、控制論、信息論、神經(jīng)心理學(xué)、哲學(xué)、語言學(xué)等多種學(xué)科基礎(chǔ)之上發(fā)展起來的一門綜合性交叉學(xué)科,醫(yī)學(xué)人工智能是人工智能的一個(gè)分支,在疾病診療等方面具有較多應(yīng)用場景[1]。近年來人工智能應(yīng)用于醫(yī)學(xué)研究和診療已經(jīng)成為現(xiàn)代科技的熱點(diǎn)之一,美國五大頂尖醫(yī)療服務(wù)機(jī)構(gòu)如梅奧醫(yī)學(xué)中心、克里夫蘭醫(yī)學(xué)中心等都已開始與人工智能公司進(jìn)行合作,希望成為醫(yī)學(xué)人工智能應(yīng)用領(lǐng)域的中心,利用人工智能技術(shù)更好地對疾病進(jìn)行預(yù)測、診斷、治療和管理[2]。
美國國立衛(wèi)生研究院(The National Institutes of Health,NIH)成立于1887年,它隸屬于美國衛(wèi)生與公共服務(wù)部(United States Department of Health and Human Services,HHS),負(fù)責(zé)管理90%以上由美國政府主導(dǎo)的醫(yī)學(xué)科研經(jīng)費(fèi)[3]。NIH每年會制定項(xiàng)目規(guī)劃和經(jīng)費(fèi)預(yù)案,獲得白宮和國會通過以后,經(jīng)費(fèi)將由NIH綜合辦公室及下設(shè)的預(yù)算辦公室依據(jù)項(xiàng)目規(guī)劃協(xié)調(diào)分配給27個(gè)按專業(yè)領(lǐng)域和職能劃分的下屬研究機(jī)構(gòu)/中心,由各IC直接負(fù)責(zé)項(xiàng)目的資助與管理[4]。NIH用于資助科研項(xiàng)目的經(jīng)費(fèi)分為院內(nèi)、院外兩部分,其中院外項(xiàng)目資金占比超過80%,主要采取競爭性項(xiàng)目及少量委托性項(xiàng)目的方式分配給全美及全球的高校、科研機(jī)構(gòu)、醫(yī)療服務(wù)機(jī)構(gòu)和醫(yī)藥企業(yè)開展醫(yī)學(xué)相關(guān)研究工作[5]。NIH項(xiàng)目資助體系較為完整,覆蓋基礎(chǔ)研究、應(yīng)用研究、產(chǎn)業(yè)化及人才培養(yǎng)等多個(gè)方面,定位清晰且有明確的分類和編號,是美國醫(yī)學(xué)科技發(fā)展的風(fēng)向標(biāo)[6-7]。
本研究主要運(yùn)用描述統(tǒng)計(jì)與科學(xué)計(jì)量方法,通過分析NIH資助的醫(yī)學(xué)人工智能項(xiàng)目,整體把握美國醫(yī)學(xué)人工智能的發(fā)展態(tài)勢和研究方向,以期為我國相關(guān)領(lǐng)域發(fā)展提供參考。
在NIH項(xiàng) 目 數(shù) 據(jù) 庫(Research Portfolio Online Reporting Tools,RePORT)檢索由NIH及其下設(shè)IC資助的應(yīng)用人工智能技術(shù)的醫(yī)學(xué)研究項(xiàng)目。檢索詞及檢索策略:“Text Search: “artificial intelligence” or “machine learning”or “deep learning” or “artificial neural network” (Advanced),Search in: Projects Limit to: Project Abstracts, Project Title,Funding IC: All NIH Institutes and Centers , Fiscal Year: All Fiscal Years”,檢索日期2019年6月28日,共獲4581條項(xiàng)目記錄,包括新項(xiàng)目、競爭性延續(xù)項(xiàng)目、延伸項(xiàng)目等。
本研究運(yùn)用Excel、Bibexcel、Pajek和Vosviewer等軟件對項(xiàng)目數(shù)據(jù)中的項(xiàng)目獲批年份、資助金額、資助來源、被資助機(jī)構(gòu)、資助機(jī)制、支出分類標(biāo)簽詞等字段進(jìn)行統(tǒng)計(jì)分析、高頻詞分析、共現(xiàn)聚類分析及可視化,以揭示美國NIH資助醫(yī)學(xué)人工智能項(xiàng)目特征、內(nèi)部關(guān)聯(lián)和整體發(fā)展態(tài)勢。
NIH共資助醫(yī)學(xué)人工智能項(xiàng)目4581項(xiàng),項(xiàng)目數(shù)量和金額變化可分為4個(gè)階段,呈現(xiàn)周期性增長趨勢(圖1)。NIH首次資助醫(yī)學(xué)人工智能項(xiàng)目是在1985年,此后的16年間項(xiàng)目數(shù)量和資助金額沒有明顯變化,平均每年資助項(xiàng)目23項(xiàng),資助金額約700萬美元。2002年至2009年間,資助力度出現(xiàn)大幅增長,項(xiàng)目數(shù)量和資助金額的年平均增長率分別達(dá)到24.1%和29.7%。此后的4年資助力度變化不大,平均每年資助項(xiàng)目185項(xiàng),資助金額8400萬美元。而最近五年間,NIH對醫(yī)學(xué)人工智能資助項(xiàng)目無論在數(shù)量還是資助金額上都再次呈現(xiàn)大幅度增長趨勢,僅2018年一年,項(xiàng)目數(shù)量就已達(dá)到847項(xiàng),資助金額4.4億美元,增長率分別達(dá)到37.9%和41.3%。
圖1 NIH資助醫(yī)學(xué)人工智能項(xiàng)目年度分布
從項(xiàng)目資助機(jī)制來看,NIH資助的主要是研究型項(xiàng)目,占到了項(xiàng)目資助總額的60%,其中又以基礎(chǔ)性研究項(xiàng)目(R01)為主,支持科研工作者以自身研究方向和興趣出發(fā),開展獨(dú)立、具體的探索性研究,資助對象為高校、科研機(jī)構(gòu)、醫(yī)院或企業(yè)的研究人員(表1)。人才培養(yǎng)、會議、培訓(xùn)等項(xiàng)目雖然資助總額不高,但數(shù)量較多,體現(xiàn)出NIH對推廣醫(yī)學(xué)人工智知識教育、醫(yī)學(xué)人工智能人才培養(yǎng)及學(xué)科隊(duì)伍建設(shè)采取重視態(tài)度。此外,NIH還資助了引導(dǎo)、培育小企業(yè)開展以應(yīng)用為導(dǎo)向的小企業(yè)研究轉(zhuǎn)化項(xiàng)目334項(xiàng),支持下設(shè)IC開展自主研究的院內(nèi)研究項(xiàng)目237項(xiàng),針對大型、多學(xué)科領(lǐng)域設(shè)立的包括工具開發(fā)、基礎(chǔ)研究轉(zhuǎn)化等一系列研究內(nèi)容的研究中心項(xiàng)目133項(xiàng),以及為滿足研究中服務(wù)和工具開發(fā)需求或資助小企業(yè)潛在產(chǎn)品轉(zhuǎn)化的研發(fā)合同項(xiàng)目39項(xiàng)。
表1 NIH醫(yī)學(xué)人工智能項(xiàng)目資助機(jī)制
NIH的4344個(gè)院外資助項(xiàng)目授予了460家機(jī)構(gòu),其中獲得資助項(xiàng)目大于10項(xiàng)的機(jī)構(gòu)有79家,共獲得項(xiàng)目資助3338項(xiàng),占項(xiàng)目總量的76.8%。這79家機(jī)構(gòu)中高校63家、醫(yī)院9家、研究機(jī)構(gòu)6家、企業(yè)1家,可以看出NIH資助開展醫(yī)學(xué)人工智能研究的主要對象是高校。
高校方面,加州大學(xué)(系統(tǒng))獲得該領(lǐng)域項(xiàng)目數(shù)量最多,占到院外項(xiàng)目總數(shù)的8.8%,其他獲得項(xiàng)目較多的高校還包括匹茲堡大學(xué)、斯坦福大學(xué)、哥倫比亞大學(xué)、賓夕法尼亞大學(xué)等。值得注意的是獲得項(xiàng)目數(shù)量前10名的高校多為在醫(yī)學(xué)科學(xué)或計(jì)算機(jī)科學(xué)方面具有較強(qiáng)實(shí)力的高校,進(jìn)入美國科研類醫(yī)學(xué)排名和計(jì)算機(jī)科學(xué)排名前10的高校各有4家[8]。NIH醫(yī)學(xué)人工智能項(xiàng)目資助高校(Top 10),見表2。
表2 NIH醫(yī)學(xué)人工智能項(xiàng)目資助高校(Top 10)
醫(yī)院和研究機(jī)構(gòu)獲得項(xiàng)目數(shù)量少于高校,其中麻省總醫(yī)院獲項(xiàng)目數(shù)量最多,但也僅占到院外項(xiàng)目總數(shù)的1.2%。從表3中進(jìn)入前10位的醫(yī)院來看,麻省總醫(yī)院、梅奧醫(yī)學(xué)中心、克利夫蘭醫(yī)學(xué)中心、西達(dá)斯西奈醫(yī)院這4家醫(yī)院在全美醫(yī)院排名中位列前10[9]。從研究機(jī)構(gòu)方面來看,NIH資助研究機(jī)構(gòu)開展的醫(yī)學(xué)人工智能項(xiàng)目主要圍繞癌癥、精神病學(xué)等領(lǐng)域開展研究。
此外,NIH還資助了少量企業(yè)開展醫(yī)學(xué)人工智能研發(fā),其 中 LAUREATE公 司(Laureate Learning Systems,Inc.)獲得項(xiàng)目數(shù)量最多,共獲得11項(xiàng)資助,資助金額為382萬美元。從公司類型和業(yè)務(wù)范圍上看,獲資助公司多為研發(fā)型小企業(yè),業(yè)務(wù)范圍主要包括生物醫(yī)學(xué)、生物信息學(xué)、軟件研發(fā)和制藥研發(fā)等。
表3 NIH醫(yī)學(xué)人工智能項(xiàng)目資助醫(yī)院和研究機(jī)構(gòu)(Top 10)
在NIH資助項(xiàng)目中,人工智能技術(shù)被應(yīng)用于多個(gè)研究領(lǐng)域和多種疾病的診療研究,通過分析項(xiàng)目資助IC,并對項(xiàng)目支出分類標(biāo)簽進(jìn)行詞頻統(tǒng)計(jì)和共現(xiàn)聚類分析可以從宏觀上了解NIH資助醫(yī)學(xué)人工智能項(xiàng)目的研究方向。
從表4可以看出,國立癌癥研究所、國立綜合醫(yī)學(xué)研究所、國立醫(yī)學(xué)圖書館、國立精神衛(wèi)生研究所、國立神經(jīng)病學(xué)與中風(fēng)研究所等IC資助醫(yī)學(xué)人工智能項(xiàng)目較多,說明人工智能技術(shù)較多應(yīng)用于癌癥相關(guān)疾病、醫(yī)學(xué)數(shù)據(jù)處理與信息化、精神疾病和行為科學(xué)以及神經(jīng)性疾病與腦病等領(lǐng)域的研究中。
為了更好地管理和統(tǒng)計(jì)資助項(xiàng)目支出,NIH使用文本數(shù)據(jù)挖掘方式將所資助項(xiàng)目按照研究領(lǐng)域、癥狀和疾病進(jìn)行類別劃分,邀請行業(yè)專家對類別進(jìn)行定義并確定適合的名稱即項(xiàng)目標(biāo)簽詞,每個(gè)項(xiàng)目可能會被標(biāo)記多個(gè)標(biāo)簽詞[10]。通過對項(xiàng)目標(biāo)簽詞詞頻的統(tǒng)計(jì)和共現(xiàn)聚類分析,可以揭示NIH資助醫(yī)學(xué)人工智能項(xiàng)目的研究領(lǐng)域、所針對的疾病、癥狀及其內(nèi)在聯(lián)系。從表5可以看出,人工智能技術(shù)主要應(yīng)用于生物工程學(xué)、臨床研究、網(wǎng)絡(luò)與信息技術(shù)研發(fā)、神經(jīng)科學(xué)、遺傳學(xué)、行為與社會科學(xué)等領(lǐng)域,針對的疾病和癥狀則包括癌癥、衰老、神經(jīng)退行性疾病、罕見病等。
醫(yī)學(xué)人工智能項(xiàng)目標(biāo)簽詞的共現(xiàn)聚類網(wǎng)絡(luò)中節(jié)點(diǎn)圓圈大小則表示標(biāo)簽詞出現(xiàn)頻次,兩個(gè)節(jié)點(diǎn)間的連線表示2個(gè)標(biāo)簽詞的共現(xiàn)關(guān)系,從連線粗細(xì)可以看出共現(xiàn)頻率的多少,連線越粗表示兩詞共現(xiàn)次數(shù)越多,反之越少。從圖2可以
看出,NIH資助項(xiàng)目中人工智能技術(shù)的主要應(yīng)用方向被分成4個(gè)聚類,每個(gè)聚類里包含多個(gè)相關(guān)研究領(lǐng)域和一系列疾病和癥狀,分別是:① 以生物工程、網(wǎng)絡(luò)和信息技術(shù)、基因組學(xué)為研究領(lǐng)域,用于癌癥、消化疾病、血液病的診療以及孤兒藥等方面的研究;② 以神經(jīng)科學(xué)、放射診斷為研究領(lǐng)域的針對老年病、神經(jīng)退行性疾病、阿爾茲海默癥、獲得性認(rèn)知障礙等方面的研究;③ 以行為和社會醫(yī)學(xué)、臨床實(shí)驗(yàn)為研究領(lǐng)域的針對精神性疾病的研究,如抑郁癥、藥物濫用等;④ 以預(yù)防為中心的兒科、患者安全、女性健康、少數(shù)民族健康、HIV/AIDS等公共衛(wèi)生研究。
表4 NIH下設(shè)IC資助醫(yī)學(xué)人工智能項(xiàng)目數(shù)量
圖2 NIH資助人工智能項(xiàng)目支出分類標(biāo)簽詞的共現(xiàn)聚類網(wǎng)絡(luò)圖
美國人工智能在醫(yī)學(xué)上的研究與應(yīng)用相對開展較早,且在近5年中項(xiàng)目資助力度明顯增加。此外,美國在該領(lǐng)域研究范圍較為寬泛,既有癌癥、神經(jīng)類疾病、老年病等領(lǐng)域的基礎(chǔ)研究,也有相關(guān)領(lǐng)域基礎(chǔ)設(shè)施建設(shè)和工具、服務(wù)的開發(fā)等,逐漸形成較為完整的研究資助體系。美國食品藥品監(jiān)督管理局對推動(dòng)人工智能產(chǎn)品的上市持積極態(tài)度,一系列針對人工智能醫(yī)療器械軟件的審評審批政策陸續(xù)出臺[11]。截至2018年底,已有多項(xiàng)產(chǎn)品通過上市前審批、上市前通知和從頭開始通道獲得審批上市,市場空間巨大[12-13]。
中國醫(yī)學(xué)人工智能研究起步較晚,即使是發(fā)展較為成熟且獲得市場資金投入最多的人工智能輔助醫(yī)學(xué)影像診斷,例如用于糖尿病視網(wǎng)膜病變識別、篩查與分期軟件、肺結(jié)節(jié)篩查軟件等大多也仍處于醫(yī)院試用階段,尚沒有相關(guān)產(chǎn)品上市[14-15]。但近幾年來,醫(yī)學(xué)人工智技術(shù)不僅受到資本熱捧,也得到國家相關(guān)科技管理部門的重視,研發(fā)投入力度增加。在2019年國家自然科學(xué)基金項(xiàng)目指南中,生命科學(xué)部中增加了生物仿生與人工智能的申請方向(申請代碼:C1005),國家重點(diǎn)研發(fā)計(jì)劃“數(shù)字診療裝備研發(fā)”試點(diǎn)專項(xiàng)2019年項(xiàng)目申報(bào)指南中也提出要支持新型醫(yī)用人工智能前沿技術(shù)創(chuàng)新,并具體提出新型人工智能算法及其介入外科手術(shù)規(guī)劃應(yīng)用研究、新型人工智能算法及其神經(jīng)退行性疾病應(yīng)用研究、新型人工智能算法及其??朴跋裣到y(tǒng)應(yīng)用研究以及新型人工智能算法及其病理診斷應(yīng)用研究4個(gè)研究方向[16-17]。我國醫(yī)學(xué)人工智能領(lǐng)域在學(xué)科發(fā)展、人才培養(yǎng)、制度建設(shè)與管理等方面仍有待完善,需要行政管理、科研、臨床和企業(yè)多方面配合,以提高相關(guān)領(lǐng)域研究理論方法水平以及臨床轉(zhuǎn)化與產(chǎn)品化效率,用好我國大數(shù)據(jù)資源,真正使疾病診療更加高效。