冬雪
盡管人們對人工智能有多種定義,但都認同一個要素,讓機器勝任一些通常需要人類智能才能完成的復(fù)雜工作。人類的許多活動,如演算數(shù)學(xué)題、猜謎語、討論、編制計劃和編寫計算機程序,甚至駕駛汽車、騎自行車和診治疾病等,都需要智能。如果機器能夠執(zhí)行這種任務(wù),就可以認為機器已具有某種性質(zhì)的人工智能。
人工智能診治癌癥的機理
利用人工智能診治疾病是人類一個雄心勃勃的計劃,而且,這一計劃早就有一些初步結(jié)果,例如2007年,美國國際商業(yè)機器公司(IBM)就推出了人工智能軟件——沃森醫(yī)生(Watson)。現(xiàn)在,人們特別希望利用人工智能去征服某些嚴重危害人們生命和健康的疾病,如癌癥,而且也已經(jīng)進入實踐,并且有不小的收獲。
要讓人工智能診治癌癥,第一步需要人工智能有像人一樣的感知,即知道周圍的環(huán)境,尤其是生物體和人的機體環(huán)境,什么是正常的機體,什么是異常的機體,甚至是癌變的機體,尤其是只具有微小變化的機體,例如,只有幾個發(fā)生癌變細胞的乳腺或肺。
第二步是,人工智能不僅要感知正常和異常機體的不同,還要理解為何有這樣的不同,是癌變引起的不同,還是其他疾病引起的不同。最后第三步才是判斷和決策,即得出結(jié)論,在感知和正確理解的基礎(chǔ)上,向醫(yī)生提供對某個個體檢測的結(jié)果,是患癌還是沒有患癌,抑或是患了其他疾病。
要讓人工智能感知和理解人體環(huán)境和器官,就要讓其學(xué)習(xí),包括利用大數(shù)據(jù)的機器學(xué)習(xí)(算法)和深度學(xué)習(xí),這兩者有時是相互結(jié)合的,同時也是相互滲透的。大數(shù)據(jù)學(xué)習(xí)和處理是人工智能的強項,可以達到比人類能力強幾百倍幾千倍的快速數(shù)據(jù)運算、分析和理解。而在癌癥診治的深度學(xué)習(xí)上,更需要人工智能像人一樣進行學(xué)習(xí),例如對通過物理和化學(xué)方式拍攝的人體各種部位,以及深淺度不同組織的圖像要有正確的感知和理解,如對X線圖像、磁共振成像和CT掃描圖像的感知、解讀,并得出結(jié)論,即診斷。
但是,人工智能的癌癥診治深度學(xué)習(xí)并不僅限于對癌癥和正常組織圖像的解讀,而是包括更多的深度學(xué)習(xí)的內(nèi)容,例如,對癌癥標記物和特異分子的識別。
癌癥診治的人工智能學(xué)習(xí)內(nèi)容
2016年1月,美國總統(tǒng)奧巴馬宣布了“癌癥登月計劃”,由副總統(tǒng)拜登全面負責。“癌癥登月計劃”的其中一個項目就是讓人工智能進行機器學(xué)習(xí)(算法)和深度學(xué)習(xí),以識別癌癥。為此,美國能源部與美國國家衛(wèi)生研究院下屬的國家癌癥研究所合作,提出了“高級癌癥計算解決方案的聯(lián)合設(shè)計任務(wù)”,這個項目就是致力于解決三個基于計算機學(xué)習(xí)的人工智能抗癌難題。
首先是從認識癌癥的分子層面學(xué)習(xí),要讓人工智能了解RAS/Raf通路的蛋白質(zhì)相互作用。RAS基因在20世紀60年代被發(fā)現(xiàn)是致癌基因,存在于30%的癌癥患者中。1982年,美國科學(xué)家溫伯格等人從膀胱癌細胞中克隆得到第一個人類癌基因,由于它和之前發(fā)現(xiàn)的鼠肉瘤病毒基因C-RAS高度同源,因此被命名為RAS基因。RAS基因編碼產(chǎn)生的蛋白定位于細胞膜內(nèi)側(cè),為GTP/GDP結(jié)合蛋白(GDP為鳥嘌呤二核苷酸磷酸,GTP是鳥嘌呤三核苷酸磷酸),通過GTP與GDP的相互轉(zhuǎn)化來調(diào)節(jié)信號通路的傳遞。由于RAS蛋白的相對分子量是21千道爾頓(kDa),故又被稱為p21蛋白。
之后,人們又發(fā)現(xiàn)了RAS蛋白的直接效應(yīng)因子Raf-1蛋白激酶。Raf-1激酶對細胞增殖、細胞分化、細胞凋亡和細胞周期停滯有重要作用,利用這些作用可以知道癌癥的發(fā)生、發(fā)展,以及找到治療癌癥的藥物和方法。
“癌癥登月計劃”讓人工智能進行的第二個學(xué)習(xí)任務(wù)是,進行臨床前的藥物篩查。這是一種研發(fā)癌癥藥物的預(yù)測模型,在臨床試驗前進行最大化的藥物篩選,為癌癥病人提供精準醫(yī)療方案。具體而言是對臨床前和臨床試驗時的癌癥數(shù)據(jù)進行篩選,結(jié)合小鼠模型中的新數(shù)據(jù),通過反饋循環(huán)讓實驗?zāi)P椭笇?dǎo)計算模型的設(shè)計,建立腫瘤藥物反應(yīng)的預(yù)測模型。其實,這也是基于特殊數(shù)據(jù)和大數(shù)據(jù)的學(xué)習(xí)和分析。
“癌癥登月計劃”讓人工智能進行的第三個學(xué)習(xí)任務(wù)是,學(xué)習(xí)和建立人口模型。這就要求人工智能根據(jù)不同人群的生活方式、生活環(huán)境、所患癌癥的種類、不同的醫(yī)療體系等,從數(shù)百萬癌癥病人的病歷數(shù)據(jù)中自動分析,從而獲取最佳治療策略。當然,海量病人的數(shù)據(jù)來自美國國家衛(wèi)生研究院、美國食品和藥物管理局、制藥公司和第三方付款機構(gòu)。
可以看到,美國的“癌癥登月計劃”中的人工智能學(xué)習(xí)并不包含腫瘤圖像的識別,所以人工智能診治癌癥的學(xué)習(xí)在不同的國家有不同的內(nèi)容。
人工智能幫助診治癌癥
人工智能對癌癥的識別和診斷首先體現(xiàn)于對癌癥數(shù)據(jù)的解讀上,其中最重要的是對癌癥基因和基因組的識別和解讀。
機器學(xué)習(xí)(算法)是人工智能的一個基本內(nèi)容,其中,數(shù)據(jù)的輸入、輸出、賦值等運算可以讓人工智能對某一問題進行計算分析,從而得出初步結(jié)果。對癌癥的診斷和治療也可以利用這一點。加拿大西方大學(xué)的羅根等人研發(fā)了一套算法,通過對基因數(shù)據(jù)的分析得出最可能的有效治療癌癥的方案,并且讓該治療方案變得更加個性化。
研究人員使用了一套含有40個基因的數(shù)據(jù),這些基因可以在90%的乳腺癌中找到。在接受試驗的近350名癌癥病人當中,至少都會接受紫杉醇或吉西他濱一種化療藥物治療。之后,研究人員讓人工智能對數(shù)據(jù)展開處理并找出藥物與病人基因之間存在的關(guān)系。結(jié)果顯示,同時接受兩種藥物的治療有效率為84%,只接受紫杉醇的治療有效率為82%,只接受吉西他濱的治療有效率則在62%~71%之間。
這就為醫(yī)生提供了選擇更好或最佳治療方案的決策基礎(chǔ),例如,在上述方案中,醫(yī)生選擇對病人同時使用紫杉醇和吉西他濱,可以達到最高的84%的治療有效率。
2016年,日本研究人員稱,他們開發(fā)的人工智能軟件能夠準確診斷出女性患者所患的罕見類型的白血病,而且,這種軟件對腫瘤大數(shù)據(jù)的提取和分析是其優(yōu)勢之一,它僅需要花費10分鐘時間就能夠?qū)εR床腫瘤研究所提供的來自2000萬名女性的遺傳信息進行對比分析,從而做出診斷。
但是,最早開發(fā)應(yīng)用于醫(yī)療領(lǐng)域的人工智能的美國國際商業(yè)機器公司更是走在了前面。
沃森癌癥醫(yī)生
美國國際商業(yè)機器公司之前推出的人工智能軟件——沃森醫(yī)生診治疾病是建立在對大數(shù)據(jù)的檢索、使用和算法之上。沃森醫(yī)生儲存了數(shù)百萬的文檔資料,包括字典、百科全書、新聞、文學(xué)以及其他可以建立知識庫的參考材料。沃森的硬件配置可以使它每秒處理500GB的數(shù)據(jù),相當于1秒閱讀100萬本書。
沃森在面臨一位就診者的時候,會進行一系列的算法,包括語法語義分析、對各個知識庫進行搜索、提取備選答案、對備選答案證據(jù)搜尋、對證據(jù)強度的計算和綜合等。此外,沃森醫(yī)生還可以通過詢問病人的癥狀、病史,迅速給出診斷提示和治療意見。通過這些程序進行診斷,沃森的診斷準確率達到73%。
現(xiàn)在經(jīng)過多年的改進,研究人員把沃森醫(yī)生的突破之一選擇為對癌癥的識別和診斷。最近,美國國際商業(yè)機器公司和美國著名的基因公司Illumina進行合作,在沃森醫(yī)生的基礎(chǔ)上,專門進行癌癥基因組的標準化測序和解讀,以診斷癌癥。根據(jù)這個目標,美國國際商業(yè)機器公司研發(fā)了一個新的專門對基因組進行測序和分析的軟件,即沃森基因組(相當于專門診治腫瘤的??漆t(yī)生),并將這個軟件整合到Illumina公司的Base Space和腫瘤測序計劃中,這就可以讓沃森基因組使用Illumina公司的實體腫瘤分析面板TruSight Tumor 170。TruSight Tumor 170匯集了一套整合DNA與RNA的靶向癌癥相關(guān)的基因突變,包括突變與微缺失、基因擴增、基因融合以及剪接變異,使得腫瘤譜分析從一系列單基因檢測向多基因檢測轉(zhuǎn)變,為腫瘤基因組提供了更加全面的視圖。教會機器識別這些腫瘤基因數(shù)據(jù),可以快速辨識和診斷腫瘤。
新的智能軟件融合后,沃森基因組可以在短短的幾分鐘之內(nèi)讀取TruSight Tumor 170生成的遺傳信息文件,梳理專業(yè)指南、醫(yī)學(xué)文獻、臨床試驗匯編和其他知識來源。然后,系統(tǒng)將生成包含每個基因組改變的注釋報告。使用沃森基因組可以大幅減少解釋結(jié)果所花費的時間。比較起來,研究人員也可以使用TruSight Tumor 170進行癌癥基因的檢測,但是,速度很慢。沃森基因組在幾分鐘內(nèi)做的事情,研究人員一般需要一個多星期才能做完。
不僅在速度上沃森基因組可以比人類快得多,而且在檢測的準確性以及提供治療癌癥的方式上,沃森基因組與臨床大夫和腫瘤專家提供的方案基本一致。美國北卡羅來納大學(xué)教堂山分校的夏普尼斯博士研究了1000余名癌癥患者的數(shù)據(jù),發(fā)現(xiàn)在99%的病例中,沃森基因組提出的治療建議與分子腫瘤專家團隊提出的治療建議相同。此外,美國國際商業(yè)機器公司旗下的沃森健康的副總裁哈韋還指出,在30%的腫瘤病例中,沃森基因組還發(fā)現(xiàn)癌癥專家遺漏的一些細節(jié)。
基于這些結(jié)果,研究人員認為,教會人工智能診治腫瘤大有可為?,F(xiàn)在,美國20個專注于基因組學(xué)和腫瘤學(xué)領(lǐng)域的癌癥研究所,包括紀念斯隆·凱特林癌癥中心和北卡羅來納大學(xué)教堂山分校的腫瘤研究機構(gòu)正在進一步培訓(xùn)沃森基因組,以便讓沃森基因組能更快和更好地診治癌癥。
對癌癥圖像的智能解讀
診斷癌癥不僅要靠解讀癌癥特有的基因、分子標記物等,還要認識和判斷采用各種物理和化學(xué)方式拍攝的人體腫瘤的圖像,這既是人工智能深度學(xué)習(xí)的內(nèi)容,又是人工智能幫助人類診治癌癥的一個重要途徑,在這個方面,人工智能也取得了一些進展。
2016年8月,美國休斯頓衛(wèi)理公會醫(yī)院的研究人員在《癌癥》雜志上發(fā)表文章稱,他們研發(fā)的一款人工智能軟件在解析乳腺X線圖片時比普通醫(yī)生快30倍,診斷乳腺癌的準確率更是高達99%。這個癌癥診斷軟件可以直觀地將X光圖片的信息轉(zhuǎn)譯成診斷信息,方便醫(yī)生快速對病人病情做出判斷,避免耽誤病情。
即便是腫瘤科的專科醫(yī)生,對諸如X線片、CT和核磁共振成像圖片的解讀都不會是百分之百的準確,而且有很多誤讀。美國疾病預(yù)防控制中心(CDC)和癌癥協(xié)會的數(shù)據(jù)顯示,每年美國大約有1210萬人接受乳腺X線圖片檢測,其中差不多有一半人在X線圖片上會出現(xiàn)陽性結(jié)果,但實際上是假陽性。為此,又迫使大量女性為了求得安心而進一步接受乳腺活組織檢查,進行這一檢查的人每年有160萬人左右,其中20%的女性根本就沒病。這給許多女性和其家庭造成極大經(jīng)濟和精神負擔。
為了改變這種狀況,研究人員打算從人工智能著手來解決X線圖片識別癌癥的假陽性問題。衛(wèi)理公會醫(yī)院的研究人員設(shè)計的這個人工智能軟件能夠掃描病人的X線影像結(jié)果,能采集診斷特征,并將乳腺X線影像結(jié)果與乳腺癌亞型進行關(guān)聯(lián)。此后,醫(yī)生可使用軟件的分析結(jié)果來精確預(yù)測每個病人是否有患乳腺癌的風險。
利用這個人工智能軟件研究人員解讀了500名乳腺癌病人的乳腺X線影像結(jié)果和病理組織切片報告,同時,研究人員還安排各種相關(guān)醫(yī)學(xué)數(shù)據(jù)企圖迷惑人工智能軟件。另一方面,讓兩名腫瘤科的權(quán)威醫(yī)生進行同樣的看圖診斷。人工智能用幾個小時就完成診斷,但兩位乳腺癌專業(yè)的權(quán)威醫(yī)生卻花了50~70小時才完成對50位病人的診斷。
這套軟件能夠快速和準確診斷乳腺癌的原因在于,它能在很短時間內(nèi)回顧幾百萬份記錄,通過解讀病人的乳腺X線影像結(jié)果幫助醫(yī)生診斷,效率更高。如此,也有望減少不必要的組織活檢。組織活檢不僅耗費錢財,而且準確率也不見得高?,F(xiàn)在,乳腺癌組織活檢結(jié)果的正確率只有60%~80%,但在美國乳腺癌活檢設(shè)備的市場規(guī)模到2024年將達9.11億美元。美國每年浪費在最簡單的非侵入性乳腺癌上的資金也高達3500萬美元。顯然,人工智能軟件可以幫助提高癌癥的正確診斷率并降低診療費用。
【責任編輯】張?zhí)锟?