前有百度進(jìn)軍人工智能,宣布“智能醫(yī)療,奇點(diǎn)臨近”;后有百洋醫(yī)藥引進(jìn)沃森腫瘤智能助手?;鸨虻娜斯ぶ悄苷诟?、更深地進(jìn)入醫(yī)療領(lǐng)域。到底什么是人工智能?人工智能是制造以人類智能的方式學(xué)習(xí)并解決問題的智能機(jī)器和計(jì)算機(jī)程序的科學(xué)工程。該領(lǐng)域包括自然語言處理與翻譯、視覺感知與模式識(shí)別,以及決策制定等。
推動(dòng)人工智能進(jìn)展的三大基石是更多的數(shù)據(jù)、更快的硬件、更好的算法。近年來,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的應(yīng)用領(lǐng)域極速擴(kuò)張也是巨大的推動(dòng)力。
機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域中有廣泛的應(yīng)用前景,而它可為其中不少的子行業(yè)提供獲得高額回報(bào)的潛力。隨著人工智能和機(jī)器學(xué)習(xí)的不斷整合,人們將有望在新藥研發(fā)過程中實(shí)現(xiàn)“去風(fēng)險(xiǎn)”,不但將節(jié)約每年約260億美元的研發(fā)成本,同時(shí)還將提高全球醫(yī)療信息領(lǐng)域的效率。
痛點(diǎn)
藥物發(fā)現(xiàn)與開發(fā)的時(shí)間和成本一直是醫(yī)療領(lǐng)域的重要痛點(diǎn)之一。塔夫特藥物發(fā)展研究中心數(shù)據(jù)顯示,一款上市的新藥從藥物發(fā)現(xiàn)到FDA批準(zhǔn)平均時(shí)間約為97個(gè)月。再算上前期研究和測試的時(shí)間,整個(gè)過程可達(dá)10年以上。
雖然專業(yè)技術(shù)進(jìn)步幫助改善了時(shí)間問題,但新藥研發(fā)成本卻仍在持續(xù)增加。德勤的數(shù)據(jù)顯示,自2010年以來,12家主要制藥公司的獲批藥物開發(fā)成本已經(jīng)增加了33%,約每年16億美元。
而新藥研發(fā)之所以越來越難,不僅是因?yàn)闀r(shí)間漫長,還由于整個(gè)開發(fā)過程中各個(gè)階段的成功概率都很低。
藥物發(fā)現(xiàn)始于最初的目標(biāo)確定。一旦確定目標(biāo)后,人們通常利用高通量篩選在同一時(shí)間進(jìn)行數(shù)以百萬計(jì)的試驗(yàn),找出最有潛力達(dá)到目標(biāo)的化合物,提高藥物發(fā)現(xiàn)的“命中”幾率。“命中”的結(jié)果經(jīng)過優(yōu)化成為導(dǎo)引化合物,然后再進(jìn)一步優(yōu)化,為進(jìn)入臨床前藥物開發(fā)做好準(zhǔn)備。這個(gè)過程通常就需要1年~3年。
此外,在藥物發(fā)現(xiàn)的早期階段,“高通量篩選”這種虛擬篩選方法非常容易受到錯(cuò)誤發(fā)現(xiàn)率的影響。有專家認(rèn)為,錯(cuò)誤發(fā)現(xiàn)率是一個(gè)統(tǒng)計(jì)學(xué)現(xiàn)象,而避免錯(cuò)誤發(fā)現(xiàn)率則有可能將后期試驗(yàn)階段的風(fēng)險(xiǎn)減半。
影響研發(fā)回報(bào)最重要的不利因素之一在于那些失敗的研發(fā)產(chǎn)品,特別是那些已經(jīng)達(dá)到后期試驗(yàn)階段的藥物;這些藥物的成本估計(jì)每年達(dá)到400億美元以上。如果可以將Ⅲ期臨床試驗(yàn)階段的風(fēng)險(xiǎn)減半,大型制藥公司就可以節(jié)約數(shù)十億美元成本,進(jìn)而影響其超過900億美元的研發(fā)經(jīng)費(fèi)并帶來有意義的回報(bào),使它們能夠騰出資源集中用于尋找更有潛力的機(jī)會(huì)。
開發(fā)一款成功藥物的成本持續(xù)增加,但由于報(bào)銷制度中的不利因素、患者量的降低和企業(yè)間的競爭等,新藥研發(fā)的收入回報(bào)環(huán)境不容樂觀,這也讓制藥企業(yè)比以前更需要考慮這一問題。
方法
在藥物開發(fā)過程中結(jié)合機(jī)器學(xué)習(xí),可以提升開發(fā)效率的潛力。機(jī)器學(xué)習(xí)不但可以加速時(shí)間進(jìn)程,還可以提高到達(dá)后期試驗(yàn)階段藥物的成功概率。
學(xué)者們已經(jīng)紛紛倡導(dǎo)利用人工智能開發(fā)有效和準(zhǔn)確的虛擬篩選方法,以取代昂貴且耗時(shí)的高通量篩選過程。而且已經(jīng)有巨頭公司和初創(chuàng)公司采取行動(dòng)。
比如谷歌和斯坦福的研究人員就正在攻關(guān)利用機(jī)器學(xué)習(xí)開發(fā)虛擬篩選的技術(shù)。目的就是取代或增強(qiáng)傳統(tǒng)的高通量篩選過程,提高篩選速度和成功率。通過應(yīng)用機(jī)器學(xué)習(xí),研究人員能夠?qū)崿F(xiàn)跨越多個(gè)靶點(diǎn)的眾多實(shí)驗(yàn)的信息共享。正如一篇機(jī)器學(xué)習(xí)相關(guān)的論文中所稱:“我們的實(shí)驗(yàn)表明,深層神經(jīng)網(wǎng)絡(luò)優(yōu)于所有其他方法,尤其在于深層神經(jīng)網(wǎng)絡(luò)大大超越了所有現(xiàn)有的商業(yè)解決方案。在許多靶點(diǎn)上,它都實(shí)現(xiàn)了接近完美的預(yù)測質(zhì)量,使其尤其適合被用作虛擬篩選裝置。總之,深度學(xué)習(xí)提供了建立虛擬篩選并將其作為藥物設(shè)計(jì)管道中標(biāo)準(zhǔn)步驟的機(jī)會(huì)?!?/p>
在2012年,默沙東主持了一項(xiàng)由數(shù)據(jù)科學(xué)公司Kaggle發(fā)起的旨在確定虛擬篩選統(tǒng)計(jì)技術(shù)的研究項(xiàng)目。而現(xiàn)在,Kaggle已經(jīng)開始測試機(jī)器學(xué)習(xí)和人工智能的應(yīng)用,并與人工智能藥物發(fā)現(xiàn)初創(chuàng)公司Atomwise開展合作。
Atomwise利用人工智能技術(shù),在不到一天的時(shí)間內(nèi)對現(xiàn)有的7000多種藥物進(jìn)行了分析測試,為尋找埃博拉病毒治療方案做出了貢獻(xiàn)。根據(jù)該公司的統(tǒng)計(jì),如果利用傳統(tǒng)方法,這項(xiàng)分析需要花費(fèi)數(shù)月甚至數(shù)年才能完成。
雖然與后期試驗(yàn)相關(guān)的巨額費(fèi)用往往側(cè)重于臨床試驗(yàn)的設(shè)計(jì)元素,但高盛報(bào)告指出,將人工智能應(yīng)用于優(yōu)化后期階段在選擇標(biāo)準(zhǔn)、規(guī)模和研究長度等方面的決策,可以實(shí)現(xiàn)有意義的效率提高。
另外,醫(yī)生的醫(yī)療實(shí)踐明顯滯后于新藥和新治療方法的獲批也是醫(yī)療領(lǐng)域的又一大挑戰(zhàn)。機(jī)器學(xué)習(xí)和人工智能可有望降低藥物發(fā)現(xiàn)和醫(yī)療實(shí)踐之間的時(shí)間差;與此同時(shí),它們還能對治療進(jìn)行優(yōu)化。例如,從北美放射學(xué)會(huì)2009年對肝膽放射的研究可見,23%的第二意見會(huì)改變診斷結(jié)論,而這也是專注于醫(yī)學(xué)影像的機(jī)器學(xué)習(xí)公司有望能解決的領(lǐng)域。那些致力于利用機(jī)器學(xué)習(xí)在基因組層面進(jìn)行疾病判斷的公司也正幫助供應(yīng)商實(shí)現(xiàn)精準(zhǔn)定位,以提供更有效和更有針對性的治療。
因此,許多醫(yī)療領(lǐng)域的機(jī)器學(xué)習(xí)和人工智能專家正不斷鼓勵(lì)主要的醫(yī)療服務(wù)供應(yīng)商,讓在其工作流程中融入現(xiàn)代的機(jī)器學(xué)習(xí)工具,以使其充分利用收集到的和已發(fā)表的海量醫(yī)療數(shù)據(jù)存儲(chǔ)。
不過,雖然人工智能在醫(yī)療領(lǐng)域的許多子領(lǐng)域均存在明顯機(jī)遇,但技術(shù)采用的障礙仍然存在。
實(shí)施人工智能需要配備必要工具和能力,但它們的成本十分昂貴。在醫(yī)療行業(yè)中,醫(yī)療成本仍然是大眾關(guān)注的焦點(diǎn)。為了確保機(jī)器學(xué)習(xí)算法能很好地利用數(shù)據(jù),光是確保擁有足夠的計(jì)算能力就將花費(fèi)不菲。還有來自相關(guān)領(lǐng)域人才的聚合也費(fèi)用高昂。2013年,Google為收購一家人工智能公司共支付了4億多美元,彼時(shí)該團(tuán)隊(duì)的成員只有十幾人。聚合這樣一群高級(jí)人才的難度以及由此產(chǎn)生的高昂成本也可能會(huì)令企業(yè)望而卻步。
實(shí)施人工智能還需要梳理多個(gè)數(shù)據(jù)集,而這往往會(huì)生成一些所謂的“黑箱子”,以前一直受到嚴(yán)格監(jiān)管的醫(yī)療行業(yè)有可能會(huì)因此推遲人工智能應(yīng)用的發(fā)展。而且,雖然美國政府已經(jīng)下令要求實(shí)現(xiàn)電子健康記錄的數(shù)字化,但將普遍使用紙張的系統(tǒng)轉(zhuǎn)變?yōu)橥耆娮踊倪^程仍然存在挑戰(zhàn)。雖然許多機(jī)構(gòu)已經(jīng)邁過了人工智能“有意義使用”的門檻,但是重要患者數(shù)據(jù)的碎片化和難以獲得仍然阻礙著改革的進(jìn)一步發(fā)展。