張曄
近日,頂尖學(xué)術(shù)期刊《自然》上線(xiàn)了一項(xiàng)有關(guān)癌癥診斷的重要研究。
與以往不同的是,來(lái)自美國(guó)加州大學(xué)圣迭戈分校的科學(xué)家,通過(guò)訓(xùn)練人工智能從血液中鑒定微生物的遺傳物質(zhì),不僅可以識(shí)別出癌癥,還能對(duì)不同類(lèi)型的癌癥做出區(qū)分。
“這是一個(gè)很有前景的方向,改變了傳統(tǒng)的檢測(cè)方法,而且運(yùn)用人工智能技術(shù),使得海量的檢索和比對(duì)工作得以快速而準(zhǔn)確地完成?!蹦暇┬畔⒐こ檀髮W(xué)教授徐軍評(píng)價(jià)道。
菌群與人體的關(guān)系毫無(wú)疑問(wèn)是十分密切的。近年來(lái),許多研究證據(jù)顯示,人體微生物對(duì)多種類(lèi)型的腫瘤有“貢獻(xiàn)”??茖W(xué)家猜想,這些微生物在癌癥中所起的作用也許比我們已知的更多。因?yàn)橐郧暗陌┌Y研究工作,忽略了人體癌細(xì)胞與微生物可能有復(fù)雜的相互作用。
美國(guó)加州大學(xué)圣迭戈分校的科學(xué)家有了一個(gè)大膽的設(shè)想:分析血液中來(lái)自微生物的遺傳物質(zhì),可以根據(jù)其特征模式來(lái)識(shí)別體內(nèi)的腫瘤。
如果在過(guò)去,這種設(shè)想真的只能是想想罷了,“這是因?yàn)榧?xì)菌的數(shù)量十分龐大,檢測(cè)它們的基因序列將是一個(gè)海量工程。”徐軍說(shuō),但是得益于基因測(cè)序技術(shù)的發(fā)展,現(xiàn)在測(cè)序的費(fèi)用與時(shí)間都在大幅下降,同時(shí)微生物的基因測(cè)序也能夠運(yùn)用AI技術(shù),效率能大大提升。
研究人員在幾千份樣本中找到相應(yīng)的微生物特征后,把工作交給了人工智能。通過(guò)相應(yīng)的機(jī)器學(xué)習(xí)模型來(lái)挖掘大量數(shù)據(jù),把特定的微生物序列特征與特定的癌癥相匹配。
“機(jī)器學(xué)習(xí)的方式主要有監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),從這個(gè)項(xiàng)目公開(kāi)的信息來(lái)看,采用的是監(jiān)督學(xué)習(xí)模式。”徐軍分析說(shuō),監(jiān)督學(xué)習(xí)的特點(diǎn)是人類(lèi)會(huì)把知識(shí)傳授給計(jì)算機(jī),計(jì)算機(jī)根據(jù)樣本的特征進(jìn)行學(xué)習(xí),接下來(lái)就能夠自動(dòng)區(qū)分疾病或者健康的樣本。
另一種非監(jiān)督學(xué)習(xí)將能夠使得機(jī)器具備更高的智能,即人類(lèi)沒(méi)有給計(jì)算機(jī)提示,計(jì)算機(jī)通過(guò)歸納的樣本之間的規(guī)律和模式,突破了以往需人類(lèi)干預(yù)才可學(xué)習(xí)的局限。
“現(xiàn)在還有一種新的非監(jiān)督學(xué)習(xí)模式——對(duì)抗學(xué)習(xí),其特點(diǎn)是人類(lèi)設(shè)計(jì)出兩個(gè)模型,一個(gè)用于制造偽裝數(shù)據(jù),另一個(gè)用于鑒別偽裝,在你來(lái)我往中實(shí)現(xiàn)互贏,最后達(dá)到納什均衡狀態(tài)。”徐軍認(rèn)為,我國(guó)擁有大量的疾病數(shù)據(jù),醫(yī)學(xué)和人工智能領(lǐng)域之間如果能夠長(zhǎng)期深入合作,將能夠更好地為患者服務(wù)。
從此項(xiàng)研究的結(jié)果來(lái)看,這套AI模型在實(shí)際診斷中是可靠的??茖W(xué)家讓AI對(duì)100名患者的樣本血漿進(jìn)行分析,并與69名健康無(wú)癌個(gè)體的血樣進(jìn)行比較。機(jī)器學(xué)習(xí)模型不僅可以區(qū)分患癌和無(wú)癌的樣本,還能區(qū)分不同類(lèi)型的癌癥:以86%的敏感性識(shí)別出肺癌患者,對(duì)于無(wú)肺部疾病的個(gè)體沒(méi)有出現(xiàn)假陽(yáng)性報(bào)告,并且以81%的準(zhǔn)確率區(qū)分出前列腺癌和肺癌。
專(zhuān)家認(rèn)為,AI和大數(shù)據(jù)的加入,可以完成更加復(fù)雜的任務(wù)。比如基因序列的讀取,是人的眼睛和智力水平基本上無(wú)法完成的,而人工智能和大數(shù)據(jù)技術(shù)的廣泛使用將能夠很好地解決這個(gè)問(wèn)題。