近日,科學(xué)家發(fā)現(xiàn),Netflix、亞馬遜和Facebook使用的強大算法可以“預(yù)測”癌癥和阿爾茨海默氏癥等神經(jīng)退行性疾病的生物學(xué)語言。
研究人員將數(shù)十年研究產(chǎn)生的大數(shù)據(jù)輸入到一個計算機語言模型中,以檢驗人工智能能否比人類做出更先進的發(fā)現(xiàn)。英國劍橋大學(xué)圣約翰學(xué)院的學(xué)者發(fā)現(xiàn),機器學(xué)習(xí)技術(shù)可以解讀癌癥、阿爾茨海默氏癥和其他神經(jīng)退行性疾病的“生物語言”。相關(guān)論文近日發(fā)表于美國《國家科學(xué)院院刊》,未來可能用于“糾正導(dǎo)致疾病的細胞內(nèi)的語法錯誤”。
研究人員使用類似的機器學(xué)習(xí)技術(shù)訓(xùn)練了一個大規(guī)模的語言模型,以觀察當體內(nèi)的蛋白質(zhì)出現(xiàn)問題導(dǎo)致疾病時會發(fā)生什么?!叭梭w是成千上萬種蛋白質(zhì)的家園,而科學(xué)家們還不知道其中許多蛋白質(zhì)的功能。我們要求一個基于神經(jīng)網(wǎng)絡(luò)的語言模型來學(xué)習(xí)蛋白質(zhì)的語言?!闭撐墓餐谝蛔髡逰adi Liis Saar說,特別要求該程序?qū)W習(xí)生物分子冷凝物(細胞中發(fā)現(xiàn)的蛋白質(zhì)液滴)的語言,以破解導(dǎo)致癌癥和阿爾茨海默氏癥等神經(jīng)退行性疾病的生物功能和故障語言。他們向算法提供已知蛋白質(zhì)的所有數(shù)據(jù),這樣它就可以學(xué)習(xí)和預(yù)測蛋白質(zhì)的語言。但科學(xué)家的發(fā)現(xiàn)可能會超出目前已知和推測疾病的范圍,甚至可能超出人類大腦在沒有機器學(xué)習(xí)的幫助下能夠理解的范圍。