李偉
人工智能(AI)直接讀取思維已不再是科幻小說中的情節(jié),而是正在成為現(xiàn)實。AI“讀心”可以讓我們更好地了解大腦的工作原理,也可以為一些臨床診斷和治療提供新的手段。
據(jù)英國《自然》雜志報道,美國得克薩斯大學(xué)的科學(xué)家在大型語言模型(LLM)的助力下,開發(fā)出一種“讀心機(jī)”,雖然它不能直接讓人“說真話”,但可以將大腦活動轉(zhuǎn)換成清晰的圖像或語句呈現(xiàn)出來。這種借助AI的“讀心機(jī)”打破了人們的認(rèn)知。
“讀心”即“思維解碼”,是指直接從大腦中提取和解析思維的過程。這個過程涉及神經(jīng)元活動模式的識別,以及將這些模式與特定的思維或感知相關(guān)聯(lián)。
美國得克薩斯大學(xué)奧斯汀分校的研究人員開發(fā)的系統(tǒng),名為語義解碼器,它是一種新型AI系統(tǒng),只需分析功能磁共振成像(fMRI)數(shù)據(jù),就可以通過非侵入性方式將參與者大腦中所想的語句甚至圖像呈現(xiàn)出來。
fMRI設(shè)備
值得一提的是,該系統(tǒng)部分依賴于大型語言模型,而這種模型正是AI聊天軟件 ChatGPT 的基礎(chǔ)。AI可以利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法,從大量的訓(xùn)練數(shù)據(jù)中找到大腦活動與思維內(nèi)容之間的關(guān)聯(lián)規(guī)律,并根據(jù)這些規(guī)律來預(yù)測或重建未知的思維內(nèi)容。假設(shè)我們想要從一個人的大腦活動中重建他看到或想象的圖像,可以先讓這個人觀看一些圖像,同時記錄他的大腦活動數(shù)據(jù)。然后讓AI學(xué)習(xí)這些圖像和受測者大腦活動數(shù)據(jù)之間的對應(yīng)關(guān)系,從而建立一個模型。最后,AI可以用這個模型根據(jù)受測者新的大腦活動數(shù)據(jù),生成與之匹配的圖像或語句。
在模型訓(xùn)練階段,科學(xué)家讓受測者躺在fMRI設(shè)備中,在接受fMRI掃描的同時,從耳機(jī)中聽取播客故事。研究人員利用基于GPT-1的大型語言模型,將受測者fMRI數(shù)據(jù)顯示的大腦活動與播客故事的語言特征聯(lián)系起來。
受測者分階段聽了十幾小時播客故事后,就進(jìn)入模型應(yīng)用階段。研究人員讓他聽一個全新的故事,然后讓語義解碼器根據(jù)受測者的大腦活動輸出語句,描述其聽到的故事。實驗結(jié)果顯示,該系統(tǒng)能夠根據(jù)受測者的fMRI數(shù)據(jù),描述出他聽到的故事。雖然準(zhǔn)確率達(dá)不到100%,但語義解碼器能讀出受測者大腦中思考的故事大意。
除了可以將語音解讀出來外,這個系統(tǒng)還能解碼視頻、圖像。研究人員讓受測者觀看一段沒有語音及文字的動畫視頻,然后語義解碼器可以根據(jù)受測者的大腦活動輸出語句,描述視頻的內(nèi)容。
這項研究的主導(dǎo)者,得克薩斯大學(xué)奧斯汀分校神經(jīng)科學(xué)和計算科學(xué)教授胡斯表示,語義解碼器須一對一量身定制。受測者要經(jīng)過一段時間的訓(xùn)練——既是訓(xùn)練自己,也是訓(xùn)練解碼系統(tǒng)。在接受解碼時,受測者要保持靜止?fàn)顟B(tài),并將精神集中在他正在聽的故事上,這樣該系統(tǒng)才能真正發(fā)揮作用。研究團(tuán)隊曾對沒有接受過任何訓(xùn)練的受測者進(jìn)行測試,其解碼結(jié)果與實際情況相差甚遠(yuǎn)。
得克薩斯大學(xué)的這項研究并非全球首例。盡管還不能完全解碼人類的思維,但各國的研究人員在這方面持續(xù)發(fā)力,并不斷取得進(jìn)展。
2021年5月,瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)的研究團(tuán)隊開發(fā)出利用AI從大腦信號中解碼視頻畫面的方法。首先,受測者觀看一些視頻片段,解碼系統(tǒng)記錄他們的大腦信號數(shù)據(jù)。然后,研究人員用一個基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的模型,將數(shù)據(jù)轉(zhuǎn)換成視頻畫面的特征向量。最后,由一種名為圖像生成網(wǎng)絡(luò)(IGN)的技術(shù),對這些特征向量進(jìn)行優(yōu)化和修復(fù),得到清晰的視頻畫面。
導(dǎo)出腦部信號
今年3月,日本京都大學(xué)的科學(xué)家使用AI成功解碼人們看到或在大腦中想象的圖像,以及他們正在聽或者想象的語句。京都大學(xué)的研究人員表示:“我們提出了一種新的圖像重建方法。圖像的像素被優(yōu)化,使其深層的神經(jīng)網(wǎng)絡(luò)特征與人類大腦活動的多個層面相似。”
該技術(shù)的核心在于:當(dāng)人們觀察一幅圖像時,會在腦海中復(fù)刻這幅圖像。AI通過特定的算法將受測者大腦中的fMRI信號和圖像的深度神經(jīng)網(wǎng)絡(luò)特征相關(guān)聯(lián),繼而訓(xùn)練出可以讀取人類思維的能力。
需要強(qiáng)調(diào)的是,目前的研究大多依賴于粗糙的大腦成像技術(shù)和有限的數(shù)據(jù)。因此,這類系統(tǒng)能解碼的思維種類和精確度都比較有限。此外,延時也是一個有待解決的問題。儀器與人的交互、讀取和處理信息都需要時間。而且,不同的人大腦活動方式有差異,這對于系統(tǒng)的適應(yīng)能力也是一個不小的挑戰(zhàn)。
現(xiàn)有的解碼器工作時,需要受測者躺在特定的儀器中,且保持靜止,這樣才能收集到可靠的數(shù)據(jù)。這種苛刻的要求是該系統(tǒng)推廣和應(yīng)用的障礙。
隨著大腦成像技術(shù)的發(fā)展和更多的數(shù)據(jù)可用,科學(xué)家有望訓(xùn)練出能解碼更復(fù)雜、更精細(xì)思維的AI。這不僅能使我們更深入地了解大腦和思維的運作模式,也將開啟全新的交流方式。
不過,AI直接讀取思維還需要更多的科學(xué)依據(jù)和技術(shù)支持。目前,AI只能解碼一些簡單的思維內(nèi)容,而對于復(fù)雜和抽象的內(nèi)容,則還沒有有效的解讀方法。此外,AI還需要更高效和精確的大腦監(jiān)測儀器,以及數(shù)據(jù)分析方法,以加快解碼的速度,并提高準(zhǔn)確度。
能讀取思維的AI必然帶來一系列道德和倫理問題。例如,誰有權(quán)“訪問”某個人的思維?如何保護(hù)“思維隱私”?這些都是在開發(fā)這項技術(shù)時必須面對和解決的問題。
解碼系統(tǒng)捕捉大腦中血液變化情況
胡斯教授表示,現(xiàn)階段不必?fù)?dān)心該技術(shù)會對人類隱私帶來威脅,因為每次“讀心”實驗的成功都需要受測者高度配合?!叭绻悴幌氡粰C(jī)器讀取你的思維,那么可以通過‘走神來建立無懈可擊的屏障?!?/p>
“不斷評估大腦解碼器對人類心理隱私的影響,這是至關(guān)重要的?!毖芯空呓苋稹ぬ撇┦空f。他指出,目前的研究結(jié)果顯示,該技術(shù)尚不能應(yīng)用于侵犯個人心理隱私的活動。
AI“讀心”在醫(yī)學(xué)領(lǐng)域的應(yīng)用更值得關(guān)注。例如,利用AI讀取思維,可以幫助失語癥患者恢復(fù)語言交流能力,給那些因疾病而喪失說話能力的患者帶來新的希望,甚至幫助植物人恢復(fù)意識。
編輯:姚志剛? winter-yao@163.com