李偉
人工智能(AI)直接讀取思維已不再是科幻小說中的情節(jié),而是正在成為現(xiàn)實。AI“讀心”可以讓我們更好地了解大腦的工作原理,也可以為一些臨床診斷和治療提供新的手段。
據(jù)英國《自然》雜志報道,美國得克薩斯大學的科學家在大型語言模型(LLM)的助力下,開發(fā)出一種“讀心機”,雖然它不能直接讓人“說真話”,但可以將大腦活動轉換成清晰的圖像或語句呈現(xiàn)出來。這種借助AI的“讀心機”打破了人們的認知。
“讀心”即“思維解碼”,是指直接從大腦中提取和解析思維的過程。這個過程涉及神經(jīng)元活動模式的識別,以及將這些模式與特定的思維或感知相關聯(lián)。
美國得克薩斯大學奧斯汀分校的研究人員開發(fā)的系統(tǒng),名為語義解碼器,它是一種新型AI系統(tǒng),只需分析功能磁共振成像(fMRI)數(shù)據(jù),就可以通過非侵入性方式將參與者大腦中所想的語句甚至圖像呈現(xiàn)出來。
fMRI設備
值得一提的是,該系統(tǒng)部分依賴于大型語言模型,而這種模型正是AI聊天軟件 ChatGPT 的基礎。AI可以利用機器學習、深度學習等算法,從大量的訓練數(shù)據(jù)中找到大腦活動與思維內容之間的關聯(lián)規(guī)律,并根據(jù)這些規(guī)律來預測或重建未知的思維內容。假設我們想要從一個人的大腦活動中重建他看到或想象的圖像,可以先讓這個人觀看一些圖像,同時記錄他的大腦活動數(shù)據(jù)。然后讓AI學習這些圖像和受測者大腦活動數(shù)據(jù)之間的對應關系,從而建立一個模型。最后,AI可以用這個模型根據(jù)受測者新的大腦活動數(shù)據(jù),生成與之匹配的圖像或語句。
在模型訓練階段,科學家讓受測者躺在fMRI設備中,在接受fMRI掃描的同時,從耳機中聽取播客故事。研究人員利用基于GPT-1的大型語言模型,將受測者fMRI數(shù)據(jù)顯示的大腦活動與播客故事的語言特征聯(lián)系起來。
受測者分階段聽了十幾小時播客故事后,就進入模型應用階段。研究人員讓他聽一個全新的故事,然后讓語義解碼器根據(jù)受測者的大腦活動輸出語句,描述其聽到的故事。實驗結果顯示,該系統(tǒng)能夠根據(jù)受測者的fMRI數(shù)據(jù),描述出他聽到的故事。雖然準確率達不到100%,但語義解碼器能讀出受測者大腦中思考的故事大意。
除了可以將語音解讀出來外,這個系統(tǒng)還能解碼視頻、圖像。研究人員讓受測者觀看一段沒有語音及文字的動畫視頻,然后語義解碼器可以根據(jù)受測者的大腦活動輸出語句,描述視頻的內容。
這項研究的主導者,得克薩斯大學奧斯汀分校神經(jīng)科學和計算科學教授胡斯表示,語義解碼器須一對一量身定制。受測者要經(jīng)過一段時間的訓練——既是訓練自己,也是訓練解碼系統(tǒng)。在接受解碼時,受測者要保持靜止狀態(tài),并將精神集中在他正在聽的故事上,這樣該系統(tǒng)才能真正發(fā)揮作用。研究團隊曾對沒有接受過任何訓練的受測者進行測試,其解碼結果與實際情況相差甚遠。
得克薩斯大學的這項研究并非全球首例。盡管還不能完全解碼人類的思維,但各國的研究人員在這方面持續(xù)發(fā)力,并不斷取得進展。
2021年5月,瑞士洛桑聯(lián)邦理工學院(EPFL)的研究團隊開發(fā)出利用AI從大腦信號中解碼視頻畫面的方法。首先,受測者觀看一些視頻片段,解碼系統(tǒng)記錄他們的大腦信號數(shù)據(jù)。然后,研究人員用一個基于卷積神經(jīng)網(wǎng)絡(CNN)的模型,將數(shù)據(jù)轉換成視頻畫面的特征向量。最后,由一種名為圖像生成網(wǎng)絡(IGN)的技術,對這些特征向量進行優(yōu)化和修復,得到清晰的視頻畫面。
導出腦部信號
今年3月,日本京都大學的科學家使用AI成功解碼人們看到或在大腦中想象的圖像,以及他們正在聽或者想象的語句。京都大學的研究人員表示:“我們提出了一種新的圖像重建方法。圖像的像素被優(yōu)化,使其深層的神經(jīng)網(wǎng)絡特征與人類大腦活動的多個層面相似。”
該技術的核心在于:當人們觀察一幅圖像時,會在腦海中復刻這幅圖像。AI通過特定的算法將受測者大腦中的fMRI信號和圖像的深度神經(jīng)網(wǎng)絡特征相關聯(lián),繼而訓練出可以讀取人類思維的能力。
需要強調的是,目前的研究大多依賴于粗糙的大腦成像技術和有限的數(shù)據(jù)。因此,這類系統(tǒng)能解碼的思維種類和精確度都比較有限。此外,延時也是一個有待解決的問題。儀器與人的交互、讀取和處理信息都需要時間。而且,不同的人大腦活動方式有差異,這對于系統(tǒng)的適應能力也是一個不小的挑戰(zhàn)。
現(xiàn)有的解碼器工作時,需要受測者躺在特定的儀器中,且保持靜止,這樣才能收集到可靠的數(shù)據(jù)。這種苛刻的要求是該系統(tǒng)推廣和應用的障礙。
隨著大腦成像技術的發(fā)展和更多的數(shù)據(jù)可用,科學家有望訓練出能解碼更復雜、更精細思維的AI。這不僅能使我們更深入地了解大腦和思維的運作模式,也將開啟全新的交流方式。
不過,AI直接讀取思維還需要更多的科學依據(jù)和技術支持。目前,AI只能解碼一些簡單的思維內容,而對于復雜和抽象的內容,則還沒有有效的解讀方法。此外,AI還需要更高效和精確的大腦監(jiān)測儀器,以及數(shù)據(jù)分析方法,以加快解碼的速度,并提高準確度。
能讀取思維的AI必然帶來一系列道德和倫理問題。例如,誰有權“訪問”某個人的思維?如何保護“思維隱私”?這些都是在開發(fā)這項技術時必須面對和解決的問題。
解碼系統(tǒng)捕捉大腦中血液變化情況
胡斯教授表示,現(xiàn)階段不必擔心該技術會對人類隱私帶來威脅,因為每次“讀心”實驗的成功都需要受測者高度配合?!叭绻悴幌氡粰C器讀取你的思維,那么可以通過‘走神來建立無懈可擊的屏障?!?/p>
“不斷評估大腦解碼器對人類心理隱私的影響,這是至關重要的?!毖芯空呓苋稹ぬ撇┦空f。他指出,目前的研究結果顯示,該技術尚不能應用于侵犯個人心理隱私的活動。
AI“讀心”在醫(yī)學領域的應用更值得關注。例如,利用AI讀取思維,可以幫助失語癥患者恢復語言交流能力,給那些因疾病而喪失說話能力的患者帶來新的希望,甚至幫助植物人恢復意識。
編輯:姚志剛? winter-yao@163.com