受到谷歌支持的DeepMind公司教會(huì)一個(gè)強(qiáng)化學(xué)習(xí)算法控制托卡馬克
核聚變反應(yīng)堆內(nèi)部熾烈的電漿。
托卡馬克(tokamak)是一種甜甜圈形狀的容器,設(shè)計(jì)用來(lái)容納核聚變反應(yīng)。托卡馬克的內(nèi)部呈現(xiàn)了一幕特別的混沌景象。在極高溫下,氫原子互相撞擊在一起,產(chǎn)生渦動(dòng)翻騰的電漿(又稱(chēng)作等離子體),這些電漿的溫度比太陽(yáng)表面更加炙熱。解鎖核聚變潛力的關(guān)鍵就在于找到聰明的辦法來(lái)控制和約束電漿。
過(guò)去數(shù)十年來(lái),核聚變一直被認(rèn)為是未來(lái)清潔能源的來(lái)源。目前,支撐核聚變的科學(xué)理論看起來(lái)顛撲不破,所以剩下的就是工程挑戰(zhàn)?!拔覀冃枰軌?qū)⑦@個(gè)物質(zhì)加熱到極高溫,讓它結(jié)合得足夠久,讓我們從中取得能量。”洛桑聯(lián)邦理工學(xué)院的瑞士電漿中心主管安布羅焦·法索利(Ambrogio Fasoli)說(shuō)道。
這就是DeepMind公司插一腳的地方。這家人工智能公司的背后是谷歌母公司Alphabet,先前已經(jīng)插手到電子游戲和蛋白質(zhì)折疊領(lǐng)域,也一直在與瑞士電漿中心進(jìn)行一個(gè)聯(lián)合科研項(xiàng)目——開(kāi)發(fā)用于控制核聚變反應(yīng)的人工智能。
恒星也是由核聚變供能的。在恒星內(nèi)部,單憑重力質(zhì)量就足以將氫原子拉攏到一起,克服它們相反的電荷。在地球上,科學(xué)家改用強(qiáng)大的電磁線圈來(lái)約束核聚變反應(yīng),將電漿助推到想要的位置,讓它成形,就像一名陶工擺弄轉(zhuǎn)輪上的黏土。必須小心謹(jǐn)慎地控制線圈,防止電漿觸碰到容器的表面,因?yàn)槟菢訒?huì)損傷容器壁,拖慢核聚變反應(yīng)。(缺少磁力的約束后,核聚變反應(yīng)無(wú)法存在,所以幾乎沒(méi)有爆炸的風(fēng)險(xiǎn)。)
但每次科研人員想要改變電漿的構(gòu)型,試驗(yàn)不同形狀(可能產(chǎn)生更多能量或更潔凈電漿)時(shí),需用大量的工程學(xué)和設(shè)計(jì)工作。傳統(tǒng)的系統(tǒng)由計(jì)算機(jī)控制,基于模型和細(xì)致的仿真,但根據(jù)法索利的說(shuō)法,那些系統(tǒng)“繁瑣復(fù)雜,不一定總是最優(yōu)化的”。
DeepMind公司已經(jīng)開(kāi)發(fā)出一個(gè)能自主控制電漿的人工智能?!蹲匀弧飞习l(fā)表的一篇論文描述了來(lái)自?xún)蓚€(gè)團(tuán)隊(duì)的科研人員如何教會(huì)一個(gè)深度強(qiáng)化學(xué)習(xí)系統(tǒng)控制TCV內(nèi)部的19個(gè)電磁線圈。TCV的全稱(chēng)是可變構(gòu)型托卡馬克,位于瑞士電漿中心,用它進(jìn)行科研取得的成果會(huì)給未來(lái)更大型核聚變反應(yīng)堆的設(shè)計(jì)提供情報(bào)?!叭斯ぶ悄芤约皩?zhuān)門(mén)的強(qiáng)化學(xué)習(xí)特別適合復(fù)雜的問(wèn)題,尤其以控制托卡馬克中的電漿為代表?!盌eepMind公司的控制團(tuán)隊(duì)帶頭人馬丁·里德米勒(Martin Riedmiller)說(shuō)道。
神經(jīng)網(wǎng)絡(luò)(一類(lèi)旨在模擬人類(lèi)大腦架構(gòu)的人工智能)最初在仿真中接受訓(xùn)練。它最開(kāi)始觀察19個(gè)線圈中的每個(gè)線圈的設(shè)置變化如何影響容器內(nèi)電漿的形狀。接著它被給予不同的電漿形狀,嘗試重新生成那樣形狀的電漿。其中包括D形截面的形狀,接近國(guó)際熱核聚變實(shí)驗(yàn)反應(yīng)堆(ITER)內(nèi)部將用到的電漿形狀。ITER是大型實(shí)驗(yàn)用托卡馬克核聚變反應(yīng)堆,目前正在法國(guó)建造中。另有一種雪花外形的構(gòu)型,有助于將核聚變反應(yīng)的極高熱度更加均勻地消散到容器四周。
DeepMind公司的人工智能可以自主琢磨出如何以正確的方式操縱電磁線圈,創(chuàng)造出這些形狀的電漿。這些操作在仿真中行得通的話,當(dāng)科學(xué)家在TCV內(nèi)部實(shí)際進(jìn)行相同的實(shí)驗(yàn)來(lái)驗(yàn)證仿真結(jié)果時(shí),大概同樣行得通。法索利說(shuō),這代表了“重要的一大步”,能影響未來(lái)托卡馬克的設(shè)計(jì),甚至加快實(shí)現(xiàn)可行核聚變反應(yīng)堆。
“這是個(gè)非常正面的結(jié)果,”未參與這項(xiàng)研究的倫敦帝國(guó)學(xué)院核聚變專(zhuān)家亞絲明·安德魯(Yasmin Andrew)說(shuō)道, “一個(gè)很有意思的地方是,看下他們能否將技術(shù)遷移到更大型的托卡馬克上?!?/p>
核聚變?yōu)镈eepMind公司的科學(xué)家提供特別的挑戰(zhàn),因?yàn)檎麄€(gè)過(guò)程既復(fù)雜又呈現(xiàn)連續(xù)性。和圍棋那樣基于回合的博弈不同,電漿的狀態(tài)持續(xù)變化。雪上加霜的是,我們無(wú)法連續(xù)地測(cè)量電漿。人工智能研究者稱(chēng)之為“觀測(cè)下系統(tǒng)”。
“有時(shí)候,擅長(zhǎng)解決這些離散問(wèn)題的算法處理連續(xù)性問(wèn)題時(shí)十分費(fèi)勁?!盌eepMind公司的一位研究員若納斯·比什利(Jonas Buchli)說(shuō)道,“這對(duì)我們的算法來(lái)說(shuō),是真正的一大步,因?yàn)槲覀兡鼙砻?,我們的算法能解決連續(xù)性問(wèn)題。我們認(rèn)為,這當(dāng)然是個(gè)非常非常復(fù)雜的難題,和棋局中遇到的復(fù)雜性相比,它是一種完全不同的復(fù)雜性?!?/p>
這并非人類(lèi)首次嘗試用人工智能來(lái)控制核聚變。從2014年起,谷歌已經(jīng)和以加州為大本營(yíng)的核聚變公司TAE進(jìn)行科技合作,試圖將機(jī)器學(xué)習(xí)算法應(yīng)用到另一類(lèi)核聚變反應(yīng)堆上,加快實(shí)驗(yàn)數(shù)據(jù)的分析。位于英國(guó)的歐洲聯(lián)合環(huán)狀反應(yīng)堆(JET)核聚變項(xiàng)目的研究已經(jīng)使用人工智能來(lái)嘗試預(yù)測(cè)電漿的行為。這個(gè)構(gòu)思甚至出現(xiàn)在虛構(gòu)故事中。2004年上映的電影《蜘蛛俠2》中,反派八爪博士創(chuàng)造出由人工智能驅(qū)動(dòng)、大腦控制的外骨骼來(lái)控制他的實(shí)驗(yàn)性核聚變反應(yīng)堆。這個(gè)反應(yīng)堆運(yùn)作良好,直到人工智能接管了他的心智,開(kāi)始?xì)⒙救祟?lèi)。
簡(jiǎn)而言之,隨著核聚變反應(yīng)堆變得越來(lái)越大,與DeepMind公司的合作能被事實(shí)證明是極其關(guān)鍵的。盡管物理學(xué)家通過(guò)傳統(tǒng)方法,很好地應(yīng)付了控制小規(guī)模托卡馬克內(nèi)電漿的任務(wù), 但隨著科學(xué)家嘗試讓發(fā)電廠規(guī)模的托卡馬克變得可行,挑戰(zhàn)只會(huì)越來(lái)越大。目前的進(jìn)展雖慢但很穩(wěn)固。近期,JET項(xiàng)目取得了突破,立下核聚變研究項(xiàng)目取得的能量值的新紀(jì)錄,而位于法國(guó)的ITER的建造工作正在進(jìn)行中,等到它在2025年點(diǎn)火啟動(dòng)后,這項(xiàng)國(guó)際合作會(huì)變成全球最大規(guī)模的實(shí)驗(yàn)性核聚變反應(yīng)堆。
加州大學(xué)圣迭戈分校(UCSD)能源研究中心副研究員德米特里·奧爾洛夫(Dmitri Orlov)說(shuō):“托卡馬克越是復(fù)雜,性能越高,以更高的可靠性和準(zhǔn)確性來(lái)控制更多量的需要也就越大?!比斯ぶ悄芸刂葡碌耐锌R克可以實(shí)現(xiàn)最優(yōu)化,控制核聚變反應(yīng)產(chǎn)生的熱傳遞到容器壁,避免破壞“電漿不穩(wěn)定性”。而反應(yīng)堆本身就能得到重新設(shè)計(jì),利用上強(qiáng)化學(xué)習(xí)算法提供的更嚴(yán)密的控制手段。
法索利說(shuō),與DeepMind公司的合作最終能允許研究者推進(jìn)界限,加快通往核聚變能的漫長(zhǎng)之旅?!叭斯ぶ悄苁沟梦覀兡軌蛱剿饕恍┯闷渌绞綗o(wú)法探究的東西,因?yàn)槲覀儗?duì)于這種人工智能模擬的控制系統(tǒng)能夠冒風(fēng)險(xiǎn),而對(duì)于其他方式,我們不敢冒風(fēng)險(xiǎn)。”他說(shuō),“假如我們確信,我們擁有一種控制系統(tǒng),它能帶我們更靠近界限,但不會(huì)越過(guò)界限,那么我們實(shí)際上就能探索一些用其他方法無(wú)法進(jìn)行探究的可能性?!?/p>
資料來(lái)源 Nature