據(jù)美國趣味科學(xué)網(wǎng)站4月27日?qǐng)?bào)道,人工智能(AI)可以在執(zhí)行短時(shí)長(zhǎng)任務(wù)時(shí)輕松超越人類,但是如果我們希望AI成為真正的智慧系統(tǒng),耗時(shí)較長(zhǎng)的任務(wù)才是真正需要應(yīng)對(duì)的挑戰(zhàn)。
科學(xué)家設(shè)計(jì)出一種衡量AI系統(tǒng)能力的新方法,能考察AI在完成復(fù)雜任務(wù)時(shí)以多快的速度擊敗人類或者與人類比肩。
為量化AI模型的性能提升幅度,這一最新研究成果建議科學(xué)界參考人類完成相關(guān)任務(wù)的時(shí)長(zhǎng),然后基于AI完成相同任務(wù)的時(shí)長(zhǎng)來衡量AI系統(tǒng)的能力。3月30日,該科研團(tuán)隊(duì)在美國預(yù)印本文獻(xiàn)庫公布了研究成果,但論文尚未經(jīng)過同行評(píng)審。
科研團(tuán)隊(duì)發(fā)現(xiàn),對(duì)于人類需要不到4分鐘就能完成的任務(wù),AI模型的成功率能夠達(dá)到近100%。可是,對(duì)于人類需要超過4個(gè)小時(shí)才能完成的任務(wù),AI模型的成功率僅有10%。對(duì)于耗時(shí)較長(zhǎng)的任務(wù),早期AI模型的表現(xiàn)不如最新版本。
這是意料之中的發(fā)現(xiàn)。科研團(tuán)隊(duì)強(qiáng)調(diào)說,在過去6年里,每7個(gè)月,通用型AI以50%的可靠度完成任務(wù)的時(shí)長(zhǎng)就能增加一倍。
這項(xiàng)研究發(fā)現(xiàn),AI的“注意力持續(xù)時(shí)間”正在迅速延長(zhǎng)。根據(jù)這一發(fā)展趨勢(shì),科研團(tuán)隊(duì)預(yù)計(jì)(前提是其研究結(jié)果能夠普遍適用于現(xiàn)實(shí)世界的任務(wù)),到2032年,AI就可以自動(dòng)完成人類軟件開發(fā)一個(gè)月的工作量。
科研團(tuán)隊(duì)表示,為更好地理解AI能力的快速提升幅度及其對(duì)社會(huì)的潛在影響和風(fēng)險(xiǎn),這項(xiàng)研究可以建立與現(xiàn)實(shí)世界結(jié)果相關(guān)聯(lián)的新標(biāo)尺,以便“對(duì)AI工作表現(xiàn)的絕對(duì)狀態(tài)、而非單純的相對(duì)狀態(tài)給出有意義的解讀”。
這一潛在的新標(biāo)尺便于我們更好地理解AI系統(tǒng)的實(shí)際智慧和能力。
資深A(yù)I專家索羅布·卡澤魯尼安說:“這一標(biāo)尺本身不太可能改變AI的發(fā)展進(jìn)程,但是對(duì)于一些很適合使用AI的任務(wù)而言,它可以跟蹤AI系統(tǒng)在這些類型任務(wù)上的發(fā)展速度?!?/p>
卡澤魯尼安說:“基于人類完成特定任務(wù)所需的時(shí)長(zhǎng)來評(píng)估AI,為衡量AI的智力水平和通用能力提供了有趣的替代性指標(biāo)。首先,沒有任何單一指標(biāo)可以體現(xiàn)我們對(duì)‘智慧’的理解。其次,完成一項(xiàng)耗時(shí)較長(zhǎng)的任務(wù)而不出現(xiàn)漂移或錯(cuò)誤的可能性微乎其微。第三,這種方法可以直接衡量我們希望利用AI去完成的那些任務(wù)類型,即解決復(fù)雜的人類問題。”
可以認(rèn)為,除了提出新的衡量標(biāo)尺,上述最新論文的最大影響在于其凸顯AI系統(tǒng)的發(fā)展速度,以及不斷提升的AI處理長(zhǎng)時(shí)長(zhǎng)任務(wù)的能力。有鑒于此,美國電氣電子工程師學(xué)會(huì)會(huì)員、奇點(diǎn)大學(xué)AI倫理工程師埃莉諾·沃森預(yù)測(cè)說,能夠處理各種任務(wù)的通用型智能體將很快出現(xiàn)。
沃森說:“到2026年,我們將看到AI變得越來越通用,可以一整天或者一個(gè)星期都在處理各種任務(wù),而不是僅僅處理經(jīng)過嚴(yán)格限定的短時(shí)長(zhǎng)任務(wù)。”
沃森認(rèn)為,對(duì)企業(yè)而言,這一發(fā)展趨勢(shì)會(huì)促成能夠承擔(dān)大量專業(yè)工作的AI系統(tǒng)。這不僅可以降低成本,提高效率,還便于人類專注于更具創(chuàng)造性、戰(zhàn)略性和人際交往性的任務(wù)。
沃森還指出:“對(duì)消費(fèi)者而言,AI將從簡(jiǎn)單的助手演變?yōu)榭煽康膫€(gè)人助理,能夠連續(xù)數(shù)日乃至數(shù)周處理復(fù)雜的生活任務(wù),比如制定旅行計(jì)劃、監(jiān)測(cè)身體健康狀況或者管理金融投資,而且只需要最低程度的監(jiān)督?!?/p>
事實(shí)上,AI處理各類長(zhǎng)時(shí)長(zhǎng)任務(wù)的能力,很可能在今后幾年對(duì)社會(huì)互動(dòng)方式和社會(huì)利用AI的方式產(chǎn)生重大影響。(編譯/劉子彥)
3月31日在漢諾威工博會(huì)開幕式上,參觀者正在談?wù)撜古_(tái)上的人工智能機(jī)器人。(法新社)