亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Manus一夜爆火,智能體取代打工人?

        2025-04-03 00:00:00榮智慧
        看世界 2025年7期
        關(guān)鍵詞:智能模型

        AI創(chuàng)意圖(制作/本刊記者 郭嘉亮)

        近日,自稱“全球第一款通用AI Agent產(chǎn)品”的Manus一夜之間爆火。

        其宣稱性能“吊打”O(jiān)penAI同款,邀請(qǐng)碼被炒至天價(jià),甚至能賣到9萬(wàn)、10萬(wàn)元一個(gè)。

        Manus火得突如其來(lái),但不算莫名其妙。

        火的原因有兩點(diǎn):“一是多家造勢(shì),風(fēng)很大,但實(shí)測(cè)的人少,神秘感強(qiáng),疊加“本土團(tuán)隊(duì)”光環(huán),又是一個(gè)后來(lái)居上的案例;二是大模型的好,大家都見(jiàn)識(shí)了,但一直停留在聊天上。現(xiàn)在急需趁手的聚合式工具,把腦子里的想法變變現(xiàn)。

        忽然,說(shuō)曹操曹操就到,正中下懷。

        聚合式工具也沒(méi)那么玄妙,相當(dāng)于“高德打車”吧。

        Manus是什么?行內(nèi)叫智能體(Agent),通俗點(diǎn)可以叫“工具人”。這個(gè)工具人就是以大模型為“大腦”,自己“動(dòng)手”使用工具來(lái)完成任務(wù)。Manus英文就是“手”的意思。

        有代表性的工具人,當(dāng)屬OpenAI的深度研究(Deep Research)和Anthropic的計(jì)算機(jī)應(yīng)用(Computer Use)。以實(shí)測(cè)結(jié)果來(lái)看,Manus達(dá)不到宣傳片里的效果:幻覺(jué)較多,任務(wù)基本以失敗告終。

        關(guān)鍵,是不是“工具人”,要看它是不是真的能自行決定怎么完成任務(wù)、挑什么工具,而不是靠編好的代碼。

        Manus目前未有任何信息能證明自己是真正的智能體—沒(méi)有人為設(shè)計(jì)的工作流程。因此,只能說(shuō)它在宣傳里呈現(xiàn)出“智能體”或通用人工智能(AGI)的樣子,并圍繞這一概念做文章。

        而Manus也絕非一無(wú)是處。作為一款應(yīng)用,界面簡(jiǎn)潔友好;大腦(思考)、手(操作)、交付的層次非常清晰,組合起來(lái)也是相對(duì)合格的當(dāng)代“牛馬”,還是能幫你提高一點(diǎn)生產(chǎn)力。

        下文將舉例說(shuō)明Manus如何完成工作任務(wù)、優(yōu)勢(shì)和局限以及技術(shù)邏輯是什么。省流版:別花好幾萬(wàn)買什么邀請(qǐng)碼,一個(gè)“毛坯房”不值得。

        使用工具是大學(xué)問(wèn)

        “工具人”絕不能純聊天,不干活兒,專業(yè)工具人都是一邊聊一邊干:左面對(duì)話框,右面操作臺(tái)。Manus和Claude的界面都是如此。

        根據(jù)“我有一個(gè)朋友”的實(shí)測(cè),給Manus由淺入深地提了幾個(gè)獨(dú)立的要求,比如寫(xiě)小說(shuō),給蘋果股價(jià)建模,寫(xiě)一個(gè)游戲等等,結(jié)果不太樂(lè)觀。

        整個(gè)流程是這樣的:用戶在對(duì)話框里發(fā)布指令,Manus在操作臺(tái)一頓輸出,用戶可以清晰地看到Manus使用工具的過(guò)程,并接收它的操作結(jié)果。

        收到指令后,Manus是這樣使用工具的:首先,建立一個(gè)總文件夾寫(xiě)明“大目標(biāo)”,再建立多個(gè)清單式的子文件夾,將任務(wù)分解,最后逐一完成子文件夾的“小目標(biāo)”。完成小目標(biāo)時(shí),它可能在瀏覽器一通搜索,也可能寫(xiě)一段代碼。

        也就是說(shuō),Manus主要工具就三種,瀏覽器工具(Agent),計(jì)算機(jī)語(yǔ)言Python和一部分命令行。

        其次,利用超文本標(biāo)記語(yǔ)言HTML來(lái)輸出“結(jié)果”。

        也就是說(shuō),Manus用網(wǎng)頁(yè)呈現(xiàn)所有的結(jié)果。

        有人問(wèn),它不是做了10頁(yè)P(yáng)PT給我了嗎?這也是Manus“聰明”的地方,其實(shí)它沒(méi)有PPT工具,為了你的PPT,它用前端工具寫(xiě)了一大堆頁(yè)面,通過(guò)命令行把前端頁(yè)面打包成一個(gè)壓縮包,下載下來(lái)是一堆前端網(wǎng)站,每個(gè)前端網(wǎng)站就是一頁(yè)P(yáng)PT—雖然甲方很過(guò)分,但乙方還是出色地完成了任務(wù)。

        兩個(gè)缺陷讓Manus不好用

        在具體測(cè)試Manus的過(guò)程中,有兩個(gè)問(wèn)題明顯暴露。

        一是瀏覽器工具的局限。

        遇到反爬蟲(chóng)網(wǎng)站或需要人機(jī)驗(yàn)證的網(wǎng)站,它根本無(wú)法讀取數(shù)據(jù)。比如,你想要在多個(gè)購(gòu)物網(wǎng)站比價(jià)一款手機(jī),進(jìn)不去的網(wǎng)站它只能作罷,最后給出的是在搜索頁(yè)標(biāo)題里找出來(lái)的價(jià)格的比較??傊?,它給出的結(jié)果非常粗糙,根本達(dá)不到你想要的結(jié)果。

        這也是瀏覽器工具的通病。OpenAI給出過(guò)統(tǒng)計(jì)數(shù)據(jù),其瀏覽器Agent在數(shù)據(jù)集上只能完成58.1%的任務(wù),而人類能完成78.2%,差距是巨大的。

        但是,OpenAI的瀏覽器工具能力還是不差的,能幫人訂餐廳,買機(jī)票。而Manus的瀏覽器工具只能打開(kāi)頁(yè)面,下滑,極少數(shù)時(shí)候點(diǎn)進(jìn)某個(gè)網(wǎng)頁(yè)。因此,Manus應(yīng)該沒(méi)有訓(xùn)練自己的瀏覽器Agent,僅能做一些初步的簡(jiǎn)單工作。

        而且,Manus選擇工具也有局限。它有時(shí)非常豪爽地用Next.js寫(xiě)代碼,這是一個(gè)全棧項(xiàng)目,前后端都能用的那種。但是Manus又沒(méi)有部署后端的能力,各種報(bào)錯(cuò)之后陷入“深深的思索”。

        二是幻覺(jué)嚴(yán)重。

        比如給蘋果公司做財(cái)務(wù)估值,Manus這次沒(méi)有利用瀏覽器搜索,而是寫(xiě)了一個(gè)Python腳本,在腳本里調(diào)用“雅虎金融”的接口來(lái)讀取公司相關(guān)數(shù)據(jù)。

        然而,在實(shí)際過(guò)程中,它并沒(méi)有提供真實(shí)數(shù)據(jù),而是撰寫(xiě)了一堆模擬數(shù)據(jù)—也就是自己編的數(shù)據(jù)。反查它的操作流程,確實(shí)沒(méi)有調(diào)用過(guò)任何API,也沒(méi)有任何搜索過(guò)程,幻覺(jué)是比較嚴(yán)重的。

        它最后給出的報(bào)告,當(dāng)然也是完全不能用的。

        在處理任務(wù)時(shí),Manus普遍將大模型和Python腳本混在一起操作,上下文極長(zhǎng),更容易產(chǎn)生錯(cuò)誤。用戶如果不留心或缺乏分辨能力,也更容易被“蒙騙”。

        模型即產(chǎn)品

        Manus AI創(chuàng)始人肖弘在接受采訪時(shí),提到了理解智能體的核心:虛擬機(jī)。

        其實(shí),智能體應(yīng)該是一個(gè)“DeepSeek”+“我”的東西。這里的“我”是執(zhí)行角色。

        在沒(méi)有智能體之前,我布置任務(wù),大模型思考目標(biāo)、分解步驟,“我”來(lái)執(zhí)行并拿到結(jié)果。有了智能體之后,我布置任務(wù),智能體直接給我結(jié)果。

        Manus的操作流程展示

        就像我需要10頁(yè)P(yáng)PT,DeepSeek給我寫(xiě)好每一頁(yè)內(nèi)容,“我”復(fù)制到PPT里?,F(xiàn)在,我需要10頁(yè)P(yáng)PT,智能體就給了我10頁(yè)P(yáng)PT。

        本來(lái)需要我使用電腦(做PPT),現(xiàn)在是大模型在使用我的電腦(做PPT)。

        這就是智能體的本質(zhì)。

        如果用的是軟件搭出來(lái)的硬件系統(tǒng),那么這個(gè)智能體就是大模型+虛擬機(jī)。

        如果直接調(diào)用現(xiàn)實(shí)中的電腦,那么這個(gè)智能體就是大模型+計(jì)算機(jī)。一年前Claude就能拿用戶的電腦做網(wǎng)頁(yè)了。

        這是因?yàn)楝F(xiàn)在大模型還較難真正接入物理世界,只能在“真假”計(jì)算機(jī)上下功夫。如果萬(wàn)物互聯(lián),“大模型+鍋碗瓢盆”可能直接把餐飲業(yè)干倒閉了,當(dāng)然倒閉的肯定也不止一個(gè)行業(yè)了。這是后話。

        智能體的背后,是“模型即產(chǎn)品”的思路。

        正如OpenAI的深度研究,Anthropic的計(jì)算機(jī)應(yīng)用,都不再套用自家的通用模型,而是根據(jù)應(yīng)用場(chǎng)景,訓(xùn)練全新的強(qiáng)化模型,這個(gè)強(qiáng)化模型本身就是一個(gè)好用的產(chǎn)品。反過(guò)來(lái)看Manus,當(dāng)然是沒(méi)有自家的大模型,也缺乏專門訓(xùn)練的相關(guān)工具,但是聚合的思路和表現(xiàn)形式很成功,也將大模型“純文本工作”—寫(xiě)代碼、寫(xiě)文字的優(yōu)勢(shì),通過(guò)網(wǎng)頁(yè)交付清晰地展示了出來(lái)。

        在訓(xùn)練模型的邏輯上,Manus可能也并沒(méi)有實(shí)現(xiàn)Claude人、大模型、環(huán)境三者即時(shí)反饋的簡(jiǎn)潔模式,而依然遵循之前人、大模型、任務(wù)分解、工具使用、進(jìn)程演化、目標(biāo)達(dá)成等復(fù)雜結(jié)構(gòu)。

        在DeepSeek非常成功的今天,發(fā)展智能體是順應(yīng)了形勢(shì)的需要、大眾的需求。各家AI公司都希望抓住這個(gè)機(jī)會(huì)來(lái)發(fā)力。搶占流量也是發(fā)力的一部分。

        對(duì)于普通消費(fèi)者而言,最重要的還是多觀察,多了解,別急著掏錢。人工智能不會(huì)毀滅你的生活,但是焦慮會(huì)。

        猜你喜歡
        智能模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        智能制造 反思與期望
        智能前沿
        文苑(2018年23期)2018-12-14 01:06:06
        智能前沿
        文苑(2018年19期)2018-11-09 01:30:14
        智能前沿
        文苑(2018年17期)2018-11-09 01:29:26
        智能前沿
        文苑(2018年21期)2018-11-09 01:22:32
        智能制造·AI未來(lái)
        商周刊(2018年18期)2018-09-21 09:14:46
        3D打印中的模型分割與打包
        男人的天堂手机版av| 久热这里只有精品99国产| 亚洲精品黄网在线观看| 农村国产毛片一区二区三区女| 中文字幕乱码亚洲一区二区三区| 把女人弄爽特黄a大片| 日本阿v网站在线观看中文| 99热在线观看| 毛茸茸的中国女bbw| 女人的天堂av免费看| 国内揄拍国内精品久久| 人妻熟妇乱又伦精品视频| 成人免费一区二区三区| 亚洲av美女在线播放啊| 一级二级三一片内射视频| 亚洲av天堂在线视频| 人妻丰满熟妇av无码片| 久久免费国产精品一区二区| 国产激情视频高清在线免费观看| 色与欲影视天天看综合网| 欧美性狂猛xxxxx深喉| www.五月激情| 亚洲av乱码一区二区三区女同 | 日本视频一中文有码中文| 无码字幕av一区二区三区| 亚洲男人的天堂网站| 国产视频最新| 国产区一区二区三区性色| 中文字幕人妻无码视频| 亚洲精品乱码久久久久久金桔影视| 精品国产群3p在线观看| av在线网站一区二区| 国产内射爽爽大片| 99久久久无码国产精品试看 | 最近中文字幕一区二区三区| 国产亚洲精品美女久久久久| 中文字幕无码av激情不卡| 无码伊人久久大杳蕉中文无码| 免费一区二区在线观看视频在线 | 久久不见久久见免费视频7| 成人特黄特色毛片免费看|