亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        為什么我的DeepSeek總在一本正經(jīng)胡說八道

        2025-05-29 00:00:00antares
        北方人 2025年4期
        關(guān)鍵詞:文本語言模型

        我有一位朋友小G,身為博物館策展人,受過良好學(xué)術(shù)訓(xùn)練的她對歷史考據(jù)嚴(yán)謹(jǐn)?shù)浇跗珗?zhí)。兩年前,ChatGPT嶄露頭角,不少人陷入職業(yè)焦慮,小G卻毫不在意,她將這類AI統(tǒng)統(tǒng)稱為“人工智障”,覺得它們輸出的內(nèi)容既淺薄又荒謬,根本無法撼動她在專業(yè)領(lǐng)域的自信。但隨著DeepSeek重掀熱潮,被工作期限逼得焦頭爛額的小G,也不得不向AI求助了。她要為歷史展品編寫通俗易懂的場景解說,便向DeepSeek詢問:請從錢莊伙計(jì)的視角,講講在沒有科技設(shè)備的年代,在工作中會遇到哪些困難?

        很快,DeepSeek便交出一份“錢莊工作手記”,其中詳細(xì)描寫了“天未亮就要在桐油燈下核對賬目”的年輕伙計(jì),“用長柄放大鏡查驗(yàn)銀票邊角的暗記紋路”的掌柜師傅,甚至還提到了“蘇漕平每百兩扣二錢五”這樣的專業(yè)細(xì)節(jié)。“蘇漕平”可不是一般人能知曉的術(shù)語(漕平,舊時(shí)征收漕銀的衡量標(biāo)準(zhǔn),各地標(biāo)準(zhǔn)不同,一般冠以地名)。這讓小G眼前一亮,她在聊天群里興奮夸贊:“確實(shí)啟發(fā)效果不錯(cuò),比以前的人工智障強(qiáng)多了!”然而,僅僅5小時(shí)后,她的態(tài)度就來了個(gè)180度大轉(zhuǎn)彎:“好多內(nèi)容是它瞎編的!給我編了個(gè)錢莊使用的套色密押印章組,本來還覺得很有道理,但仔細(xì)一查,根本就沒有這個(gè)東西…”

        不甘心的小G試圖要求AI在生成文本同時(shí)提供參考文獻(xiàn),可新生成的說明里,不僅“騎縫章”“法幣券”等真實(shí)元素與“驗(yàn)鈔機(jī)”“美鈔暗記對照表”等虛構(gòu)情節(jié)交織,給出的參考文獻(xiàn)更是子虛烏有,小G只能無奈吐槽:“我現(xiàn)在不得不對它寫的東西做事實(shí)驗(yàn)證,可我又不是它導(dǎo)師….”

        被AI坑過的不止小G。隨著生成式

        AI的普及,越來越多的人發(fā)現(xiàn),表面上無所不知的AI,有時(shí)會煞有介事地編造看似合理實(shí)則虛假的內(nèi)容。這種現(xiàn)象,被研究者們稱為“AI幻覺”。

        要明白“AI幻覺”,得先搞清楚生成式AI的工作原理。很多人從新聞中的“大語言模型”一詞展開想象,以為ChatGPT或DeepSeek像是一個(gè)擁有龐大數(shù)據(jù)庫的搜索引擎,能像翻書查文獻(xiàn)一樣給我們的問題提供準(zhǔn)確答案。但其實(shí),今天的生成式AI更像是一個(gè)沉浸在語料庫海洋中學(xué)習(xí)說話的學(xué)習(xí)者,它不是在查找答案,而是在預(yù)測下一個(gè)要說的最合理的詞是什么。

        這個(gè)學(xué)習(xí)者有專屬的大腦結(jié)構(gòu),就是Transformer深度學(xué)習(xí)模型。Trans-former處理語言時(shí),首先把輸入的句子拆成一組包含位置信息的詞元,并用數(shù)字對詞元編碼,以方便計(jì)算機(jī)處理。一個(gè)詞元可能是一個(gè)單詞,也可能是一個(gè)詞根、數(shù)字或標(biāo)點(diǎn)等類似單詞的東西,比如“生成式AI”可能被拆為“生成”“式”“A”“I”,Transformer可能被拆成“Trans”“former”,這種拆分能讓AI更靈活地處理各種語言。

        Transformer模型的核心是注意力機(jī)制。在處理好詞元后,它會對輸入句子中的每個(gè)詞元計(jì)算上下文中的哪些詞元與它相關(guān),借此捕捉句子中遠(yuǎn)距離詞語的聯(lián)系。

        想象一下你讀到“陰雨連綿,小伙計(jì)仍然要”這半句話時(shí),大腦會關(guān)注“陰雨”,并依據(jù)“仍然”的轉(zhuǎn)折語義,推斷接下來小伙計(jì)應(yīng)該不會進(jìn)行一個(gè)適宜雨天的行為,由此判斷后面可能出現(xiàn)“出門”之類的戶外行動。

        AI的注意力機(jī)制也是如此,分析詞元關(guān)聯(lián),確定“注意”重點(diǎn),綜合注意力權(quán)重產(chǎn)生新的語義矢量,最終輸出基于前文預(yù)測的下一個(gè)詞元的概率分布。

        AI訓(xùn)練時(shí)用了大量高質(zhì)量文本和書籍等資源,最基本的訓(xùn)練任務(wù)就是從這些文本中摘取段落,讓模型盡可能準(zhǔn)確地預(yù)測后續(xù)應(yīng)該出現(xiàn)的詞元。之后,還會對模型應(yīng)用領(lǐng)域內(nèi)的相關(guān)文本進(jìn)行微調(diào)。所以,從內(nèi)部結(jié)構(gòu)到訓(xùn)練過程,AI都沒有“理解詞意”這一步。

        人類回答問題時(shí)會試圖基于知識進(jìn)行聯(lián)想推理,而AI則基于訓(xùn)練數(shù)據(jù)中觀察到的語言模式生成答案,它不理解問題,只是按統(tǒng)計(jì)規(guī)律給出看似合理的輸出,因此也有研究者用“隨機(jī)鸚鵡”形容大語言模型的這一特性。

        這就解釋了小G為何會得到“套色密押印章組”這種幻覺回答。AI處理晚清錢莊歷史問題時(shí),注意力機(jī)制關(guān)聯(lián)訓(xùn)練數(shù)據(jù)中與“錢莊”“防偽”等相關(guān)的所有信息。但它不理解詞元的含義,也不區(qū)分信息真假,僅按統(tǒng)計(jì)關(guān)聯(lián)性選擇看似“最可能”的組合。訓(xùn)練數(shù)據(jù)里,古代金融機(jī)構(gòu)需要防偽,印章是認(rèn)證工具,套色是印刷技術(shù),密押是銀票防偽暗記,這些碎片信息被概率重組,就創(chuàng)造出了看似專業(yè)合理實(shí)際并不存在的歷史細(xì)節(jié)。

        (摘自微信公眾號“三聯(lián)生活周刊”)

        猜你喜歡
        文本語言模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        讓語言描寫搖曳多姿
        累積動態(tài)分析下的同聲傳譯語言壓縮
        3D打印中的模型分割與打包
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        人妻丰满精品一区二区| 精品国产精品久久一区免费式| 国产婷婷丁香久久综合| 中文字幕亚洲乱亚洲乱妇| 精品综合久久88少妇激情| 国产精品h片在线播放| 日日碰狠狠躁久久躁| 久久久久国产亚洲AV麻豆| av免费在线手机观看| 嫩呦国产一区二区三区av| 国产精品成人3p一区二区三区| 国产色诱视频在线观看| 日韩精品欧美激情国产一区| 一本色道久久综合亚洲精品不| 成人国成人国产suv| 亚洲xxxx做受欧美| 欧美破处在线观看| av天堂网手机在线观看| 亚洲欧洲国产成人综合在线| 国产精品免费久久久久影院| 无码一区二区三区久久精品| 玖玖资源站亚洲最大的网站| 波多野结衣的av一区二区三区| 国产AV无码专区亚洲AⅤ| 久久熟女乱一区二区三区四区| 亚洲美女毛多水多免费视频| 欧美一区二区三区久久综| 手机看片1024精品国产| 一区二区三区日本在线| 国产在线无码精品无码| 人妻少妇精品专区性色av| аⅴ天堂一区视频在线观看| 久久一区二区av毛片国产| 亚洲日韩久久综合中文字幕| 国产激情视频白浆免费| 我和丰满老女人性销魂| 懂色av一区二区三区尤物| 真人无码作爱免费视频禁hnn | 亚洲日韩成人无码| 国产午夜三级一区二区三| 亚洲精品美女久久久久99|