亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一千三百七十億參數(shù)谷歌帶來新語言模型LaMDA,將實現(xiàn)更安全更高質(zhì)量對話

        2022-03-26 11:18:46
        海外星云 2022年4期
        關(guān)鍵詞:趣味性語言模型

        如今,語言模型的能力越來越強,在各種任務(wù)中都發(fā)揮了很大的作用。其中,開放域?qū)υ捒赡苁亲铍y以完成的一類任務(wù),需要做到能夠就任何主題進行對話。

        在對話任務(wù)中,除了生成人類認(rèn)為合理、有趣且特定于上下文的響應(yīng)之外,語言模型還須按照負(fù)責(zé)任的人工智能框架工作,以免生成無信息源證實的內(nèi)容。

        近日,谷歌在以《LaMDA:對話應(yīng)用程序的語言模型》為題的一篇論文中介紹了語言模型LaMDA在安全、可靠和高質(zhì)量的對話方面取得的最新進展。

        據(jù)悉,LaMDA模型具有1370億個參數(shù),通過微調(diào)采用Transformer架構(gòu)的專用對話神經(jīng)語言模型而構(gòu)建,可以利用外部知識源展開對話。

        對于訓(xùn)練對話模型來說,定義目標(biāo)和指標(biāo)至關(guān)重要。LaMDA模型具有質(zhì)量、安全和扎實性三個關(guān)鍵目標(biāo),每個目標(biāo)有各自的衡量指標(biāo)。

        質(zhì)量上,谷歌將其拆分為合理性、特異性和趣味性這三個方面。

        其中,合理性是指模型在對話中作出有實際意義的回應(yīng),如回應(yīng)中沒有出現(xiàn)常識性錯誤;特異性是指模型在對話中針對特定的上下文來響應(yīng),而不是在常規(guī)情形下的通用響應(yīng);趣味性是指模型作出了富有洞察力和智慧的回應(yīng)。

        安全上,谷歌在開發(fā)和部署負(fù)責(zé)任的人工智能方面有很大的進步。為避免出現(xiàn)各種偏見以及可能對用戶造成傷害的內(nèi)容,其用一組可限制模型輸出對話的安全目標(biāo)來組成安全指標(biāo)。

        由于語言模型有時會輸出貌似合理實際卻與已知事實相悖的內(nèi)容,谷歌對LaMDA模型的扎實性展開了研究。

        扎實性是指在外部世界聲明上能夠獲得權(quán)威外部信息來源支持的百分比。但是,在這些來源中建立的LaMDA模型也無法完全保證所生成響應(yīng)的準(zhǔn)確性,所以谷歌允許用戶及外部系統(tǒng)來源的可靠性來判斷響應(yīng)有效與否。

        此外,谷歌在論文介紹了LaMDA模型的預(yù)訓(xùn)練和微調(diào)階段。

        預(yù)訓(xùn)練階段,谷歌做了一個包含1.56T詞匯的數(shù)據(jù)集,并將該數(shù)據(jù)集中的詞匯標(biāo)記為2.81T Sentence Piecetoken ,接著通過GSPMD系統(tǒng)對LaMDA模型進行預(yù)訓(xùn)練。

        據(jù)了解,谷歌將經(jīng)過預(yù)訓(xùn)練的LaMDA模型用于其自然語言處理的研究中,包括程序合成、零樣本學(xué)習(xí)和風(fēng)格遷移等。

        微調(diào)階段,谷歌讓LaMDA模型執(zhí)行兩類任務(wù),一類是作出面向指定上下文自然語言回應(yīng)的混合生成任務(wù),另一類響應(yīng)是否安全和高質(zhì)量的分類任務(wù),從而成為一個多任務(wù)模型。

        對話時,LaMDA生成器會對面向的上下文生成幾個候選回應(yīng), 然后LaMDA分類器預(yù)測每個候選回應(yīng)的合理性、特異性和趣味性和安全分?jǐn)?shù),最后根據(jù)這兩項數(shù)據(jù)的排名選出最佳回應(yīng)。

        人類可以通過現(xiàn)存的工具和知識庫來明確事實,而語言模型僅能依靠其內(nèi)部參數(shù)來得到訊息。

        為此, 谷歌做了一個人類與LaMDA模型交流的數(shù)據(jù)集,并通過該數(shù)據(jù)集對LaMDA模型的生成器和分類器進行微調(diào),讓其在與對話期間調(diào)用外部信息檢索系統(tǒng),以提高回應(yīng)的扎實性。

        谷歌表示,“在對LaMDA模型進行評估后得出,其在每個維度和所有模型大小情況下都顯著優(yōu)于預(yù)先訓(xùn)練的模型。無論微調(diào)與否,合理性、特異性和趣味性等質(zhì)量指標(biāo)通常會隨模型參數(shù)量而提升。而安全性雖然無法僅根據(jù)模型縮放變化,但可以通過微調(diào)來提升。”

        此外,LaMDA模型的扎實性會因模型大小的增加而不斷提升。造成的原因可能是,模型越大,其記住不常見知識的能力越強,且微調(diào)允許模型訪問外部知識源,并將記住知識的負(fù)載轉(zhuǎn)移到外部知識源。

        不過,微調(diào)雖然縮小了語言模型與人類之間的差距,但該模型在安全性和扎實性上的水平依然弱于人類。

        LaMDA模型的出現(xiàn)為完成開放域?qū)υ掗_辟了新的途徑,同時表明了神經(jīng)語言模型面臨的關(guān)鍵挑戰(zhàn),如安全指標(biāo)的使用和扎實性的提高,以及如何通過更大的模型和更清晰標(biāo)記的數(shù)據(jù)來進行微調(diào)。

        但是,這還是一項非常早期的工作,且具有很大的局限性。未來,谷歌將探索新的方法來進一步改進安全指標(biāo)和LaMDA模型的扎實性,并與其人工智能原則保持一致。

        猜你喜歡
        趣味性語言模型
        一半模型
        “揪”出音樂教學(xué)的趣味性
        井岡教育(2022年2期)2022-10-14 03:11:30
        重要模型『一線三等角』
        提高化學(xué)實驗教學(xué)趣味性的實踐探索
        甘肅教育(2020年8期)2020-06-11 06:10:20
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        讓語言描寫搖曳多姿
        累積動態(tài)分析下的同聲傳譯語言壓縮
        3D打印中的模型分割與打包
        把握民生新聞趣味性的幾點思考
        新聞傳播(2015年8期)2015-07-18 11:08:25
        国产精品多人P群无码| 神马影院午夜dy888| 天天爽夜夜爽人人爽一区二区| 亚洲精品无码久久久久y| 国产卡一卡二卡3卡4乱码| 免费人成无码大片在线观看 | 亚洲国产日韩欧美综合a| 日本免费a级毛一片| 欧洲熟妇色xxxx欧美老妇多毛网站| 黑人巨大videos极度另类| 久久aⅴ无码av高潮AV喷| 一区二区三区国产精品麻豆| 亚洲av成人无码一区二区三区在线观看| 女人色毛片女人色毛片18| 日韩国产精品一本一区馆/在线| 久久黄色精品内射胖女人| 三个男吃我奶头一边一个视频| 亚洲∧v久久久无码精品| 丰满熟妇人妻无码区| 亚洲专区路线一路线二网| 高潮抽搐潮喷毛片在线播放| 97精品伊人久久大香线蕉| 永久免费毛片在线播放| 福利利视频在线观看免费| 亚洲色一区二区三区四区| 免费无码黄动漫在线观看| 揄拍成人国产精品视频肥熟女| 日本高清中文字幕二区在线| 成年人观看视频在线播放| 国内精品自在自线视频| 99精品久久久中文字幕| 午夜精品男人天堂av| 久9re热视频这里只有精品| 又爽又黄无遮挡高潮视频网站| 一区二区三区免费观看在线视频| 99久久婷婷国产精品综合网站 | 欧美成妇人吹潮在线播放| 五月天丁香久久| 日韩精品成人一区二区三区| 国产精品人人做人人爽人人添 | 亚洲av福利天堂在线观看|