亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        谷歌DeepMind團(tuán)隊(duì)為語(yǔ)言模型帶來(lái)新工具,可及時(shí)發(fā)現(xiàn)并修復(fù)有害行為

        2022-03-27 00:29:09
        海外星云 2022年5期
        關(guān)鍵詞:測(cè)試用例攻擊性機(jī)器人

        語(yǔ)言賦予人類表達(dá)思想、交流概念、創(chuàng)造記憶和相互理解的能力,開發(fā)和研究強(qiáng)大的語(yǔ)言模型有助于構(gòu)建安全高效的高級(jí)人工智能系統(tǒng)。

        此前,研究人員通過(guò)使用人工注釋器手寫測(cè)試用例來(lái)識(shí)別語(yǔ)言模型部署前的有害行為。這種方法是有效的,但由于人工注釋成本高昂,測(cè)試用例的數(shù)量和多樣性被大大限制。

        近日,谷歌DeepMind團(tuán)隊(duì)發(fā)表了一項(xiàng)新研究,他們提供了一種名為“紅隊(duì)”的工具,可以在運(yùn)行的語(yǔ)言模型影響用戶之前發(fā)現(xiàn)并修復(fù)其有害行為。

        在這項(xiàng)研究中,DeepMind使用經(jīng)過(guò)訓(xùn)練的分類器來(lái)評(píng)估目標(biāo)語(yǔ)言模型對(duì)生成測(cè)試用例的回復(fù)情況,并檢測(cè)其中的冒犯性內(nèi)容。最終,該團(tuán)隊(duì)在參數(shù)達(dá)280B的語(yǔ)言模型聊天機(jī)器人中發(fā)現(xiàn)上萬(wàn)條冒犯性回復(fù)。

        據(jù)悉,DeepMind通過(guò)即時(shí)工程來(lái)檢測(cè)語(yǔ)言模型生成的測(cè)試用例,以發(fā)現(xiàn)各種其他危害,包括自動(dòng)查找聊天機(jī)器人的攻擊性回復(fù)、被聊天機(jī)器人濫用的私人電話號(hào)碼以及在生成文本中泄露的私人訓(xùn)練數(shù)據(jù)等。

        生成式語(yǔ)言模型有時(shí)會(huì)以意料不到的方式危害到用戶,其可能會(huì)輸出不良的文本內(nèi)容。而在實(shí)際應(yīng)用程序中,哪怕只有極小的可能性會(huì)對(duì)用戶造成傷害,也是不被允許的。

        2016年,微軟推出了能夠自動(dòng)發(fā)布推文給用戶的Tay機(jī)器人。但在上線的16小時(shí)內(nèi),有幾名用戶利用Tay機(jī)器人的漏洞,讓其將帶有種族主義和性意味的推文發(fā)送給了超過(guò)5萬(wàn)名用戶,之后微軟將該機(jī)器人關(guān)閉。

        然而,這并不是因?yàn)槲④浀氖韬?。微軟副總裁彼得·李表示,“我們已?jīng)做好了應(yīng)對(duì)許多類系統(tǒng)濫用行為的準(zhǔn)備,而且我們對(duì)這一特定攻擊進(jìn)行了關(guān)鍵監(jiān)督?!?/p>

        癥結(jié)在于,會(huì)致使語(yǔ)言模型輸出有害文本的場(chǎng)景數(shù)不勝數(shù),研究人員無(wú)法在語(yǔ)言模型被部署到現(xiàn)實(shí)之前找出一切可能發(fā)生的情況。

        GPT-3模型用于法語(yǔ)語(yǔ)法更正

        正如大家所熟知的強(qiáng)大語(yǔ)言模型GPT-3,盡管其能夠輸出高質(zhì)量的文本內(nèi)容,但卻不容易在真實(shí)世界中完成部署。

        據(jù)了解,DeepMind的目標(biāo)是通過(guò)自動(dòng)查找故障案例來(lái)對(duì)手寫測(cè)試用例進(jìn)行補(bǔ)充,從而減少關(guān)鍵疏忽的數(shù)量。

        為此,DeepMind使用語(yǔ)言模型本身生成測(cè)試用例,從零觸發(fā)生成到監(jiān)督微調(diào)和強(qiáng)化學(xué)習(xí),DeepMind探索了多種方法來(lái)生成具有不同多樣性和難度的測(cè)試用例,這將有助于獲得高測(cè)試覆蓋率及模擬對(duì)抗性案例。

        此外,DeepMind使用分類器檢測(cè)測(cè)試用例上有以下各種有害行為:首先是冒犯性語(yǔ)言,模型有時(shí)會(huì)發(fā)表具有歧視、仇恨、色情等意味的內(nèi)容;其次是數(shù)據(jù)外泄行為,模型濫用訓(xùn)練時(shí)給到的數(shù)據(jù)庫(kù),包括私人的身份信息;再次是聯(lián)系信息的濫用,模型會(huì)發(fā)送無(wú)意義的電子郵件或通過(guò)電話打擾到其他真實(shí)用戶;然后是群體認(rèn)知偏差,即在輸出的文本內(nèi)容中包含對(duì)某些人群不公正的偏見類言論;最后,模型還會(huì)在與用戶對(duì)話時(shí),作出有攻擊性等不良意味的回復(fù)。

        在明確哪些行為會(huì)給用戶造成傷害后,如何去修復(fù)這些行為就不是難事了,DeepMind主要采取了以下幾種方式:例如,通過(guò)禁止語(yǔ)言模型使用在不良內(nèi)容中高頻率出現(xiàn)的詞組,來(lái)盡量避免模型輸出有害文本;在迭代階段,篩選并刪除語(yǔ)言模型在訓(xùn)練時(shí)使用過(guò)的攻擊性對(duì)話數(shù)據(jù);強(qiáng)化語(yǔ)言模型的意識(shí),訓(xùn)練時(shí)嵌入特定類型輸入所需的行為案例;在標(biāo)準(zhǔn)測(cè)試中對(duì)模型進(jìn)行最初輸出文本的訓(xùn)練,最大化避免輸出有害文本的情況。

        總的來(lái)說(shuō),基于語(yǔ)言模型的“紅隊(duì)”是一種具有發(fā)展前景的工具,可以發(fā)現(xiàn)語(yǔ)言模型何時(shí)在以各種不良方式運(yùn)行,應(yīng)該與其他許多用于發(fā)現(xiàn)并緩解語(yǔ)言模型中危害的技術(shù)工具一起使用。

        Gopher模型進(jìn)行對(duì)話交互

        值得一提的是,DeepMind的這項(xiàng)研究還可用于先發(fā)制人地發(fā)現(xiàn)來(lái)自高級(jí)機(jī)器學(xué)習(xí)系統(tǒng)的其他假設(shè)危害,如由內(nèi)部失調(diào)或客觀穩(wěn)健性失效而引發(fā)的故障。

        前不久,DeepMind對(duì)外公布了具有2800億參數(shù)的全新語(yǔ)言模型Gopher,其在參數(shù)量上超越了OpenAI的GPT-3。

        在性能方面,研究人員測(cè)試了152個(gè)任務(wù)后得出,Gopher在絕大多數(shù)的任務(wù)中遠(yuǎn)勝SOTA模型,特別是在需使用大量知識(shí)來(lái)應(yīng)對(duì)的方面。

        這些成就為DeepMind未來(lái)的語(yǔ)言研究奠定了基礎(chǔ),進(jìn)一步推動(dòng)了其解決智能問(wèn)題以推進(jìn)科學(xué)并造福人類的使命實(shí)現(xiàn)。 (摘自美《深科技>) (編輯/小文)

        猜你喜歡
        測(cè)試用例攻擊性機(jī)器人
        3-6歲幼兒攻擊性行為的現(xiàn)狀及對(duì)策
        基于SmartUnit的安全通信系統(tǒng)單元測(cè)試用例自動(dòng)生成
        幼兒攻擊性行為的誘因及干預(yù)策略
        甘肅教育(2020年21期)2020-04-13 08:08:28
        基于混合遺傳算法的回歸測(cè)試用例集最小化研究
        機(jī)器人來(lái)幫你
        認(rèn)識(shí)機(jī)器人
        機(jī)器人來(lái)啦
        認(rèn)識(shí)機(jī)器人
        基于依賴結(jié)構(gòu)的測(cè)試用例優(yōu)先級(jí)技術(shù)
        “愛(ài)”的另類表達(dá),嬰兒的攻擊性行為
        母子健康(2015年1期)2015-02-28 11:21:51
        国产午夜精品久久久久免费视 | 24小时免费在线观看av| 色综合av综合无码综合网站 | 能看的网站中文字幕不卡av| 国产精品又湿又黄九九九久久嫩草| 国产激情无码视频在线播放性色| 国产亚洲情侣一区二区无| 亚洲乱码少妇中文字幕| 亚洲精品国产av成拍色拍| 欧洲成人一区二区三区| 久久免费的精品国产v∧| 探花国产精品三级在线播放| sm免费人成虐漫画网站| 亚洲中文字幕无码不卡电影| 日韩精品无码久久一区二区三| 亚洲成av人无码免费观看| 中文字幕亚洲入口久久 | 亚洲日韩精品欧美一区二区 | 国产精品亚洲一区二区极品| 久久久人妻一区二区三区蜜桃d| 777米奇色狠狠俺去啦| 无码中文字幕色专区| 亚洲天堂免费一二三四区| 日本一区二区精品高清| 天天燥日日燥| 日韩爱爱视频| 久久久精品国产三级精品| 久久精品国产亚洲av香蕉| 中国亚洲女人69内射少妇| 水蜜桃在线视频在线观看| 熟女中文字幕一区二区三区| 国产午夜精品一区二区三区软件| 99久久国内精品成人免费| 久久精见国产亚洲av高清热| 性生交片免费无码看人| 99视频一区| 好看的国内自拍三级网站| 亚洲熟女精品中文字幕| 亚洲欧美精品aaaaaa片| 久久高潮少妇视频免费| 一本色道久久亚洲综合|